如果你把这场圆桌(见文末【附录】实录整理)当成一次 “AI 前沿趋势分享”,那你会错过它真正的价值。
它本质上是一场关于:
- 企业 该如何活下去
- 又该如何 把对手彻底甩开
的经营讨论。
? 四位嘉宾,站位不同,却指向同一个真相
这场对话,聚集了四位国内 AI 关键节点人物:
- 姚顺雨(OpenAI / 腾讯体系)
- 林俊旸(阿里 · 通义千问)
- 杨强(学术 × 工业桥梁)
- 唐杰(智谱)
他们背景不同、立场不同,但反复指向一个事实:
AI 的竞争,已经从「谁更强」变成了「谁用得对、用得久、离真实世界更近」
一、【道】真正震撼管理者的 4 个底层认知
1️⃣ 智能效率,比智能上界更重要
唐杰老师提出一个反直觉但极其重要的概念:
不要再只看“模型有多强”,而要看“单位成本能产出多少智能”
通俗说一句话:
? 不是油箱越大越牛,而是每升油能跑多远
今天很多企业的问题是:
- 砸 10 个亿
- 换来 10% 的能力提升
- ROI 越来越低
真正聪明的企业在算一笔账:
- 50 美元/月的模型,能解决 80% 问题
- 200 美元/月的模型,只多解决 10%
? 这 4 倍的价格,值不值?
给管理者的提醒:
- 不追“最强”
- 只选“最合适、最划算”
2️⃣ To B 和 To C 的分化,是“本质差异”
姚顺雨点出了一个被严重低估的事实:
To C 用户,大多数时候不需要最强 AITo B 场景,智能 = 生产力
普通用户:
- 把 ChatGPT 当“更聪明的搜索引擎”
程序员、分析师、工程师:
- AI 已经在 重塑工作方式
- 人不再写代码,而是“用语言指挥机器”
更残酷的是:
- To B 市场,强模型和弱模型的差距会被无限放大
- 因为失败一次的成本,远高于模型费用
一句话总结:
- To C:体验 > 能力
- To B:能力 > 成本
3️⃣ 垂直整合不是万能,AI 的机会在“长尾”
过去我们迷信:
“模型 + 应用一体化 = 王炸”
但现实正在打脸。
在 To B 领域:
- 最好的模型 × 最好的应用
- 往往 优于 一个“什么都做”的团队
原因只有一个:
做模型,和做业务,是两种完全不同的能力
给创业者的关键启示:
- 别贪全
- 别恋战基础模型
- 把精力用在:
“全世界都没人解决,但你最懂的那个小场景”
4️⃣ AI 真正的护城河,是 Context(真实语境)
姚顺雨说了一句非常“杀人诛心”的话:
为什么有时候 ChatGPT 不如你老婆懂你?
因为老婆知道:
- 你今天冷不冷
- 刚刚有没有生气
- 现在是不是不想被说教
这就是 Context(上下文)。
? AI 的未来,不是更聪明? 而是更“贴身”
对企业来说,最大的误区是:
- 花大钱买“行业数据”
- 却忽略了自己每天产生的真实业务语境
会议记录客户投诉实时库存一线沟通
这些,才是真正的护城河。
二、法:重塑企业经营的逻辑框架
? 框架一:价值 × 成本 × 时间窗(三角模型)
唐杰老师提出了一个判断Agent和AI应用的三维框架:
价值维度:这个AI应用解决的问题有多大价值?真的能帮到人吗?如果只是"nice to have"而不是"must have",很快就会被淘汰,就像GPTs刚出来时很多简单Agent,最后发现一个prompt就能解决。
成本维度:做这件事的成本有多大?如果调用一个API就能解决,为什么要自己开发?但反过来,如果这件事价值很大,API提供商可能会直接把功能做进基座模型。
时间窗维度:你能比别人(尤其是模型公司)快多久?如果能拉开半年时间窗,迅速满足市场需求,就有机会建立壁垒或找到下一步迭代方向。
如何使用这个框架:
- 评估任何AI项目时,先打分:价值(1-10分)、成本效率(1-10分)、时间领先度(1-10分)
- 只有三个维度都在7分以上才值得大力投入
- 如果价值高但成本也高,要么优化成本,要么确保时间窗足够大
- 如果时间窗很小(比如大模型公司3个月就能复制),要么转向长尾需求,要么准备好快速迭代到下一个版本
? 框架二:预训练 → 强化学习 → 自主学习
从对话中可以清晰看到AI能力提升的三个阶段:
预训练阶段(已走过70-80%):就像给孩子打基础,学语文、数学、常识。这个阶段投入大,但边际收益递减。
强化学习阶段(目前主战场,还有40-50%空间):就像让孩子做习题、考试,在特定任务上精进。这个阶段投入产出比最高。
自主学习阶段(下一个范式):就像孩子学会自学,能根据环境反馈自己成长。这是未来3年的主战场。
如何应用:
- 如果你用AI:现阶段重点关注强化学习阶段的产品(如各种专业Agent),性价比最高。不要等"完美的AGI",那还需要时间。
- 如果你做AI:预训练已经是红海,除非你有独特数据或算法优势;强化学习是蓝海,找准一个垂直领域深耕;自主学习是未来,但要做好长期投入准备。
- 判断信号:姚顺雨说2025年已经看到自主学习信号(Cursor每几小时用新数据训练,Claude Code用自己写的代码优化自己),2026年可能看到更明显突破。关键是要定义清楚"什么样的表现证明自主学习成功了"。
? 框架三:环境 × 模型 × 数据的正向闭环
这是几位嘉宾反复强调但容易被忽视的框架:AI的进步不只靠更大的模型,更靠"模型-环境-数据"的正向循环。
姚顺雨以腾讯为例:作为10万人的公司,有真实的生产场景,可以捕获真实世界的数据,而不只是依赖标注公司。这是创业公司很难复制的优势。
林俊旸提到阿里的思考:AI for Science要真正有用,不只是算法突破,还要能指挥机器人做实验,形成"AI设计实验→机器人执行→数据反馈→AI优化"的闭环。
如何建立你的闭环:
- 小企业/创业者:聚焦一个足够窄的场景(如某个细分行业的特定任务),在这个小闭环里快速迭代。不要贪大求全。
- 中大企业:利用自己的业务场景作为"练兵场"。比如电商公司用AI优化客服,数据反馈又能训练模型,形成飞轮。
- 关键指标:数据获取成本、数据-模型-应用的迭代周期、每次迭代的效果提升。周期越短、提升越明显,闭环越健康。
? 框架四:长尾价值,而不是头部需求
林俊旸提出了一个深刻洞察:AGI最大的魅力在于解决长尾问题——那些在全世界任何角落都找不到解决方案,但AI却能帮你搞定的问题。
这颠覆了传统的"二八定律"。过去我们做推荐系统、做产品,都是服务头部需求(20%的用户贡献80%的价值)。但AI时代,真正的机会可能在那80%的长尾需求——每个需求很小众,但加起来市场巨大,而且几乎没有竞争。
如何挖掘长尾价值:
- 需求发现:不要只看行业报告里的"主流需求",多跟用户深聊,记录那些他们"到处找不到解决方案"的痛点。
- AI适配性测试:长尾需求的特点是"没有标准答案",正好适合AI的生成能力。测试一下现有AI工具能解决到什么程度。
- 快速验证:长尾需求单个价值小,要快速验证。不要花6个月开发,先用现有工具+人工服务验证需求真实性,再决定是否投入开发。
? 框架五:记忆与个性化,从工具到伙伴
姚顺雨举了个生动的例子:"我今天该吃什么"这个问题,要回答好不需要更大的模型或更强的搜索,而需要更多的上下文(Context)——知道你今天很冷想吃暖和的、知道你在哪个区域活动、知道你老婆在另一个地方吃什么...
这揭示了下一阶段To C AI的核心:从无状态工具变成有记忆的伙伴。
如何应用记忆框架:
- 数据收集:合规前提下,记录用户的偏好、历史行为、上下文信息。不只是显性反馈(点赞、收藏),更要捕捉隐性信号(停留时长、修改次数)。
- 记忆分层:短期记忆(当次对话)、中期记忆(近期偏好)、长期记忆(人设画像)。不同层级用不同存储和调用策略。
- 临界点设计:林俊旸说得好,"每次叫一遍你名字不代表聪明"。要设计记忆的涌现时刻——在某个临界点,AI基于记忆的反应让用户觉得"它真的懂我"。这需要产品设计而不只是技术。
三、术:可马上执行的实践策略
✅ 1. 用“三问法”选 AI 工具
面对市场上几十种AI模型和工具,很多管理者不知道怎么选。基于嘉宾们的讨论,这里有一个简单实用的"三问法":
第一问:我的场景是To B还是To C?
- To C场景:优先考虑响应速度、用户体验、成本控制。不一定要最强模型,能解决80%问题的中等模型+好的产品设计可能更合适。推荐:豆包、Kimi、文心一言等国产模型。
- To B场景:优先考虑准确率和可靠性,宁可多花钱用最强模型。一个任务失败的成本可能远超工具成本。推荐:Claude(如果能用)、GPT-4、国内做To B优化的模型。
第二问:我需要通用能力还是专业能力?
- 通用任务(写邮件、头脑风暴、信息整理):用通用模型即可,不需要定制。
- 专业任务(代码生成、法律分析、医疗咨询):找垂直领域优化过的模型或应用,效果会好很多。比如Coding用智谱、医疗用专门的医疗AI。
第三问:我的数据敏感度如何?
- 高敏感(客户隐私、商业机密):优先选择支持私有化部署的开源模型(如DeepSeek、Qwen),或使用API时确保数据不被训练。
- 低敏感:可以放心用云端API,通常效果更好、成本更低。
本周就做:列出你团队最常用AI的3个场景,用这三问法重新评估工具选择。可能会发现有些地方用错了工具,有些地方根本没用上AI。
✅ 2. 启动企业内部 AI 教育计划
姚顺雨强烈建议:"今天中国能做的最有意义的事是教育,教育大家怎么更好地使用AI工具。"这不是客套话,而是血淋淋的现实——未来不是AI替代人类,而是会用AI的人替代不会用AI的人。
三步走教育计划:
第一步(第1周):全员体验
- 给每个员工开通一个AI工具账号(可以从免费版开始)
- 布置作业:用AI完成一个日常工作任务,记录过程和感受
- 组织分享会:让用得好的人分享经验
第二步(第2-4周):场景化培训
- 按岗位分组:销售、设计、开发、运营等
- 每组找3-5个高频使用场景,制作"AI使用手册"
- 关键:不是教AI原理,而是教"怎么提问能得到想要的答案"
第三步(持续进行):建立内部专家网络
- 每个部门指定1-2个"AI先锋",他们优先试用新工具
- 每月一次"AI时刻"分享会,展示最佳实践
- 建立内部问答社区,遇到AI相关问题随时求助
衡量指标:3个月后,至少50%员工每天使用AI工具;6个月后,每人每天至少节省30分钟。
✅ 3. 建立一个“小闭环”试验场
不要等条件完美再开始,从一个最小闭环开始:
步骤1:选择试点场景(标准:高频+可量化+有数据)
- 例子:客服部门的常见问题回复、销售部门的邮件撰写、开发部门的代码审查
步骤2:设计数据捕获机制(关键:不增加员工负担)
- 使用AI处理后,让用户简单打分(满意/不满意)
- 记录修改次数和修改内容
- 追踪最终结果(客户满意度、成交率、Bug数等)
步骤3:快速迭代(周期:2周一次)
- 分析数据,找出AI表现差的case
- 调整prompt或切换工具
- 再次测试,对比效果
步骤4:建立案例库
- 把表现好的prompt和场景沉淀下来
- 标准化流程,推广到更多团队
- 不断扩大闭环范围
现在就开始:本周选定一个试点场景,拉一个3-5人小组,用最简单的方式(甚至Excel表格)开始记录数据。不要等完美的系统,先把流程跑起来。
✅ 4. 推出 AI 时代的「20% 探索时间」
借鉴Google的"20%时间"理念,但针对AI时代调整:
具体做法:
- 允许团队中10-20%的时间用于探索"可能失败但值得尝试"的AI应用
- 关键规则:必须分享学习过程,无论成败
- 每季度一次"探索成果展示",最佳探索有奖励
探索方向建议:
- 新工具试用:市场上新出的AI工具,有人试用并评估
- 跨界应用:把其他行业的AI应用移植到自己行业
- 范式探索:尝试AI Agent、AI自主学习等前沿概念
- 长尾需求:那些"一直想做但没时间做"的小众需求
防止失控:
- 设定资源上限(时间+预算)
- 要求每周简报,及时止损
- 明确"探索成功"的定义(不一定要商业化,验证可行性就算成功)
本月行动:下次团队会议提出这个机制,征集第一批探索项目,选3-5个批准启动。
✅ 5. 设计你的 Agent 战略路线图
基于唐杰老师的三维框架,设计你的Agent应用路线图:
阶段1:工具型Agent(现在就做)
- 特点:目标明确、人类定义、单次任务
- 例子:文档总结、数据分析、代码生成
- 部署建议:选择成熟工具(如智谱AI、Kimi),集成到现有流程
阶段2:协作型Agent(3-6个月)
- 特点:多轮交互、半自主规划、人机协作
- 例子:营销活动策划助手、技术调研助手
- 部署建议:基于API构建轻量级应用,focus on用户体验
阶段3:自主型Agent(6-12个月,视技术成熟度)
- 特点:自主目标、自主规划、长时间运行
- 例子:持续监控并优化广告投放、自动化测试并修复Bug
- 部署建议:小范围试点,严格监控,逐步放开自主权限
风险控制:
- 所有Agent都要有"紧急制动"机制
- 涉及资金、对外沟通的决策必须人类审核
- 定期审计Agent的行为日志
本季度目标:部署至少1个工具型Agent,让至少30%团队成员每天使用。
四、读完就行动:你的7天AI转型启动计划
把上面的"道法术"整合成一个可执行的一周计划:
Day 1:认知升级
- 管理层会议:分享本文核心观点
- 讨论:我们在哪个阶段?差距在哪?
- 决策:未来3个月AI转型的首要目标
Day 2:现状盘点
- 调研:团队目前AI工具使用情况
- 列表:所有可以用AI优化的工作场景
- 优先级排序(用价值-成本-时间窗框架)
Day 3:工具选择
- 用"三问法"为前3个优先场景选工具
- 申请账号、开通权限
- 指定每个场景的负责人
Day 4:培训启动
- 组织半天AI使用培训
- 发放场景化使用手册
- 布置第一周作业
Day 5:试点启动
- 启动第一个"小闭环"试验
- 设计数据收集表格
- 第一次使用,记录问题
Day 6:探索机制
- 宣布"20%探索时间"政策
- 征集探索项目提案
- 选定第一批试点
Day 7:复盘规划
- 总结一周进展
- 调整下周计划
- 设定第一个月里程碑
结语:你不需要成为 OpenAI
四位嘉宾在最后,其实给了一个非常现实的答案:
中国会不会出现下一个 OpenAI?不确定。
但可以确定的是:
AI 时代,普通企业和聪明企业的差距,会被无限放大。
你不需要:
- 自研大模型
- 砸百亿算力
你只需要三件事:
1️⃣ 认知升级(道)2️⃣ 框架决策(法)3️⃣ 持续小步快跑(术)
最重要的一句:
不要等完美工具,不要等完美时机,现在就开始。
附录:AGI-Next【圆桌对话】实录整理

1、关于模型分化的讨论
主持人问题: 硅谷公司明显在分化,Anthropic专注企业、Coding和Agent,中国模型会分化成哪些方向?
姚顺雨(腾讯):
- To C和To B的分化:ChatGPT一年来用户感受差别不大,但Coding已在重塑行业。To C大部分时候不需要太强智能,更像搜索引擎加强版;To B场景下智能越高代表生产力越高,越值钱。
- 强弱模型的分化:在To B市场,强模型和弱模型分化会越来越明显。年薪20万美元的工程师,强模型能做对8-9个任务,弱模型只能做对5-6个,且不知道哪些会错,需要额外精力监控,所以愿意付溢价用最好的模型。
- 垂直整合vs分层的分化:To C领域垂直整合仍成立(ChatGPT、豆包模型与产品强耦合),但To B领域模型在变得越来越强,会有很多应用层产品使用好的模型,分层趋势明显。
- 腾讯的方向:To C基因更强,思考如何让AI给用户提供更多价值,核心是提供更多Context(上下文)。To B方面,作为大公司有各种应用场景,能捕捉真实世界数据,而不仅依赖标注商。
林俊旸(阿里云):
- 服务真实问题:无论To B还是To C,核心是把人类世界变得更好。To C也会分化,要明确服务的用户究竟是谁。
- 发现真实机会:通过频繁与客户交流发现机会。美国API厂商基本全是Coding消耗,在中国还没那么大,这是通过客户交流才能Get到的。
- 顺其自然的分化:相信AGI,做AGI该做的事情,分化是自然发生的。
杨强(教授):
- 学术界和工业界的分化:工业界领头狂奔,学术界是观望者。就像天体物理学先有伽利略观测,后有牛顿理论。现在大模型进入稳态,学术界应该跟上。
- 学术界要解决的问题:智能上界在哪里?给定资源,能做到多好?资源如何分配在训练和推理上?记忆如何帮助推理?会不会记太多噪音反而干扰推理?
- 哥德尔不完备定理启示:大模型不能自证清白,必定有幻觉无法消灭。多少资源能换取多少幻觉降低?这是科学问题,类似经济学的风险收益平衡。
- 持续学习问题:多个Agent串联,能力会指数下降。人类通过睡眠清理噪音,AI是否需要类似机制?这孕育着新的计算模式。
唐杰(智谱):
- 回到本质问题:2023年做Chat时,预判会替代搜索,但今天谷歌自己革命了搜索。DeepSeek出来后,基座模型这一仗已经结束。
- 下一仗是什么:让AI真正做一件事情。经过团队长时间争论,把所有精力放在了Coding上。
- Best的重要性:不只追求通用能力,还要根据资源禀赋把擅长的点做到极致。
2、关于下一个范式(自主学习)的讨论
主持人问题: 预训练走了3年达到七八成收益,强化学习成为共识还有四五成空间,下一个范式会是什么?2026年能看到信号吗?
姚顺雨(腾讯):
- 自主学习不是方法论而是任务:每个人对自主学习定义不同。它在什么场景下、基于什么奖励函数去做?聊天越来越个性化是一种自主学习,写代码越来越熟悉环境是一种,探索新科学也是一种。每种挑战和方法论都不一样。
- 已经在发生:ChatGPT在利用用户数据不断优化聊天风格,Claude Code已经写了自己95%的代码在帮助自己变好。这些都是自主学习,只是还局限在特定场景,没让人感觉到巨大威力。
- 更像渐变不是突变:可能受限于各种问题,但这个事情已经在发生。
- 2025年已看到信号:Cursor每几小时用最新用户数据学习,新模型在使用真实环境数据训练。最大问题是想象力——如果2026-2027有新范式,应该用什么任务、什么效果证明它实现了?
- OpenAI概率最大:虽然商业化削弱了创新基因,但仍是最有可能诞生新范式的地方。
林俊旸(阿里云):
- RL潜力还未充分发挥:从实际角度,强化学习还有很多潜力没打出来,全球范围内都存在类似问题。
- 自主学习的两个方向:
- 第一,能否通过吐更多Token变得更强?像O系列那样,干30小时能干出很难的任务。不一定要更新参数,可以用不同技术手段实现。
- 第二,AI的主动性。现在AI需要人类启动,有没有可能自主思考、自己做事?但这引发安全问题——不希望它做不该做的事。
- 主动学习可能先在用户交互上实现:持续理解用户,就像推荐系统那样。但衡量指标是什么还不清楚,这是技术挑战。
- 记忆技术是线性发展:很多突破都是观测问题,技术在线性发展,只是人类感受非常强烈。Memory要到某个临界点,结合记忆就像人一样理解你,人类感受会突然迸发。可能需要一年时间。
杨强(教授):
- 联邦学习视角:多中心协作越来越可能。通用大模型和本地小模型/领域专家模型如何协作?在去中心化状态下,既保护隐私又能有效沟通。
- 开源模式特别好:知识开源、代码开源、模型阶段开源。在医疗、金融场景会越来越多看到这种现象。
唐杰(智谱):
- 对2026年有信心:持续学习、Memory、多模态都有可能出现新范式变革。
- 为什么会产生范式变革:
- 第一,学术界资源改善。去年前年很多老师几乎零卡,现在很多学校有很多卡,硅谷老师也开始做模型架构、持续学习研究。学术界有创新基因和可能性。
- 第二,效率成为瓶颈。投入巨大但efficiency不高。继续Scaling有收益,但收益率下降。花10亿、20亿收益很小就不值得。
- Intelligence Efficiency(智能效率)概念:既要Scaling up获得智能上界提升,更要定义智能效率——用多少投入获得智能增量。如果能用更少投入获得同样增量,这就是瓶颈式创新。
- 2026年一定会有范式发生:我们在努力,希望发生在我们身上,但也不一定。
3、关于Agent战略的讨论
主持人问题: 2026年Agent可能做人类1-2周的工作量,这是创造经济价值的关键一年。对Agent战略、垂直整合、模型公司的Agent机会怎么看?
姚顺雨(腾讯):
- To B已在上升曲线:目前看起来没有变慢趋势。基本不做什么创新,就是老老实实把预训练做大,后训练把真实任务做好,就会越来越聪明,带来越来越大价值。
- To B目标一致:模型智能越高→解决任务越多→收益越大。所有事情都是正向的。
- To C问题:DAU、产品指标和模型智能很多时候不相关甚至相反。
- 刚刚开始:除了模型,还有环境问题、Deployment问题。即使今天模型不再变好,把现有模型部署到各种公司,已能带来10-100倍收益,对GDP产生5-10%影响(现在不到1%)。
- 教育非常重要:人和人差距非常大。不是AI替代人类,而是会用工具的人替代不会用的人。就像电脑出现,会编程的人和用计算尺的人差距巨大。中国最有意义的事是教育大家更好使用AI工具。
林俊旸(阿里云):
- 产品哲学问题:套壳是否未来?更相信"模型即产品",Research可以成为产品经理。
- Agent需要主动学习:要干很长时间,就得在过程中进化,还要自己决定干什么。对模型要求很高,模型就是Agent本身,做基础模型就是在做产品。
- 环境交互的复杂化:现在环境还不够复杂,都是电脑环境。未来AI环境要复杂到真实人类世界,比如指挥机器人做实验,才是真正能做很长时间活的Agent。3-5年会更有意思,要跟具身智能结合。
- 通用Agent的机会:长尾反而更值得关注。AGI的魅力在于解决长尾问题——全世界任何角落都找不到解决方案,但AI能帮你解决。模型公司做通用Agent有优势(遇到问题就训模型、烧卡),但如果创业者是套壳高手且做得比模型公司好,也可以做。
- RL让修问题变容易:以前修问题很难,现在很小的数据点,甚至不需要标注,只要有Query稍微训一训就行,合并也容易。
杨强(教授):
- Agent的四个阶段:
- 目标定义:人为定义 vs 自动定义
- 规划:人定义 vs AI自动定义
- 现在处于初级阶段:目标和规划都由人定义。现在的Agent软件系统是更高级阶段。
- 未来:大模型观察人的工作,把数据使用起来。最后目标和规划都可以由大模型定义,Agent应该是大模型内生的native系统。
唐杰(智谱):
- 决定Agent走势的三个方面:
- 第一,价值:Agent解决的事情有没有价值?价值有多大?真的能帮到人吗?如果只是prompt就能解决,Agent会慢慢死掉(像早期GPTs)。
- 第二,成本:做这事Cost有多大?如果调用API就能解决,但如果事情价值很大,API提供商可能会把它做进基座模型。这是矛盾的。
- 第三,速度/时间窗:能否拉开半年时间窗,迅速满足需求?半年后要么迭代要么接上继续走。
- 在拼速度和时间:代码如果做对了,就会走得更远;失败了半年就没了。智谱在Coding和Agent做了一点点,调用量还不错,是一个方向。
4、关于中国引领全球AI的讨论
主持人问题: 3-5年后,全球最领先AI公司是中国团队的概率有多大?需要哪些关键条件?
姚顺雨(腾讯):
- 概率挺高,很乐观:任何事情一旦被发现,在中国很快能复现并在局部做得更好(制造业、电动车已有先例)。
- 关键条件:
主观因素 - 光刻机能否突破?算力是否成为瓶颈?目前有电力、基础设施优势,主要瓶颈是产能、光刻机、软件生态。 - To B市场能否成熟?能否在国际商业环境竞争?做生产力/To B的模型应用诞生在美国,因为支付意愿更强、文化更好。国内很难,所以都选择出海。 客观因素 - 有没有更多人愿意做冒险的事、前沿探索、新范式突破?一旦范式发生,我们能用很少卡、很高效率局部做得更好。能否引领新范式是今天中国唯一要解决的问题,因为其他方面(商业、产品设计、工程)已经比美国做得更好。
- 研究文化差异:
- 中国更喜欢做安全的事、确定性的事。预训练被证明能做出来就很有信心,但探索长期记忆、持续学习这种不知道怎么做的事比较困难。
- 不只是不愿意创新,更重要是文化积累和整体认知需要时间沉淀。OpenAI 2022年开始做,国内2023年才开始,对事物理解有差异。
- 中国对刷榜、数字看得更重。DeepSeek做得好的一点是没那么关注榜单数字,更注重什么是正确的事、自己能体验出好不好。需要走出榜单束缚,坚持自己觉得正确的过程。
林俊旸(阿里云):
- 概率:20%(已经非常乐观):因为有很多历史积淀原因。
- 中美差异:
- 美国Computer比我们大1-2个数量级,且大量投入到下一代Research。我们捉襟见肘,光交付就占据绝大部分算力。
- 创新发生在有钱人还是穷人手里?穷人不是没机会,富人很浪费卡训了很多没用的东西。穷的话要做算法Infra联合优化,如果很富就没动力做。
- 软硬结合机会:下一代模型和芯片有可能一起做出来。2021年阿里做芯片的人问能否预测三年后模型,需要三年留片时间。当时没催他做,现在很懊悔。这个机会会不会再来?穷则思变,创新机会可能发生在这里。
- 冒险精神在变好:90后、00后冒险精神越来越强。美国人天然冒险精神强(电动车刚出来漏水、会出事故,富豪仍愿意买),中国富豪不会干这事。但今天年轻人冒险精神变好,营商环境也在变好,有可能带来创新。
- 初心很重要:能干这一行就非常不错,做大模型已经很幸运。模型不一定最强也OK,只要为人类社会带来充分价值、帮助人类,就愿意接受。
杨强(教授):
- 回顾互联网发展:一开始从美国开始,中国很快赶上,应用像微信是世界第一。
- AI是技术不是终端产品:中国聪明才智会把产品发挥到极致。
- 更看好To C:百花齐放,集思广益。To B有限制(付费意愿、企业文化),但也在改变。
- Palantir启示:不管AI发展到什么阶段,总能发现好东西应用在企业上。中间有gap用本体方法弥合(迁移学习思想)。通过前端工程师FDE解决。中国AI Native公司应该发展出这样的To B Solution。
- 结论:To C肯定百花齐放,To B也会很快跟上来。
唐杰(智谱):
- 承认差距:中美在做研究,尤其企业界AI Lab,和美国有差距。
- 未来越来越好:90后、00后这一代企业远远好过之前。(开玩笑说:我们这代最不幸,上一代还在工作,下一代已经出来,把我们无缝跳过了)
- 中国的机会:
- 第一,一群聪明人敢做冒险的事:00后、90后这一代愿意冒风险(俊旸、Kimi、顺雨都是)。
- 第二,环境变好:大企业和小企业竞争、创业企业问题、营商环境。如果环境更好,让敢冒险的聪明人有更多时间做创新(比如让俊旸有更多时间做创新而不是交付)——这是政府、国家可以帮忙改善的。
- 第三,能不能坚持:环境永远不会是最好的。我们幸运经历环境从不够好到慢慢变好的时代,我们是经历者,也许是收获最多的人。如果笨笨地坚持,也许走到最后的就是我们。
- 呼吁:把更多资源资金投入到中国AGI行业,有更多算力,让更多AI年轻研究员搓卡。搓个三五年,中国有三五个自己的伊莉亚,这是未来三五年很期待的。
推荐阅读:


