社会热点
LLM行业潜力挖掘不到10%
2025-12-21 18:56
LLM行业潜力挖掘不到10%

LLM行业潜力挖掘不到10%

LLM行业潜力挖掘不到10%

Andrej Karpathy最新发布的2025年LLM年度复盘,直言行业潜力才挖了不到10%

? 核心观点:一种“新型智能”诞生
“既比预期聪明,也比预期笨,但极其有用”
LLM不是“逐渐进化的动物”,而是像被召唤的幽灵,能力分布极不均衡:能解奥数题,却可能被简单问题绕晕。这种“锯齿状智能”正是未来突破的关键

? 六大范式变革
1. RLVR:让AI学会“自己思考”
传统训练三步曲(预训练+SFT+RLHF)被颠覆!
2025年新增RLVR(可验证奖励强化学习),让模型在数学、代码等有明确答案的环境里反复试错,自发练出“推理链”。
效果:模型参数量没咋涨,但解题能力暴增!OpenAI的o3模型就是典型

2. 幽灵vs动物:智能的“锯齿现象”
为什么AI一会儿天才一会儿小白?因为它的优化目标不是全面进化,而是“在特定任务拿高分”。比如为刷榜训练出的模型,benchmark分数爆表,但离真AGI还远。他吐槽:基准测试已失去参考价值

3. Cursor
Cursor爆火揭示了一个趋势:基础模型之上会存在厚厚的应用层!它通过编排多个AI调用、设计上下文工程、加入“自主权滑块”,把通用模型变成垂直领域的专家。争议点:大厂会通吃应用吗?
他认为:垂直机会依然巨大

4. Claude Code:住在你电脑里的AI助手
首个让人信服的Agent形态,关键不是云端算力,而是完全本地化——直接用你电脑里的文件、配置、密钥,像“田螺姑娘”一样贴身协作。对比OpenAI的云端路线,Claude Code更贴合当前AI能力不稳定的现状

5. Vibe Coding:编程门槛归零
2025年用自然语言写程序成为常态,代码变得“免费、可塑、即用即弃”,普通人也能造软件,开发者则能快速试错。他自己用Rust写分词器、临时工具,称这是“权力归于大众”的变革

6. Nano Banana:从聊天框到“AI图形界面”
当前和AI聊天好比80年代用命令行,未来LLM必须用人类喜欢的方式交流:图片、图表、动画甚至网页应用。Nano Banana是雏形,多模态能力深度融合,才是LLM的GUI时代

? 总结与预言
• 潜力挖掘不足10%:现有模型已被玩出花,但创新空间仍巨大
• 未来是“快进步+苦干活”:技术会持续爆发,但落地需大量细致工作
• “系好安全带,这场变革才刚开始!”
发表评论
0评