25年全年,我精选的36条硬核AI行业洞察
都是平时自己觉得获益的内容,尽可能复述原意,但不一定是原话。
最近Manus又火了一把,完整听了季逸超的访谈,质量蛮高的,很多观点在我们内部研发时也有类似讨论。所以前6条都是季逸超的。
Manus季逸超:模型 Context 支持到 200K 已经够用了,再往后更关键的是模型Compression Awareness(感知压缩)能力。简单理解,让模型知道它有自己的“备忘本”,把暂时不需要了解的细节存在备忘本中,在后续需要细节的时候还能再取用。我们在内部设计Agent时,也时常讨论这个话题,模型对于自己“上下文有限”是“不自知的”,我们应当想办法(在提示词中说明或者其他方式)让它自知。季逸超的 Compression Awareness 的确是很合理的思路。最简单的方式,无非是给模型提供一个“备忘本”工具,并告诉它该如何使用,更进一步,在模型训练侧可能也得把“备忘本”当做与“搜索”同等重要的工具来看待才行。
Manus季逸超:现在做大模型应用,很像制造业(包括很早之前 肖红在另一档博客中也曾提到 Monica 更像是在做消费电子产品),因为边际成本不会趋近零,模型推理有成本。Manus 追求的不是 DAU,而是 Agentic GPU hours 。一个知道如何用AI运行大量高价值任务的用户,会愿意为产品(本质是交付的结果)持续支付大量费用(可能直接替代传统的助理,用户自身还省了一大笔);这要比大量不知道能用AI干什么的小白用户重要得多。
季逸超举了一个生物学家的应用案例,该用户扔进来一个生物行业的专业文件,一般软件无法读取该文件。Manus 先去研究了一下,这是一个什么样的文件,然后去 GitHub 上面下载了一个相应的开源软件并对这个文件进行了处理。
Manus季逸超:不应该给 Agent 定义角色岗位,比如“设计Agent”、“研发Agent”... 人有局限性,所以才需要分岗位。把 Agent 人格化是一种人的自恋。非常认同,我一直认为“多智能体框架”其实质是一种上下文管理策略,核心解决的还是模型上下文不够的问题。将复杂任务拆解成多个独立的子任务执行。至于一定要将完成这些子任务的Agent命名为“设计Agent”、“研发Agent”只不过是为了让人(特别是普通业务用户)好理解。不过这个问题还有很多细节值得探讨,这里没办法展开了。
Manus季逸超:肖红(Manus CEO)最可贵的特质是,他是一个正常人,没有偏执的毛病,相信常识。业内有很多人是没有乔布斯的命,却得了乔布斯的病。看到这里,让像我们这帮感觉比较 平常和普通 的创业者,内心暖暖的。实在是看不惯网上某些创业者为了博眼球的各种发言和戏剧化的操作。
Manus季逸超:公司内部 Benchmark 可能是是所有 AI 公司唯一的护城河。这里不仅是指模型、产品效果的Benchmark,也包含了对员工的激励方式和公司的目标(谈到抵制 “vibe ARR”,这体现的是公司的 taste)。最近同样备受关注,刚出任腾讯首席AI科学家的姚顺雨曾提出“大模型下半场”的概念,他认为下半场最需要的是寻找好场景和更好的 Benchmark ,只有更好的 Benchmark 才能指引模型的持续提升。
杨植麟在更早的一期播客中也曾提过,AI产品经理的核心工作之一是定义数据集(Benchmark)。
AI产品 Feature 的定义未来将大部分来自 Benchmark 的定义,而非界面交互的定义。
Manus季逸超:关于套壳,壳(shell)这个词其实是一个很高级的词。如果说Monica 是生鱼片(好不好吃核心取决于食材——模型能力),Manus 是水煮鱼。Shell 在计算机领域,指的是一种命令行解释器,它充当用户与操作系统内核之间的交互接口,负责接收并执行用户输入的命令。Apple的核心是设计、定义和营销产品,传统意义上核心的产品制造和组装也并不是自己做。
作为AI产品的上游,模型公司的生态位可能更类似富士康,真正对于各种场景需求的探索以及对模型能力发展方向的定义可能更多来自于应用公司(Again,未来更重要的是真实的需求场景和 Benchmark )。这一点季逸超在访谈中也有提到,各模型公司会非常积极接受Manus提出的模型诉求,他认为更像是所有模型公司在帮自己训模型。
Minimax 闫俊杰:相信长期价值,下注上限高的事情。Manus 张涛:(谈及大模型厂商也做一样的事怎么办)在这样的环境里,做应用的我们反而灵活度更高,可以根据每一个具体任务挑选最合适的模型,甚至精确到「任务步骤」级别,而不是整段任务都用同一个模型。比如:网上搜索信息时,我们用 Gemini,因为它能访问 Google 的搜索指数,检索最强;需要最强推理时,我们用 GPT-5;做后端构建或数据分析时,我们用 Claude,因为它写后端和 Python 的能力最稳。Manus 张涛:很多创业者只会通过结果反向学习,所以他们学到两件事:第一,创始人要坐在沙发上讲英文;第二,背后要有绿色植物,因为视频背景的办公空间公共区后面正好就摆着一排绿植。所以有人学到了要拍视频,有人学到了要做邀请码。但很多时候你的产品连初始用户都没有,你搞邀请码有什么用呢?如果你真想创业,一定要理解事情背后的本质和原因,而不是学表面。一度很反感坐在沙发上,说着英文发布没什么用的AI产品的视频。
交互设计师 Geoffrey Litt 在播客里讲过一个观点,现在很多 AI 工具都在追求极致的自动化(比如 Agent 一键做出一个完整的作品),但他认为这是非常反人性的,完全由 AI 生成的内容,用户很难产生「这是我的作品」的归属感。一个形象的比喻是做陶瓷。如果只是对工匠下指令说「我要个杯子」,这不叫创作,这叫采购。真正的创作是你手摸着泥巴,根据泥巴的反馈实时调整力度和形状。这种 Feedback Loop(实时反馈回路)才是让用户进入心流,感到满意和快乐的关键。马斯克宣布 Grok5 将于 2026 年挑战英雄联盟 S16 冠军战队 T1,并对 Grok5 设置了“只能看屏幕”和“反应速度不超人类”的限制。T1 战队已接受挑战。优秀的Founder应当关注愿景叙事能力,用目标管理引领人才管理,优秀的战略家核心是提出正确且激奋人心的挑战。
乔布斯曾提出:最有权利的人是讲故事的人。1994年夏天,乔布斯在 NeXT 休息室与同事闲聊时提出“Who is the most powerful person in the world?”,并补充“讲故事的人设定一代人的愿景、价值观与议程,而迪士尼垄断了这个领域,我要成为下一个讲故事的人”。
注:乔布斯被赶出苹果后,创立了NeXT,目标打造一款面向高等教育和科研领域的高端电脑。
前智谱 COO 张帆:所有的企业家不要想偷懒,今天在 AI 时代,学习怎么理解 AI,是特别重要的一件事。你不要把它当成一个技术问题。很多企业家会觉得 AI 是技术问题,但我想说,AI 是个业务问题。每一个企业家当仁不让,你要让自己变成公司的 AI 先知。你不可能有别人比你更早了解 AI 跟业务的结合,不可能有供应商比你更早,也不可能有模型厂商比你更早。所以你要比别人更早地理解 AI 和你业务的结合,把它当成战略要素中的必选一环。前智谱 COO 张帆:你要接受 AI 就是有幻ؒ觉。但是,我们应该怎么去驾驭幻觉?就像人今天有幻觉,但依然不影响人能做出很高效的产出。这是两种不一样的思考体系。所以从这个维度上,你要视 AI 为人,而不是视 AI 为代码。Y Combinator 合伙人 Dalton Caldwell:批判“表演式创业”,融资、媒体报道等外部符号不是真实正反馈,只有用户付费、业务增长等真实市场信号才是企业价值的根本验证。旷视CEO、千里科技董事长 印奇:Business model is the best model。Palantir 的 CEO Alex Karp 曾在内部表示,他们过去所有在 Foundry 和 Gotham 上的工作,都是在"等待 LLM(大语言模型)时代的到来"。 Palantir 提供的是一个综合性的数据分析和决策支持平台。Palantir过去,可能是碰巧,将企业内部的业务数据通过本体,构建成了一个清晰且易于模型理解的统一语义层。这可能就正是下一代企业智能系统的雏形。未来的架构,可能是基于企业统一治理的带语义的数据湖,由Agent自主调用底层数据,无缝实现所有专业能力。我们内部正在研发一款 企业统一 Context 平台 产品,欢迎感兴趣的朋友交流。
Hack各个头部 AI 产品的系统提示词(Claude Code, Cluely, Cursor, Devin, Lovable, Manus, NotionAI...):蕴含他们对于场景、模型能力的深度思考。
吴明辉:CUI(语言交互)的一个主要问题是 IO (input-output)效率不够高。大部分知识工作者都有多个大屏,核心就是提高自己与机器的信息传递和交互效率。
Agent可能就不应该追求高 IO 的交互方式,它对标的是数字劳动力,当信任逐渐建立,长期来看,就不需要知道Agent具体是怎么干的,只需要验收结果即可。
AIPPT 赵充:做 C 端产品,要么只打一个人群,要么就是通用产品一个一个人群打。(比如 AIPPT 会专门做党建、各个学校模板)。做 B 端应该也是,即使是通用平台,也可以一个一个行业打,做行业方案。用户更关注技术具体能帮自己做什么。
AIPPT 赵充:首页一个输入框看起来简单,但其实交互门槛很高。加几个按钮是为了提升给用户交付结果的可控性。Plaude 莫子皓观点:关注大模型对智能的处理,而不是对信息的处理能力。比如让AI准确记录会议内容就属于“信息处理”,而如果让AI综合过去50场会议的录音,帮忙给一些公司经营优化建议,则属于利用AI的“智能处理”能力。
Plaude 莫子皓:人才是模型的 Agent。模型比我们牛,它干不了一些事情我们去干,这个事情才合理。所以思考一下除了人问模型问题,是不是考虑模型可以主动问人什么问题。Homebrew 合伙人Hunter Walk:我过去认为,如果你从不用铲屎,最终就会对那些不得不铲屎的人缺乏同理心。我的视角已更新:情况比这更糟。你不仅会对那些真正干这活的人缺乏同理心,还往往会制造更多“屎”,让别人去清理。人生中总会有那么一刻,铲过屎会很有帮助。或许,拿起铁锹永远都不算晚。马斯克:AI 会一直扩展,一直到大部分太阳的能量都被用于计算。扎克伯格:AI 泡沫是很有可能的,但对于 Meta 这样的公司来说,更大的风险是犹豫不决。如果我们最终为 AI 浪费了数千亿美元,显然非常不幸,但我实际上认为错过 AI 的风险更高。对于我们来说,风险不是过于激进,而是不够激进。姜汁汽水:殖民 4.0 时代,科技加速主义时代,殖民思想,人没有科技重要,禁锢人的思想(只能接受到科技巨头想让大家看到的,让大家“脑袋空空),圈养人类。殖民3.0 是金融,殖民2.0 是资源,殖民1.0 是土地朱啸虎:眼镜看上去简单,但做得好非常难。今年有好几个公司都折了,虽然产品定义的很好。对中国创业者来说,做 AI 硬件最重要的是做减法,不是做加法。你加上很多花哨的功能,但交不了货、上不了量,都是空的。要先做减法,保证能大批量发货,这是第一步。AI 时代会不会出现一个独有的新硬件?说实话,这个问题现在没有答案,还太早了。今天要取代手机,还是非常非常难的。你看《黑镜》里做了很多假设,有些东西很有希望,但今天的技术还做不到。比如说一个随身的 AI 硬件,能记录你的一切并帮你分析,今天的电池、存储、联网能力都跟不上,可能还需要 10 年、20 年。大家总是太高估硬件的迭代能力了。我们当年投共享充电宝的时候,很多人都说电池技术很快会进步,充电宝就没需求了。但事实是,人对电量的消耗需求,远远快于电池技术的进步。硬件的迭代速度,即使在中国这么强大的供应链支持下,也需要以 5 到 10 年为单位来计划。AIPPT赵充:AIPPT 打的是内部汇报和交差场景(家长帮做作业、给领导汇报…结构要清晰,字不能太少),Gamma 做的是一对多演讲场景(大图,少字)确实没想过AI做PPT其实是一个还可以进一步细分的场景。当然这也是一门定位的学问。
Youmind玉伯:大模型时代,剪藏就是点赞(以前剪藏了也不看,现在剪藏了可以给 AI 看,以后可以直接问AI ,AI会根据你剪藏的内容来回答这个问题)百川 郭美青:人和 AI 的四种关系,按照认知负载和谁主导这两个维度划分:导学、内观、依附、工具。对应的我添加了各维度典型的应用场景:科研探索、聊天与情感陪伴、推荐和知识学习、效率应用
姚顺雨:成为洛克菲勒和爱因斯坦谁更难?不分高低,分别代表了创新能力和组织管理能力。所以OpenAI定义的AGI五个阶段的最后两个阶段(创新者和管理者)其实是不分先后的。杨植麟:AI 是 Meta science,是人类文明的放大器。杨植麟:RL 之于组织管理:给大家定合适的目标,然后不断迭代目标(因为目标容易被 hack,REWARD HACKING)以及 Review 目标。刘小排:AI 工具就是你自己,不是它能帮你做什么,而是你想做什么,你有能力做什么。重点是使用它的人的能力。忘了谁说的:(大模型是一种有损压缩)有损压缩解决不了事实幻觉,因为事实无法压缩。所以不涉及事实的逻辑和推理是更适合大模型的场景。
? 招:IOS开发、咨询顾问(FDE)、营销负责人、PMO、UIUX实习生...