
But(李善友语音包),超垂直专家 Agentic 产品,似乎,可能,也许,能活着?

最低订阅价格,20美元/月,折合140元人民币/月。
最高订阅价格,400美元/月。
俘获了全世界16个国家的专业编剧的芳心,退订率18%。
我和梁适之,每周5次腾讯晨间会议。我负责产品,梁适之从0学习增长。
每周平均提交代码200次,发版20次,100%的 ClaudeCode 与 CodeX 完成一切。
Stripe 渠道,因支付宝付款不成功导致的收入损失,约占付款意图的30%,巨大的摩擦。——因为 Stripe 有些情况会跳转到网页打开支付宝,并要求用户输入付款密码,吓走好多用户。
因海外信用卡付款的 Stripe 风控问题导致的损失,更是惨重。

150万行AI生成的代码。0元融资。0张PPT。二人不语,只是一味地提交代码。
从纯血 Seedance 的神奇表现,到梁圣实惠的 DeepSeek4.0 驱动的Agent,Laper 完成了从专业剧作到专业影像的闭环。
以上,是一些数字。
以下,则是关于开发 Laper 期间,我关于 Agentic 的理解、AI视频生成上下游生态的观察,以及一些令人难忘的故事。
算作写在Laper.ai内测的这一天的续篇。给关心 Laper 的朋友。
三个人,杭州的一个午后
我反复想起这样一个午后:我,玉伯,西元,三个人在杭州玉伯公司楼下的咖啡馆聊天。
六个月后,我们竟然做出了三个气质如此相近的产品。



Youmind 、Fatetell、Laper ,分别关注着:
人的全能创作欲。
人的命与运。
以及人的剧作冲动。
三个让投资人一听就头大的命题。哈哈。WTF!
AI务虚三杰,为何没有合影?
六个月后,Youmind 历时两年的打磨,终于发布了1.0版本,Youmind 的桌面端产品也将于近期发布。YouMind 创业两周年的三大收获 ——这篇文章实在是玉伯创业干货的鲜榨浓缩。
而 Fatetell,也发布了一个美得令人绝望的 Brandbook,道自重洋至,慧从往昔来|FateTell Brand Book
另有神奇一幕:
5月,西元和他的命理学事业合伙人小霖(与西元一起负责着 Fatetell Agent 灵魂的塑造)来武汉找我。在我家客厅,对我进行了 Fatetell 同款命理演绎。注意!真正的命理解析不是从“大师!您看,这是我的八字!您给我算算吧!”开始的,而是从自然而然的对话中以静息模式启动。就在谈天说地的期间,不经意、不刻意地,偶尔地,流露一些判断和事项。体感如同 Fatetell 的设计一样。
当天的结果是,我当场就卸载了Tinder和相关软件。第二天开始,改在西边卧室睡觉,直接把主卧废弃。Laper 的营收曲线从那一天开始抬头,真是神奇地要骂脏话了!
——立刻马上将本文切至后台,去 Download Fatetell。您的命与运,远远比对这篇文章的兴趣更加贵重。

AI务虚三杰中,Laper 发展是最慢的。不过,就在苦苦在全球外包平台上找 LaunchVideo 配音演员的时候,火山方舟如降甘霖,发布了豆包音频生成模型 1.0(Seed-Audio 1.0)。
先看VCR:
注意,人声合成,根本不是这个视频的重点...重点是这里面的各种翻页、拉丝声、铃铛声、齿轮声以及一切滴滴答答的粒子小音效,完全由 prompt 驱动实现。
这完全是一个:人声 + 音效 + 环境音混合直出的音频导演模型。
利好有声书。想象一下,小说中与情节相配合的各种飞沙走石、斧钺钩叉声,与人声同 Roll 直出。
血盆大口,吃不停歇
就在我写文章的期间,一件非常具有象征意义的事情在X出现、酝酿、然后火爆起来。它非常契合我接下来要描述的 : 模型厂桌面端产品,正在加速蚕食 Agent 1.0 时代产品的残酷现状。
那就是现任豆包桌面端产品经理@钟二信探索出的:CodeX + tldraw or Excalidraw 无限画布方案。
起初,是一个Demo视频:

很快,它被钟二信做成了CodeX插件,开源。
12小时内,不少人在自己的CodeX里面尝试了它。
所有人都想到了:Lovart

一个插件,装到 CodeX 上,CodeX 就有了 Lovart 同款体验。重要的是,这一切,包括 iamge2 级别的生图,都包含在 CodeX 本身的订阅费当中!
模型厂桌面级产品,像一张张血盆大口。没有吃不掉的,只有还没吃的。CodeX、ClaudeCode,或者最近的扣子桌面端,腾讯的 WorkBuddy,只要推一个版本,无限画布有了,剪辑有了,甚至自媒体 B-roll 制作也有了。你不能指望模型厂的桌面端产品永远只做 Code 和 PPT 吧?

CodeX 中的自媒体 B-roll 制作
要想不被吃,只能和这张嘴,保持一个绝对安全距离。
很长一段时间,关于这个安全距离的共识是:要垂直。虽然垂直意味着市场不大,但不垂直,都没法活。
人们对垂直的最初想象,是 Agent + 老需求。
比如,真格基金领投了 ChatCut,和 Lovart 一样,Agent 1.0 产品:Agent + 剪辑。用与Agent 聊天或口述的方式,来剪辑视频。
那么,看下面这个视频:
如果说 CodeX + tldraw 使 CodeX 自包含了 Lovart
那么 Claude + Palmier,也使其自包含 ChatCut。
包括KimiCode 搭配 Kimi 2.5,一个经典用法是,拖入20个音视频文件,自动识别色彩,镜头,场景结构。直接生产剪映的调色文件,和剪辑草稿。
离模型厂桌面端产品直接干起全能剪辑的日子,还远吗?
Agent + 老需求结合而生的产品,一律都在血盆大口的范围之内。
Agent 1.0 时代,错就错在 :Agent + 老需求,本质上等于,左手Agent,右手一套特殊UI界面。
可现在看来,如果 Agent + 一套特殊UI界面,就能创造壁垒。
那创业就成了送分题。
最要命的是,现在,为产品接入Agent,只需要1小时。而为产品制作特殊 UI,更有 VibeCoding 加持。两边儿都不值钱。
如果两个不值钱的东西,加起来就能值钱。那创业就成了送分题!
这也是AI应用在一级市场变成“猫狗嫌”的核心原因。

不要慌,有希望
介绍 Agentic 2.0 时代。
接下来,介绍一个刚刚融资3000万美元的产品。是一个我心目中具有真正意义上护城河的,离血盆大口十万八千里的 Agentic 产品。
同样的,它的 Agent 不值钱,UI更是廉价,还没我做得好。
但是它改变了一切。
也将是未来很长一段时间,会接连涌现的 Agentic产品的方向。
这要从扭屁股理论说起。
纯想扭屁股理论
任意一个Agent产品,从用户登录后打开主页起,他头顶就有一个倒计时约30秒的时钟,开始走字。30秒之内,你有且仅有一次机会,向用户索要一点点信息。
只能是可怜的一点点,不能要多了。
——99%的用户,在体验 Agent 产品的时候,首次输入 prompt 的长度,不超过15个字。
人们只是想试试。
人们手边上有CodeX,有Claude,有豆包,有ZCode,有扣子….他们愿意试一试你的 Agent,说明他对你的产品已经有了非常“不切实际”的幻想。
他指望CodeX、GPT、Claude(暂时)办不到的事情,你能办到。
而你,99%的情况下,只能拿到15个字。或一张图片。或一个文件。
不管拿到什么,这个Agent,必须立刻忙活起来,越忙越好。
忙得不像样子。哪怕是瞎忙活也好!
全过程,不允许用户再干涉、再干预,也不允许用户打断你的忙活。
“你别动,看我的。”
这个 Agent 要像完全疯了一样。你一碰它,他就开始扭屁股,狂舞。
这就叫做:直接以交付结果作为目的,并立即收取费用的,超级垂类专家 Agentic 产品。
这款最近刚融了3000万美元的真 · 一人公司,它的产品叫 叫 Polsia。
以下,是当我在登录 Polsia 后,输入一个 laper.ai 的网址之后,它长达10分钟的扭屁股全过程。
10分钟内,这个超级垂直专家 Agent,为 laper.ai 这个项目:
- 做了市场调研、确定了企业当前阶段的目标
- 调查了创始人,找到了我的X和其他社交媒体,从而进一步定义了用户邀请邮件的内容和说辞
- 确定了广告投放策略和渠道(注意,离真正投放只差打钱这一步)
- 写好了一个营收监测面板,并部署了这个名为 LaperOS 的系统
- 确定了第一条官方X推文如何发送,如何措辞
- 建立了融资计划
- 安排了合伙人招募计划以及路线图
最后,弹出3天免费试用的订阅弹窗
以上全部,一条龙一气呵成,宛如一场剑舞。
用户盯着电脑。看见内容的血肉开始疯长,表格也好,文件也罢。才知道:哦,原来你可以干这么多事。
以及,哦,原来你封装了这么一大堆专家级、成体系的东西。
再以及,哦,我自己用 CodeX 实现的话会怎样?
1、我得从头学习很多东西。
2、我看你已经服务过那么多初创公司,肯定积累了客户数据,有经验,干得要比我好。
后面,他才有可能删掉这个结果,从头开始,认真使用。
前者叫专家黑箱,后者叫品牌飞轮。
2026年之后,只有专家黑箱 + 品牌飞轮的产品,才有可能活下来。而且,永远不可能被桌面大鲨鱼吃掉。
那么以上这个疯狂表演业务处理能力的 Onboarding 过程,就叫做扭屁股。
直接交付结果
至此,你已经来到了这篇文章的深水区:
Lovart 不负责结果,它搭建了一个面向过程的无限画布工具。用户一打开产品,一个空荡荡的白板。
—— Agent 被动等待,不作为,不扭屁股。
ChatCut 不负责结果,它搭建了一个面向过程的剪辑工具。用户一打开产品,一个空荡荡的剪辑轨道。
—— Agent 被动等待,不作为,不扭屁股。
而Polsia,它直接面向交付而行动。
结果驱动营收的产品,和过程型AI工具产品的区别,就是视频生成模型和大语言模型的区别。
拿 Seedance 举例,它将电能转化为视频结果,输出的一刻,任务就完成了、钱就扣了。用户心甘情愿。不满意,你就抽卡。
而 Deepseek,它将电能转换为智力,而智力本身是一个过程向量,高级的智力,指向高级的过程,但再高级的过程它终究不是结果本身。
以朋友在做的产品举例,让我们进一步描绘 Agentic 产品应有的样子:隆重介绍,婚礼专家 Agentic 产品。
用户输入婚礼信息,产品直接开始扭屁股:
- 确定设计语言,Coding,并直接部署本次婚礼的网站到公网
- 制作漂亮的邀请函,为本次婚礼制定专属logo
- 分配好本次婚礼云端相册服务,供亲友下载当日照片
- 使用刚才制作的专属logo,做好了若干个3D打印模型文件:伴手礼,杯子等
- 按桌号分配好亲属的座位,并制作座位上的姓名牌,可以直接拿去打印
- 联系租车公司,比价,给出最佳选项
- 确定若干个酒店场地的候选,比价,给出同城分析报告
然后,啪,弹出 $999 一次性全包费用。
注意,以上每一步,都可以单独由CodeX完成,没问题。但是以上每一步,都不是结果,都是过程。
无数过程,按照专家经验编排、运行、包装起来的结果,才是 Agentic 2.0 时代的产品所指向的结果。
这都不是重点,重点是:当用户在你的网站上看到你服务过的1000个婚礼案例的时候,他会在0.1秒内放弃自己用CodeX实现全部流程的想法。
因为数据飞轮,就是这个 Agentic 专家的经验飞轮,就是品牌心智本身。它才是 AI 应用有可能可以创造出的护城河。
——从今往后,不能自己“瞎忙活”10分钟以上的 Agentic 产品,一律不允许称呼自己为AI产品了!一律都要被AI产品扫地出门了!因为你的存在只是临时的。
纯想扭屁股理论实践
其实,本来想先放 Laper 是如何扭屁股的,只不过 Laper 0元融资,没有说服力就是了。
但还是想演示一下,看看 Laper 是怎么扭的。
以下,是用户输入一个“直接给我低俗小说的剧本”之后,Laper 长达十分钟的扭屁股全过程。
视频6x加速
- 根据剧作意图,写好大纲
- 确立剧作节拍
- 写好剧本封面
- 创建角色
- 创建场景所需的地点
- 按场次撰写前20场戏
- 为角色生成形象图
大扭特扭,在用户关掉网页之前,尽风骚之能事。
你管他用户满意不满意呢?
只要扭了,用户就有可能满意。不扭,不但绝无满意的可能,还会被CodeX吃掉!
如果不满意,用户知道:我可以改。
但不扭,纯粹是干活不积极,思想有问题。没有扑面而来的 Ownership ...
扭动10分钟,是为了让专业的编剧,迅速见识到剧作专家 Agentic 的大纲优先、节拍辅助、人物关系、自动剧作格式等全部能力。
——这才有一点点可能,让人们以$20刀每月,甚至$100刀每月的价格来订阅Laper。
2026下半年,一切有可能被 CodeX 吃掉的Agent,根本不会再次愚蠢地出现了。
俗话讲,人们学精了。创业者们被吃了快1年了,做一个你吃一个,做一个你吃一个。那是因为共识尚未形成。但以后不会了。人们都不是傻子。
另外补充一句:在扭屁股这方面,开山鼻祖是 Manus,致敬电臀舞王 Manus!
在软件世界还不知道 Agentic 表现力为何物的时候,Manus 早就在用户脸上开启沙箱环境,跳起桑巴舞了。领先行业100年。
只不过它扭得不垂直就是了。垂直不彻底,等于彻底不垂直。
AI软件的未来,或许,属于:垂直型电臀舞王。
例子还不够?
来看看,如果 ChatCut 进化为 Agentic 电臀版,它应该如何介绍自己的产品:

总而言之一句话:
你别动,我来动。
下一个黑泽明,是一位AI原生导演
Laper 推出AI视频能力的原因,非常朴素,也非常忧伤:
朴素在:既然专业编剧都订阅 Laper 了,那么,有哪个编剧,不希望看见自己的人物直接表演给自己看?
忧伤在:我总是想起我向从前的制片人描述我写的剧本桥段,“如果真拍出来绝对牛逼”的委屈场面。现在,在laper,编剧可以直接将剧情,用 VibeFlimmaking 的方式,“拍摄”给制片人、给导演看,并附着在相应的剧本片段附近。将剧本,连带逼真的“实拍”画面,一起分享给团队,就像分享一个 Figma 文件那样简单。
从而,不再受委屈。哪怕,也许,依然,会被被毙掉。但至少被毙掉的不再是纯文字。不再抱有遗憾。
要知道,编剧写剧本的时候,脑海中是实拍画面,不是象形文字。可剧组恰恰要求编剧用词凝练,不要发挥太多。所以编剧如果不是大咖,没有权力在剧本中写气氛、写感受。于是经常词不达意。这样看来,Seedance 这个名字起的真好,真的好。它一定是一个真的热爱影像的人取的名字。
从写下,到看见。从 Write 到 See ,这就是 Laper 被创造的意义。
有人说,AI视频,还远未达到真人影视项目所需的市场生产级别高清,还处于一个非常尴尬的境地,即:小白用不起,导演看不上。
来看看最近两个值得关注的模型进化方向。最近 Seedance2.0 已开始支持 4K 10-bit 高位深原生直出,效果如下:
Seedance 2.0 4k 10-bit 直出
还有人说,即便清晰度够了,AI视频也需要强大的抽卡专家,需要无限画布的终极魔法师,才能保证场景一致性,确保演员站位的空间逻辑等。
那么,来看看即将上线的 Seedance 2.5。
首先,30秒单段原生直出。之前的15秒真的是要了亲命了,我根本没法用在生产环境。要知道,仅针对 laper 场景,好莱坞专业剧本中,1页纸剧本 ≈ 1分钟的戏。之前15秒卡得太碎,难以呈现一次带有复杂演员走位调度的表演。而解放到30秒,意味着,一页纸剧本,围绕着两个片段来接续调度即可。
其次,Seedance 2.5 支持了视频局部片段的编辑、调整。这意味着,不必从头推翻每一个15秒。我一直有一个产品直觉,如果要让我的编剧们必须学会无限画布那一套削尖了脑袋的技能,这产品就完蛋了。太复杂。
Seedance 2.5 之后,抽卡魔法师们,可以开始向着真正的AI导演跃迁:“执导”和“修改”表演片段。而不是“期待”和“许愿”画面。
另外就是模型本身的审美,和支持的参考素材容量,也提升了近一倍。
容量,意味着信息量。信息量,是一直以来禁锢着人类影像表达的一个重要紧箍咒。
以下面这个见证人类历史的石头为例:
30秒里面,压缩着人类100万年的历史,单条直出。
同时,可以做到模拟延时摄影。石头旁边人、事、物,自由地切换着,全程音画同步。
Seedance 2.5 30s 单条直出
这一切的进化,都在催生着:真正的AI原生导演的出现。
我所指的真正的AI原生导演,不是用旧有的剧作思路来创作故事的、仅仅把AI当作降本增效来实现故事的导演。
因为AI原生导演,可以用上面这样30秒压缩百万年的超密度信息视频,来展示我们这代人从未见过和想过的故事——从未想象过的结果,必然有从未想象过的过程来堆砌。
举个例子:《瑞克和莫蒂》这样的故事,很难拍成真人电影。因为每一集几乎都是一部《瞬息全宇宙》,瑞克姥爷,动不动在一集里面打开传送门十几二十次,每一个世界都是别样一番天地。而这种从前要砸下十几二十亿美元经费的高密度特效电影,正是AI视频模型将来大放光彩的领域。
AI原生导演,他们一生中从未在片场工作过,从未面试过演员,从未拿起过导筒。他们甚至可以不懂黑泽明,更不必看过罗曼·波兰斯基或者侯孝贤。
他们可能这辈子都不会建立真实的线下剧组。
Seedance 时刻,和 GPT 时刻不同。它需要一大批工具的涌现和竞争,才能沉淀出阿莱、尼康等著名的“电影机”品牌和全套器材。
帮助AI原生代导演,自由灵活地实现心中的一切。
为了改UI、测试Laper中的胶卷、和轨道等 VibeFlimmaking 理念(VibeFlimmaking 是指无限画布模式的反面,如果无限画布是手工编码,Laper 就是 VibeCoding)。我一边开发 Laper 的视频能力,一边用 Seedance2.0 制作一些小的故事片。
它们在各个平台迅速取得了惊人且可复制的流量。

其实,这些视频的完播率,严重受到我片尾长达十几秒的 Laper 硬广的影响,否则可能播放数据会更好。

laper.ai 的胶卷轨道与VibeFilmmaking
而说到AI视频生成领域的工具:
工具不值钱!
这句话听起来挺2B的,因为视频生成工具LibTV所属的公司,最近刚刚融资3个亿。估值达到25亿美元。冕,赢!
但它依然是面向过程的创作软件。左手Agent,右手复杂UI。
做 Laper 期间,我在武汉,长沙等地调研了几家漫剧、真人剧公司。
他们分为如下几种情况:
摸索期的,用 LibTV 制作。
赚到钱的,老板在自己琢磨VibeCoding。桌面文件夹里,有好几个版本的什么漫剧白金工作流V3.87,什么全能一站式开源无限画布。
赚到大钱的老板,放弃自己VibeCoding了,招聘了很多程序员,程序员也在拉开源仓库,大搞VibeCoding。他们同样在制作公司内部的工作流画布。
LibTV 可以花钱使自身人尽皆知,但是挡不住企业大客户自己开发工作流软件,摆脱工具溢价带来的成本劣势。来看看老板们企业内部折腾出来的东西。和冕相比,只差了正规军味道的投流。但用起来,功能甚至更丰富,更霸道。
——就此打住,咱这 MRR 一万美金的 Laper,就别给人家单月营收 1300多万美元的LibTV提建议了。


最终的一切都关乎品味
感光元器件量产后,数字影像行业百花齐放。
Seedance,将电,转化为影像,与佳能、富士、尼康将光子转化为影像,对于创作者来说,是一样的。随着真实度的差距被更好的 Seedance2.5 磨平,这两个影像生产过程将殊途同归。
那么,接下来,就是大师专家 Agentic 所能处理的事务,也就是剧作一条龙黑箱风味服务 + 数据飞轮与品牌心智:
如果说阿莱是柔和、厚重、胶片感,那么尼康就是真实、清醒、现场感。如果说 RED 是锋利、强烈、大片感,那么佳能就是温暖、亲近、人像感。
如果说索尼是干净、现代、工业感,那么富士,就是色彩、情绪、胶片记忆。
——具有特定风味的电影器材厂商会活下来。具有特殊审美流程控制的AI视频工作流,也可能活下来。
Laper 正在尝试这个路线,成为一种“剧作美学控制下的软件”,献给所有剧作家的Figma + 即梦。
140元每月,完全可以不交,用Word自由地去写剧本。

《我的心好冷》图1

《我的心好冷》图2
但还是有16个国家的编剧们付费了,因为 Laper 控制着剧本工作流的全链路。从大纲,到节拍,从人物小传,到编剧们容易遗忘和搞乱的一切,全部由 Agentic 来管理、驱动。
Laper 的出发点:哪怕AGI来了,剧本也还是要人来写。
一个人,挑选和编排一些光,让光子射在胶卷上,或者让电能转换成视频token。然后把影像播放出来,震撼另一个人的心灵,扰动另一个人的思绪——这个过程,是一种魔法。
难度比任何男追女、女追男都难上一个数量级。
“拍一部电影,打动我。” ——这也许是最后的图灵测试。
AI影像能不能感动人类?完全可以,只要幕后操刀的是另一个人类,这一切就有可能。
接下来,Laper 仍会持续迭代剧作能力,并同时等待和测试 Seedance2.5 的最新能力。以尽快促成专业剧作 + VibeFlimmaking 的时代的到来,以确保AI原生北野武,能够诞生在 Laper,而不是其他地方。
将他稳稳地接住!
技术分享
1、Mastra 框架可以满足绝大多数初创 Agentic 产品的扭屁股需求。
2、Supabase 依旧是出海公司的不二之选,节省心力,统一团队心智战线,节省时间。时间就是钱。
3、VibeCoding的最佳伙伴,纯想的 GEB 系统,用过的都说好,没用过的,普遍都带着偏见:
世界上最牛逼的 VibeCoding System Prompt,凭什么是你赵纯想写出来的?硅谷那帮计算机大神是吃干饭的?
别这样。
放下偏见,提前享受。免费的,又不会害你。
4、如果你的初创公司,实在搞不出能打的UIUX,可以交给我。最近,为了获取巨量的 gpt-image2 的生成积分。纯想卖艺行为,再次启动:帮一个API 中转站的00后哥们,做了一下国际化升级。此人在API中转站热度为0的时候,就开始搭建中转服务了。现在员工20多人。营收相当可怕。我们谈了个巨大的积分包,改造就开始了。
从这样:

搞成了这样:

从这样:

搞成了这样:


像苔藓一样
两人公司,没什么假期可言。反正生活挺单一的,起床就是干。
一杯三倍浓缩,从早晨喝到中午。手卷烟,越抽越有。
中午整点儿高蛋白黑暗料理,晚上弄一套冰浴连招,一天就结束了。


独居久了,有一种生活在宇宙空间站的感觉。
不停地,向全世界的专业编剧发布新版本。直到每位剧作家感到得心应手。
时刻不忘,以扭屁股为本的原则。
坚持贯彻,“你别动,我来动”的核心思想。
深入落实,从写下到看见的企业愿景。帮助编剧做好幕后的繁琐工作。
Laper 是绿色主色调的,其实做UI的人都知道,绿色很难搞。搞不好就成了微信或者航旅纵横了。但是我从小就有个恶趣味,喜欢观察苔藓。
Laper的绿色是鲜嫩的青苔之绿。
苔藓,总是带着谎言。你盯着它,它就装蠢。你不看它,它就偷着疯长。武汉最近热得要命,天上不停地泼水。雨后,就会有苔藓。
Laper 成长过程也像苔藓一样。
沉默地、踏实地。
家人们请进行暴力的转发
点击原文直达laper.ai - web端体验扭屁股


