
数据截至:2026 年 2 月 23 日 | 覆盖时间窗口:最近 7 天 | 信源:CNN、BBC、NBC News、eWeek、Medium、Reddit、X/Twitter、Google 官方博客等
一、本周核心动态摘要
本周 AI 视频行业的焦点高度集中在一个事件上:ByteDance 的 Seedance 2.0 引爆全球舆论。这款 2 月 12 日发布的模型在过去一周内从技术圈话题迅速升级为好莱坞法律战、中美 AI 竞赛叙事的标志性事件。与此同时,Kling 3.0 的多镜头叙事能力在专业创作者社区中获得了高度认可,Google 的 Project Genie(世界模型)向 Ultra 用户开放,整个行业正在从“单模型比拼”进入“多模型路由+工作流整合”的新阶段。
二、关键事件时间线
三、重点事件深度分析
1. Seedance 2.0:从技术突破到全球法律风暴
技术层面:Seedance 2.0 的核心差异化在于多模态输入架构。用户可以同时提供最多 12 个文件(图像、视频、音频)作为参考,模型将这些素材融合为一个连贯的场景。它的原生音视频联合生成能力(joint audio-video architecture)在对话和口型同步方面表现突出。在 Cliprise 的 500 条视频横评中,Seedance 1.5 Pro 在“对话/口播”类别以 9.1/10 的得分拿下第一,毫秒级音素-视素对齐精度超过所有竞品。 citation
爆款内容:引爆传播的是一段 Tom Cruise 与 Brad Pitt 在废墟屋顶格斗的视频,物理效果、光影一致性和动作连贯性达到了“电影级”水准。随后用户生成了 Spider-Man、Darth Vader、Baby Yoda、Trump 练功夫、Kanye 在中国皇宫唱中文歌等大量内容,浏览量迅速过亿。 citation
法律冲突:Disney 称 ByteDance 的行为是“对迪士尼 IP 的虚拟抢劫”(virtual smash-and-grab),Paramount 发出停止侵权函,SAG-AFTRA 谴责其“公然侵犯人类创作者权利”。Deadpool 编剧 Rhett Reese 在 X 上写道:“I hate to say it. It‘s likely over for us.” 值得注意的对比是:Disney 最近与 OpenAI 达成了合作协议,允许 Sora 使用 Mickey Mouse 等角色,这意味着版权问题的本质是数据访问权的商业博弈,而非单纯的法律原则。UCLA 教授 Ramesh Srinivasan 指出:“这些协议的核心是谁能获得竞争对手无法获得的数据。” citationcitation
监管动态:中国网信办同期宣布打击未标注 AI 生成内容,处罚超过 13,000 个账号,删除数十万条帖子。但 ChinaTalk 分析指出,各平台之间的执行力度参差不齐,在激烈的商业竞争下,没有平台愿意成为最严格的执法者。ByteDance 已回滚了“仅凭图片自动生成用户语音”的功能,并引入了数字化身验证机制。 citation
2. Kling 3.0:多镜头叙事的结构性突破
快手(Kuaishou)的 Kling 3.0 在本周的多篇专业评测中获得了极高评价,被 Cliprise 称为“2026 年 2 月最大的发布”。其核心突破是多镜头故事板(Multi-Shot Storyboard):在单次生成中产出 3-15 秒、包含最多 6 个镜头切换的视频,且跨镜头保持主体一致性。这在技术上依赖于统一潜空间(unified latent space),解决了此前所有模型都面临的“分段生成、风格漂移”问题。 citation
在 500 条视频横评中,Kling 3.0 在产品展示(8.9/10)、房地产漫游(9.0/10)、社交媒体广告(8.4/10)三个类别拿下第一。原生 4K 分辨率是其独有优势,其他模型目前均无法达到。Reddit 社区的共识是:Kling 在性价比和角色一致性方面已经成为个人项目的首选,正在快速缩小与 Runway 的差距。 citationcitation
3. Google:Project Genie 开放 + Veo 3.1 持续领跑写实 B-Roll
Google 本周有两个值得关注的动作。一是向 AI Ultra 用户开放了 Project Genie,这是基于 Genie 3 的世界模型研究原型,允许用户创建和探索虚拟世界并导出视频。这标志着 Google 在 AI 视频领域的布局从“生成工具”延伸到了“交互式世界模拟”。 citation
二是 Veo 3.1 在横评中继续巩固其在写实类内容上的统治地位。在电影级 B-Roll(9.3/10)和美食类内容(8.8/10)两个类别中排名第一,其体积光、焦散效果和材质渲染精度在盲测中几乎无法与实拍区分。但 Veo 的短板同样明显:最长 8 秒的单次生成时长、封闭的生态系统、以及缺乏多镜头能力。 citation
4. Sora 2 & Runway Gen-4.5:各守一方
Sora 2 Pro 在叙事/角色类内容中以 9.0/10 拿下第一,25 秒的最长单次生成时长赋予了它独特的叙事弧线优势。OpenAI 还推出了专属社交应用,用户可以浏览 AI 视频创作的信息流。但其物理模拟偶尔出现违反直觉的液体行为,产品类视频的几何精度也不够稳定。 citationcitation
Runway Gen-4.5/Gen-4 Turbo 在风格化/动态设计类别中以 8.7/10 独占鳌头,是唯一在非写实内容上明显领先的模型。其 30 秒的生成速度也是所有模型中最快的,适合快速创意迭代。但价格仍然是社区最大的抱怨点,8 秒的时长限制也制约了叙事能力。 citationcitation
四、2026 年 2 月 AI 视频模型能力矩阵
五、行业趋势观察
趋势 1:多模型路由成为生产标准
2026 年的专业创作者已经不再寻找“一个最好的模型”,而是根据任务类型在不同模型之间路由。典型工作流是:用 Runway 做快速原型验证,用 Kling 或 Sora 做正式生产,用 ComfyUI 做大规模角色控制。这种“模型路由”思维正在从少数技术用户扩展到整个创作者生态。 citation
趋势 2:原生音频成为分水岭
2026 年最大的技术突破共识是原生音频生成。Seedance 2.0、Sora 2、Veo 3.1、Kling 3.0 均已支持同步音频(语音、音效、环境音),而 Runway Gen-4.5 和 Pika 2.5 仍需外部音频工具。音频能力正在成为区分“演示工具”和“生产工具”的关键指标。 citationcitation
趋势 3:版权战争进入实质阶段
Seedance 2.0 事件标志着 AI 视频的版权争议从“理论讨论”进入了“法律行动”阶段。Disney 与 OpenAI 的合作协议和对 ByteDance 的停止侵权函形成了鲜明对比,揭示了版权问题的实质:谁能通过商业协议获得优质训练数据,谁就在竞争中占据优势。这场博弈将深刻影响各模型未来的能力上限。
趋势 4:中国 AI 视频军团的集体崛起
从 DeepSeek 到 Seedance 2.0,再到 Kling 3.0,中国 AI 公司在过去 90 天内密集发布了多个前沿模型。CNN 将此定性为中美之间的“AI 太空竞赛”。在 AI 视频领域,中国模型(Kling、Seedance、Hailuo)在性价比、多镜头能力和音频同步方面已经与美国模型(Sora、Veo、Runway)形成了正面竞争格局。
趋势 5:API 聚合平台崛起
FAL.AI 等 API 聚合平台正在成为开发者的首选入口,提供 600+模型的统一接口,单秒成本 0.40。这降低了模型切换成本,加速了“多模型路由”工作流的落地。 citation
六、社区热议焦点(Reddit / X)
Reddit 核心讨论:r/Freepik_AI 上一篇深度横评帖引发了大量讨论,社区共识是 Kling 在角色一致性和性价比上已成为个人项目首选,Runway 仍是预算充足的专业项目的安全选择,Veo 因封闭生态而被诟病。多位用户提到 ComfyUI 作为“认真创作者的后端武器”正在快速普及。 citation
X/Twitter 热度:Seedance 2.0 相关内容本周在 X 上呈现爆发式传播。高互动帖子集中在三个叙事角度:(1) 技术震撼(“Hollywood is officially in alarm mode”);(2) 版权争议(Disney、SAG-AFTRA 的法律行动);(3) 中美竞赛叙事(“China went from copying to leading AI video generation in under a year”)。Intelligence 账号的一条帖子获得 6,300+浏览和 29 个赞,是本周 AI 视频话题中互动最高的推文之一。


