推广 热搜: 采购方式  滤芯  甲带  气动隔膜泵  减速机  减速机型号  带式称重给煤机  履带  无级变速机  链式给煤机 

AI巨头争锋,Sora模型颠覆行业规则

   日期:2024-02-18 13:17:43     来源:网络整理    作者:本站编辑    评论:0    

CHAOWAIYIN

潮 / 外 / 音

互联海内外 探知科技与创新

在同一天,两个科技巨头同时发布了各自的创新AI技术。OpenAI的文生视频模型Sora再次获得了广泛的赞誉。Sora的出现不仅在AGI视频领域中脱颖而出,还有可能对电影、电视、广告和游戏行业产生深远的影响,改变未来的发展格局。
CWY

谷歌推出Gemini 1.5 Pro,性能卓越

在周四,谷歌突然发布了新一代多模态大模型Gemini 1.5 Pro,迅速超越了与OpenAI的竞争。这是业界迄今为止最强大的大型语言模型,支持最高10,000K Token的上下文,将性能提升到了百万级别,完全超越了OpenAI的GPT-4 Turbo。
百万级别的Token意味着什么?谷歌AI项目负责人杰夫·迪恩(Jeff Dean)解释道,在Gemini 1.5 Pro的支持下,用户可以进行复杂的内容交互,轻松解析整本图书、电影、播客,理解非常长的文档,甚至是数百个文件数十万行的代码库。
谷歌Gemini 1.5 Pro的发布标志着谷歌在与OpenAI的竞争中取得了显著的性能优势。相比之下,OpenAI的GPT-4 Turbo只能处理128k个Token,并且最近出现了性能下降的情况,直到上个月发布了更新才有所改善。
OpenAI并没有让谷歌独占鳌头。在同一天,他们发布了一款名为Sora的人工智能模型,该模型可以仅通过文本生成视频。继文本模型ChatGPT和图片模型Dall-E之后,OpenAI再次颠覆了视频领域。
相较于谷歌Gemini 1.5 Pro基于数据性能的强大优势,Sora凭借其令人惊叹的视觉美学表现,显然更容易给人留下深刻印象,并迅速成为社交网站上的热点话题。
Sora的惊艳之处在于其能够理解用户需求并将其转化为具体创意构思的视频内容。OpenAI展示了多段Sora制作的视频片段,令人惊叹不已。据OpenAI官方博客介绍,Sora不仅能理解用户的需求,还能够将其与现实世界联系起来。

只需输入一段文本,Sora就能够自动生成长达一分钟的高清视频。令人难以置信的是,Sora不仅能够准确把握用户文本中的复杂意思,还能将不同的元素拆分出来,以创造出专业导演、摄像和剪辑作品般的视觉效果。
CWY

AI的进化速度令人惊讶

自从Sora发布以来,网络一片惊叹,其表现甚至超过了Gemini。AI的进化速度确实令人惊讶。要知道,从OpenAI推出ChatGPT开启生成式AI时代的14个月里,我们才刚刚熟悉了文本生成图片的产品。而仅仅半年前,创作的AI图片中还会出现六指人物。然而现在,Sora的视频已经开始让人们感受到现实与虚拟之间的界限变得模糊。
尽管OpenAI的GPT-4 Turbo曾面临性能下降和速度减慢的问题,引发了对生成式AI增长瓶颈的担忧,但Sora的发布消除了人们的疑虑。云计算公司Box的创始人兼CEO列维(Aaron Levie)在Sora发布后表示,“如果有人仍然担心AI的发展速度会放缓,那么这次发布的Sora再次展示了相反的趋势。”
目前,Sora仅向受邀的制作者和安全专家开放测试,目的是发现并解决潜在的安全问题,尚未宣布正式公测的时间安排。考虑到虚假信息充斥互联网的现状,以及DeepFake所带来的道德问题备受关注,一旦像Sora这样以假乱真的视频被滥用,可能会引发严重后果。
在Sora发布几乎同一时间,OpenAI也完成了一项要约售股交易。这次交易并非为了融资以供公司使用,而是允许员工向Thrive Capital牵头的风投机构出售现有股份套现。值得注意的是,作为OpenAI董事会成员,奥特曼自己并不持有公司股票,因此估值飙升对他来说并不能带来巨额财富。
此次交易使OpenAI的整体估值达到了800亿美元,较去年年初的300亿美元增长了两倍多。根据投融资市场调研公司CB Insights的数据,OpenAI已成为全球估值最高的创业公司之一,仅次于字节跳动和SpaceX。
实际上,此次交易本应在去年11月完成,但因奥特曼与董事会之间的冲突风波而被迫搁置。随着奥特曼重新担任OpenAI CEO,投资者再次对这家人工智能巨头投出了信任票。显然,在Sora正式发布之后,OpenAI的估值还将进一步上升。
那么,令人惊叹的文本生视频Sora将会对哪些领域产生冲击?
AGI视频行业无疑是受到最直接冲击的。Sora发布之后,AI视频创业公司Runway的CEO瓦伦祖拉(Cristóbal Valenzuela)在X平台(之前的推特)上简洁地发布了两个字,“Game On.”(竞争开始了)。几个月前,Runway刚刚发布了Gen-2视频模型。而另一家AI视频公司Stability的CEO莫斯塔克(Emad Mostaque)则直接感慨道:“奥特曼真是个魔术师。”
Runway已经成立五年,在AI视频领域处于领先地位,并已获得好莱坞主流片场的使用。去年获得七项奥斯卡大奖的年度影片《瞬息全宇宙》就使用了Runway来制作AI视频。在《瞬息全宇宙》取得巨大成功后,Runway的新一轮融资估值也大幅增长,达到了15亿美元,是一年之前的三倍。
目前,文本生视频领域是最热门的创业领域。过去几个月,随着生成式AI的热潮兴起,涌现出了许多从事文本和图像生成视频的创业公司。A16z的AI投资合伙人摩尔(Justin Moore)列出了他跟踪的20多个文本生视频创业团队,其中就包括了曾经引起网络轰动的创业新贵Pika、Zeroscope等。
去年年底,斯坦福华人毕业生创办的Pika视频一度在中美互联网引起了惊叹。凭借AI视频的出色表现,这家只有四人的创业公司在不到半年的时间里完成了超过5500万美元的三轮融资,估值飙升至2.5亿美元。
现在AI巨头OpenAI直接推出了Sora。无论是视频时长、画面精细度、细节完整性还是多镜头拍摄,Sora都远远超越了这些小创业公司的视频,可以说是毫不费力。虽然AI视频领域仍有巨大的提升和增长潜力,但这些小公司是否具备与OpenAI竞争的能力仍然是一个巨大疑问。
在好莱坞劳资谈判的背景下,Sora的影响力远不止于其他AGI视频初创企业的生存空间,更将重塑整个好莱坞以及电影、电视、广告和游戏行业的未来游戏规则。
好莱坞运用AI技术来制作图片和视频并不是什么新鲜事,从CG(电脑动画)、VR到AI,影视娱乐行业一直是高新技术的先行者。然而,与其他技术不同,AI工具一直被视为困扰好莱坞从业人员的难题。
除了《瞬息全宇宙》采用了Runway的AI视频工具外,去年21世纪福克斯还与IBM沃森合作,利用AI工具为关于AI主题的恐怖片《摩根》制作预告片;而迪士尼旗下的漫威更是完全依赖AI技术制作了《秘密入侵》的开场动画。
当时正值好莱坞演员和编剧工会大罢工期间,生成式AI在影视行业的应用也成为了双方争议的焦点之一。就在谈判进行的过程中,演员和编剧们得知迪士尼漫威新一季的《秘密入侵》已经完全采用了AI技术来打造开场场景。这一消息使得双方的谈判再次陷入了僵局。
为什么影视行业使用AI工具引发争议?业内人士主要担心制片方使用现有素材进行AI训练,频繁使用AI工具生成内容,这可能侵犯创作者版权,未给予足够回报,还可能影响他们的未来工作机会和空间。

去年编剧和演员们通过让行业停摆和自身失业,换来了制片方的暂时让步,对AI工具的使用制定了更多规范。然而,三年后的下一次劳资谈判中,面对性能大幅提升的AI,演员编剧们可能会面临更困难的处境。
声明:本文来自潮外音创作者,内容仅代表作者观点和立场,且不构成任何投资建议,请谨慎对待,如文章/素材有侵权,请联系官方客服处理。

·推荐阅读·


1、
 
打赏
 
更多>同类资讯
0相关评论

推荐图文
推荐资讯
点击排行
Powered By DESTOON