文| 吴俊宇 编辑|谢丽容经历近半年喧嚣后,大模型狂热正在逐渐回归现实。大模型如何商业化正成为行业更关心的问题。今年5月科技部下属的中国科学技术信息研究所发布了《中国人工智能大模型地图研究报告》。该报告显示,截至5月28日,国内10亿级参数规模以上基础大模型至少已发布79个。当大多数大型科技公司都发布了大模型战略之后,字节跳动的大模型策略是什么,外界十分关注。6月末,字节跳动旗下云业务平台火山引擎,发布了大模型服务平台“火山方舟”,面向企业提供模型精调、评测、推理等平台服务(MaaS,即Model-as-a-Service)。火山引擎的官方口径是,将不会推出自己的基础大模型。不过,这并不意味着字节跳动也不做基础大模型。“字节跳动未来如果推出基础大模型,将会是火山引擎客户之一。”7月初,火山引擎总裁谭待提到对大模型市场的几个关键判断。其一,大模型商业化尚在探索期,真正的落地案例今年四季度后才会出现。大模型的参数门槛至少在百亿级别,未来会发展到千亿甚至万亿。目前,部分企业混淆了算法模型、小模型、大模型的应用案例。其二,未来会有少数几个超级通用大模型,但不会只有这几个,同时还会存在众多中等规模大模型和垂类大模型。企业未来使用大模型,可能会是“1+N”模式。“1”是通过自研或深度合作形成1个主力模型。由于成本和场景复杂多元等原因,主力模型之外,还会有N个模型同时应用。其三,经过良好微调训练的模型,特定工作表现会优于通用的基础大模型。很多行业并不需要非常通用的基础大模型。未来大模型的推理开销会远大于训练开销,精调后的模型会拥有更好的性价比。基于上述判断,火山引擎希望搭好模型平台,让买方、卖方能以更低成本交易。这种思路理论上可以降低大模型使用门槛。也意味着智能算力租用率、消耗量会提升——这是云计算商业模式的本质。大模型被认为给云市场带来了新的增长点。2023年中国云市场变化巨大。电信运营商云营收增长均超过100%,互联网云厂商营收增速已经低于10%,所有企业仍处于营业亏损状态。云市场亟待一个新的增长周期。美国企业软件市场有一条判断企业的法则,叫“Rule of 40”。这指的是,一家健康的企业软件公司,营收增速+营业利润率应该超过40%。2022年火山引擎营收增速、营业利润率高于“Rule of 40”指标。火山引擎仍处于发展早期,但正在缩小与头部企业的差距,并期望依靠大模型进一步缩小差距。
今年是字节跳动做云的第三年,承载字节云战略的火山引擎也是中国云市场“最年轻的云”(详情见7月29日报道,《最年轻的云,字节跳动为什么不着急?》)。目前,火山引擎不仅覆盖IaaS、PaaS、SaaS,产品线也已经非常完整。IDC今年4月数据显示,2022年下半年中国公有云(IaaS+PaaS)市场前五强分别为阿里云(31.9%)、华为云(12.1%)、天翼云(10.3%)、腾讯云(9.9%)、亚马逊AWS(8.6%)。火山引擎市场份额暂时在五强之外,但大模型被外界认为是火山引擎缩小差距的机会。在海外市场,谷歌云、Oracle同样在摩拳擦掌,把新一轮AI浪潮视为挑战亚马逊AWS、微软Azure的机会。大模型会带来巨大的算力消耗。在算力之上,大模型还正在降低应用开发门槛,会带来软件生态的变化。这意味着大模型将为云计算市场带来市场增长和竞争变量。不做大模型,更意味着鼓励第三方大模型容易做大生态,带来更大的算力消耗、算力租用。尤其是Oracle,它把智能算力作为差异化打法。Oracle与英伟达结成了战略同盟,不仅在大规模采购GPU算力,而且用低廉的GPU算力价格争夺领先者的市场份额。目前,Oracle Cloud全球市场份额约为2%。2023财年(2022年3月-2023年3月),Oracle的IaaS营收14亿美元,增速高达77%。远超过亚马逊AWS、微软Azure的10%-30%。近两个季度,其他国际云厂商营收增速下滑时,Oracle Cloud营收增速还在提升。火山引擎在中国是最像谷歌云、Oracle这类“挑战者”型企业。作为“挑战者”,火山引擎的打法是搭建模型平台,提升智能算力租用率、消耗量,以此带来云的增长。字节跳动本身就有智能算力的基因。火山引擎的算力、算法、数据也被认为有优势。目前市场判断是,GPU算力资源储备最丰富的就是阿里、字节、腾讯三家公司。字节跳动本身就有抖音、今日头条等业务,其起家靠的就是推荐算法,算法需要依靠大量GPU算力做训练,无论是视频推荐、信息流推荐都需要消耗大量GPU算力。火山引擎背靠字节跳动具备算力优势。算法、数据能力无法直接衡量,但字节跳动的抖音等To C业务依靠算法、数据获得了远超同行的流量和规模。作为国内互联网公司前三强,字节跳动被认为不可小觑。至于大模型服务平台,在谭待看来,更重要的是把平台搭好,让买方和卖方能够以更低成本交易。他说,大模型平台通常会收取两种费用,模型服务费和平台服务费。火山方舟平台相当长时间内将不收服务费,火山引擎还采取了很多手段优化成本,如利用技术优化基础模型的成本。也包括利用云的规模效应,如用错峰、训推一体把提升整体利用率提、降低单位价格。降低大模型使用门槛意味着火山引擎的智能算力租用率、消耗量会提升——这也是云计算这种商业模式的本质。一份启明创投研报显示,亚马逊AWS的AI算力,如果客户全年无休地租用毛利率可达80%,若客户租用率不足50%毛利率将仅为60%,相当于亚马逊AWS的整体毛利率。美国企业软件市场有一条判断企业的法则,叫“Rule of 40”。这指的是,一家健康的企业软件公司,营收增速+营业利润率应该超过40%。这个法则常被用于评估成长期的SaaS企业。谭待表示,火山引擎作为云公司,不能简单套用这个法则。不过,2022年火山引擎的营收增速、营业利润率高于“Rule of 40”指标。公司处于健康的高增长状态,且毛利水平在提升。复盘三年来的节奏和变化,谭待说,应该在成立最初就做IaaS的云服务。火山引擎最大的变化是,在云市场初步站稳了脚跟,市场口碑正在变得更好,“不再会有人把我们混淆成火山视频”。中国的云市场渗透仍然较低,火山引擎还有很大的空间。2022年7月,谭待谈到,组织不要过度设计,“几十亿的盘子不能按照你那几百亿的规模进行设计。”火山引擎的规模在变大,2023年谭待仍然坚持“组织不要过度设计”这个判断。火山引擎正在缩小与云巨头的差距,并期望依靠大模型进一步缩小差距。