推广 热搜: 采购方式  甲带  滤芯  带式称重给煤机  气动隔膜泵  减速机型号  无级变速机  链式给煤机  履带  减速机 

AIGC行业研究|水木资本原创

   日期:2026-01-01 17:39:38     来源:网络整理    作者:本站编辑    评论:0    
AIGC行业研究|水木资本原创

2022年11月,智能对话机器人模型ChatGPT上线,引发了火爆的关注。用户可与该AI系统就日常生活,或协助写代码、文案创作、解决具体难题等相对复杂领域进行持续聊天,其回答有序且专业。ChatGPT的连续对话能力、强大的理解力、回答的准确度和创造性使其迅速走红。World Of Engineering数据显示,ChatGPT发布短短两个月时间,用户数便突破1亿。具体而言,ChatGPT能理解并生成文字,属于AIGC(AI-Generated Content,人工智能生产内容)技术应用中的文本生成模态应用模型。

而AIGC则是相对来讲更宏大的范围,不仅包括文本生成,还包括音频生成、图像生成、视频生成、游戏生成、3D生成等。

1

兴起背景

AIGC的兴起源于日益增长的数字化内容供给需求以及深度学习技术的快速突破。一方面技术进步驱动AIGC的可用性不断增强。在人工智能发展初期,虽然对AIGC进行了一些初步尝试,但受限于多种因素,相关算法多基于预先定义的规则或模板,还远远算不上是智能创作内容的程度。近年来,基于深度学习算法的AIGC技术快速迭代,打破了原先模板化、公式化、小范围的局限,可以快速、灵活地生成不同模态的数字化内容。

另一方面,海量需求牵引AIGC应用落地。如今数字经济与实体经济不断加深融合,以及Meta、微软、字节跳动等平台型巨头的数字化场景向元宇宙转型,人类对数字内容总量和丰富程度的整体需求不断提高。数字内容的生产取决于知识水平、想象能力、制造能力;传统内容生产方式受限于人力有限的创意能力,逐渐无法满足消费者对于数字内容的消费需求,供给侧产能矛盾日益显现。

2

核心要素

数据+算法+算力三大核心要素,决定AIGC产出质量。

  • 数据,海量优质的应用场景数据是训练算法精确性关键基础。

  • 算法,神经网络、深度学习等算法是挖掘数据智能的有效方法。与传统机器深度机器学习算法不同,神经网络在学习范式+网络结构上的迭代提升了AI算法的学习能力,未来多模态大模型或为核心趋势,赋能产业空间及实践潜力。

  • 算力,计算机、芯片等载体为AIGC提供基本的计算能力。

在AIGC的发展过程中,算力是支撑,数据是瓶颈,算法迎来突破。算力层,近年来大模型流行,模型参数量迅速膨胀,所需计算资源越来越大,算力是AIGC核心生产要素;而AI芯片全球短缺,美对华芯片制裁升级,我们认为国内短期算力充足,长期仍需要逐步实现AI芯片国产化替代。数据是机器学习的核心,AI发展的瓶颈,数据决定模型质量的上限;大模型训练需要海量且优质数据,AI对数据训练集的消耗量远大于人类数据生产的速度,专业领域、图像视频等数据获取和标注成本也将越来越高,我们认为加速商业化,实现数据反哺是对提高数据量、降成本的重要解决办法。算法层,近年来迎来不少突破,过去NLP领域以RNN及其变体为主,CV领域以CNN及其变体为主,但各有优劣,Transformer架构突破了RNN不能并行计算的限制,较CNN有更好的计算局部特征间的关联等,自2017年开始在NLP领域应用、变种升级,Transformer在多模态的发展和应用将让AI越来越多的向人类推理方式靠近,以实现AGI。AIGC包括文本/音频/图像/视频/代码/3D/数字人/跨膜态生成等,目前文本、音频和图像领域都迎来较大突破,图像生成的突破是Difussion的出现,文本生成的突破则是GPT的出现,AIGC基本采用GAN算法,算法及产品越来越丰富多元,AI因AIGC的蓬勃发展,已开启技术与应用的新篇章。

3

产业链与商业模式分析

目前AIGC的发展格局是科技巨头全面布局,中下游厂商百花齐放。国外主要以微软、谷歌、Meta为主,国内以百度、腾讯、阿里、华为等为主,既拥有充足的算力支撑,又有优秀的人才团队,多年算法、数据积累,在大模型领域的发展及应用具备天然优势。

产业链端,上游除云厂商外,还有光通信厂商、数据服务商、算力相关设备厂商,将较大程度受益于大模型发展带来的更多计算资源和数据需求。中游有商汤、科大讯飞、旷视、拓尔思等企业多年细分领域布局,部分也有一定算力储备,垂直行业细分赛道深耕,相关技术、数据储备丰富。下游主要是受益于AIGC对业务的驱动、降本增效,空间较大,多行业公司均将逐步受益。

在商业模式方面,AIGC商业化初启,产业生态、技术与产品都有待发展完善。小模型在B端已应用多年,大模型商业刚刚开始,目前主要是MaaS,包括大模型厂商自用,实现增量或降本增效;云厂商“MaaS+IaaS”打包输出;替代翻译、美工、原画师、程序员、分析师、设计师等繁琐重复的低端工作等。大模型商业价值闭环未成,国内SaaS生态、付费意识较差,商业落地还需要各行各业共同发展、相互奔赴,共建良好产业生态。

4

应用市场分析

AIGC应用场景中,数字化程度高及内容需求丰富的领域有广阔应用空间。随着AIGC技术快速迭代,其可高效生成不同模态的信息产出(包括文字、音频、视频及跨模态),以真实性、多样性、可控性及综合性等特征,有望帮助企业提高内容生产的效率,以及为其提供更加丰富多元、动态且可交互的内容,或将率先在传媒、电商、影视、娱乐等数字化程度高、内容需求丰富的行业取得重大创新发展。

随着AIGC应用场景的拓展,叠加国内外科技巨头纷纷推出相关产品,如谷歌将推出“ChatGPT竞品”Bard,百度也将推出类ChatGPT产品——文心一言,并将于三月份完成内测并对公众开放,拓展了AIGC的商业化想象空间。Acumen Research and Consulting 预测,2030年,AIGC行业相关市场规模将达到1,100亿美元。

此外,AIGC的快速发展将催生巨大的高性能网络、芯片、训练数据存储和数据传输市场。AIGC的持续商业化落地离不开算力与数据支撑。在算力侧,微软数据显示,GPT-3.5在微软Azure AI超算基础设施上消耗的总算力需7—8个30亿投资规模的数据中心支持运行;2月7日-9日,ChatGPT官网多次出现因为满负荷而无法进入的问题,训练AI所需算力呈指数级增长,AI芯片、高性能网络等基础设施作为算力底座,升级需求愈发明确。在数据侧,ChatGPT等AIGC模型依靠大规模数据进行训练,并将产生海量数据,由此产生快速增长的数据传输需求。

5

发展瓶颈与未来展望

AIGC在内容生成上面临着系列创作瓶颈。一方面,目前实用性较强的ChatGPT也面临着因技术能力有限,给出答案准确性仍需提高,且重复性和对语料库的依赖度较高等问题。答案准确性不高、无意义的主要原因包括:

  • 在强化学习过程中,没找到可使用的数据;

  • 训练模型谨慎度提升,可能拒绝本可正确回答的问题;

  • 监督训练中行为克隆对模型产生误导,导致信息失真。同时,训练数据的偏差和过度修正会导致ChatGPT过度使用某些短语,使答案过度冗长。

  • 此外,仅依赖大规模离线语料进行训练,无法像人类一样基于现有信息进行判断推测,导致ChatGPT算力、训练成本偏高,实时性不够及智能程度不足。

另一方面,AIGC无法避免学习到存有偏见或不道德的答案,也无法明确用户使用目的,人工智能安全和伦理性问题依然存在。例如,学生使用ChatGPT完成考试是否为作弊、ChatGPT生成内容的著作权归属及用于训练算法模型的数据是否侵犯他人版权等问题尚未有统一定论。

当前,部分行业顶尖的AIGC公司已进行商业化落地,但应用场景、行业相对较窄,内容生产效率仍有待提高,主要原因是整体技术仍处在快速成长中。未来,随着关键技术与基础理论不断突破,大算力、大数据、大模型将成为未来重点发展方向,带动自然语言处理、翻译模型、生成算法和数据集等细分要素持续提升,推动产出的内容细节、类型更丰富、质量更高。

相关阅读

公司动态

水木资本获评融资中国“中国早期投资机构TOP50”

上市月余股价翻倍,水木资本Portfolio飞天云动获投资者认可

回报超80倍,水木资本斩获港股元宇宙第一股

水木资本:七载耕耘,风华正茂

行业研究

核电市场分析:东风已来,蓄势待发|水木资本原创

GPT-4技术研究报告

元宇宙第一股,去年挣了2.58亿

中药行业研究|水木资本原创

作者:水木资本
水木资本Tsing Ventures是一家早期直投基金管理公司,专注于投资TMT领域。水木资本亦管理着多支母基金。团队成员主要来自于清华大学、牛津大学等知名高校,拥有较为丰富的投资经验。
优秀项目请发送BP至:bp@tsingcap.com
更多信息请关注水木资本今日头条号与官方网站www.tsingcap.com
实习生简历投递:yaoli@tsingcap.com
 
打赏
 
更多>同类资讯
0相关评论

推荐图文
推荐资讯
点击排行
网站首页  |  关于我们  |  联系方式  |  使用协议  |  版权隐私  |  网站地图  |  排名推广  |  广告服务  |  积分换礼  |  网站留言  |  RSS订阅  |  违规举报  |  皖ICP备20008326号-18
Powered By DESTOON