行研笔记 | 大模型行业学习笔记_社会热点_资讯

行研笔记 | 大模型行业学习笔记

一、行业概览

大模型（Large Models / Foundation Models）是一类基于深度学习技术，在海量数据和大规模算力支持下训练出的通用型神经网络模型。这类模型的特点是在单一训练框架下，通过学习平行化的语言、图像、音频等多种模态数据，能够在多个任务上展现出跨场景、跨任务的推理、理解与生成能力。与传统的人工智能系统相比，大模型不依赖于严格的人为特征工程，而是通过自监督预训练与后续微调、强化学习等步骤，从数据中自动抽取通用模式，使其具备跨任务适应性和多功能性。

这种技术形态的出现，本质上标志着人工智能从“专用功能系统”向“通用能力底座”的转变。传统AI系统通常围绕单一问题或特定任务进行设计，例如语音识别、图像分类或推荐系统，每一类应用都需要单独构建模型并进行针对性优化，模型能力与应用场景高度绑定。而在大模型范式下，模型首先获得广泛的基础认知与生成能力，随后再通过参数微调或提示工程等方式适配具体任务，从而显著降低了新应用开发的门槛。

从行业视角看，大模型的意义并不局限于技术层面的性能提升，而在于其具备类似“基础设施”的属性。它可以像操作系统、云计算平台或互联网协议一样，被不同组织、不同系统反复调用和复用，成为支撑各类智能应用的通用能力底座。正因如此，大模型逐渐从一项前沿技术成果，演变为新一代数字经济体系中的关键基础设施。

进一步而言，大模型正在改变企业和组织构建智能系统的方式。过去，企业若希望引入智能能力，往往需要投入大量成本进行定制化开发；而在大模型体系下，企业更倾向于围绕现有模型能力进行“能力调用”和“场景适配”，将智能能力快速嵌入业务流程。这种变化不仅加快了智能化落地速度，也推动了跨行业、跨场景的智能能力扩散。

二、产业链分析

上游：算力基础设施与基础软件体系

大模型产业链的上游，本质上是算力、数据和基础软件等生产要素的供给端，其成熟度直接决定模型训练规模、迭代速度以及单位成本水平。与传统软件产业不同，大模型对硬件资源和数据资源的依赖程度显著更高，上游在整个产业链中的战略地位更加突出。

（1）算力硬件与智算基础设施

在算力硬件层面，大模型训练与推理仍高度依赖GPU等专用加速芯片。全球范围内，英伟达在高端训练GPU市场中占据主导地位，其产品被广泛用于头部模型的预训练阶段。但在中国市场，受外部环境影响，算力供给呈现出明显的“多路径”特征，国产算力体系的重要性持续提升。

以华为昇腾为代表的国产算力平台，正在通过“芯片—服务器—集群—软件栈”一体化方式参与大模型基础设施建设。昇腾算力已被用于盘古大模型、中国电信“星辰”大模型等项目，并在多地智算中心中实现规模化部署。相较单点性能，国内方案更强调系统协同能力与稳定供给。

同时，寒武纪、壁仞科技、摩尔线程等企业在不同细分方向推进产品落地，主要集中于推理算力及特定行业场景。整体来看，国产算力在通用性和生态成熟度上仍需时间，但在政务、能源、通信等领域已具备可用性基础。

（2）基础软件与工具链

在基础软件层面，国内形成了以“自主框架+开源生态并行”的格局。飞桨（PaddlePaddle）在产业端应用较早，覆盖金融、工业等领域；MindSpore则与昇腾体系深度绑定，服务于盘古模型训练。与此同时，Hugging Face、PyTorch等国际开源工具在国内仍被广泛使用，成为模型研发不可或缺的工程基础。这种“国际开源+本地适配”的模式，在短期内仍将持续。

中游：模型研发、工程化能力与平台交付

中游是大模型产业链中技术与商业模式最为密集的环节，核心任务并不局限于模型训练本身，而在于将模型能力转化为稳定、可控、可复用的产品或服务。

通用模型研发主体国内通用大模型主要由互联网大厂和部分创业公司主导。百度依托搜索、知识图谱和算力积累，推动文心大模型在搜索、智能云等业务中的深度应用；阿里巴巴围绕通义千问，重点布局电商、办公和云计算场景；字节跳动则将模型能力与内容生态和推荐系统相结合。在此之外，智谱AI、百川智能、零一万物等创业公司，以通用模型为起点，强调模型工程效率、API交付能力和行业适配速度。这类企业普遍不再单纯追求参数规模，而是更关注模型在实际场景中的可用性与成本结构。

下游：行业应用与终端落地

大模型下游应用正快速从“新工具”演化为“基础能力层”，同时覆盖日常通用场景与企业生产流程两大主战场。用户侧，高频需求主要集中在检索、写作与学习等通用任务；QuestMobile数据显示，截至2024年12月，AI原生App月活跃用户已突破1.2亿，月人均使用时长133分钟、月人均使用次数49.6次，说明大模型已进入高频使用阶段。企业侧，调用规模在加速上量。财新报道称，2025年中国公有云厂商对外提供的大模型Token调用量全年增长16倍、累计超过2000万亿，反映出大模型正被更多业务系统以API方式接入。腾讯研究院对3570名中国网民调研也显示，受访者使用AIGC的目的集中在文本处理与资料检索，场景主要发生在学习与工作之中。

三、行业发展情况

发展现状

近两年，大模型行业的发展重心已由早期的模型参数竞赛，逐步转向围绕算力基础、数据资源、工程能力与应用落地的系统性竞争。从产业结构看，大模型已不再是单一技术产品，而是深度嵌入数字经济体系，成为推动产业智能化升级的重要通用基础设施。

从国内情况看，中国大模型产业呈现出“能力快速追赶、应用导向突出”的总体特征。

在底层能力方面，国内通用大模型在多语言理解、代码生成、多模态处理等关键指标上与国际领先水平差距持续缩小，但整体更强调可部署性与性价比优势。在应用侧，中国大模型的落地节奏明显快于多数海外市场，已在办公自动化、智能客服、内容生成、政务辅助决策、工业质检等场景形成规模化应用。

算力基础设施是支撑国内大模型发展的关键要素。国家层面持续推进“东数西算”工程，通过全国一体化算力网络建设优化算力布局，提升智能算力供给能力。相关行动计划明确提出，到 2025 年全国算力规模和智能算力占比将进一步提升，为大模型训练和推理提供更稳定、可控的资源保障。

从产业规模看，人工智能已成为中国数字经济的重要组成部分。根据中国信息通信研究院相关公开测算，2024年我国人工智能核心产业规模已超过9000亿元，预计2025年将突破1.2万亿元，大模型作为核心技术形态，正成为资本、企业与地方政府重点布局方向。大模型（生成式AI）正处于“高投入、高增速”的产业扩张期：Gartner预测2025年全球生成式AI支出将达6440亿美元（同比+76.4%），显示企业端与硬件端投入快速放量。从资本与创新投入看，斯坦福HAI《AI Index 2025》指出 2024 年美国私营AI投资1091亿美元，且全球生成式AI私营投资达339亿美元（同比+18.7%），反映资金持续流入基础模型与生态。同时行业“烧钱大头”在算力基础设施：路透社援引麦肯锡测算，为支撑AI增长，到2030年全球数据中心投资需求约5.2万亿美元（另有估算建设成本可达6.7万亿美元）。国内同样呈现高景气：IDC指出2024年中国AI市场规模接近3000亿元人民币、增速超过70%，且2024年生成式AI占中国AI投资18.9%，预计2028年占比提升至30.6%、生成式AI投资规模将超过300亿美元，并预测2028年中国AI总投资规模将突破1000亿美元。

行业风险

（1）技术风险：模型可靠性与系统安全性仍存在不确定性。尽管大模型在通用任务上表现出较强能力，但在复杂推理、事实一致性和长链决策方面仍存在“幻觉”与误判问题。随着模型被嵌入企业核心系统并通过工具调用、智能体协作等方式参与业务流程，其风险已不再局限于内容输出错误，而可能放大为业务中断、决策失误甚至安全事故。

此外，大模型对抗攻击、提示注入、模型越权调用等安全问题尚未完全解决，尤其在开放环境或多模型协同场景下，系统级安全风险显著上升。

（2）数据与隐私风险：合规成本持续上升。大模型高度依赖大规模数据训练和持续微调，但数据来源的合法性、版权归属以及个人信息保护问题日益突出。在跨境业务中，企业还需同时满足不同司法辖区对数据流动、模型透明度和责任归属的要求。欧盟针对通用目的模型提出的系统性风险管理义务，也在客观上提高了企业合规门槛。

（3）商业化风险：高投入与回报周期不匹配。大模型研发和部署具有显著的资本密集特征。算力采购、模型训练、能耗支出以及高端技术人才成本长期处于高位，而企业客户在采购决策中更关注可量化收益和业务稳定性。对于缺乏行业数据沉淀和交付能力的企业而言，单纯依赖模型能力难以形成可持续盈利模式，价格竞争风险较高。

（4）政策与地缘风险：算力与芯片供给不确定性仍存。在全球科技博弈背景下，高端算力资源的获取存在不确定性。路透社援引相关官员信息称，受制于先进制程和供应链条件，2025 年中国先进 AI 芯片产量仍难以完全满足国内需求，这在一定程度上可能推高训练成本并影响模型迭代节奏。

行业壁垒

（1）算力与工程壁垒：全流程能力决定竞争上限。大模型竞争已从“是否能训练模型”转向“是否能稳定、高效、低成本地运行模型”。训练并行策略、推理加速、资源调度、系统运维等工程能力构成显著门槛。具备自有或深度绑定算力资源，并拥有成熟 LLMOps（Large Language Model Operations）体系的企业，更容易形成规模优势。国家层面推进的一体化算力网络，也在强化算力作为战略资源的属性。

（2）数据壁垒：高质量行业数据难以复制。通用数据只能支撑通用能力，真正形成差异化优势的，是长期积累的行业数据、业务流程数据和高质量标注数据。将数据转化为可复用模型能力，还需要检索增强、知识组织和反馈机制的持续投入，这一过程具有明显的时间与经验壁垒。

（3）人才与组织壁垒：复合型能力难以快速搭建。大模型产业不仅需要算法研究人员，还需要系统工程、数据治理、安全合规及行业专家协同。尤其在企业级应用中，产品化能力和交付经验对项目成败具有决定性影响，而相关复合型团队在短期内难以复制。

（4）合规与信任壁垒：进入高价值场景的关键门槛。随着监管趋严，企业在安全评测、风险管理和责任划分方面的能力，正成为能否进入金融、政务等高价值领域的重要前提。中国、欧盟和美国分别通过生成式AI 管理办法、AI Act 配套准则和 AI 风险管理框架，逐步提高行业准入标准，具备治理能力的企业更易获得长期竞争优势。

四、行业重点企业

阿里巴巴（09988.HK / BABA.N）

阿里巴巴是国内最具“基础模型+云基础设施+企业级商业化”一体化能力的大模型厂商之一，在大模型行业中代表了ToB主导型路线。公司以“通义千问（Qwen）大模型体系”为核心，依托阿里云构建从模型训练、推理部署到行业应用的完整闭环，形成“模型即服务（MaaS）”的商业模式。

在技术层面，通义千问覆盖从轻量级模型到超大参数模型的完整序列，并在代码生成、多轮推理、Agent能力和多模态方向持续迭代。模型通过阿里云对外提供API与行业解决方案，重点服务互联网、电商、金融、制造、政务等领域客户，强调稳定性、可控性与私有化部署能力。

在商业化方面，阿里将大模型能力深度嵌入云计算产品体系，通过算力、模型调用、行业解决方案打包收费，商业路径清晰、客户付费意愿强。未来随着企业端AI渗透率提升，阿里在大模型领域更像“基础设施型龙头”，其核心竞争力并非单点模型能力，而是规模化交付与生态黏性。

字节跳动（代表产品：豆包）

字节跳动是国内应用驱动型大模型路线的最具代表性企业。其大模型以“豆包”为主要对外产品形态，背后依托字节自研基础模型体系，在对话、内容生成、多模态理解等方面持续升级。

与阿里偏重ToB不同，字节的大模型战略以ToC与内容生态为核心突破口，将模型能力快速嵌入搜索、内容创作、信息推荐、短视频与工具类产品中，形成高频使用场景和真实用户反馈闭环。这种“模型—产品—数据—再训练”的循环，使其在交互体验、响应速度与成本控制上具备明显优势。

在商业化层面，字节并未急于单独出售模型能力，而是通过广告效率提升、内容生产工具、企业智能营销与API能力逐步释放模型价值，路径更偏向“隐性变现”。其风险在于模型能力的通用性与企业级可信交付仍需时间验证，但在应用规模与用户触达方面具备其他厂商难以复制的优势。

五、行业政策

国家已在大模型与生成式人工智能领域形成较为清晰、连续的国家层面政策与治理框架。国务院于2017年发布《新一代人工智能发展规划》，将类脑智能、智能计算等作为重点方向，提出到2030年我国人工智能总体技术和应用达到世界领先水平，为大模型等通用智能技术奠定长期战略基础。中共中央、国务院于2023年印发《数字中国建设整体布局规划》，明确将人工智能作为数字中国建设的重要支撑技术，强调提升基础模型、通用算法和算力体系能力，推动人工智能与实体经济深度融合。围绕生成式人工智能服务，国家互联网信息办公室、国家发展改革委、教育部、科技部、工业和信息化部、公安部、国家广播电视总局于2023年联合发布《生成式人工智能服务管理暂行办法》，对模型训练数据来源、内容安全、算法备案、未成年人保护等作出明确规定，是当前我国大模型对外提供服务的核心监管依据。在产业与标准层面，工业和信息化部、中央网信办、国家发展改革委、国家标准委于2024年联合印发《国家人工智能产业综合标准化体系建设指南（2024版）》，系统部署包括基础模型在内的人工智能标准体系建设路径，推动技术研发、产品落地与产业协同发展。2025年8月《国务院关于深入实施“人工智能+”行动的意见》特别提到要“提升模型基础能力”。

六、行业发展

从技术发展趋势看，大模型正朝着多模态融合、智能体化和轻量化方向持续演进。模型能力不再局限于文本处理，而是逐步整合图像、语音、视频等多种模态信息，以适应更加复杂的现实应用场景。同时，随着推理和执行能力的增强，大模型正在从“提供建议的工具”转向“能够执行任务的智能助手”。

从产业发展趋势看，生态化竞争将愈发明显。企业不仅需要具备模型研发能力，还需要构建完善的开发者生态、合作伙伴体系和应用生态，以支撑模型能力的持续扩展。与此同时，大模型与具体行业的深度融合将成为常态，其应用将进一步嵌入金融、医疗、制造和公共服务等核心业务流程中。

总体而言，大模型行业仍处于快速演进阶段，其技术路径、商业模式和产业格局尚未完全定型。对于持续关注该行业的学习者而言，与其关注短期技术热点，不如重点观察哪些应用场景真正形成刚性需求，哪些商业模式开始稳定运行，以及哪些企业在体系能力上逐步拉开差距。

参考资料：

1.前瞻产业研究院：《2025年中国大模型行业全景图谱》

2.中商产业研究院：《2025年中国AI大模型产业链图谱研究分析》

3.Grand View Research: Large Language Models Market Size, Industry Report

4.Precedence Research: Large Language Model Market Size, Share and Trends

5.Springer: Large Language Models – An Overview of Foundational Architectures

6.ScienceDirect: Integrative Innovation of Large Language Models in Industries

7.Financial Times: China’s Open-Source AI Is a National Advantage

8.Reuters: Alibaba Launches New Qwen Large Language Model

9.《QuestMobile2024年AIGC应用发展年度报告：AI原生APP三强争霸，AI应用“四大模式”形成，智能体数量超过小程序》

10.腾讯研究院：《中国公众对生成式AI的看法与使用行为｜年度调研》

11.财新网：《信通院：2025年中国公有云大模型调用量增长16倍人工智能核心产业规模超1.2万亿》

12.Gartner. Forecast: Generative AI Spending Worldwide, 2023–2028[R]. 2024.

13.Stanford University, Human-Centered Artificial Intelligence (HAI).AI Index Report 2025[R]. 2025.

14.Reuters. McKinsey estimates on AI-driven data center investment needs[EB/OL]. 2024.

15.International Data Corporation (IDC) China.IDC中国人工智能市场研究及预测[R]. 2024.

16.International Data Corporation (IDC).Worldwide AI and Generative AI Spending Guide[R]. 2024

❊免责声明：部分素材源自网络，版权归原作者所有。如涉侵权，请联系我们处理。

整理人 | 王梓力

编辑 | 王梓力张洁

终审 | 坤凡