《人工智能产业发展报告(2025)》(四)生态支撑:开源成标配、全球AI标准竞合加剧、投资规模扩张、测试体系升级_社会热点_资讯

《人工智能产业发展报告(2025)》(四)生态支撑:开源成标配、全球AI标准竞合加剧、投资规模扩张、测试体系升级

关注我们,了解更多

由中国信通院发布的《人工智能产业发展研究报告(2025年)》探讨了近期人工智能技术创新方向、产业升级重点、行业落地趋势和安全治理进展，展望人工智能发展机遇。本期重点介绍人工智能的生态支撑，限于篇幅后续将分期推出报告内容，回复“人工智能”可获取完整报告。

生态支撑

一

开源成为标配，社区协同演进推动技术普惠

2025年，全球人工智能技术的快速发展与开源生态的繁荣密不可分。我国在受益于全球开源体系的同时，也积极为开源社区做出贡献。开源作为人工智能产业与技术发展的重要引擎，不仅孕育出一批高质量的人工智能项目，还有效促进了上下游产业链的协同与融合，深刻改变了人工智能产业的发展格局。

开源模型创新活跃，国际影响力稳步提升。以深度求索、通义千问等为代表的国产开源模型迅速崛起，技术研究不断突破，打破了闭源模型的垄断格局，为用户提供更具性价比的选择。据ArtificialAnalysis平台数据，国产模型性能稳居全球前列，深度求索、通义千问、智谱、月之暗面等开源模型表现尤为突出，充分印证了国产模型的技术硬实力。截至2025年12月，国产开源大模型全球累计下载量突破100亿次，月下载份额最高占全球的17.1%。本土开源社区模型下载量也从2024年12月的5.8亿次增长至2025年11月的14.4亿次。与此同时，基于国产开源模型进行微调的模型占比，从2024年2月的10%大幅提升至2025年8月的60%。这些趋势一致反映出国产开源模型在全球范围内的接受度和影响力正快速增强。

开源社区协同演进，推动技术普惠发展。一批本土开源社区正在积极推动技术普及与生态建设。例如，魔搭社区面向东南亚提供本地化支持，助力我国开源模型走向国际；焕新社区聚焦“人工智能+行业应用”,开放了78个由央国企发布的行业大模型，促进人工智能技术在实体经济中的规模化落地；魔乐社区围绕国产软硬件全栈适配，已实现上千个模型对国产算力的兼容适配。截至2025年12月，本土开源社区平台已托管模型达40.5万个，与HuggingFace同期托管模型的比例从年初的11%提升至18%,展现出本土开源生态正稳步壮大。

商业模式孕育成型，构建合作共赢生态。模型厂商普遍推行“开源免费+高阶服务收费”的策略，即通过开放基础模型吸引开发者与用户，进而借助技术支持、定制化开发、云服务等增值项目实现商业转化。与此同时，开源模型也拉动了云服务与芯片市场的需求增长。模型厂商积极与芯片厂商、云服务商展开合作，在降低国产芯片应用门槛的同时，共同探索联合运营的新路径。例如，硅基流动、无问芯穹等企业持续优化国产芯片适配能力，通过私有化部署、模型即服务(MaaS)等形式提供解决方案，助推国产算力市场迅速增长。

二

全球AI标准竞合加剧，我国纵深推进体系建设

2025年，人工智能标准从技术规范向价值引领加速演进，成为平衡创新发展与风险防控的关键抓手。全球主要经济体加快人工智能标准战略布局，我国人工智能标准体系建设持续深化，在关键技术、行业应用等领域形成一批重要成果，为人工智能高质量发展高水平安全提供了有力支撑。

全球AI标准战略加速落地，推动治理格局深刻变革。近年来，全球主要经济体加速出台相关战略，试图通过标准化手段引导人工智能技术创新与安全发展。一方面，立足本土实际，形成差异化发展路径。欧盟强调风险防范与法律约束，通过《通用人工智能实践准则》等文件强化合规指引，凸显其规则先行的监管思路。美国倾向于依托市场力量与自愿共识，由私营部门主导标准制定与试点应用。2025年6月，美国将人工智能安全研究所调整为人工智能标准与创新中心(CAISI),职责重点转向推动科学驱动、行业协同的标准制定与风险评估。另一方面，融入全球网络，加速与国际标准接轨。欧洲标准化委员会(CEN)、欧洲电工标准化委员会(CENELEC)与欧洲电信标准化协会(ETSI)三大组织与国际标准化组织ISO、IEC和ITU建立了对应合作关系，并确立了国际标准化优先原则。美国国家标准与技术研究院(NIST)在协调国内标准、参与制定全球标准外，还积极推动其《人工智能风险管理框架》(AI RMF)成为国际标准。

我国纵深推进AI标准体系建设，开放协同生态稳步构建。我国坚持国内统筹与国际对接双规并行，体系化推进人工智能标准体系建设。一是持续强化顶层设计，完善配套举措。2024年6月，工业和信息化部等四部门印发《国家人工智能产业综合标准化体系建设指南(2024版)》,明确了人工智能标准体系结构框架，为赋能产业发展提供了重要指引。二是构建协同互补的标准化组织网络。我国已形成覆盖广泛、分工明确的标准研制力量。国家标准方面，全国数据标准化技术委员会、全国信息技术标准化技术委员会人工智能分技术委员会等围绕人工智能数据、安全治理等热点领域开展标准研制，发布多项重要标准。行业标准层面，工业和信息化部人工智能标准化技术委员会等围绕人工智能软硬协同、智能体、具身智能、安全治理等重点方向加速推进标准制订，由“按批次报送”改进为“随来随审、随时报送”的模式。同时，加强贯标推广和标准应用，不断壮大人工智能标准生态，年度开展60余场标准宣贯、培训和推广活动，累计培训870余名标准化人才。深化跨行业、跨领域协同，与14个标准化组织，7个产业组织建立了联络关系。三是持续推进AI标准“引进来”和“走出去”。2025年3月，国家市场监管总局修订《采用国际标准管理办法》,完善了对ISO、IEC等国际标准的动态追踪与快速转化机制，稳步扩大标准制度型开放。

我国AI标准成果持续涌现，供给能力不断增强。国内层面，2025年以来，工业和信息化部人工智能标准化技术委员会围绕标准研制、生态建设、产业研究形成一系列重要成果。发布了年度标准制定指南及安全治理标准体系建设指南，在广泛调研基础上凝练形成产业界定及测算、大模型评测、高质量数据集、人工智能工程化等十大重点标准方向，与中国通信标准化协会(CCSA)联合推动发布20项标准，年度新增征集176项标准立项建议，完成11项标准报批、25项标准送审稿。国际层面，我国积极参与ITU等国际标准组织工作，多位专家担任ITU-T主席、副主席、报告人等职位。截至目前，我国牵头ITU-T人工智能标准已经发布47项，在研标准63项，覆盖芯片评测、软件框架、工程平台、大模型及重点应用，其中大模型评测、人工智能平台、数字人等标准填补国际标准空白。

三

人工智能受全球资本热捧，投资规模持续扩张

人工智能热潮引发全球资本竞逐，我国非国资机构占据主导。从全球趋势看，人工智能投融资活跃度不断提高。全球人工智能投融资占全行业投融资比例从2023年的8.1%上升至2024年的13.5%,并在2025年二季度跃升至23%。从投融资规模看，我国与美国尚存在量级差距。2025年上半年，美国人工智能投融资金额为381亿美元，同比增长43.6%,我国投融资金额仅为36.7亿美元。从资本属性看，非国资机构投资占主导地位。2025年上半年，我国境内人工智能领域已披露机构投资738笔，其中，非国资机构23(包括民营、外资以及天使投资人)投资539笔，占行业内总投融资笔数的73%。

AI基础层投资热度高，工业等垂直赛道受资本关注。一是基础层(算力、模型与数据)方面，我国境内大模型领域投融资占AI总投融资金额的比例从2023年的31%,上升至2024年的66%,并在2025年上半年达到16%,略低于算力投资。全球来看，2024年至2025年一季度，全球Top10大模型融资事件中，中国有4项，融资的企业分别是智谱AI、月之暗面、百川智能和Minimax。二是行业赋能方面，2023年至2025年上半年间，我国人工智能+工业、人工智能+医疗、人工智能+科研等垂直领域投融资活跃度高。2025年上半年，AI工业、AI医疗、AI科研应用在全国范围内分别获投约10亿人民币、16亿人民币、10亿人民币。三是智能产品方面，我国资本持续加码智能机器人、智能终端、智能网联汽车等前沿产品。2025年上半年，智能机器人、智能终端、智能网联汽车在全国范围内分别获投约25亿人民币、13亿人民币、12亿人民币。

四

基准测试价值日益突出，测试体系随技术演进持续升级

当前，大模型评测体系的构建与模型训练重要性已逐渐趋同。基准测试已进一步深化大模型“建用管”全生命周期多个阶段，主要体现在指引学术研究、指导产品选型、支撑行业应用、辅助监管治理、监测能力变化等方面。可以依托长期、动态化的大模型基准测试构建宏观决策的数据底座，实现产业政策的精准制定与动态优化，如精准量化国内外头部语言大模型在基础能力和推理能力上的表现等。以下图为例，可以观察到虽然国内头部语言大模型在基础能力与国外不相上下，但在推理能力上差距明显，成为两者综合能力差距的主要影响因素之一。

2025年以来，大模型基准测试整体发展趋势表现为：一是测试数据向高难度与场景化升级，以MMLU、GSM8K为代表的传统测试数据集已难以覆盖模型能力边界，Humanity's Last Exam、SWE-Bench Pro等测试数据更侧重真实场景与复杂任务。二是测试方法融合客观量化与主观评估，单一客观评测无法捕捉创造性等复杂特性，LMArena等主观评测结果参考性极强。三是测试工具迈向全流程自动化，利用开源测试工具Evals、OpenCompass.VLMEvalKit等大幅提升测试效率与覆盖率。四是面向模型未来高级能力的测试基准已出现，以WorldScore、FutureX、EvaLearn为代表的针对长期记忆、自主学习、未来预测、社会融合等能力的基准已进行提前布局。五是测试价值延伸至全生命周期风险防控，测试从发布前验证转向贯穿全流程的质量管控。

当前，全球大模型能力评测体系面临多重结构性挑战，主要体现在以下几个方面：一是测试技术落后模型发展，测试理论研究薄弱，仍以“考试”的评估模式为主，在动态环境下进行真实测试的研究刚刚启动；二是高质量测试数据构建困难，需要消耗大量的数据标注及复核成本，AutoEval、AutoCode、Benchagents等合成方法得到数据仍需要人工核验；三是存在榜单作弊的现象，针对模型数据污染检测的方法不成熟，“套壳”作弊检测仍需依赖模型水印。四是自动化质量评估成本高，需要大量专家介入进行主观评估，Prometheus等裁判模型仍存在偏见。五是评测距离实际应用较远，MMLU、AIME等数据集过度集中于通用能力测试，无法真实体现模型在实际应用场景中的表现。

为形成一个全面、公正、科学、规范和客观的大模型测试体系，中国信通院从指标体系、测试方法、测试数据集和测试工具四个维度出发，构建“方升”(FactTesting)大模型基准测试体系，目前已经发展至3.0,发布业界第一个大模型基准测试国际标准《Assessmentcriteria for foundation models Benchmark》,支撑整个大模型测试过程的实施。

综合分析“方升”基准体系的测试结果，可以通过发展速度和能力表现两个维度展现出语言、多模态、智能体、具身智能的关键能力变化趋势。右上象限集中在基础推理、深度研究、场景识别、动作识别等能力，是当前核心优势领域；左上象限涵盖规划决策、具身操作等能力，发展快但能力待提升；左下象限以自主学习、人机交互为代表，仍是大模型当前的能力短板；右下象限包含指令遵循、多语言等维度，能力强但发展平缓。整体呈现出当前大模型的基础能力相对成熟、前沿场景仍需追赶的格局。

此外，围绕大模型安全要求，中国信通院联合30余家企业、科研机构及高校，构建“大模型安全基准测试框架AI Safety Benchmark”,以底线红线、社会伦理、数据安全为核心维度，持续收录100余万条测试数据，80余种攻击方法模板，形成覆盖模型自身安全与内容安全的体系化测试方案。在此基础上，针对大模型特定应用场景和安全需求，中国信通院进一步推出场景化安全风险评估，从大模型在具体场景下应用的幻觉问题、实际危害，评估大模型的安全风险等级，助力大模型的场景化应用安全。