当前,人工智能正加速赋能经济社会发展的各个领域,推动实体经济和数字经济深度融合,成为新一轮科技革命和产业变革的核心驱动力。我国数据资源丰富,产业体系完备,应用场景广阔,具备发展人工智能的重要基础。《全国数据资源调查报告(2025年)》(下文称《报告》)显示,2025年全国数据生产总量达52.26泽字节,同比增长27.28%;全国数据存储总量为2.53泽字节,同比增长21.05%;用于人工智能训练和推理的数据总量达199.48艾字节,同比增长42.86%。随着“人工智能+”深入推进,高质量数据供给正从规模扩张转向面向场景应用和价值转化的体系化能力建设,成为支撑人工智能产业高质量发展的关键基石。
一、人工智能驱动数据从规模扩张转向高质量供给
人工智能技术的快速迭代正重塑数据资源的价值导向和发展路径。在信息化发展前期阶段,数据主要服务于业务记录、统计分析、信息查询和流程管理等基础需求。进入大模型和智能体加速落地的新阶段后,数据需支撑模型预训练、场景化推理、多任务执行和动态迭代优化等多重目标。这一转变意味着高质量数据供给的评价标准,已不再单纯以资源规模大小为核心,而是更加注重数据的组织形态是否能够被模型高效理解、灵活调用、可靠验证和持续迭代,实现从“数据资源”到“模型可用资产”的价值跃迁。
智能体技术的普及进一步重构了数据生产和利用的全流程模式。与传统信息系统“用户发起请求-系统被动响应”的运作逻辑不同,数据使用方式从“被动查询”逐步走向“主动协同”。数据既是智能体完成任务的输入要素,也是智能体运行过程中产生新知识、积累新经验、形成新反馈的载体。这种双向互动关系要求高质量数据供给必须更加贴近应用场景和治理需求,在现有数据资源建设成果的基础上,进一步强化动态更新能力、反馈回流机制和闭环优化体系,推动数据供给与人工智能应用形成相互促进的良性循环。
词元调用量的爆发式增长为观察数据价值释放进程提供了全新的量化维度。词元作为大模型处理信息的基本单位,也是人工智能服务被调用、被计量和被商业化的载体。《报告》显示,2025年全年词元调用量约达21100万亿。公开数据显示,我国日均词元调用量已从2024年初的约1000亿增长到2025年底的约100万亿,在2026年3月突破140万亿关口。词元调用量的指数级增长,反映出人工智能应用正在从试点探索走向更高频、更广泛的产业落地,也体现出数据集供给、模型能力提升和应用需求拓展之间正在形成紧密联动的正向循环。
二、以重点行业场景牵引高质量数据集建设新格局
场景需求是高质量数据集建设的重要导向。《报告》显示,2025年我国高质量数据集数量超11万个,总数据量超908拍字节,同比分别增长61.13%和142.58%。不同行业、不同场景下的业务逻辑、风险边界和决策机制存在显著差异,以具体场景需求牵引数据供给体系建设,能够有效提升数据开发利用的针对性,避免低水平重复建设和资源浪费,推动数据资源配置效率最大化。
政务服务具备率先形成高质量数据供给示范场景的先天优势。《报告》显示,2025年公共数据开放数据量和授权运营数据量同比分别增长31.71%、53.96%,公共数据带动各行业数据融合应用的效应正加速显现。政务数据具有权威性高、连续性强等特征,是推进国家治理体系和治理能力现代化的重要基础资源。围绕政策咨询、事项办理、热线分派、基层治理、城市运行和公共安全等典型治理任务,推动政策文本、办件记录、群众诉求、事件处置和结果反馈等多源数据的协同利用,推动公共服务模式从“人找政策”向“政策找人”转变,实现更加主动、高效、便捷的公共服务供给。
实体经济领域是高质量数据集建设的关键应用场景。电力、交通、物流、农业等传统行业积累了海量的设备运行数据、生产工艺数据和场景应用数据,是人工智能技术赋能实体经济的核心切入点。以能源电力行业为例,负荷精准预测、设备智能巡检、故障提前预警和源网荷储协同调度等典型场景,对实时运行数据、设备状态数据、气象环境数据和历史处置数据的质量都提出了极高要求。围绕具体任务建设行业专题数据集,有效提升能源系统调度效率和运行安全水平。
三、健全要素转化机制促进数据要素价值释放
一是强化任务牵引的数据集建设机制。围绕政务服务、能源运行、金融风控、交通治理、工业制造、医疗健康等重点领域,建设一批面向人工智能训练与场景应用的专题数据集,明确服务对象、应用任务、更新机制和评测标准。在数据质量评价体系中,除传统完整性、准确性、时效性等指标外,同步纳入模型适配性、场景覆盖率、标注一致性、反馈回流能力等价值导向指标,推动数据供给从一次性交付向动态更新、持续优化转变,以优质数据资产为数据要素价值释放筑牢基础。
二是构建安全可信的数据流通生态。引导数据交易所(中心)、数据流通服务平台企业、数据商等三类市场主体各有侧重、协同发展,形成错位互补的市场格局。依托国家数据基础设施,提升数据发现、供需匹配、授权使用、定价交易的全流程效率;探索人工智能技术与数据流通交易的技术路径和机制设计,进一步降低流通成本、提高交易效率,以高效畅通的流通通道加速数据要素价值释放。
三是培育专业化数据服务产业体系。数据要素价值释放依托覆盖采集、清洗、标注、合成、治理、运营和安全服务的全生命周期专业支撑。加快培育分工清晰、协同高效的专业化数据服务产业体系,加强各环节、各主体间协同创新,全面提升数据资源开发利用的标准化、专业化水平,以成熟产业生态推动人工智能全方位赋能千行百业,为数据要素价值持续释放提供长效保障。
总体来看,我国拥有数据资源规模优势和应用场景丰富的双重优势,具备推动数据资源开发利用与人工智能创新发展互促共进的良好条件。面向下一阶段发展,应加快推动高质量数据集建设与行业场景深度融合,健全要素转化机制、畅通要素流通渠道、完善服务产业生态,全方位促进数据要素价值释放,为数字中国建设和经济社会高质量发展提供坚实支撑。
来源:通信产业网


