2026年上半年,国家数据局在一系列座谈会和政策文件中释放了一个明确信号:词元(Token)计价已成为数字经济新业态的标志性现象。这一判断的背后,是我国日均词元调用量从2024年初的1000亿飙升至2026年的日均140万亿,两年增长超过千倍;Token调用量占全球比重达36%,连续超越美国。然而,真正值得关注的并非数字的膨胀,而是这一计量工具的出现,正在从底层重构数据价值的评估逻辑——从过去以"数据确权"为核心的静态估值体系,转向以"智能服务消耗"为核心的动态流量兑现体系。对于数据治理从业者而言,这一转变带来的影响远不止于技术层面的算力规划,更在于它重新定义了"什么是可量化的数据价值"。
一、Token何以成为新业态的标志性符号
Token并非新概念。它在自然语言处理领域一直是一个纯技术术语,指将连续文本离散化为神经网络可处理的最小语义单元。但2025年至2026年间的政策演进,让这个词彻底跳出了技术圈层。
2025年4月,国家数据局在第九届数字中国建设峰会上正式发布《全国数据资源调查报告(2025年)》,首次将"词元调用量"纳入官方统计口径。报告披露,2025年全年词元调用量约21100万亿,并明确提出"词元正成为人工智能的新度量衡"。这一表述的政策意义在于:它意味着政府首次以"智能服务的产出单元"而非"数据的物理存储量"来衡量数字经济活动。
此后,一系列政策文件接踵而至。2026年《政府工作报告》部署"打造智能经济新形态";国家数据局在2026年"数据要素×"首场发布会上进一步明确,将探索词元交易等新型数据集交易模式;6月18日,国家数据局组织召开上半年数字经济形势座谈会,会同多部门、多机构研判形势,明确"词元计价、效用付费等业态初显"。从技术参数到政策关键词,Token完成了它的第一次身份跃迁。
值得深思的是,这种跃迁的深层逻辑。过去十年,围绕数据要素市场化的制度建设,核心议题始终是"如何确权"——数据归谁、谁受益、怎么分配。这套框架在数据作为"静态资产"的语境下是自洽的。但当AI大模型成为数字服务的核心交付形态时,"数据价值"不再取决于其存储的静态规模,而取决于它能在模型推理中被调用多少次、产生多少有效的认知输出。Token,正是对这一"动态消耗过程"的标准化计量。
二、Token计价的本质:从"打包卖文件"到"按语义流量计费"
要理解Token计价的意义,不妨先看清传统数据交易的困境。
长期以来,国内数据市场面临三个结构性痛点:价值难定价、收益难分配、交易难标准化。数据具备可复制、非消耗、多主体共享的物理特性,导致传统的"数据包售卖"模式只能给出粗放定价——买的是存储空间,而非数据的实际效用。数据供给方、加工方、应用方各自的价值贡献难以量化,市场因此陷入"劣币驱逐良币":优质数据供给意愿不足,企业习惯于免费获取数据,数据付费文化迟迟难以形成。
Token计价尝试解决的核心问题,恰恰是这个。它的本质是将"按存储量计价"升级为"按语义价值流量计费"——用多少、付多少,按调用效果结算。这与电力市场的逻辑异曲同工:用户不为发电厂的装机容量付费,而为实际消耗的千瓦时付费。
从经济学的角度看,Token的价值形成机制有两个锚点:供给侧的算力成本(决定价格下限)和需求侧的场景兑现(决定价格上限)。在两者之间,模型能力、数据质量、推理效率共同决定单位Token能释放多少有效价值。这意味着,Token的价值不完全由"谁的数据"决定,而更多由"谁的模型能在给定数据上产生更精准的推理结果"决定。
这一逻辑对数据治理的冲击是深远的。传统数据治理的核心假设是:数据是有价值的,治理的目标是保护这种价值——通过确权、安全合规、质量管理来维持数据资产的完整性。但Token经济框架下的假设变了:数据只有在被调用、被消费、被转化为智能输出时才有价值。存储着的、未被模型使用的数据,无论质量多高、确权多清晰,在Token计价的逻辑里都是"沉默资产"。
三、Token计价与三年行动计划的共振
2026年是"数据要素×"三年行动计划的收官之年。从官方披露的成效数据看,计划目标已大幅超额完成:累计发布417个典型案例,覆盖11个行业领域的760个"数据要素×"典型场景指引,提前超额完成"打造300个以上场景"的原定目标。2025年,全国活跃数据总量达1.67ZB,同比增长28.46%;企业数据产品和服务数量同比增长29.29%,交易额同比增长39.8%。
然而,正是在这份亮眼的成绩单面前,Token计价新业态的出现反而揭示出一个深层矛盾:数据交易市场的规模增长,主要靠的是交易量的扩张,而非交易价值的精细化定价。39.8%的交易额增长背后,有多少是真正基于数据质量和使用效果的差异化定价,有多少是因为数据产品数量增加而带来的总量叠加?这个问题的答案,决定了数据要素市场能否从"粗放增长"走向"精细化运营"。
Token计价为这一转型提供了可能的工具。它让数据价值不再是一个模糊的"资产评估"概念,而变成可按次计量的"服务消耗"概念。对于数据治理从业者,这意味着一个重要的认知切换:过去,我们用"数据目录"管理数据的归属和安全;未来,我们可能还需要用"Token消耗日志"来管理数据的效用价值。
这一判断与"数据要素×"三年行动计划的内在逻辑高度吻合。该计划的核心目标是"释放数据要素乘数效应"——即同一份数据能够在多个场景中被反复调用、产生叠加价值。Token的可计量性,恰恰为这种"乘数效应"的精确度量提供了技术基础。
四、数据治理的新命题:如何让沉默资产"开口说话"
从数据治理的实务视角,Token计价新业态至少带来了三层新命题。
第一,数据质量评估标准的重构。传统数据质量评估围绕完整性、一致性、准确性、时效性等维度展开,这些指标反映的是数据"自身的状态",而非数据"被使用后的效果"。Token经济框架下,需要引入"智能服务适配度"这一新维度——给定一个推理任务,数据能否帮助模型以更少的Token消耗达成更高的准确率?这意味着高质量数据不仅要"对",还要"有用";不仅"存在",还要"被高效调用"。
第二,数据价值衡量的动态化。传统数据资产管理建立在"资产估值"的基础上,核心问题是"这份数据值多少钱"。Token计价框架下,核心问题变成了"这份数据在每次被调用时能产生多少有效价值"——这是两个完全不同的度量逻辑。前者是静态快照,后者是动态流量。对于金融机构而言,这意味着数据资产的估值逻辑可能需要从"成本法"或"收益法"之外,引入基于"智能服务贡献度"的第三种评估路径。
第三,数据治理范围的扩展。传统数据治理关注的是结构化数据和半结构化数据的管理。但在大模型推理场景下,训练数据的质量、语料库的覆盖度、提示词工程的效果,都直接影响Token的消耗效率和输出质量。这些过去被视为"AI工程问题"的领域,正在成为数据治理必须覆盖的新边界。
五、结语:让价值在流动中被看见
Token计价新业态的出现,本质上是中国数据要素市场从"建设期"走向"运营期"的一个缩影。三年行动计划的超额完成证明了数据市场的规模扩张能力,而Token计价的出现,则指向了一个更深远的问题:当数据从"资产"变成"服务",我们准备好了吗?
对于数据治理从业者而言,这不是一个技术问题,而是一个认知框架的切换。我们过去花了大量精力确保数据"安全存储、合规使用",但可能忽略了更重要的问题:这些数据有没有被真正用起来,用出价值? Token计价为这个问题提供了一个可量化的参考答案——数据治理的终极目标,不是让数据"躺"在治理框架里,而是让它在智能服务的消耗过程中"开口说话"。
往期推荐:
【行业洞察】金融信息服务数据分类分级指南发布:数据治理从"碎片化"到"统一语言"