
郭家堂.公共数据开放与中国绿色全要素生产率:数据要素的视角[J].经济研究,2025,60(02):56-72.
本文来自上海社会科学院的郭家堂。自2010年以来,全球数字经济规模呈指数级扩张,数据要素已渗透至社会生产的各个角落。然而一个令人困惑的现象是,主要发达经济体和重点发展中国家的宏观经济增长速度却普遍放缓。这一现象让经济学界再次聚焦著名的索洛悖论,即计算机虽然无处不在,却唯独没有体现在生产率的统计数据里。针对这一宏大命题,本文另辟蹊径,从数据要素的视角出发,不再局限于传统的GDP增长,而是聚焦于更具可持续性的绿色全要素生产率。在这一背景下,我们不禁要问:公共数据开放作为数据要素释放的关键闸口,到底能不能打破索洛悖论?它又是如何通过减少信息误差和创造新知识的双重机制,重塑中国的绿色发展路径?
针对这一极具现实意义的问题,作者利用中国省级公共数据开放平台逐步上线这一准自然实验,基于城市宏观数据与企业微观数据的详实匹配,展开了深度的量化研究。
这篇文章最大的创新点在于,它突破了以往仅关注经济总量的局限,在理论上重新界定了数据要素的价值,将其拆解为减少信息误差的第一经济价值和创造新知识的第二经济价值。实证结果给出的答案发人深省:索洛之所以提出悖论,可能是因为他忽视了数字技术在突破能源与环境刚性约束方面的巨大潜力。这为我们重新评估数字技术的真实贡献提供了一个全新的视角。
01 引言
党的二十届三中全会提出要让各类先进生产要素向新质生产力集聚,数据作为继土地、劳动力、资本、技术之后的第五大生产要素,其地位日益凸显。但现实中存在一个令人费解的现象:数字经济发展迅猛,增速是实体经济的2.5倍,可全球主要经济体的GDP增速反而在放缓。这种宏观数据与数字繁荣之间的温差,让索洛悖论再次成为焦点。
以往研究多将这一矛盾归结于统计核算的滞后,但本文提出一个全新的视角:问题可能出在评估维度过于单一。如果我们在评估模型中纳入能源消耗和环境污染这两个关键变量,采用绿色全要素生产率这一指标,或许就能精准捕捉到数字技术的真实贡献。这一视角的转换,正是本研究的核心创新所在。
政府掌握着全社会约80%的数据资源。自2012年起,随着各地公共数据开放平台的陆续上线,一场旨在打破信息孤岛、释放数据红利的改革正在重塑经济结构。本文正是基于这一背景,深入探讨公共数据开放释放的海量数据,究竟能否提升中国的绿色全要素生产率。如果这种提升确实存在,它究竟是源于资源配置效率的优化,还是源于颠覆性的技术进步?这正是本文要解答的核心问题。
02 理论框架
为了深入剖析公共数据开放背后的运作机理,文章并没有沿用传统的分析路径,而是构建了一个覆盖社会、城市与产业三个维度的全新理论框架。这一框架最令人耳目一新的地方 ,在于作者创造性地将数据要素的经济价值提炼为两个核心层面。
首先是减少信息误差的价值 。数据本质上是一种信息载体,能有效降低市场交易成本并优化资源配置 。比如在绿色发展领域,企业能利用数据精准预测需求,避免生产过剩;城市管理者也能借此实时监控交通与能耗,优化物流路径 。这种机制的核心作用,在于推动绿色效率的实质性改进。
其次是创造新知识的价值 。数据不仅是信息,更是创新的原材料。通过对海量公共数据的深度挖掘与重组,例如将卫星数据与气候数据结合,往往能催生出前所未有的绿色技术解决方案 。这一机制的目标,则是推动绿色的技术进步。
这一理论框架清晰地展示了公共数据开放是如何向社会、城市和产业系统注入要素,通过激活上述两条路径,最终共同汇聚成绿色全要素生产率的增长 。这不仅超越了传统开放政府的研究视角,更为我们理解数字时代的生产函数提供了坚实的理论基石。

03 识别策略与平行趋势检验
为识别公共数据开放的因果效应,作者利用中国省级公共数据开放平台上线时间不一致这一特征,构建了多时点双重差分模型(Staggered DID)。
模型设定
本研究在模型设定上展现了极高的严谨性与前沿性。为了精准剥离出政策的真实效应,作者并没有沿用老套路,而是采用了目前计量经济学界公认更为先进的CSDID估计法 。这一方法的创新之处在于,它能有效解决传统模型难以处理的异质性问题,确保评估结果的纯净与可靠。
在被解释变量的选择上,文章同样突破常规,锁定了绿色全要素生产率这一综合指标,将能源消耗与碳排放纳入核算体系,从而更全面地反映经济发展的质量 。至于核心解释变量,则是根据各省公共数据开放平台的实际上线时间来确定,以捕捉政策落地带来的瞬间冲击。

平行趋势与动态效应
双重差分法是否有效,关键在于处理组和控制组在政策实施前是否具备可比性,也就是平行趋势假设。研究通过可视化的方式,清晰展示了动态处理效应的检验结果。在公共数据开放政策落地之前,无论是绿色效率改进还是绿色全要素生产率,处理组与控制组之间的差异系数都稳定在零附近,这完美验证了模型设定的合理性。
而在政策实施之后,局面发生了显著变化。上述两个指标的系数不仅显著为正,而且随着时间的推移呈现出明显的上升势头。这种边际效应递增的特征,有力地在实证层面印证了数据要素独特的规模报酬递增规律,即数据资源越是融合应用,其产生的价值就越丰富。
但与此同时,数据也揭示了一个耐人寻味的现象:在绿色技术进步这一指标上,政策前后的波动始终不明显。这暗示了在当前阶段,公共数据开放的红利更多地体现在存量资源的效率优化上,而非颠覆性的技术创新上。

04 回归结果
基准回归结果
基准回归结果为我们提供了一份关于中国公共数据开放成效的真实体检报告。从整体数据来看,公共数据开放确实扮演了绿色全要素生产率增长的助推器 。数据显示,受该政策影响的城市,其绿色全要素生产率的年均增长率比未受影响的城市高出了约0.767个百分点,这一结果在统计学上极为显著,证明了政策的有效性。
但这篇文献并没有止步于此,而是通过结构分解进一步挖掘了增长的源头。细分数据显示,代表资源配置优化的绿色效率改进系数显著为正,而代表硬核创新的绿色技术进步系数却在统计上不显著 。这一发现深刻地揭示了当前的现状:在样本考察期内,中国公共数据开放带来的绿色发展红利,几乎完全是靠改善资源配置效率“挤”出来的,而非源于技术前沿的实质性拓展。

地区差异与数字鸿沟
我们通常担心数字技术会扩大地区差距,也就是所谓的“数字鸿沟”,但这项研究通过异质性分析得出的结论却恰恰相反 。作者将样本城市划分为东部和中西部两组分别进行检验,结果发现,公共数据开放对中西部城市的绿色效率改进和全要素生产率的提升作用,反而显著高于东部城市。
这背后的逻辑在于,中西部地区聚集了大量资源型城市,它们过去依赖的高耗能、粗放型生产模式,恰恰为数据要素的介入提供了巨大的边际改善空间——起步越晚,数字化转型带来的边际收益反而越高 。这一发现极具启发性,它证明了公共数据开放不仅没有加剧区域间的不平衡,反而在客观上成为缩小东西部差距、推动区域绿色协调发展的重要力量。

05 机制探析
为什么是“效率”而非“技术”?
为了搞清楚为什么出现了重效率轻技术的现象,并从根本上回应索洛悖论,作者并没有停留在表面,而是对绿色全要素生产率这一指标进行了更深层的投入产出双向拆解 。这一拆解揭示了一个关键事实:公共数据开放带来的改变,主要体现在显著提升了能源投入效率和二氧化碳减排效率上,而在传统的劳动、资本和GDP产出效率方面,其促进作用并不明显 。
这一发现精准地找到了索洛悖论的症结。过去的索洛模型主要关注资本和劳动如何拉动GDP增长,因此很难捕捉到数字技术的真实价值。事实上,以公共数据为代表的数字技术,当下的核心贡献并不在于直接制造GDP的爆发式增长,而在于突破了能源和环境对经济发展的刚性约束。简单来说,就是用更少的能耗和排放,维持了经济的平稳运行。这证明计算机并非对生产率无效,而是对绿色生产率更有效。

微观企业的证据
为了确立数据要素双重价值理论的唯一性,作者没有止步于宏观层面,而是进一步下沉到上市公司微观数据进行了严密检验 。
在验证减少信息误差这一第一经济价值时,研究选取企业供应链效率作为观测指标。结果显示,公共数据开放显著降低了企业的库存周转天数,有效提升了运营效率。更有趣的是,这种效应在非大型互联网平台关联的企业中表现得更为显著 。这说明广大缺乏数据的普通企业,正是通过公共数据填补了信息鸿沟,从而优化了供应链管理 。
而在验证创造新知识这一第二经济价值时,研究以企业专利知识宽度为指标。全样本回归结果并不显著,这恰好解释了为何宏观层面看不到技术进步的踪影 。但当样本被拆分后,一个惊人的结构性痛点浮出水面:在与BAT等大型平台企业关联的样本组中,公共数据开放显著促进了新知识的创造 。这深刻揭示了当前数据要素市场的现实:只有那些本身拥有丰富私有数据的巨头,才有能力将公共数据与私有数据融合,产生化学反应并跨越创新的门槛;而广大普通企业受限于数据处理能力和私有数据的匮乏,目前只能利用公共数据做简单的效率优化。

06 结论与启示
本研究基于详实的数据分析,不仅确证了公共数据开放对中国绿色全要素生产率具有显著的推动作用,更深入挖掘了这一现象背后的深层动力。研究发现,公共数据开放的核心价值在于释放了海量数据要素,这极大地降低了市场中的信息不对称,进而显著提升了能源利用效率和碳减排能力 。这一发现从一个新的维度回应了索洛悖论,证明了在数字经济时代,衡量技术价值的标准应当从单纯的经济总量增长转向经济增长的质量,也就是绿色与低碳水平。
但研究同时也指出了当前存在的问题,即公共数据开放带来的红利目前还主要局限在效率优化的层面,尚未在大范围内引发突破性的绿色技术进步。究其原因,主要是广大普通企业尚不具备将公共数据转化为创新成果的能力和配套资源。
基于此,本研究对未来的政策制定提出了极具针对性的建议。政府的工作不能止步于搭建公共数据开放平台这一基础设施,更要致力于解决不同企业间数据利用能力不平衡的结构性难题。政策重心应从单纯的数据开放转向降低数据利用门槛和提供分析工具,同时引导大型平台企业共享数据 。只有当各行各业都具备了利用数据创造新知识的能力,由数据要素驱动的绿色技术革命才会真正到来。



