
Jing, K. and Liao, W.C., 2025. Expressways, Market Access, and Industrial Development in China: Using Walled-City Panel Instrumental Variables of Minimum Spanning Tree. Journal of Development Economics, p.103707.
1. 故事的缘起:从一个生活案例说起
在进入复杂的模型之前,我希望大家先闭上眼睛,想象一个生活中的场景,来理解这就所谓的“市场准入”(Market Access)究竟是什么,以及它如何改变命运。
案例:四川内陆的一家家具厂
假设时光倒流回 1990 年代末。在四川省的一个内陆县城——我们就叫它“A县”吧——有一家生产实木桌椅的小型家具厂。
没有高速公路的世界: 此时,A县只有蜿蜒曲折的省道和国道。如果厂长想把桌椅卖到上海或广州这些高收入城市,卡车需要在路上颠簸好几天。高昂的运输成本、货物在途中的损耗、以及漫长的时间成本,使得这笔生意根本无利可图。因此,这家工厂只能服务于本县和周边几个邻县的低收入市场。由于市场规模小,需求有限,工厂没有动力扩大生产,也不敢购买昂贵的自动化设备,只能雇佣几个工人手工打造。这是一家典型的低效率、小规模、劳动密集型企业。
时间来到 2005 年。
高速公路通车了: 国家高速公路网(NEN)的一条大动脉修到了A县门口,并且在距离工厂 10 公里处开设了一个出入口。 “市场准入”的剧变: 注意,这不仅仅是“路通了”这么简单。经济学家眼中的变化是:这家工厂通往上海、广州、北京等高购买力市场的加权旅行时间大幅缩短了。这就叫市场准入(Market Access)的改善。 结果一(集约边际): 原本卖到上海是亏本的,现在有利可图了。面对上海巨大的市场需求,厂长决定扩大生产规模。 结果二(资本深化): 为了满足大订单,原来的手工生产太慢了。厂长决定贷款购买数控机床。于是,企业的资本投入(Capital) 增速超过了劳动投入(Labor),企业变“重”了,技术升级了。 结果三(广延边际): 隔壁村的张三看到家具厂赚了钱,也开了一家配套的油漆厂。于是A县的企业数量增加了。
这就是这篇文章试图讲述的故事:交通基础设施的改善,通过降低贸易成本,扩大了企业的有效市场边界,从而引发了企业的规模扩张、资本深化和产业集聚。 作者不仅仅是讲故事,而是要用最严谨的数据证明:这一切在 2000-2009 年的中国,是普遍存在的因果规律,而不仅仅是个案 。
2. 研究背景与动机:宏大叙事下的识别难题
2.1 宏观背景:中国的基础设施奇迹
我们要研究的这段时期——2000 年到 2009 年——是中国经济的“黄金十年”,也是基础设施建设的“大跃进”时期。
GDP 增速: 这十年间,中国年均 GDP 增长率超过 10% 。 高速公路网爆发: 2000 年,中国高速公路通车里程仅为 1.63 万公里;到了 2009 年,这一数字翻了两番,达到 6.5 万公里 。 “7918”网: 2004 年,国务院批准了《国家高速公路网规划》,也就是著名的“7918网”(7条首都放射线、9条南北纵线、18条东西横线)。这一规划不仅连接了所有省会城市,更覆盖了绝大多数人口超过 20 万的城市。 货运依赖: 与欧美国家铁路货运发达不同,中国的内陆货运高度依赖公路。2017 年数据显示,公路承担了 76.7% 的国内货运量 。因此,高速公路对中国工业的重要性,远超其他国家。
2.2 研究动机:因果识别的“阿喀琉斯之踵”
既然高速公路这么重要,为什么还需要学者费尽心力去研究它?因为在经济学实证中,有一个巨大的拦路虎叫“内生性”(Endogeneity)。
反向因果(Reverse Causality): 政府修路不是闭着眼睛瞎修的。规划者通常会把路修在经济增长潜力大、工业基础好的地方。那么,当我们看到“有高速公路的地方经济好”,究竟是因为路带来了繁荣,还是因为繁荣引来了路? 遗漏变量(Omitted Variable Bias): 也许某些地区的领导人特别能干,既善于招商引资搞工业,又善于跑部进京要路条。这种“领导能力”是我们观测不到的,但它同时导致了修路和经济增长。
Redding and Turner (2015) 在其综述中明确指出,现有文献很少有基于面板数据(Panel Data)对交通基础设施动态影响的研究,因为这太难了 。
2.3 现有文献的局限
为了解决内生性,前人(如 Faber, 2014; Qin, 2017)通常采用“无关紧要地区法”(Inconsequential Place Approach)。
逻辑是: 如果要连接大城市 A 和大城市 B,中间必须经过小县城 C。C 县通路是“被迫”的,是外生的。 缺陷: 这种方法必须把大城市(A和B)从样本中剔除。这就像研究中国经济却要把北上广深和所有省会都删掉一样,结论的代表性大打折扣。这就导致了文献中缺乏对整个国家经济地理的全面评估 。
本文的动机就在于此:我们需要一种新的方法,既能解决内生性问题,又不需要剔除任何重要的经济节点,从而全面评估高速公路对中国所有县域工业发展的动态影响。
3. 边际贡献:方法论的突破
这篇文章之所以能发在 JDE,核心在于它在方法论上的三重重大突破 :
面板工具变量(Panel IV)的创新: 过去的研究多使用横截面工具变量(如 19 世纪的铁路网、明代的驿路)。这只能研究“长期影响”,无法捕捉 2000-2009 年这种快速变化时期的动态冲击。 本文首创了“古城墙最小生成树面板工具变量”(Walled-City MST Panel IV)。它利用历史地理信息构建了一个动态演进的虚拟路网,解决了这一难题。 外生性的源头创新: 传统的最小生成树(MST)方法通常用“1990年人口”来确定路网节点。但 1990 年人口本身可能就是内生的(人多的地方经济好)。 本文创造性地使用了1820年(清嘉庆二十五年)的古城墙特征(如城墙周长、城门数量)来预测节点。这些城墙是几百年前为了军事防御修建的,与现代工业发展几乎没有直接的经济联系,从而保证了完美的排他性(Exclusion Restriction) 。 全样本覆盖与参数估计: 由于工具变量足够强大,作者不需要剔除任何大城市。研究覆盖了中国大陆所有县级行政区。 作者没有直接套用美国文献中的参数,而是利用中国海关微观数据,首次估算了中国情境下的“贸易对时间的弹性”参数(Trade Elasticity to Travel Time),使得市场准入的度量更加精准 。
4. 研究数据:拼图式的构建过程
一项扎实的实证研究,离不开高质量的数据。作者像拼图一样,整合了多源数据 。
4.1 核心被解释变量:工业发展数据
来源: 国家统计局的中国工业企业数据库(ASIF)。 样本期: 2000年、2003年、2006年、2009年(三年一期,构成面板)。 处理细节: 涵盖所有国有企业和年销售额 500 万元以上的非国有企业。 为了保证数据质量,作者剔除了只有法人注册地但无实际生产的企业,并将企业数据加总到县(County)层面。 关注指标:县域制造业 GDP、企业数量(Firm Count)、平均产出(Output)、资本(Capital)、劳动(Labor)以及全要素生产率(TFP)。
4.2 核心解释变量:交通网络数据
来源: 澳大利亚格里菲斯大学 ACASIAN 数据库提供的 GIS 地图。 内容: 包含 2000、2003、2006、2009 年每一年的实际高速公路路网矢量图。 处理: 结合 ArcGIS 软件,计算每个县到其他所有县的最短路径旅行时间。
4.3 工具变量构建数据
这是文章最精彩的部分,用到了非常独特的历史和地理数据:
古城墙数据(1820年): 来源: 哈佛大学 Dataverse 平台。 内容: 清代 1820 年的城墙周长、高度、厚度、护城河、城门数量、塔楼数量等。 用途: 用来预测该城市在现代的重要性,从而确定它是否应该作为虚拟路网的节点。 地理成本数据: 来源: 中国国家冰川冻土沙漠科学数据中心、DIVA-GIS。 内容: 1km x 1km 网格的土地覆盖(水体、湿地、建筑用地)和坡度/高程数据。 用途: 用来计算修路的“建设成本面”(Cost Surface),毕竟在平原修路比在山区便宜,虚拟路网必须遵守地理约束。
4.4 辅助数据:贸易弹性估计
来源: 中国海关进出口微观数据库(2000-2006)。 用途: 利用企业所在县到出口港口的运输时间和贸易额,回归估算“时间每减少1%,贸易量增加多少”。
5. 研究设计:严密的因果推断逻辑
这是我要重点讲解的部分,也是大家学习计量经济学的核心。
5.1 模型构建:市场准入(Market Access)公式
作者没有简单地用“是否有高速公路”这个 0/1 变量,而是基于 Eaton and Kortum (2002) 的贸易理论,构建了一个连续变量——市场准入(MA)。
公式如下:
同学们请看这个公式的含义:
: 年 县的市场准入值。 :目的地 县的市场规模(用 GDP 或人口代理)。 :从 县到 县的旅行时间。 :距离衰减参数(贸易弹性)。
直觉解释: 一个县的市场准入,等于它能连接到的所有其他县的市场规模的总和,但是要打折。打折的力度取决于路程时间的远近。高速公路修通后, 变小了,分母变小,MA 值就变大了。
关键参数估计(Table 2):
在这个公式里, 是多少?美国的数据是 1.0 左右,但这不一定适用于中国。作者在 Table 2 中利用海关数据进行了回归 。
Table 2 结果: 作者发现,当控制了各种固定效应后,旅行时间每减少 1%,贸易量增加约 **1.68%**。因此,在后续计算中,作者将 设定为 1.68。这是一个非常扎实的参数校准过程。
5.2 核心识别策略:古城墙 MST 面板工具变量
这是文章的灵魂。为了解决 的内生性,作者构建了一个工具变量(IV)。
第一步:确定节点(Target Nodes)——历史的回响
作者没有用 2000 年的 GDP 来决定哪些城市该修路(那是内生的),而是回到了 1820 年。
Table 1 讲解: 作者跑了一个回归(Eq. 11)。被解释变量是 1990 年县域人口,解释变量是 1820 年的城墙特征。

结果显示:城墙周长越长、城门越多、有护城河的城市,在 1990 年的人口越多。 逻辑: 清朝修城墙是为了防御(Exogenous to modern industry),但城墙规模大的地方往往是历史上的行政中心,具有人口聚集的惯性(Relevance)。 操作: 利用这个回归的预测值,选出预测人口超过 50 万的城市作为 MST 的“目标节点”。
第二步:构建成本面与最小生成树(MST)
Figure A1 讲解: 这是一张中国地图,颜色越深代表修路越贵(坡度大、有水域)。 算法: 假设规划者只考虑两件事:① 连接所有目标节点;② 总建设成本最低。 利用 Kruskal 算法和 Dijkstra 算法,在成本面上画出一张“虚拟路网”。这张网完全是由地理和历史决定的,跟现在的市长想不想搞政绩没关系。
第三步:动态面板化(Dynamic Expansion)——模拟生长
Figure 3 讲解: 这是一组图,展示了 2000、2003、2006、2009 年虚拟路网是如何“生长”的。 规则: 2003 年真实的高速公路网增加了 X 公里,那么我的虚拟路网也按成本优先原则增加 X 公里。 结果: 这样就得到了一个随时间变化的工具变量 。它既有横截面上的差异(由古城墙决定),又有时间上的变化(由国家总投资进度决定)。
5.3 计量模型设定
主回归方程(Eq. 10)如下:
:县固定效应(控制地理、文化等不变量)。 :省份-年份固定效应(控制全省层面的宏观冲击)。 :控制变量(如人口、产业结构)。 **关注系数 **:这就是我们想求的市场准入对经济发展的弹性。
5.4 实证结果详解
现在,请大家把目光集中到论文的实证表格上。
第一阶段回归(Table 4):工具变量强不强?

内容: 检验工具变量 对真实变量 的预测能力。 解读: 系数显著为正(P<0.01),说明虚拟路网通了,真实路网大概率也通了,相关性很好。 Kleibergen-Paap F统计量: 都在 30-80 之间,远超临界值 10。说明不存在若工具变量问题。 结论:工具变量非常强力。
主回归结果(Table 5):核心结论
这是全文最重要的表格。我们逐列来看 Panel B(使用古城墙 IV 的结果):
Column 1 (Manufacturing GDP): 系数为 0.282。 含义: 市场准入每提升 1%,该县的制造业 GDP 就会增长 **0.28%**。这是一个非常可观的经济回报。 Column 2 (Firm Count): 系数为 0.072。 含义: 市场准入提升 1%,企业数量增加 0.07%。这叫广延边际(Extensive Margin),说明路通了,新企业进来了。 Column 3 (Value Added): 系数为 0.075。 含义: 现有企业的平均产值增加了。这叫集约边际(Intensive Margin),说明老企业做大了。 Column 4 & 5 (Labor vs Capital): 平均资本投入(Capital)的系数是 0.062。 平均劳动投入(Labor)的系数是 0.027。 深刻洞见: 资本的增长速度是劳动的两倍多!这说明高速公路带来了资本深化(Capital Deepening)。企业在用机器替代人。为什么?理论模型部分会解释(因为土地限制导致工资上涨,企业被迫转型)。 Column 6 & 7 (TFP): 全要素生产率的系数不显著(接近 0)。 含义: 路通了,企业规模大了,用更多机器了,但并不代表技术效率(TFP)直接提高了。这符合 Eaton-Kortum 的理论预测:交通主要降低贸易成本,而非直接改变生产函数。
为什么面板 IV 比横截面 IV 好?(Table 6 & 7)
作者做了一场精彩的“赛马”(Horse Race)。
Table 6: 作者试着像以前的文献那样,只用一年的横截面数据跑回归。结果发现系数甚至变成了负的或者不显著。这说明在快速发展的中国,如果不考虑动态变化,横截面回归全是偏差。 Table 7(过度识别检验): 作者对比了“1990人口IV”和“古城墙IV”。 结果显示,“1990人口IV”在某些情况下拒绝了原假设(说明它可能内生)。 而“古城墙IV”在所有测试中都通过了 Sargan-Hansen J 检验(P值很大,不能拒绝外生性)。这证明了利用历史数据作为工具变量的优越性。
外生性再检验:平衡性测试(Table 8 & 9)
Table 8: 作者检验了工具变量的变化量()是否与 1998 年的基期特征(如 GDP、生产率)相关。 结果:古城墙 IV 的相关性系数都不显著。说明这个路网的扩张路径,并没有刻意偏向那些本来就富裕或者增长快的地方,它是“准随机”的。 Table 9: 检验被连接的“顺序”(Timing)。结果同样显示,连接的早晚与当地经济基底无关。
5.5 异质性分析与机制讨论
区域去中心化(Table 11 & 12)
大家可能会问:修了路,是让大城市更强(虹吸效应),还是让落后地区受益(扩散效应)?
Table 11: 交互项显示,内陆省份(Inland Provinces) 从市场准入改善中获益最大。 结论: 高速公路网促进了中国工业的去中心化。制造业开始从昂贵的沿海地区向内陆转移。这对于国家平衡区域发展战略来说,是一个巨大的利好证据。 例外: 北上广深(一线城市)依然强者恒强,获益巨大。
产业异质性(Figure 4 & Table 13)
Figure 4: 横轴是资本密集度,纵轴是回归系数。 趋势: 向上倾斜。说明资本密集型和高科技行业,从高速公路中获益更多。 Figure 4 Panel B: 横轴是“重量价值比”(Weight-to-Value Ratio)。 趋势: 向下倾斜。说明轻型高价值商品(如电子产品、医药)比重型低价值商品(如水泥、木材)更受益。这很符合直觉,因为运费对低价值商品来说太贵了。 Table 13: 进一步证实,高速公路促进了资本密集型产业在内陆地区的集聚。
5.6 稳健性检验(Table 14-16)
为了证明结论不是凑出来的,作者做了大量测试:
Table 14: 换个贸易弹性参数(从 1.0 试到 2.0),结论不变。 Table 15: 改变“连接”的定义。究竟离高速路口 10km 算连接,还是 50km 算?结果发现 20km 是最佳阈值,超过这个距离,效应就开始衰减。 Table 16: 考虑普通公路(假设时速 10km/h)。把普通路网加进来一起算 MA,结论依然稳健。
6. 研究结论
总结一下,这篇文章通过极其严谨的实证分析,得出了以下核心结论:
正向因果效应: 高速公路建设带来的市场准入改善,显著推动了县域工业发展。MA 每增加 1%,制造业 GDP 增长约 **0.28%**。 增长机制: 这种增长既来自于新企业的进入(广延边际 0.07%),也来自于老企业的扩张(集约边际 0.08%)。 结构转型: 高速公路通过要素价格机制(土地限制导致工资上涨),迫使企业进行资本深化,用资本替代劳动。这对中国制造业的技术升级起到了倒逼作用。 空间重构: 高速公路网有效地将工业活动从沿海扩散到了内陆,促进了区域经济的平衡发展。内陆地区利用低成本优势,承接了大量资本密集型产业。 效率来源: 生产率的提升主要来自集聚效应,而非交通本身直接带来的技术进步。


