推广 热搜： 采购方式滤芯甲带带式称重给煤机气动隔膜泵减速机型号无级变速机链式给煤机履带减速机

首页 > 资讯 > 社会热点

为何TOP5刊青睐叙事性分析? 宏观经济学因果推断的利器到底是什么?

日期：2026-01-16 04:45:51 来源：网络整理作者：本站编辑评论：0

为何TOP5刊青睐叙事性分析? 宏观经济学因果推断的利器到底是什么?

.

凡是搞计量经济的，都关注这个号了

邮箱：econometrics666@126.com

所有计量经济圈方法论丛的code程序, 宏微观数据库和各种软件都放在社群里.欢迎到计量经济圈社群交流访问.

1.AI经济研究神器! 全网首发中国微观数据选题宝库, 秒生原创X+Y组合, 论文idea源源不断. 2.别再死磕模型了, 全网首发计量方法+中国政策数据宝库. 秒出顶级Paper计量方法选择.

在当代宏观经济学的实证研究中，因果识别始终是一个核心挑战。

当我们试图衡量战争、财政政策或货币政策的经济影响时，一个根本性问题始终如影随形，即这些事件的发生本身可能与经济状况相关。

经济下滑引发战争，而非战争导致经济衰退；税收调整是对经济周期的反应，而非外生冲击。这种内生性问题使得传统的计量方法常常难以令人信服。

正是在这样的背景下，叙述性分析(narrative analysis)逐渐成为宏观实证研究中的一把利器。

这种方法不依赖复杂的统计技巧，而是回归历史本身，通过系统审查历史记录、官方文件、领导人演讲和媒体报道，对重大事件的起因进行逐案判断，筛选出那些与当前经济状况无关的外生事件，从而为因果推断提供更坚实的基础。

下面，咱们就看看26年AER上这篇The Price of War里的叙事分析方法。

参考: 必读! 26年AER首篇重磅文, 迄今为止最系统,最严谨的实证回答"战争的代价".

首先，必须承认的是，在《战争的代价》这篇论文里，同样面对着一个看似简单却异常棘手的问题：当我们观察到战争之后经济大幅下滑，怎么确定这种下滑真的是战争造成的，而不是因为经济已经变差才引发了战争？

这种因果关系的倒置问题（或者说双向因果）在实证研究中一直是个难点。

面对这一挑战，文章没有选择常见的工具变量方法或者复杂的结构模型，而是走上了一条更为扎实的路径，即通过系统化的历史叙事分析，为他们的计量分析扫清障碍。

在这篇文章中叙事分析究竟做了什么?

文章对每一场国家间战争的细致审查。这不是泛泛而谈地介绍战争背景，而是真正深入历史档案，对1870年到2023年间所有符合标准的战争逐一分析，核心目标是判断这场战争是不是因为短期经济困难而爆发的。

为了做到这一点，作者们广泛搜集了多种权威史料。他们不仅参考了Gibler整理的战争叙事汇编，还仔细研究了Martel编纂的战争史百科全书，以及Morillo、Black、Lococo和Parker等历史学者的著作。

Gibler（2018）整理的战争叙事摘录；
Martel（2012, 2018）的标准战争史条目；
Morillo, Black & Lococo（2009）、Parker（2020）等历史学文献；
所有判断依据均完整记录在论文附录O–E中，确保读者可以逐案复核。

此外，他们把每一条判断依据都详细记录在论文附录中，让读者能够完整追溯他们的研究过程，而不是只看到最终结论。

在此基础上，作者们建立了一个细致的战争动机分类体系。这个体系包含八类可能的战争原因，包括民族主义或帝国主义倾向、大国权力转移与安全困境、宗教或意识形态冲突、长期经济目标、边境争端、复仇心理、国内政治压力，以及最关键的短期经济动机。

值得注意的是，他们允许一场战争同时具有多种动机，平均下来每场战争有三个主要原因。当不同史料给出不同解释时，他们选择全部纳入分析，而不是挑选最符合自己假设的解释。

对于短期经济因素这一关键类别，研究者采取了特别保守的标准。只有当历史证据清晰表明战争直接是为了缓解短期经济压力、掠夺资源或应对经济周期性困境时，才将其归为经济驱动型战争。

经过如此严格的筛选，60多个国家间战争中，仅有6场被确定为明显由短期经济动机主导，包括1982年阿根廷与英国的马尔维纳斯群岛战争和1969年萨尔瓦多与洪都拉斯之间的足球战争。

这里的叙事分析如何强化因果推断?

这套历史叙事分析并非论文中可有可无的点缀物，而是解决内生性问题的核心工具。

文章首先展示了一个关键现象——不同类型的战争在爆发前的经济轨迹存在明显差异。内战和殖民战争往往发生在经济已经恶化的背景下，战前GDP增长往往已经下降，通胀已经开始上升。而国家间战争在爆发前，宏观经济指标通常保持平稳。这一发现为将国家间战争视为潜在外生冲击提供了初步证据。

但这还不够。通过系统的历史审查，文章进一步剔除了那6场由短期经济问题引发的战争，使得剩余样本在逻辑上更接近真正的外生冲击。

在此基础上，他们又进行了两项关键检验。其中，Granger因果检验发现，在剔除6场战争后的样本中，过去的GDP增长和通货膨胀无法预测战争的爆发；而重新进行的计量分析显示，使用剔除6场战争后得到的结果与全样本几乎完全一致。

这种叙事分析与计量方法的结合，创造了一个更为可靠的因果识别环境。所以，从这里也可以看出来，它不是替代计量分析，而是为计量分析铺平道路。

这里的叙事分析为何令人信服?

《战争的代价》中的叙事分析之所以令人信服，并不在于它讲了很多故事，而在于它满足了实证研究中最难做到的三点。

首先是系统性和透明度。作者没有选择性地只讨论支持自己假设的案例，而是对每一场战争进行逐案判断，明确说明只剔除了6场战争，而且详细记录了剔除理由。

其次是多来源交叉验证。研究者同时依赖多位历史学家的研究和多种史料传统，避免被单一叙事或意识形态视角所左右。当不同史料给出不同解释时，他们不是选择性采纳，而是全部纳入分析，这种处理方式大大增强了结论的稳健性。

最重要的是，论文巧妙地将定性分析与定量方法相结合。叙事筛选与Granger因果检验、稳健性回归相互印证，形成了一个完整的证据链。这种叙事加计量的组合在宏观经济学中已有成功先例，如Ramey对国防支出冲击的研究、Romer夫妇对货币政策冲击的分析等。

*接下来，我们还会专门展开讨论一下Ramey和Romer这两篇论文中的叙事分析情况。

AER上的税收变化对经济产出.

叙述性方法在宏观经济学中的广泛应用，很大程度上始于Christina和David Romer夫妇在2010年发表于AER的开创性研究。

在这篇已成为经典的论文中，Romer夫妇面对一个看似简单却极为困难的问题：税收变化对经济产出的真实影响是什么？

传统方法在这里遇到了障碍。税收政策通常是对经济状况的反应，经济低迷时减税，繁荣时增税。这种反向因果关系使得简单回归会产生严重偏误。

Romer夫妇的解决方案是回到历史现场，他们仔细研读了1945年至2007年间美国每一次重大税法变更的原始资料，包括总统的国情咨文、国会辩论记录、财政部报告以及《总统经济报告》。

通过这些一手历史资料，他们为每一次税制变革确定了真实动机。

这个过程并非简单归类。他们区分了具有长期经济目标或财政整顿目的的外生税收变化，与那些明显为了应对短期经济波动的内生变化。只有前者被纳入他们的分析样本。通过这种精心设计的叙述性筛选，Romer夫妇发现，一个相当于GDP1%的外生增税，会导致产出在随后三年内下降约3%。

这一发现之所以具有说服力，不仅因为其方法的严谨性，更因为他们将每一条判断依据都详尽记录在论文附录中，使同行能够完整复核他们的研究过程。

QJE上Ramey的国防支出研究.

如果说Romer夫妇的工作为税收政策研究设定了新标准，那么Valerie Ramey在2011年发表于QJE的研究则在政府支出领域掀起了一场方法论革命。

Ramey面临的挑战是预期问题，政府通常提前宣布重大支出计划，市场会提前反应，这使得传统的VAR模型难以准确捕捉财政政策的真实效应。

Ramey的创新解决方案是创建国防新闻冲击指标。

她系统查阅了《商业周刊》、《纽约时报》等历史媒体报道，识别那些预示未来军事支出重大变化的事件，如朝鲜战争爆发前夕的动员报道，或越南战争升级前的战略讨论。这些新闻往往领先于实际支出数月甚至数年，因而能够捕捉到市场对政策变化的初始反应。

后续，从单一叙述到混合识别策略进行了演进.

随着叙述性方法在顶级期刊中获得认可，研究者们开始将其与其他识别策略结合，创造出更强大的实证工具。

Mertens和Ravn在2013年发表于AER的研究就是一个典型例子。他们不仅扩展了Romer夫妇的税收数据集，还将税制变革细分为个人所得税和公司所得税两大类别，并开发了所谓的代理变量SVAR(proxy-SVAR)框架。

在这个框架中，叙述性识别的税变冲击被用作外部工具变量，解决了传统SVAR模型中识别不足的问题。这一方法显示，个人所得税减税对消费和产出的刺激效应明显强于公司税减税，而后者主要影响资本形成。

2018年，Antolín-Díaz和Rubio-Ramírez在AER发表的研究进一步推动了方法创新。他们提出了叙述性符号限制的概念，将历史事件的具体时间点(如特定的美联储会议或重大税改法案通过日)作为额外约束条件，嵌入到结构向量自回归模型中。

这种方法既保留了叙述性分析对历史细节的尊重，又充分利用了计量模型的灵活性，从而提高了冲击识别的精确度。

为何国际TOP刊青睐叙事性方法？

在AER、QJE等顶级期刊中，叙述性方法日益受到重视，这并非偶然。在因果识别要求极高的宏观经济学研究中，这一方法提供了几个无可替代的优势。

首先，它直接诉诸历史事实，而非统计假设。当计量模型依赖于战争是外生的这一假设时，叙述性分析则通过系统审查历史记录来验证或拒绝这一假设。这种基于事实的方法比纯粹的统计调整更令人信服。

其次，叙述性方法为复杂的计量模型提供了地面真相(ground truth)。在Ramey的国防支出研究中，叙述性确定的新闻冲击时间点成为验证VAR模型的重要基准；在《战争的代价》中，对战争动机的历史审查为Granger因果检验提供了理论基础。

第三，叙述性分析特别适用于那些事件数量有限但历史记录丰富的研究场景。战争、重大税制改革、货币政策转向等宏观事件并不频繁发生，但每次事件都有丰富的一手资料可供分析。在这种情况下，深度胜过广度，细致的历史审查比大样本统计更具说服力。

当然，叙述性方法也存在局限。它依赖于研究者对历史资料的解读，存在主观性风险；它通常只能处理重大事件，对日常政策变化的识别能力有限；而且，历史记录本身可能存在偏见或缺失。

这些挑战促使研究者采取多种策略应对，例如详尽公开附录以增强透明度；多人独立编码以减少主观偏误；结合多种史料来源以交叉验证。

*群友可以到社群下载这些文章的PDF和相关数据和代码。
1.最全! 我国适合"断点回归"的政策都整理出来了, 让你有做不完的RDD断点政策评2.最全! 我国适合"合成控制法"的政策都整理出来了, 让你有做不完的SCM政策评估3.最全106页! 我国适合DID双重差分的政策都整理出来了, 让你有做不完的DID政策4.最全! 我国适合DDD三重差分的政策都整理出来了, 让你有做不完的DDD政策论5.最全! 国内哪些政策适合用队列DID, 模糊断点RDD, 双重机器学习DML进行评估？6.最全! 国内哪些政策情景适合用Bartik IV, 空间DID, 模糊DID方法进行评估？

7.最全! 我国各种X的工具变量IV都整理出来了, 8.最全! 把CFPS研究过的全部自变量X与因变量Y做成数据库了, 全网第一份CFPS选题数据库.9.最全! 把CHFS研究过的全部自变量X与因变量Y做成数据库了, 第一份CHFS金融选题数据库.10.中国健康与养老CHARLS选题库, X与Y的研究组合助你研究老年人问题.11.把CSMAR研究过的自变量X与因变量Y做成数据库了, 第一份公司与金融微观选题数据库.12.三农微观数据选题库, 从此AI轻易助你选择经过检验了的X与Y的不同组合选题.13.CHIP和CEPS选题数据库, 轻松助你选择经过检验了的X与Y的不同组合家庭收入和教育选题.

下面这些短链接文章属于合集，可以收藏起来阅读，不然以后都找不到了。

8年，计量经济圈近2500篇不重类计量文章，

可直接在公众号菜单栏搜索任何计量相关问题,

Econometrics Circle

数据系列：空间矩阵 | 工企数据 | PM2.5 | 市场化指数 | CO2数据 | 夜间灯光| 官员方言 | 微观数据| 内部数据

计量系列：匹配方法 | 内生性 | 工具变量 | DID | 面板数据 | 常用TOOL | 中介调节 | 时间序列 | RDD断点 | 合成控制 | 200篇合辑 | 因果识别 | 社会网络 | 空间DID

数据处理：Stata | R | Python | 缺失值 | CHIP/ CHNS/CHARLS/CFPS/CGSS等 |

干货系列：能源环境 | 效率研究 | 空间计量 | 国际经贸 | 计量软件 | 商科研究 | 机器学习 | SSCI | CSSCI | SSCI查询 | 名家经验

计量经济圈组织了一个计量社群，有如下特征：热情互助最多、前沿趋势最多、社科资料最多、社科数据最多、科研牛人最多、海外名校最多。因此，建议积极进取和有强烈研习激情的中青年学者到社群交流探讨，始终坚信优秀是通过感染优秀而互相成就彼此的。

打赏

更多>同类资讯

0 条相关评论

推荐图文

推荐资讯

点击排行

网站首页 | 关于我们 | 联系方式 | 使用协议 | 版权隐私 | 网站地图 | 排名推广 | 广告服务 | 积分换礼 | 网站留言 | RSS订阅 | 违规举报 | 皖ICP备20008326号-18

(c)2008-2022 免费发布网 All Rights Reserved