约瑟夫·斯蒂格利茨|现代宏观经济学错在哪里_社会热点_资讯

约瑟夫·斯蒂格利茨|现代宏观经济学错在哪里

原文发表于《牛津经济政策评论》2018年第34卷第1-2期第70-106页

现代宏观经济学错在哪里

约瑟夫·E·斯蒂格利茨

摘要：本文对过去25年间主导宏观经济学领域的动态随机一般均衡（DSGE）模型提出批判。文章指出，该模型失败的核心症结在于存在缺陷的微观基础——这一基础未能纳入经济行为的关键特征，例如信息经济学与行为经济学的相关洞见。对金融部门的建模不足，导致这类模型难以预测或应对金融危机；而对代表性行为人模型的依赖，则使其无法分析收入分配在经济波动与危机中发挥的作用，也难以阐释经济波动对不平等现象造成的影响。本文提出了可供替代的基准模型，这类模型或能更有效地帮助人们理解深度经济衰退，并制定应对策略。

关键词：动态随机一般均衡模型；代表性行为人；深度经济衰退；经济波动

经济学文献分类号：A1、A2、E0、E1

一、引言

动态随机一般均衡（DSGE）模型在现代宏观经济学的相关讨论中占据重要地位，但在笔者看来，这类模型并未实现一个设计良好的宏观经济模型应具备的功能。任何宏观模型面临的核心挑战，都是揭示反复出现的深度经济衰退的内在机理，并提供应对策略。显然，若模型能够预测此类危机，则其价值将进一步提升。从社会层面来看，经济体明年的增长率是3.1%还是3.2%，并不会产生实质性影响；但当经济陷入危机、国内生产总值下滑且失业率大幅攀升时，无论对当下居民的福祉，还是未来的经济增长，都会造成严重后果。尤其需要指出的是，如今学界已普遍达成共识：像2008年后欧美经济体经历的长期经济疲软，会对未来的潜在经济增长产生显著的负面影响。

2008年金融危机的爆发，以及DSGE模型既无法预测危机、也未能为危机应对提供政策指导的事实，引发了人们对该模型的普遍质疑。但事实上，该模型的缺陷更为深刻：即便在其他类型的深度经济衰退中，DSGE模型同样表现乏力。

DSGE模型无法解释这些重大衰退现象的关键问题，包括：引发经济扰动的根源是什么；为何模型设定中本应被经济体吸收的冲击，会不断放大并造成严重后果；为何经济衰退会持续存在——即为何经济体未能如均衡模型所预期的那样，快速回归充分就业状态。这些绝非无关紧要的小缺陷，而是直指模型核心的根本性漏洞。

我们对宏观经济学领域“基准模型”的具体定位，往往缺乏清晰认知。瓦因斯（私人通信）提出，我们应当构建“一套能够教授给研究生的简化模型，为他们开展各类研究项目提供更具指导性的分析框架”。

布兰查德（2017）则认为：

模型应当捕捉我们所认定的、企业与居民行为中具有宏观核心意义的特征，而非试图囊括所有相关动态变化。唯有如此，模型才能实现其预设功能，保持足够的简洁性，并为理论探讨提供可靠平台。

基于此，学界通常将核心DSGE模型视为基准模型，同时衍生出各类扩展模型——这些扩展模型纳入了更多复杂因素，除技术冲击外引入了多重冲击源，也在名义工资与价格粘性之外补充了更多市场摩擦因素。诚然，随着越来越多的DSGE模型使用者意识到该模型的各类缺陷，他们开始以较为随意的方式对模型进行“拓展”。这种做法类似于托勒密体系的修正思路：不断在模型中添加新的要素，以纳入此前被忽略的关键特征。其结果是，模型原本可能具备的简洁性荡然无存，所谓“坚实微观基础支撑”的理论主张被大幅削弱，基于这类模型的政策分析的可信度也随之下降。而模型日趋复杂的结构，往往会进一步阻碍人们对经济运行本质的理解。

此外，由于模型包含大量参数，宏观计量经济学的相关研究几乎沦为“曲线拟合”的机械操作——即简单对比模型生成的任意矩条件与现实经济数据，而常规的统计标准则被束之高阁。科雷内克（2017）对此提出了一针见血的批判：

第一，现有研究通常采用霍德里克-普雷斯科特滤波等方法对时间序列进行去趋势处理，以聚焦于经济周期频率下的平稳波动。尽管这种方法在部分研究场景中具有一定价值，但也可能导致“倒洗澡水时连同婴儿一起倒掉”的风险——因为诸多重要的宏观经济现象均具有非平稳性，或发生于更低的频率区间。近年来极具代表性的例证，便是金融危机对经济增长产生的长期影响。

第二，针对去趋势后的时间序列，用于评估模型并与现实数据对比的矩条件选择具有很强的主观性，目前尚无可靠的科学依据支撑某一组矩条件优于其他选择。宏观经济学界已形成某些研究惯例，主要关注二阶矩（即方差与协方差）。但对于金融危机等重大宏观经济事件而言，这种做法存在明显缺陷——二阶矩难以有效刻画这类事件的特征。金融危机属于罕见的尾部事件，会使时间序列呈现出显著的偏态性与厚尾性。因此，一个能够有效解释金融危机的模型，很可能无法匹配用于评估常规经济周期模型的传统二阶矩——毕竟这两类模型的驱动冲击存在本质差异。在这类情况下，以匹配传统矩条件为评判标准，甚至可能对模型的现实适用性产生误导。例如，某一模型即便能够匹配21世纪头十年的产出方差，也并不意味着它能够准确描述该时期的产出动态变化规律。

第三，针对既定的矩条件组合，目前尚无明确的统计指标用于衡量DSGE模型的拟合优度，也无法界定模型改进的具体标准。模型生成的矩条件与现实观测值的匹配程度，往往仅通过直观对比判断，且很大程度上依赖读者的主观解读。这种研究方法的科学性严谨性令人质疑。

第四，动态随机一般均衡模型常常施加一些与微观层面经验证据直接矛盾的约束条件。如果一个模型已经在某些维度被证伪，那么其在其他维度的拟合优度指标便失去了意义。

科雷内克的结论——即这种研究方法的“科学性严谨性值得怀疑”——实则已是一种十分委婉的表述。

学界有时还会对“政策模型”与“具备扎实理论基础的模型”加以区分：前者旨在针对不同经济情境提供切实可行的政策建议，后者则侧重于理论逻辑的严密性。由此便产生一种观点：标准凯恩斯主义模型或许足以指导我们判断是否应当刺激经济、以及如何实施刺激政策，但其核心方程缺乏微观基础支撑，在理论层面难以令人信服；而要构建严谨的理论体系，则必须借助DSGE模型。在笔者看来，这种区分存在两方面的谬误：首先，如下文所述，核心DSGE模型本身并非“优良的理论”——真正优良的经济理论，应当基于企业与居民的真实行为模式、以及市场的实际运行机制。如果信贷可得性比利率水平更能影响经济运行，那么假设不存在信贷配给的模型，本质上就是存在缺陷的理论。在2008年金融危机期间，银行面临严重的流动性约束，无法获得充足资金——而这种约束条件，与DSGE模型的核心假设完全相悖。其次，我们之所以需要构建具备微观基础的模型，是因为政策调整可能改变此前观测到的简约式经济关系，而要判断这种影响是否存在，必须依托相应的理论框架。优良的政策制定，离不开对经济行为背后深层决定因素的理解。

与此同时，短期政策的制定需要以短期经济预测为依据。笔者在克林顿政府时期担任美国经济顾问委员会主席——该委员会由美国国会设立，旨在通过恰当的宏观经济干预，确保经济体维持充分就业状态——期间，曾负责监督经济预测工作，相关预测结果也被用于财政预算编制。尽管当时新一代DSGE模型尚未问世，但我们关注的诸多关键因素，均被排除在标准模型的分析框架之外。例如，我们十分重视预期的变化，但对预期的分析并非基于“个体具备理性预期”或“个体行为表现出理性预期特征”的假设，而是依托居民预期的现状与历史调查数据——笔者认为这种分析方法是更为合理的。

我们同样关注消费行为的变化。显然，消费决定机制是任何优良宏观模型的核心要素。但在中短期内，家庭储蓄率的变动与代表性行为人跨期效用最大化模型的核心假设几乎无关。该模型无法准确预测储蓄率的这类变化，也无法识别导致消费变动的偏好转移、技术变革、甚至预期变化因素——尤其是在假设预期具有“理性”特征的情况下。

DSGE模型在政策设计方面同样缺乏指导价值，例如在“如何最优实施减税政策”这一问题上便是如此。笔者认为，行为经济学的相关研究已经有力证明：储蓄行为会受到各类“助推因素”的影响，而这种影响机制与标准模型的设定并不一致。值得注意的是，居民对2008年与2009年美国减税政策的反应存在差异，这种差异的根源更多在于行为经济学层面的因素，而非DSGE模型所设定的储蓄行为决定机制。

但DSGE模型似乎将如下设定奉为圭臬：消费行为应当通过“无限生命周期、无借贷约束的代表性行为人效用最大化模型”加以解释，并将这种建模方式称为“为模型提供微观基础”。然而，经济学本质上是一门行为科学。如果凯恩斯的观点——即居民储蓄占收入的比例保持恒定——是正确的，那么基于这一假设构建的总量模型，同样具备微观基础。当然，现实经济体由无数异质性个体构成：所有个体的生命周期都是有限的，多数个体面临信贷约束，且会根据经济环境的变化调整自身消费行为——尽管这种调整可能较为缓慢。因此，我们也明确认识到，无论经济环境如何变化，居民储蓄率都不会一成不变。

由此可见，DSGE模型与传统凯恩斯主义模型均是对现实经济的简化。当我们将这些简化假设纳入宏观模型时，本质上是在主张“经济体的运行模式近似于……”。那么问题的关键便在于：哪种模型能够更准确地描述现实经济、更有效地提供政策建议、更可靠地作为模型进一步拓展的基础？答案并非一目了然。因此，对DSGE模型的批判，并非指责其采用了简化假设——所有模型都需要简化——而是批判其做出了错误的建模选择：在那些可以通过更简洁假设阐释宏观经济波动核心逻辑的领域，无端增加模型的复杂性；而在那些宏观经济关键变化实际发生的领域，却进行了过度简化。

DSGE模型的复杂性，反过来又要求进行大幅简化处理：为了便于分析，必须施加严格的参数限制。我们已经发现，DSGE模型采用的参数设定（例如常弹性效用函数），得出的预测结论很容易被经验证据推翻——例如模型预测所有个体持有的风险资产组合完全相同，且具有位似偏好特征，即所有商品的收入弹性均为1、所有资产的财富弹性均为1。更糟糕的是，即便引入这些不符合现实的参数设定，那些纳入了更多宏观经济现实特征的大型DSGE模型，通常也只能通过线性近似方法求解，且仅适用于分析小幅冲击——这就排除了可能使经济体偏离线性近似有效区间的大幅冲击的影响。

二、失败的核心：存在缺陷的微观基础

DSGE模型的根本性缺陷，可追溯至数十年前学界试图调和宏观经济学与微观经济学的尝试。当时存在两种不同的研究路径：第一种路径是实际经济周期（RBC）理论及其后续发展的DSGE模型。这类模型试图借助简化版竞争性均衡模型的微观基础，重新构建宏观经济学理论体系——但讽刺的是，彼时竞争性均衡模型正因行为经济学、博弈论与信息经济学的发展而饱受质疑。该研究路径试图通过对基准模型进行最小化修正——即假设存在（通常为名义层面的）价格与工资粘性——来解释失业及其他偏离标准竞争性模型预测结果的经济现象。

第二种研究路径（例如可参见伯南克与格特勒（1989）、清泷信宏与摩尔（1997）、格林沃尔德与斯蒂格利茨（1987a、1987b、1988a、1988b、1993a、1993b、2003）及相关参考文献）则直到大衰退之后才逐渐进入主流视野。该路径致力于将现代微观经济学理论与宏观经济学有机融合，纳入了现实市场与完全竞争假设相背离的各类特征（即“市场失灵”）——除名义工资与价格粘性外，还对这类粘性现象给出了不同的解读与阐释。通过这一研究路径，欧文·费雪（1933）的理论思想得以复兴。费雪提出的宏观动态理论，与希克斯基于工资和价格粘性对凯恩斯理论的解读存在本质差异，其核心是强调价格灵活性与债务通缩所引发的后果。

这类模型中，对标准竞争性均衡模型的关键修正包括：不完全契约、资本市场缺陷（包括与信息不对称相关的缺陷）、风险市场不完备以及市场非理性行为等。（明斯基（1986）的理论在后文所述的市场非理性行为研究方面影响尤为深远。）或许值得一提的是，近年来各国政策制定者在应对经济衰退时——无论是日本、欧洲还是美国——关注的核心始终是通缩风险、即物价下跌的可能性，而非价格粘性问题。

下文将以2008年金融危机为例，具体阐释DSGE分析框架的不足。部分DSGE模型的支持者辩称，这类模型的设计初衷并非用于应对“百年一遇的重大冲击”。针对这种辩护，我们可以从以下几个角度予以回应：

首先，我们可以做一个类比：如果一位医生在面对身患重病的患者时，表示“很抱歉，我只诊治感冒”，人们会作何感想？

其次，DSGE模型的问题不仅在于未能预测危机，更在于其理论设定从根本上排除了这类危机发生的可能性。在该模型的核心假设（理性预期、外生冲击）下，如此规模与类型的危机根本不可能发生。

危机的爆发，会将模型在分析小型、高频经济波动时不易察觉的缺陷彻底暴露出来。笔者认为，DSGE模型的多数核心设定均存在严重缺陷，甚至无法作为构建优良宏观经济模型的起点。这些缺陷包括：

（1）消费理论；（2）预期理论——理性预期与共同知识假设；（3）投资理论；（4）代表性行为人模型的使用（以及目前文献中备受青睐的纳入异质性因素的简单扩展模型），毕竟收入分配具有重要影响；（5）金融市场与货币理论；（6）加总问题——过度加总掩盖了诸多具有重要宏观意义的经济现象；（7）冲击因素——即引发经济扰动的根源；（8）冲击调整理论——包括关于经济体向均衡状态调整的速度、机制，以及非均衡状态下经济行为的相关假设。

本文篇幅有限，无法详细评述上述所有缺陷及其他不足（例如未能纳入关键的制度细节），因此将选择性地聚焦其中几点，作为反映模型普遍问题的例证。这些缺陷之间存在密切关联：例如，信息不对称与不完全信息会导致信贷配给和股权配给现象。因此，个体在进行跨期效用最大化决策时，必须将信贷约束纳入考量——正如前文所述，这与标准DSGE模型的分析框架存在显著差异。代表性行为人模型之所以失效，原因之一便是部分个体面临信贷约束，而另一些个体则没有。此外，大量研究（例如可参见金等（2014）、米安与苏菲（2015）、德赖曼等（2017））均强调债务对总体经济行为的重要影响；但在代表性行为人模型中，国内债务会相互抵消，因此不具备任何实质性作用。至少在某些情况下，中短期宏观经济分析需要密切关注债务规模与实际债务动态变化。制度细节在这一过程中同样具有重要意义：从30年期固定利率抵押贷款，转向期限更短的浮动利率抵押贷款，这一变化在2008年金融危机中发挥了关键作用——尤其是当这种变化与非完全理性预期及信贷约束因素叠加时，影响更为显著。当房价未能如预期般上涨（事实上，房价显然不可能永远保持高速增长），且购房者面临再融资约束时，房地产泡沫破裂，危机随之爆发。

正如笔者此前所述，笔者的研究路径与DSGE模型的出发点是一致的，即阿罗-德布鲁竞争性均衡模型。显然，该模型无法解释诸多经济现象，其中就包括宏观经济波动。DSGE模型的核心思路是：寻找能够匹配宏观经济行为（主要体现为匹配矩条件）的、对基准模型的最小化修正方案。其最初的答案是引入价格与工资粘性，以及未被完全对冲的外生技术冲击。当这一框架无法充分解释现实经济时，研究者便以较为随意的方式，添加了多重冲击与市场摩擦因素。而所谓“提供微观基础”的标准，同样具有很强的主观性：例如，将货币纳入效用函数的做法，虽然“解释”了居民持有货币的动机，但并未说明当信贷可得性变化、或货币政策调整导致货币供给概率分布改变时，经济会出现何种变化。

三、解释深度经济衰退

笔者主张的研究路径，首先需要明确现代微观经济学的哪些理论进展，对于理解宏观经济波动的核心问题最为关键——这些核心问题包括：冲击的来源；冲击的放大机制——即为何看似轻微或中度的冲击，会对宏观经济变量与居民福祉产生巨大影响；以及冲击的持续性——即为何冲击的影响会长期存在，例如在初始冲击发生后很长一段时间内，失业率仍维持在高位。

对深度经济衰退的合理解读，应当能够转化为具体的政策建议。例如，解释为何政府支出乘数可能会相当大（这与前文所述的冲击放大机制分析一致），以及为何货币政策的效果可能相对有限。在这类分析中，信息不对称与不完全信息、行为经济学理论往往发挥核心作用，制度因素与收入分配效应同样不可或缺。如下文所述，货币政策效果的局限性，实际上并非源于零利率下限，而是由银行的行为模式所决定——毕竟银行是向除大型企业之外的所有经济主体提供信贷的核心机构。

2008年金融危机本质上是一场金融危机，因此标准DSGE模型的分析框架尤其难以解释其成因与演变过程：在代表性行为人模型中，破产、债务与信息不对称等金融学核心问题根本无从谈起。模型中究竟是谁向谁提供借贷？只有当代表性行为人陷入严重的精神分裂状态时，信息不对称问题才可能存在——而这种假设显然与模型通常采用的理性人假设相矛盾。

部分DSGE模型（例如斯梅茨与沃特斯（2003））试图通过引入企业部门与家庭部门，构建基础的金融分析框架。但2008年金融危机的成因，无法在这一框架内得到解释——因为这场危机的导火索，正是部分家庭向另一部分家庭过度借贷。此外，无论是否引入企业部门，在代表性行为人模型中，金融融资都将以股权形式进行——因此仍然不会出现破产与债务危机问题。

（一）冲击因素

DSGE模型在解释深度经济衰退（尤其是2008年金融危机）方面的局限性，首先体现在对危机根源的分析上。例如，在多数DSGE模型中，经济衰退由外生技术冲击引发。在农业领域，负向技术冲击的含义十分明确——例如恶劣天气或蝗灾；但在现代工业经济体中，负向技术冲击意味着什么？难道是某种流行病导致社会丧失了生产知识？

相比之下，在诸多（即便不是绝大多数）案例中，引发经济波动的冲击显然具有内生性。2008年金融危机的冲击便是内生的，源于房地产泡沫的破裂——这一泡沫是由市场自身催生的，不当的政策或许也起到了推波助澜的作用。即便存在外生冲击，企业与家庭暴露于冲击的程度同样具有内生性，会受到市场结构的影响。

（二）金融领域：防范过度风险与构建稳定的金融体系

当前，危机防范的核心任务，在于防止金融部门承担过度风险，同时确保金融体系的稳定性。政策制定者已经认识到，经济体面临的诸多重要冲击，均可能源于金融部门。

在标准模型中，货币需求方程被认为涵盖了金融领域的所有关键信息；但事实上，即便是货币需求方程，其重要性也十分有限——模型真正关注的，只是中央银行能够通过某种方式控制利率水平。但国库券利率与居民、企业实际面临的利率并非同一概念，二者之间的利差是一个关键的内生变量。大型企业或许可以通过资本市场融资，但中小企业的融资渠道则高度依赖银行体系。在当前的制度安排下，总体信贷创造与监管机构（包括中央银行）所掌控的政策工具之间的联系，既薄弱又不稳定。在各类政策工具中，监管规则尤为重要，但这类规则通常被排除在宏观经济分析的范畴之外。

此外，金融体系的结构对经济稳定性具有重要影响。厘清何种金融结构最有利于维护经济稳定，以及其中的核心权衡关系（例如在抵御小幅冲击与大幅冲击能力之间的权衡），是危机后宏观经济学的重要进展之一。这些问题在DSGE分析框架中甚至从未被提出——因为在缺乏明确金融部门设定的模型中，这类问题根本不可能存在；即便是在包含代表性金融机构的模型中，同样不会产生这类问题。

代表性行为人模型之所以难以增进我们对宏观经济波动的理解，原因之一在于宏观经济外部性的普遍存在——即每个行为人的总体行为会产生宏观经济影响，但行为人自身在决策时并未考虑这种影响。宏观经济外部性有助于解释，为何市场自身可能呈现出过度脆弱性，且面临过高的风险暴露。这类宏观经济外部性在实际经济周期（RBC）模型中并不存在，在标准DSGE模型中也仅能得到有限体现。在风险市场不完备、信息不对称与不完全的情况下，货币外部性具有重要意义，市场均衡状态通常也并非帕累托最优（格林沃尔德与斯蒂格利茨（1986）；吉纳科普洛斯与波莱马查基斯（1986））。例如，企业可能会过度举债（在开放经济体中，则可能过度积累美元债务），这意味着当经济陷入衰退时，企业可能会被迫抛售资产，进而导致资产价格下跌，对企业资产负债表造成冲击，进一步放大经济衰退的程度（详见下一节）。银行之间签订的契约，虽然从个体角度看具有合理性，但可能会加剧系统性风险，尤其是在面临大幅冲击时，这种效应更为显著。实际经济周期（RBC）模型的结构设定，决定了这类宏观经济外部性不可能存在，因此市场在应对冲击时始终是有效的；而作为其后续发展的、纳入工资与价格粘性的新凯恩斯主义模型，也仅能有限地反映这类外部性。相比之下，宏观经济外部性是本文所主张的替代模型的核心要素，有助于解释经济为何会显著偏离有效均衡状态。

在标准模型中，系统性风险问题根本不会被提及。模型关注的核心是通货膨胀，仿佛恶性通胀是经济稳定面临的主要威胁。但过去三十多年来的现实表明，情况并非如此；而金融不稳定引发的问题，则始终反复出现。

与标准DSGE模型相比，笔者主张的这类模型具有一项尤为重要的启示：在存在破产成本的情况下，过度的多元化（即资本市场一体化）可能会放大冲击的影响，而非如美联储所假设、标准模型所预测的那样，平抑和分散冲击的影响。事实上，基于DSGE模型假设的政策讨论，本身就存在逻辑矛盾：危机爆发前，传统观点主张尽可能推进多元化——例如通过资产证券化与金融关联实现风险分担；而危机爆发后，政策讨论的焦点却转向了风险传染。“传染”这一借自流行病学的概念，本身就与多元化的理念相悖：倘若有100名埃博拉患者抵达纽约，没有人会建议采取“多元化”政策，将患者分散到各个州。风险传染正是由这类金融关联所引发的。除非我们能够彻底消除未来危机发生的可能性，否则经济体系的设计必须同时兼顾危机前后的运行状态，平衡金融关联在危机前带来的收益与危机后产生的成本。传统观点从未考虑这一点——这绝非无关紧要的小缺陷，而是一个重大的根本性失误。

（三）冲击的放大与持续性

一个完善的宏观模型，除了解释冲击的来源以及经济体暴露于冲击的程度之外，还需阐明为何即便是中度冲击，也会引发严重的宏观经济后果。2008年金融危机期间的一大失误在于，当时有观点预测，即便次贷危机规模较大，也不会产生显著的经济影响，理由是风险已通过多元化配置被分散。对于当时主要政策制定者所使用的动态随机一般均衡（DSGE）模型而言，这一结论是顺理成章的。然而，其他模型却给出了截然不同的预测——这些模型聚焦于经济体内存在的关键放大机制，而事实上，其中部分机制后来也成为解释危机的标准理论。

冲击放大的一个重要来源是资产负债表效应：当企业资产负债表遭受冲击时，其生产与投资活动会随之收缩。要为资产负债表效应提供微观基础，就必须分析企业为何无法通过增发新股来弥补股权损失，也就是要解释股权配给现象（例如可参见格林沃尔德等人（1984）的研究）。现代基于信息经济学的金融理论，恰好为此提供了理论支撑，而且这些理论观点已被整合到简单的理论与应用宏观模型中。在这类模型里，企业的供需决策是其资产负债表状况的函数（参见格林沃尔德与斯蒂格利茨（1993b）、辜朝明（2008））。例如，格林沃尔德与斯蒂格利茨的研究表明，一次价格冲击（比如由产品需求冲击引发），会通过企业后续的产量、雇佣规模与投资决策被不断放大。

如果同时存在信贷配给，冲击的放大效应还会进一步加剧。学界不仅已构建起成熟的信贷配给理论（例如斯蒂格利茨与韦斯（1981）），卡洛米里斯与哈伯德（1989）等学者也证实，信贷约束在经济的多个关键部门均具有约束力，且在那些投资波动较大的部门中，信贷约束的影响尤为显著。这一点在2008年金融危机的演变过程中表现得淋漓尽致：到2010年时，大型企业手握数万亿美元现金，而中小企业却依旧面临严峻的信贷约束。

从宏观层面来看，现代信贷配给理论的核心主体是银行——这一关键机构在DSGE模型中却被遗漏了。这种遗漏显得尤为荒谬，因为如果没有银行，中央银行也就无从谈起，而中央银行的货币政策操作，恰恰是DSGE模型的核心内容。信贷是由银行这类机构来分配的，而非通过传统的拍卖市场机制，这一重要区别在DSGE分析框架中完全被忽略。格林沃尔德与斯蒂格利茨（2003）将银行建模为一类特殊企业：它们整合自有资本与吸纳的外部资本，开展信息收集与处理工作，并决定信贷投放的对象。银行自身同样普遍面临股权约束，此外还需遵守大量监管规定。银行资产负债表遭受的冲击、可投放贷款组合的变化、对贷款回报的预期调整，以及监管政策的变动，都会导致贷款供给规模与放贷条件发生剧烈变化。美国各州之间银行监管规则与经营环境的差异，正有助于验证：在2008年金融危机及其后续阶段，银行信贷供给条件的变化具有至关重要的影响。

面对2008年这般规模的冲击，资产负债表的修复需要耗费漫长时间，因此危机影响的持续性也就不足为奇。但即便在银行与企业的资产负债表恢复之后，危机的影响似乎仍在持续。这表明，此次危机（与大萧条类似）并非单纯的资产负债表危机，而是发达国家结构性转型的一部分。这种转型最显著的特征是经济重心从制造业向服务业转移，同时非技术密集型生产环节被外包至新兴市场；而对于发展中国家而言，结构性转型则体现为工业化推进与全球化融入的过程。毫无疑问，这类结构性转型会产生重大的宏观经济影响，也是经济增长过程中不可或缺的组成部分。DSGE模型之所以特别不适合分析结构性转型的影响，原因有三：

（1）理性预期假设，尤其是共同知识假设，或许在分析农业经济波动与增长时具有一定适用性——毕竟农业面临的天气冲击相对稳定，且服从平稳分布，但该假设无法刻画此类罕见的结构性变革；

（2）分析这类转型至少需要构建两部门模型；

（3）一个关键的市场失灵问题在于，资源（尤其是劳动力）难以在部门间自由流动。

事实上，已有学者构建了简单模型，用于分析结构性转型如何导致失业率长期高企，以及即便在这种情况下，标准凯恩斯主义政策仍能推动经济回归充分就业状态；相反，提高工资灵活性反而可能进一步推高失业率（参见德利·加蒂等人（2012a, 2012b））。

（四）调整过程与均衡状态

失业率高企的经济衰退之所以会持续存在，其中一个原因与经济调整机制有关。DSGE模型并未对这一问题展开分析，它只是简单假设，经济体可以直接跃迁至新的均衡路径。在单一行为人模型中，求解能够满足横截性条件的当期工资与价格水平，在理论上是清晰明确的——这个“超级理性人”会精准预判选择其他工资与价格组合的后果；但在缺乏共同知识的现实世界中，经济体如何实现这种均衡调整，却无从得知。如果存在一套覆盖无限未来的完整市场体系，那么我所提出的这一问题便不会存在。但现实中并不存在这样的市场——这正是关键的市场失灵表现之一。仅靠代表性行为人假设就宣称问题得到“解决”，丝毫无法解释现实世界中市场缺失的问题是如何被应对的。实际上，即便个体之间的唯一差异仅在于出生时间，这一问题依然存在：在世代交叠模型中，只要至少有部分个体的行为模式不符合无限期界王朝效用函数的设定，那么不仅可能存在太阳黑子均衡（卡斯与谢尔（1983）），还可能存在无数条与理性预期相符的均衡路径（参见平野与斯蒂格利茨（2017））。

基于“经济体瞬时调整至新均衡”假设的分析，与现实情况——以及大多数政策经济学家的假设——之间，存在明显脱节。现实中的工资与价格调整是一个分散化的过程：每个市场的工资与价格，都会对该市场的供需紧张程度做出反应（在劳动力市场中，这一点体现为简单的菲利普斯曲线，即劳动力市场趋紧时工资会上涨）。显然，在存在通胀的宏观环境中，调整过程会更为复杂，此时名义变量的调整需要考虑通胀预期的影响。

在短期内，这类调整过程可能会加剧非均衡状态：失业导致的工资下降，可能会拉低总需求，进而进一步推高失业率。如果不同群体的边际消费倾向存在差异，这种效应会表现得尤为突出（这是凯恩斯理论中的隐含假设，也是卡尔多（1957）与帕西内蒂（1962）的明确假设）：工资水平下降会导致收入向利润端转移，而资本家的边际消费倾向低于工人。

当然，真正起作用的是实际工资，而实际工资的变化取决于工资相对于价格的调整幅度（参见索洛与斯蒂格利茨（1968））。工资与价格可能会以相同速率下跌，从而使实际工资保持不变，形成一种实际工资粘性。货币实际余额（即货币持有的实际价值）的增加，通常会推动支出扩张，但这种效应相对有限，因此失业均衡状态仍可能长期持续。此外，通缩本身也会产生抑制效应，因为在其他条件不变的情况下，通缩会推高实际利率。不仅如此，如前所述，若经济中不同群体的边际消费倾向存在差异，那么（未被预期到的）通缩会导致收入从债务人向债权人再分配，这会进一步抑制总消费（参见埃格特松与克鲁格曼（2012）、科雷内克与希姆塞克（2016））。在开放经济体中，若债权人是外国主体，这种效应会更加显著——这相当于将收入转移给外国人，对非贸易品需求的冲击尤为剧烈。同理，价格调整还会引发前文所述的资产负债表效应，进而产生重大的宏观经济后果。

（五）金融摩擦

2008年金融危机之后，学界逐渐形成共识：标准模型的一大关键缺陷，在于对金融部门的忽视。如今被称为金融摩擦的一系列因素，具有至关重要的影响。这些因素包括信贷配给、股权配给，以及由此衍生的抵押品约束和银行的核心作用——这些内容在前文中均已提及。当然，引发金融摩擦的根源是多方面的信息与合约执行问题。那些最适合写入教科书、用以展示金融摩擦重要性的理论，未必是最贴合现实的。这一点至关重要，因为不同类型的金融摩擦，对应的政策含义可能截然不同。具体而言，基于执行成本（例如伊顿与格尔索维茨（1981））或状态验证成本（汤森（1979））的理论，与前文提到的基于逆向选择和激励机制的理论，存在显著差异。同样，尽管上述各类模型都可能产生重要的宏观经济外部性（例如与激励相容、自我选择或抵押品约束相关的外部性），且通常而言抵押品约束类模型最易于分析，但这在一定程度上是因为这类模型中的约束条件未能被充分内生化。

不过，对于构建简单的基准模型而言，纳入部分金融摩擦，远胜于完全忽略它们。事实上，我在教授宏观经济学时所使用的核心模型，是一个三期模型。模型的分析核心是当期，但当期与过去（过去的决策与冲击会影响当期状态变量）和未来紧密相连。估值函数概括了明日之后的未来情况，而当期的个体、企业与银行，都可能进行跨期权衡决策。总需求由总消费与总投资的简约式函数构成，其中信贷约束与净资产规模发挥着重要作用。企业的生产与投资决策，源于追求价值最大化的企业面临的股权约束——短期内企业无法通过增发新股融资，且随着借贷规模扩大，融资成本会上升（这反映了杠杆率提高与破产预期价值增加的影响），同时企业采用标准生产函数进行生产。纳入收入分配因素的最简模型包含两类家庭：一类是将全部收入用于消费的工人，另一类是在借贷约束下最大化跨期效用函数的资本家。中央银行设定国库券利率，而贷款供给曲线则是国库券利率、银行净资产、监管政策与经济状态的函数。一次负面冲击会使贷款供给曲线上移（即对于任意借贷规模，代表性企业都需要支付更高的利率）。研究者可以根据具体研究问题，对该模型进行扩展。关于模型的详细描述，可参见附录部分。

四、政策启示

我们之所以需要构建优良的基准模型，核心目的之一是为政策制定提供指导。正如前文所述，即便短期预测模型在理论上源于DSGE框架，也需要纳入各类变量以提高预测精度。仅仅实现模型矩条件与现实数据的匹配，并不意味着模型具备良好的预测能力。尤其是在经济陷入深度衰退时，政府往往希望采取干预措施，而用于分析小幅波动的模型，对此几乎难以提供有效指导。

政府需要针对具体的支出项目做出决策，而没有理由认为，与私人投资具有互补性的公共投资项目，其支出乘数会与公共消费支出的乘数相同。前者会挤入私人投资，而后者的影响则有所不同。但DSGE模型往往难以处理这类政策分析中的关键细节。

部分基于标准模型形成的传统观点认为，长期来看，旨在刺激经济的财政赤字会推高公共债务，进而挤出私人资本积累，损害经济增长。但这种观点的成立，依赖于一系列假设条件：

（1）若公共支出用于公共资本品、人力资本或技术研发，且这些投入与私人资本品具有互补性，那么公共支出反而会挤入私人资本积累；

（2）在经济体处于零利率下限的情况下，政府可以通过印钞为支出融资。此时，政策制定者通常担忧通缩问题，而印钞带来的通胀效应反而具有积极意义。

同样，传统观点认为，在理性预期假设下，由于个体预期未来税收会增加，财政支出乘数会较低（甚至为零）。但这一结论也依赖于特定假设：

（1）若财政支出用于能够提升生产率的公共投资项目，那么在理性预期假设下，传统支出乘数反而会扩大；

（2）若个体预期经济衰退将长期持续，那么当期支出的部分“漏出”会转化为未来需求约束时期的支出，从而提高未来时期的收入；消费者会将这一因素纳入考量，因此当期消费水平会高于不考虑该因素时的水平。

在存在金融摩擦的情况下，货币政策的效果可能相对有限。这并非源于零利率下限的约束——如果零利率下限是核心问题，那么政府可以通过调整不同时期的投资税收抵免与消费税税率，来改变个体的跨期边际替代率——而是因为降低国库券利率（或美联储贴现率），未必能显著改变银行的放贷行为。在这种情况下，相较于传统货币政策，直接针对信贷受限主体、旨在提高其信贷可得性的政策，可能会取得更好的效果。

核心结论在于，政府需要考虑的、具有显著宏观经济影响的政策种类繁多。我们必须以前文所述的核心模型为基础，构建针对性的模型，以评估各类政策的效果。例如，部分政策可能会影响经济体暴露于冲击的程度（如全面的资本市场自由化政策）；另一些政策则可能影响经济体自动稳定器的效力。构建能够分析这些政策效果的简单模型，具有至关重要的意义。而以DSGE框架为基础构建这类模型，其效果远不如基于前文所述的分析框架。

当前，全球经济正经历结构性转型。其结果是，在现有的政府收支规模与结构、私人支出模式下，经济体可能难以实现充分就业。基于前文所述及其他诸多原因，经济体向充分就业均衡状态的调整过程可能十分缓慢。但即便存在工资与价格粘性，仍存在一系列跨期财政政策组合（税收与支出政策），能够在短期内推动经济回归充分就业，或至少加快经济向充分就业状态收敛的速度。这类政策组合并非唯一，不同组合在短期公共投资规模与经济增长表现上存在差异。即便政府担忧债务规模问题，平衡预算乘数的存在也提供了解决思路——如果能够精心设计税收与支出政策，平衡预算乘数可以达到相当可观的水平。因此，与失业率长期高企相关的“长期停滞”，并非经济体无法规避的宿命，而是可以通过调整政策予以改变的结果。再次强调，如前文所述，以假设共同知识与理性预期的DSGE模型为基础，远不如以聚焦金融摩擦的模型为基础，更有助于设计应对结构性转型的政策。

五、进一步的批判

我们可以逐一剖析DSGE模型的各项基本假设，阐明这些假设的作用机制，解释为何它们会导致模型无法预测和解释宏观经济波动的关键特征，以及为何那些本应提升经济效率的“改革”措施，反而可能加剧宏观经济的波动性。

（一）信念差异的重要性

例如，前文已提及理性预期假设。我坚信，在理性预期框架下，无法充分解释在本轮危机中扮演关键角色的房地产泡沫的膨胀过程。但显然，抵押贷款市场的部分“改革”措施——这些措施得到了当时美联储主席的大力支持——确实助推了泡沫的形成。

信念差异同样会通过古兹曼与斯蒂格利茨所说的伪财富的创造与毁灭，对宏观经济波动产生重要影响。当两个个体的信念存在分歧时，他们会有动机进行打赌（或开展类似打赌的经济交易）。当然，交易双方都认为自己会获胜，因此双方“感知到的财富”之和会大于“真实财富”之和。在赌局结果揭晓之前，双方都有动机扩大支出，必要时甚至会举债消费。赌局结果的揭晓（即相关事件的发生），会导致一方财富增加、另一方财富减少。但这一过程并非简单的收入转移：它会造成总财富的缩减，进而抑制总消费。伪财富的创造与毁灭在经济中始终存在，但某些变化——例如新赌博市场的出现（如与金融“创新”相关的衍生品与信用违约互换市场的创设）——可能会导致总伪财富大幅增加；而某些事件（如房地产泡沫破裂）则可能导致伪财富的净毁灭。伪财富的波动，有助于解释宏观经济学中的一个悖论：为何在物质资本、劳动力与自然资本等实体状态变量变化较小的情况下，经济体却会出现剧烈波动。

（二）加总问题

宏观经济分析中存在一类关键假设，但学界对其关注严重不足，这便是加总假设。

很久以前，我们就已经认识到构建总量生产函数的困难性。“橡皮泥-橡皮泥”模型虽然极大地简化了分析，但我们不应宣称基于该模型的任何分析都具备真正的“微观基础”。早期研究已对标准模型在均衡分析中的应用提出了批判——例如，当经济系统存在“用商品生产商品”的生产方式，或存在涉及耐用性差异极大的资本品的生产过程时，标准模型的适用性便值得怀疑；而将其用于动态分析时，问题则更为突出——例如，“橡皮泥-陶土”模型与资本品世代模型的动态特征，与“橡皮泥-橡皮泥”模型存在显著差异。因此，在短期至中期的动态分析中，当资本品世代效应具有重要影响时，依赖“橡皮泥-陶土”模型进行分析是极为轻率的。

或许更为重要的问题是，将整个经济体加总为单一部门——尤其是当经济体面临结构性变革压力，需要将资源从一个部门转移至另一个部门（如从农业转向制造业），且存在阻碍资源再配置的市场失灵（如信贷可得性限制）时，单一部门模型的缺陷会尤为明显。

基于单一部门模型的政策分析，也很可能产生误导。货币政策通常被视为一种高效的政策工具，但货币政策对利率敏感型部门的影响更大，因此会导致经济体出现扭曲——这种扭曲在单一部门模型中根本无从体现（参见克雷默（2015））。

最后，代表性行为人假设本质上是对家庭部门的加总处理。宏观经济学家试图为宏观理论提供微观基础，因此希望施加一些约束条件，这一点是可以理解的——否则，任何形式的需求函数都可以被宣称具备微观基础。但代表性行为人假设的问题在于，它走得太远了：该假设完全排除了收入分配产生影响的可能性。至少有大量研究观点认为，不平等程度的上升，在危机的酝酿与经济复苏乏力的过程中，发挥了一定作用，甚至可能是关键作用。收入前1%群体与后80%群体的边际消费倾向存在巨大差异，因此任何显著影响收入分配的因素，都会影响总需求，即产生宏观经济效应。

六、超越标准模型的进一步思考

四十年来的经济学研究已表明，阿罗-德布鲁构建的基本竞争性均衡模型的微观基础存在缺陷。那么，我们又怎能期望基于此类微观基础的宏观模型有效呢？从根本上讲，标准模型在逻辑上是不连贯的，且会潜移默化地引导社会向损害经济效率与民众福祉的方向发展。该模型假设所有个体都是纯粹的利己主义者，却又假设合约总能得到完全履行。但完全利己的个体清楚合约执行存在成本，因此即便违约会损害自身声誉，他们也不会完全履行合约。正因如此，美国司法部与多起民事诉讼均揭露，在资产证券化过程中，普遍存在欺诈行为——多数（即便不是全部）信用评级机构、抵押贷款发放机构与投资银行都牵涉其中。这与金德尔伯格（1978）对历史上经济萧条与恐慌的分析结论一致。尽管将这类行为纳入标准经济模型存在困难，但此类行为的普遍存在，显然与标准DSGE模型的精神内核相悖，反而更符合那些强调通过制度安排防范此类行为、并充分考虑信息不完善性的模型的结论。毫无疑问，无论是制定防止类似危机重演的政策，还是分析市场动态，都需要同时考虑市场与监管层面的反应。最重要的是，宣扬并纵容毫无道德底线的利己主义文化，会导致经济体效率下降，个体与社会福祉受损。行为经济学的研究表明，大多数人的行为模式与标准模型的假设存在系统性偏差，但如果将个体置于利己主义文化氛围中（即利己被视为常态），其行为会逐渐向标准模型假设的方向转变。宏观经济学的使命，是为我们提供解释经济体实际运行机制的模型，而非描述一个由极端利己、却又总能完全履行合约的个体组成的虚幻世界的模型。亚当·斯密常被视为现代“利己主义”经济学的奠基人，但他在《道德情操论》（1759）中提出“看不见的手”假说的同时，也提醒我们：

无论人们认为某人多么自私，这个人的天性中，显然仍存在一些原则，使他会关注他人的命运，以他人的幸福为乐，尽管他不会因此得到任何实质性的回报。

幸运的是，斯密的这一观点是正确的。现代宏观经济学应当致力于纳入与这类人性本能相符的行为模式，就像它也会纳入那些不那么高尚的行为动机一样。对DSGE模型的批判之一在于，该模型及其背后的假设已演变为一种教条，研究者几乎没有动力去质疑它们——尤其是在需要发表同行评审论文的学术环境中。

七、结论

假设至关重要。所有模型都会进行简化，但关键在于，针对不同的研究问题，应当选择恰当的简化方式。危险之处在于，简化假设可能会以我们未曾察觉的方式，使分析结论产生偏差。DSGE模型忽视了那些在2008年危机中被证明至关重要的问题，因此，该模型既未能预测过去75年中最重大的宏观经济事件，也未能为制定恰当的政策应对措施提供有效指导——这一切都不足为奇。基于其模型结构，它本就不可能预测到此类事件的发生。在危机爆发前，货币当局关注的焦点是通胀，而非本应重点关注的金融稳定；它们采取的部分措施（尤其是放松监管的举措），显然加剧了金融体系的不稳定性。而DSGE模型则为它们提供了（错误的）信心，让它们认为自己的做法是正确的。

当然，任何优良的宏观经济模型，都必须具备动态性与随机性，并能够对整体经济运行进行分析。但正如前文所述，模型的每个组成部分，都隐含着特定的假设条件。关于模型动态性假设的若干问题，我们已在前文进行了探讨。

在我看来，该模型最大的缺陷之一，在于对不确定性的处理方式——不确定性正是DSGE模型中“随机性”的来源。前文已对模型的基本假设提出质疑：即风险可通过多元化配置被分散，且冲击具有外生性。此外，模型中那些通常未被明确阐述的风险管理假设，同样值得商榷。有充分证据表明，风险对企业、家庭与银行的影响是首要的，但这些影响并未被充分纳入标准DSGE模型。这也是为何在2008年危机期间，当政策制定者面临“如何最优地对银行进行资本重组”这一关键问题时，DSGE模型却束手无策。当时的政策目标是扩大信贷投放，尤其是向中小企业放贷。但美国与部分其他国家所采用的、通过发行优先股为银行注资的方式，被证明远非最优选择。实际上，存在其他资本重组方式，能够促使风险厌恶的银行扩大放贷规模。

本文通过诸多实例表明，基于有限期界假设的简单宏观模型，能够得出许多深刻洞见；而这些洞见，往往被DSGE模型为实现简化所做出的假设所掩盖。

在我看来，小型模型与大型模型应当是互补关系：我们需要用一类模型去检验另一类模型的结论。或许某些效应在三期模型的简化设定中被遗漏了，但更多情况下，结论恰恰相反。问题的核心并非模型规模的大小，而是假设条件的审慎选择。正如前文所述，当经济体面临的主要冲击是结构性变革时，部门加总假设会引发严重问题。

尽管如此，我们使用的模型确实会影响我们的思维方式：DSGE模型促使我们将经济运行理解为经济体始终沿着动态均衡路径演进，并将分析焦点放在跨期替代效应上。但我认为，无论是在短期还是中期，这两点都并非经济运行的核心特征；而且正如前文所述，DSGE模型对长期经济增长的分析贡献甚微。例如，对货币政策有效性的盲目信仰，导致部分人得出结论：当前货币政策之所以明显失效，仅仅是因为受到零利率下限的约束——只要能够突破这一限制，经济体就能恢复充分就业。当然，如果负利率的幅度足够大——比如借款人永远无需偿还贷款——那么刺激经济无疑会取得成效。但问题在于，当更大幅度的利率调整都被证明无效时，将实际利率从-2%下调至-4%这样的温和调整，是否真的能解决问题？货币政策失效的部分原因在于，降低国库券的名义利率，未必会带动贷款利率下降；或者说，降低国库券利率，未必会提高信贷可得性——这一点前文已予以阐明。但正如前文也提到的，如果真的认为跨期价格是关键因素，那么政府完全可以通过税收政策——调整不同时期的消费税税率与投资税收抵免——来改变跨期价格。

归根结底，无论模型的理论性有多强，其有效性都需要通过各种方式，接受现实观测数据的检验。模型的各个组成部分——例如消费行为设定——都需要接受大量微观与宏观数据的验证。但2008年危机这类深度衰退事件的发生频率极低，我们无法使用常规的计量经济学方法，来评估模型解释和预测这类关键事件的能力。正因如此，正如前文所述，单纯的最小二乘拟合是远远不够的。我们需要采用贝叶斯方法——对那些我们高度关注的预测结果赋予更高的权重。而通过校准模型来匹配某些变量的协方差，其参考价值则更低。模型的假设与参数数量众多，远超我们能从数据中获取的矩条件数量；因此，即便模型能够匹配数据中的所有矩条件，也并不意味着其假设是正确的，自然也无法让我们对基于该模型的预测或政策建议抱有信心。

DSGE模型的支持者辩称，其他模型的表现并不比DSGE模型好。这种说法并不正确。当时有多位经济学家（如罗伯特·希勒），借助虽未完全成型、但更贴合现实的模型，发现了房地产泡沫发生的高概率证据。还有一些关于金融传染的模型（前文已提及，且危机后得到了进一步发展），预测房地产泡沫的破裂很可能引发系统性风险。如果危机前美联储掌握的数据能够向公众公开，那么人们对危机爆发的判断会更加坚定。采用本文所述的替代模型的政策制定者，在危机预警与应对方面的表现，会远优于那些依赖DSGE模型的政策制定者。

即便模型的预测能力与解释力不尽如人意，它们也会产生深远的影响，因为模型会影响家庭、企业，尤其是政策制定者对经济运行的认知方式。如果模型认为，市场失灵的根本原因在于工资粘性，那么政策制定者可能会倾向于主张提高工资灵活性，并认为只要实现这一点，经济运行绩效就能得到改善。

本文的核心观点是，标准DSGE模型为政策制定提供的基础十分薄弱，对其进行小幅修正也难以发挥作用。幸运的是，政策制定者如今可以借鉴其他更优的分析框架。本文试图阐述，在用于教授学生的宏观经济学基准模型中，应当纳入哪些核心要素。我们应当向学生提出这样的挑战：如何将这些核心要素不断拓展，构建出兼具规模大小的各类模型，并融入从一系列“局部模型”（如银行部门模型）中获得的洞见——这些模型能够帮助我们理解经济体的重大波动，以及我们可以采取哪些措施，来降低波动的幅度与频率，减轻波动带来的民生疾苦。