1. 首页 > 知识问答

什么是dsge模型(均衡模型DSGE会走向何方)

自20世纪80年代开始,动态随机一般均衡(DSGE)模型的使用在学术界的宏观经济学和中央银行中已经变得无处不在了。这些模型是动态的,因为它们的特点是代理人会随着时间的推移做出决定。它们是随机的,因为它们以最终驱动模型的一系列变量波动的过程的不确定性为特征。最后,它们是一般均衡模型,因为价格、利率和数量都是同时决定的,这意味着所有代理人都满足他们的最优条件。在2007-09年的金融危机之后,这些模型受到了大量的批评。例如,见约瑟夫-斯蒂格利茨在2017年发表的非常有影响力的论文。在我看来,其中一些批评是有根据的,尽管很多批评是没有根据的,而且应该注意到,在此后的十年中,许多更合理的批评已经被纳入主流DSGE模型。然而,大多数批评都是针对DSGE模型的基本原则,例如,批评代表机构假设的有效性,或者强调这些模型没有充分考虑到金融部门的作用以及由此产生的对整个宏观经济的摩擦。

Daniel J. McDonald和Cosma Rohilla Shalizi两位统计学家在最近的一篇挑衅性的、有趣的论文中,将他们的批评指向DSGE文献的另一个方面,即这些模型的估计过程。他们提出了两个关键点,我将引用Shalizi关于这个问题的博文:

  1. 即使Smets-Wouters模型对经济结构的判断是完全正确的,而且它被赋予了几个世纪的静止数据,它的预测也会非常糟糕,而且许多 “深层”参数的估计仍然非常差。
  2. 在很多时候,随机调换序列可以改善拟合效果,即使结果是实质性的废话。

Smets-Wouters(2007)模型是一个大规模的DSGE模型,代表了文献中的一个基准,因为它包含了大量宏观经济学家通常认为与实践相关的摩擦。这是一个非常有影响力的模型,为中央银行和金融机构使用的许多其他模型奠定了基础。在他们的AER论文中,Smets和Wouters用美国的数据估计了他们的模型,并发现该模型在样本中可以超过贝叶斯VARs(一种不同的宏观技术,不对经济世界的明确结构进行表态)的表现。这在一段时间内是对DSGE模型的严重打击,也是私人部门大多对DSGE模型的目的持相当消极的看法的原因之一。

McDonald和Shalizi(以下简称MS)的批评表面上看非常令人担忧。他们在上述两点中的第一点基本上是说,如果我们采取一个DSGE模型,我们知道真实的参数集,使用参数化的模型来产生虚假的模拟数据,然后在模拟数据上估计模型,这个过程将不能可靠地获得真实的参数。显然,在实践中,当我们估计这些模型时,我们并不知道真正的参数(否则我们就不会费心了),但这是在实验室环境中测试估计性能的一种方法,我们知道真实的数据生成过程。如果在我们知道真相是什么的情况下,模型不能找到真相,我们应该对在真实世界的数据上产生的估计结果持高度怀疑态度。因此,这是个低标准。然而,他们发现,模型无法通过这个低标准,许多参数估计值大大偏离了它们的真实值,而且随着模拟样本长度的增加,参数估计误差也没有下降。

这个结果让我印象深刻,因为在我自己的工作中,我经常进行非常类似的练习,检查一个模型在模拟数据上估计时是否能正确恢复参数,然后再将其用于真实数据。应该指出的是,这是在估计DSGE模型时的标准做法,与MS暗示的情况不同1。例如,Schmitt-Grohe和Uribe(2012)通过在与他们的经验样本相同长度的模拟数据上估计他们的模型,检查他们的估计程序是否正确地恢复了真实参数。当我过去这样做的时候,其表现通常是非常好的,与MS的发现形成鲜明对比。因此,我想对Smets-Wouters模型进行我自己版本的测试。我不会完全复制MS在他们论文中的做法,而是会尝试做我认为典型的宏观经济学家在现实世界数据上估计他们的模型之前会做的事情。我将使用Matlab中的Dynare包来做一切,这在实践中几乎是普遍使用的。这是与MS的一个显著区别:

“为了估计模型,我们最小化负对数可能性,并对先验进行惩罚。这与在贝叶斯环境中寻找最大的后验估计相同。由于可能性是不稳定的,有许多平坦的部分和局部最小值,我们使用R的optimr包。我们使用模拟退火法和共轭梯度技术来估计参数,模拟退火法以一种原则性的方式随机地探索可能性表面。每个程序从5个随机初始化(从先验分布中抽取)开始,对每个起点运行50,000次迭代(可能性评价)”。

这一切都很好,使用R而不是Dynare也没有错,但Dynare的好处是它明确地设计用于解决和估计宏观模型,并包括许多有用的诊断测试。例如,实践中一个常见的问题是在估计过程中找到后验密度的全局模式,如果不能做到这一点,就会在随后的Metropolis Hastings算法中导致收敛性的重大问题。例如,Johannes Pfeifer表明,Jermann和Quadrini(2012)的原始估计就存在这个确切的问题,并且在修正后导致了明显不同的参数估计和其他各种结论。Dynare内置了许多不同的模式搜索器,其中一些明确设计用于处理为多模态后验密度寻找全局模式的问题,以及检查以验证全局模式确实被找到。该软件包是通过一个丰富的开发者和用户社区开发的,这意味着多年来已经发现了许多错误并随后解决了这些问题。这让我有信心,它能很好地进行估算,而任何仍然存在的问题都是真实的。

首先,我将对模型进行一些识别检查,这是Dynare提供的另一个有用的功能。尽管MS将有关DSGE模型识别的文献描述为 “相切”,但在现实中这是核心问题。如果一个参数的识别能力很差,增加数据量对其估计的准确性影响有限。众所周知,这种弱识别是许多DSGE模型的问题,有许多关于这个主题的论文,如Canova和Sala(2009),Iskrev(2010),Komunjer和Ng(2011),以及其他许多人。这促使人们使用贝叶斯技术来估计宏观模型,其中纳入了关于可能不好识别的参数的先验信息。上述后两篇论文提出了诊断性测试,允许从业者评估参数集的识别程度,这些测试在Dynare中实现。让我们看看在数据中使用的参数先验集和观测变量的情况下,SW中的估计参数集的识别程度如何:

 

看起来好像没有确定四个参数,但正如Johannes Pfeifer在他的SW模型的Dynare文件中指出的,实际上不是这样的。

“请注意,在先验平均值上,cmap,crhopinf和cmaw,crhow是成对的。因此,在先验均值上运行识别将返回一个警告。但这只是一个局部问题。这些参数只是在先验均值处无法区分,但在不同的点上却无法区分。”

其他参数大多都是相当好的识别。做这个识别测试绝对是好的做法,因为对于一些DSGE模型,会有一些参数识别得很差,或者完全没有识别。

接下来,我将从SW模型中生成模拟数据,并将参数校准为他们在原始论文中发现的后验模式。然后我将在模拟数据上估计模型,将每个估计的参数与它的 “真实 ”值进行比较。我使用Dynare中的mode_compute = 9选项,这是一个旨在找到全局模式的模式搜索器,然后我将在用于评估后验的Metropolis-Hastings算法中使用20,000次抽样。我将对不同长度的模拟样本进行操作,从300个季度的长度(N)开始,这大致相当于我们在实践中考虑到数据可用性而通常使用的宏观经济数据的长度。然后我将增加到1000、2000和最后的5000个季度,评估估计误差(估计参数和 “真实”参数之间的差异)是如何演变的。首先看一下300个季度的情况下的图:

 

即使在这种现实的样本长度情况下,估计的模型也能很好地恢复真实参数。当然,这些点并不完全落在45度线上,但误差并不很大。这与MS的发现形成了鲜明的对比(引文已编辑,删除了参数符号):

例如,劳动力供应对实际工资的弹性一直被低估了大约-93%。数据基本上没有提供关于衡量实际工资对滞后通货膨胀依赖性的参数的信息。其他估计不足的参数包括资本调整成本函数的稳态弹性。在所有这些情况下,估计都是有偏差的,所以使用真实数据的估计值来得出关于实体经济的结论是不明智的。

在我对N=300的估计中,我发现劳动力供给对实际工资的弹性估计值为1.75,而真实值为1.95;实际工资对滞后通货膨胀参数的依赖性估计为0.30,而真实值为0.32;资本调整成本函数的稳态弹性估计为0.23,而真实值为0.27。这些误差显然不大。全套参数的均方根误差(RMSE)为0.09,无论如何也不会很夸张。

对全部模拟样本长度的阵列重复这一练习:

 

参数集的RMSE随着样本长度的增加而下降,这与估计器的一致性概念相一致。这里的结果表明,关于Smets-Wouters模型不能成功的批评是没有道理的,即使在从自身产生的模拟数据上估计它,也是如此。我无法准确解释为什么我得到了如此不同的结果,这相当不令人满意,但如果我必须猜测,我会把它归结为Dynare与R的差异。就个人而言,我倾向于相信Dynare中产生的结果,原因如前所述。应该指出的是,Joshua Brault也进行了与我在这里描述的非常类似的练习,并发现了非常类似的结果。

MS提出的第二点是,将用于估计模型的变量彼此重新标记,可以导致更好的拟合。我不太清楚该如何理解这一批评。值得提出的一点是,众所周知,许多宏观经济变量之间显示出非常高的相关性,因此,这可能会削弱变量之间互换对参数估计的影响。Otilia Boldea在Twitter上雄辩地提出了另外一个观点,即这些变量交换产生了一个故意错误的模型,因此你估计的是错误的可能性。归根结底,这意味着这个练习对模型的任何特定缺陷都没有参考价值,纯粹是一种统计练习。

 

我通常欢迎对宏观范式的批评,包括那些不是来自内部人士而是来自另一个学科的批评,就像这里的情况一样。我的观点是,这是一个重要的机制,通过这个机制,事情会得到改善。这方面的一个很好的例子是在大流行病期间,流行病学模型自然受到了大量的审查,这暴露出了“引擎盖”下的一些紧迫问题。然而,Macdonald和Shalizi在这里提出的这种特定的批评似乎充其量是夸大了。说Smets-Wouters模型即使作为数据生成过程也不能恢复真正的参数,这当然是不准确的,而且变量交换的批评可能并不像作者所说的那样令人震惊。为了避免疑问,我绝不是说DSGE的估计完全没有问题。事实上,在实践中,识别是一个严重的问题,但这是宏观经济学家清楚地意识到的,并采取了措施来测试和解决。此外,模型的错误指定肯定是一个问题。Den Haan和Drechsel(2021)发现,Smets-Wouters模型存在这个问题,并提供了一些纠正措施。

跨学科的批评最终是一把双刃剑。一方面,对一个根深蒂固的现状的新视角无疑是有用的,应该受到欢迎。另一方面,我们不能指望一个不熟悉某个领域的人了解所有的相关文献,因此,在这个过程中错过一些既定的智慧也就不足为奇了。不幸的是,Macdonald和Shalizi对DSGE估计的批评似乎以牺牲前者为代价,大量采用后者。

注释:1: 来自Shalizi的博文:“但是,‘让我们在模拟输出上试试估计器 ’是,或者说应该是一个完全标准的诊断方法,而且似乎也缺乏,尽管有大量关于DSGE的争议性文献”。

版权声明:本文内容由互联网用户贡献,该文观点仅代表作者本人。本站不拥有所有权,不承担相关法律责任。如发现有侵权/违规的内容, 联系QQ15101117,本站将立刻清除。

联系我们

在线咨询:点击这里给我发消息

微信号:666666