论文复现:装模做样的IV

发布时间:2023-01-12 阅读 519

Stata连享会   主页 || 视频 || 推文 || 知乎 || Bilibili 站

温馨提示: 定期 清理浏览器缓存,可以获得最佳浏览体验。

New! lianxh 命令发布了:
随时搜索推文、Stata 资源。安装:
. ssc install lianxh
详情参见帮助文件 (有惊喜):
. help lianxh
连享会新命令:cnssc, ihelp, rdbalance, gitee, installpkg

课程详情 https://gitee.com/lianxh/Course

课程主页 https://gitee.com/lianxh/Course

⛳ Stata 系列推文:

PDF下载 - 推文合集

作者:陈晓淇 (中山大学)
邮箱chenxq223@mail2.sysu.edu.cn

编者按:本文主要摘译自下文,特此致谢!
Source:Bazzi S, Clemens M A. Blunt instruments: Avoiding common pitfalls in identifying the causes of economic growth[J]. American Economic Journal: Macroeconomics, 2013, 5(2): 152-86. -PDF- -Appendix- -Replication-


目录


1. 引言

经济学研究的一大课题是找出经济增长的原因。然而,探讨因果关系是困难的。许多研究人员通过使用工具变量来解决这一问题。工具变量需要满足两个条件:

  • 一是工具变量影响经济增长的唯一渠道是通过与之相关的内生解释变量;
  • 二是工具变量与内生解释变量具有良好的相关性。

不幸的是,在已发表的研究中,这些工具变量可能无效,较弱,或两者兼而有之。在本文中,我们首先讨论了在单一背景中使用看似有效的工具变量,为何在其他背景中可能是无效的。其次,本文提供的证据表明,弱工具变量可能会在应用中产生虚假的结果,特别是那些使用动态面板广义矩估计方法 (GMM) 的研究。

针对可能存在的问题,本文提出四种补救措施,以帮助研究人员克服这些困难:

  • 第一,在构建工具变量回归的理论基础时,应当考虑使用同一工具变量的其他已发表结果。
  • 第二,使用最新的方法来检验工具变量违反排除限制的敏感性。
  • 第三,用补充的方法来评估工具变量强度,打开 GMM 的“黑箱”。
  • 第四,使用弱工具稳健检验和估计量。

2. 强工具变量何时是无效的

假设增长由以下模型决定:

其中,g 是增长,xj 是 k 个潜在内生的增长决定因素,β 是待估参数,ε 是具有零均值的误差项。假定我们有一个工具变量 z,满足 E[zε]=0,Cov(z,xj)0 j。现在我们试着估计 k 个独立的回归:

在每一个回归中,xj 的工具变量为 z,其中 εjljβlxl+ε。但是,除非对于所有 j, βl=0 (或者更难以置信的是 xjxl ),否则 Cov(z,εj)=jβlCov(z,x)0 j。而工具 z 在每一个回归中都是无效的。

换句话说,如果现有的研究表明 z 是 xl 的强工具,而 xl 没有包含在式(2)中,且 βl 不等于 0,则 z 不是 xj 的有效工具变量。βj 的估计将会产生未知偏差,这使得回归结果的可靠性受到质疑。正如 Durlauf 等 (2005) 指出的那样:“由于增长理论是相互兼容的,工具变量的有效性需要一个积极的论证,即它不能是直接的增长决定因素,也不能与省略的增长决定因素相关。”

我们可能认为在式 (2) 中包含一些遗漏的 xj 会有所帮助,但这带来了一个新问题。式 (2) 中包含的每个 xj 都需要一个额外的工具变量 z~。该工具变量必须是有效的 (E[z~ε]=0),并在与其他变量一起使用时保持强度 (即 Corr(z,xj|z~)0 和 Corr(z~,xj|z)0)。这是一个很高的标准,且不谈寻找多个有效工具变量的困难,Dollar 和 Kraay (2003) 描述了这样一种情况:两种工具变量单独使用时,每一种看起来都很强,但彼此高度相关,当一起使用时,两者都很弱。

2.1 问题示例——人口规模

人口规模是另一个被广泛使用的工具变量。在这些使用人口规模作为工具变量的研究中,作者们给出了可信的理由,说明人口规模不仅是一个强工具变量,而且跟回归的误差项不相关。然而,当放在一起看时,问题暴露出来了。考虑到这些研究中没有一项把其他研究的内生变量作为自变量之一,假如人口规模在任何一项研究中是一个强且有效的工具变量,那么它在其他所有研究中就不是有效的。

一些研究人员使用人口规模作为贸易的工具变量,研究其对人均收入水平( Frankel 和 Romer 1999;Frankel 和 Rose,2002)或增长(Spolaore 和 Wacziarg,2005)的影响。另外一些研究使用人口规模作为工具变量,以识别外国援助对民主的影响(Hausmann 等,2007)。

如果在其他研究中识别的因果途径是正确的,那么人口规模作为有效工具变量所必需的排除限制就会被违反。人口规模最多只能是其中一项研究的有效工具变量。每个估计的偏差可大可小,但不应该忽视。

2.2 数量多,但无效

许多研究试图通过使用多个工具变量来解决工具变量无效或弱工具变量的问题。然而,人们常常忽视这样一个问题:一揽子工具变量中最有效的工具变量可能是最弱的,而最强的工具变量可能是最不有效的。

Rajan 和 Subramanian (2008) 用增长对外国援助收入进行了横截面回归,用一个由受援国人口规模、援助国人口规模、殖民地关系和语言特征构建的变量作为援助的工具变量。但事实上,该工具变量几乎只包含了受援国人口的规模的信息。在 Rajan 和 Subramanian (2008) 的数据中,1970-2000 年期间,对数人口与所构建的工具变量的样本内相关性为 −0.93。在 1980-2000 年和 1990-2000 年期间,这种相关性为 −0.95。实际上,Rajan 和 Subramanian(2008) 只是将人口作为援助的工具,尽管他们意识到使用人口规模作为工具的问题。

下面用 Rajan 和 Subramanian (2008) 的数据作为例子。以下结果表明,几乎所有的工具变量强度都来自人口变量。第 1 列复制了原文的一个代表性回归。识别不足和弱工具变量的检验表明工具变量很强。第 2 列在第二阶段中包含了对数人口,工具变量强度崩溃。我们不能拒绝结构方程识别不足的原假设。第 3 列仅使用对数人口作为援助的工具变量,结果与第 1 列几乎一模一样。第 4 列把人口规模从原来的工具变量中剔除,再次进行估计,工具变量强度极低。

3. 有效的工具变量何时是弱的

一般动态面板估计方程为:

其中,yi,t1 是城市 i 在 t1 时期的人均 GDP,gi,t 是增长百分比,xi,t 是一个代表增长决定因素的向量,ψi 是国家固定效应,νi,t 是特殊冲击,t=1,...T;i=1,...,N

Arellano 和 Bond (1991) 提出差分 GMM 的方法,将式 (3) 转换为一阶差分,并利用矩条件 E(lnyi,tjΔνi,t)=0 和 E(xi,tkΔνi,t)=0 进行估计。研究人员通常使用滞后因变量来解决动态面板偏误,但大多数人对 x 中增长决定因素的一些子集特别感兴趣。文献有两种处理方式:

一些作者将特定的子集视为内生的或前定的,与之相对应,k=2 和 k=1。另一些人则把 x 的所有元素都视为内生的,在这种情况下 k=2。另一个关键选择涉及矩条件的数量。有些研究者希望使用完整的滞后集。然而,Roodman (2009) 和其他人的研究表明,在有限样本下,这样的选择可能会产生误导性的结果。

Blundell-Bond 估计量(系统 GMM)是针对差分 GMM 中的弱工具变量问题而提出的,它用一个水平方程扩展了 Arellano-Bond 差分 (DIF) 方程。具体来说,这个估计量使用了一组额外的矩条件 E(ωi,tΔlnyi,t1)=0 和 E(ωi,tΔxi,t1)=0。其中 ωi,t=ψi+νi,txi,t 被假定为内生。

这些矩条件在 lnyi,t 和 xi,t 联合均值平稳过程下是有效的,在较弱的条件下也是有效的。这为式 (3) 中的增长决定因素在水平方程中提供了排除限制 (基于滞后差异)。从理论上讲,这些矩条件为检验典型索洛增长模型或突出各国增长率异质性的显著来源的研究提供了可靠的识别策略。

然而,在这种新的计量经济学技术的应用中,一个关键的问题却没有得到足够的关注:内生变量中的变动有多少是由工具变量解释的?

虽然一般认为在弱工具变量的问题上,系统 GMM 比差分 GMM 更稳健,但近期的研究表明,系统 GMM 也可能面临严重的弱工具变量偏误 (Hayakawa,2009;Bun 和 Windmeijer,2010)。在实践中,大多数系统 GMM 的应用简单地假设工具变量是强的。本文认为,工具变量强度是一个实证问题,可以也应该直接检验。

本文研究了系统 GMM 在各种应用中的工具变量强度。首先是在模拟数据中,然后是最近在顶级领域和大众关注的期刊上发表的几个有影响力的增长回归。我们采用一种简单的方法来评估动态面板 GMM 回归中的工具强度,这是 Bun 和 Windmeijer (2010) 与 Hayakawa (2009) 提出的分析方法。此外,本文在各种情况下采用探索式方法对工具变量强度进行评估。

具体而言,本文为系统估计量的差分和水平方程构造了 GMM 工具矩阵,并利用 2SLS 进行了相应的回归。Blundell 等 (2000) 证明了系统估计是差分方程和水平方程的加权平均,水平方程的权重随着差分方程工具变弱而增加。因此,如果一期、两期或多个滞后水平对同期差分的测度是微弱的,而滞后差分对同期水平的测度是微弱的,则 GMM 估计产生强识别的能力是值得怀疑的。

3.1 蒙特卡罗结果

首先我们证明了系统 GMM 估计量的估计效力可能是很差的,这关键取决于工具变量内生性的程度以及强度。我们模拟

其中,初始条件 yi,0=(ψi+(γθi/(1ζ)))/(1β)+νi,0 和 di,0=(θi)/(1ζ)+ϕi,0 足够保证均值平稳性。扰动项的分布如下:

以及

冲击的相关系数是 ρ=ωσ2。所有模拟的结果中所有方程都使用了 Windmeijer (2005) 两步纠正法,i 层面上的聚类标准误,也包含时间虚拟变量,并把 yi,t1 和 di,t 视为内生,并且在差分方程工具变量矩阵中包含了可用的滞后项的完整集合。

图 1 展示了 γ=0.3 且 β=0.2 时重复 500 次的模拟结果。横轴展示了 ζ{0.1,0.2,...,0.9} 中的不同值,表示 d 的持续性,纵轴比较了估计的 γ^ (黑实线)和真实的 γ (红虚线。虚线展示了所有模拟的 γ^ 的平均 95% 置信区间。图 1 的上半部分展示了差分 GMM 估计量的结果,下半部分展示了系统 GMM 估计量的结果。每一张小图都展示了内生程度 ω{0.1,0.5,0.9} 和冲击方差 σ2{0.1,0.5,1,5,10} 的不同组合。

σ2 的大小捕获了特殊冲击的方差与国家固定效应的方差的比值,这对工具变量的强度有重要影响。尽管 Blundell 和 Bond (1998) 的理论假定 σ2=1,但是在实证增长文献中 σ2<1 是很有可能的。也就是说,各国收入水平不随时间变化的异质性很可能淹没特殊冲击的国内变动。从低 σ2 到弱工具变量的理论渠道在 Bun 和 Windmeijer (2010) 等文献中得到了证实。

差分 GMM 估计量的估计效果较差。在任何情况下,我们都不能拒绝 γ=0 的假设,也不能拒绝 γ=0.3 的假设。当 ω 负得更多时,偏差是如此大,以至于 γ 的真实值经常被拒绝。

系统 GMM 估计量表现较好。只有在 ζ 较低时,γ 的估计才会拒绝真实值。它能够拒绝 γ=0 的假设,但仅针对高水平的 ζζ>0.6

图 2 表明这些偏误跟弱工具变量或识别不足的问题有关。纵轴展示了 Kleibergen-Paap LM 检验的 p 值,零假设是图 1 相应的差分和水平方程的 2SLS 回归是识别不足的。在图 2 的上半部分,当期的差分方程使用了与图 1 中差分 GMM 估计相同的滞后水平 GMM 工具矩阵。在图 2 的下半部分,当期的水平方程使用了与图 1 中系统 GMM 估计中水平方程相同的滞后差分工具变量矩阵。LM 检验 p 值大于 0.1(或者更保守地,0.05)说明可能存在严重的识别不足。

结合两张图,可以看出,当工具变量在图 2 中的 2SLS 方程中显示为弱工具变量时,图 1 中相应的差分和系统 GMM 对 γ 的估计表现糟糕。而当工具变量在 2SLS 水平方程中是强工具变量时(例如,当 ζ>0.6 且 σ2>1 ),γ 表现较好。

蒙特卡罗模拟的结果显示,在合理的参数假设下,系统 GMM 估计可能引导研究人员得出虚假的结论。这可能是因为,在许多情况下,没有很好的理由相信回归量的滞后水平项可以解释当期差分中的很大一部分变动,反之亦然。

3.2 问题示例——金融中介

Levine 等 (2000) 使用动态面板 GMM 考察了流动负债对增长的影响。本文对此作出检验,结果如下表。第 1 列复制了原文增长对“流动负债”的代表性回归。第 2 列给出了本文使用作者的原始数据集所能得到的最接近的回归重现结果,结果匹配得相对较好。

再次,我们进行了识别不足检验 (Kleibergen-Paap LM 检验) 和弱工具变量检验 (Cragg-Donald and Kleibergen-Paap Wald 检验)。第 3 列使用简单的 Pooled OLS 进行相同的回归。在第 4 列和第 5 列中,我们通过一阶差分 (FD) 和组内变换 (FE) 从回归中去除国家固定效应。识别不足的 Kleibergen-Paap LM 检验和 Cragg-Donald and Kleibergen-Paap Wald-type 统计量都表明工具变量非常弱,以至于无法消除相当一部分OLS偏差。

3.3 弱工具稳健推断

以Hausmann 等 (2007) 与 Hauk 和 Wacziarg (2009)的研究为例,我们对 2SLS 差分和水平方程进行弱工具稳健推断。本文利用 Kleibergen (2002) 的检验步骤,在存在多个工具变量的情况下,它比传统的 Anderson 和 Rubin (1949) 检验具有更好的特性。利用得到的 K 统计量,我们可以得到多个内生变量的联合置信集。尽管计算量很大,但该方法不仅对 (许多) 弱工具变量是稳健的,而且对无效工具变量也是稳健的 (Doko 和 Dufour,2008)。

在下图中,Panel A 绘制 Hausmann 等 ( 2007 ) 五年面板中三个内生变量子集的二维弱工具稳健置信集:对数初始出口多样性 (EXPY)、对数人力资本和对数初始人均 GDP。图中的 95% 置信度椭圆表示 (近似) 全三维置信度椭球中第三个内生变量上的最大面积水平集的边界。

我们不能拒绝 2SLS 差分方程中对数初始出口多样性和人力资本对经济增长的影响均为零。然而,回到水平方程,我们不能拒绝对数初始出口多样性具有积极的影响。

Panel B 绘制了 Hauk 和 Wacziarg (2009) 中四个内生变量子集的二维弱工具稳健置信集:实物资本、人力资本、人口和滞后收入。我们不能拒绝在 2SLS 差分和水平方程中,对数人力资本和对数物质资本对经济增长的影响均为零。

4. 建议

本文为增长经验提供了一些指导方针:

使理论基础更加一般化,以解释使用同一工具变量的其他已发表的结果。 当工具变量已经在其他文献中被使用时,新的使用者有责任证明使用该工具变量的其他重要发现,不会使得该工具变量在新研究中是无效的。这可以通过使用一个更一般化的模型来完成,该模型包含了该工具在其他地方探索的因果路径。通过“统一增长理论”来解释所有看似合理的路径的标准太高了,但解释已发表的重要路径应该是最低标准。

使用最新的方法来检验有效性。 寻找增长决定因素的完美工具变量是困难的,但许多未得到充分利用的方法,可以为我们现有的工具变量的使用带来启示。例如,Hahn 等 (2011) 检验在弱工具变量存在的情况下强工具变量的有效性。Imbens (2003) 提供了一种透明的方法,以评估增长效应的估计对工具变量和误差项相关程度的敏感性。

打开 GMM 的黑箱。 仅仅使用系统 GMM 未必能充分解决动态面板模型中弱工具变量的问题。研究增长决定因素的论文应进行更多探索,如两阶段最小二乘回归中备选工具变量的强度,工具变量矩阵折叠的稳健性,应利用为动态面板 GMM 定制的最优工具变量选择程序 (Okui 2009),并应探索弱工具稳健性方法。稳健推断步骤使增长研究人员不仅能识别弱工具,而且能够刻画它们对关键结构参数推断的影响。

5. 相关推文

Note:产生如下推文列表的 Stata 命令为:
lianxh 工具变量, m
安装最新版 lianxh 命令:
ssc install lianxh, replace

相关课程

免费公开课

最新课程-直播课

专题 嘉宾 直播/回看视频
最新专题 文本分析、机器学习、效率专题、生存分析等
研究设计 连玉君 我的特斯拉-实证研究设计-幻灯片-
面板模型 连玉君 动态面板模型-幻灯片-
面板模型 连玉君 直击面板数据模型 [免费公开课,2小时]
  • Note: 部分课程的资料,PPT 等可以前往 连享会-直播课 主页查看,下载。

课程主页

课程主页

关于我们

  • Stata连享会 由中山大学连玉君老师团队创办,定期分享实证分析经验。
  • 连享会-主页知乎专栏,700+ 推文,实证分析不再抓狂。直播间 有很多视频课程,可以随时观看。
  • 公众号关键词搜索/回复 功能已经上线。大家可以在公众号左下角点击键盘图标,输入简要关键词,以便快速呈现历史推文,获取工具软件和数据下载。常见关键词:课程, 直播, 视频, 客服, 模型设定, 研究设计, stata, plus, 绘图, 编程, 面板, 论文重现, 可视化, RDD, DID, PSM, 合成控制法

连享会小程序:扫一扫,看推文,看视频……

扫码加入连享会微信群,提问交流更方便

✏ 连享会-常见问题解答:
https://gitee.com/lianxh/Course/wikis

New! lianxhsongbl 命令发布了:
随时搜索连享会推文、Stata 资源,安装命令如下:
. ssc install lianxh
使用详情参见帮助文件 (有惊喜):
. help lianxh