Stata连享会 主页 || 视频 || 推文 || 知乎 || Bilibili 站
温馨提示: 定期 清理浏览器缓存,可以获得最佳浏览体验。
New!
lianxh
命令发布了:
随时搜索推文、Stata 资源。安装:
. ssc install lianxh
详情参见帮助文件 (有惊喜):
. help lianxh
连享会新命令:cnssc
,ihelp
,rdbalance
,gitee
,installpkg
⛳ Stata 系列推文:
作者:陈晓淇 (中山大学)
邮箱:chenxq223@mail2.sysu.edu.cn
编者按:本文主要摘译自下文,特此致谢!
Source:Bazzi S, Clemens M A. Blunt instruments: Avoiding common pitfalls in identifying the causes of economic growth[J]. American Economic Journal: Macroeconomics, 2013, 5(2): 152-86. -PDF- -Appendix- -Replication-
目录
经济学研究的一大课题是找出经济增长的原因。然而,探讨因果关系是困难的。许多研究人员通过使用工具变量来解决这一问题。工具变量需要满足两个条件:
不幸的是,在已发表的研究中,这些工具变量可能无效,较弱,或两者兼而有之。在本文中,我们首先讨论了在单一背景中使用看似有效的工具变量,为何在其他背景中可能是无效的。其次,本文提供的证据表明,弱工具变量可能会在应用中产生虚假的结果,特别是那些使用动态面板广义矩估计方法 (GMM) 的研究。
针对可能存在的问题,本文提出四种补救措施,以帮助研究人员克服这些困难:
假设增长由以下模型决定:
其中,
在每一个回归中,
换句话说,如果现有的研究表明
我们可能认为在式 (2) 中包含一些遗漏的
人口规模是另一个被广泛使用的工具变量。在这些使用人口规模作为工具变量的研究中,作者们给出了可信的理由,说明人口规模不仅是一个强工具变量,而且跟回归的误差项不相关。然而,当放在一起看时,问题暴露出来了。考虑到这些研究中没有一项把其他研究的内生变量作为自变量之一,假如人口规模在任何一项研究中是一个强且有效的工具变量,那么它在其他所有研究中就不是有效的。
一些研究人员使用人口规模作为贸易的工具变量,研究其对人均收入水平( Frankel 和 Romer 1999;Frankel 和 Rose,2002)或增长(Spolaore 和 Wacziarg,2005)的影响。另外一些研究使用人口规模作为工具变量,以识别外国援助对民主的影响(Hausmann 等,2007)。
如果在其他研究中识别的因果途径是正确的,那么人口规模作为有效工具变量所必需的排除限制就会被违反。人口规模最多只能是其中一项研究的有效工具变量。每个估计的偏差可大可小,但不应该忽视。
许多研究试图通过使用多个工具变量来解决工具变量无效或弱工具变量的问题。然而,人们常常忽视这样一个问题:一揽子工具变量中最有效的工具变量可能是最弱的,而最强的工具变量可能是最不有效的。
Rajan 和 Subramanian (2008) 用增长对外国援助收入进行了横截面回归,用一个由受援国人口规模、援助国人口规模、殖民地关系和语言特征构建的变量作为援助的工具变量。但事实上,该工具变量几乎只包含了受援国人口的规模的信息。在 Rajan 和 Subramanian (2008) 的数据中,1970-2000 年期间,对数人口与所构建的工具变量的样本内相关性为 −0.93。在 1980-2000 年和 1990-2000 年期间,这种相关性为 −0.95。实际上,Rajan 和 Subramanian(2008) 只是将人口作为援助的工具,尽管他们意识到使用人口规模作为工具的问题。
下面用 Rajan 和 Subramanian (2008) 的数据作为例子。以下结果表明,几乎所有的工具变量强度都来自人口变量。第 1 列复制了原文的一个代表性回归。识别不足和弱工具变量的检验表明工具变量很强。第 2 列在第二阶段中包含了对数人口,工具变量强度崩溃。我们不能拒绝结构方程识别不足的原假设。第 3 列仅使用对数人口作为援助的工具变量,结果与第 1 列几乎一模一样。第 4 列把人口规模从原来的工具变量中剔除,再次进行估计,工具变量强度极低。
一般动态面板估计方程为:
其中,
Arellano 和 Bond (1991) 提出差分 GMM 的方法,将式 (3) 转换为一阶差分,并利用矩条件
一些作者将特定的子集视为内生的或前定的,与之相对应,
Blundell-Bond 估计量(系统 GMM)是针对差分 GMM 中的弱工具变量问题而提出的,它用一个水平方程扩展了 Arellano-Bond 差分 (DIF) 方程。具体来说,这个估计量使用了一组额外的矩条件
这些矩条件在
然而,在这种新的计量经济学技术的应用中,一个关键的问题却没有得到足够的关注:内生变量中的变动有多少是由工具变量解释的?
虽然一般认为在弱工具变量的问题上,系统 GMM 比差分 GMM 更稳健,但近期的研究表明,系统 GMM 也可能面临严重的弱工具变量偏误 (Hayakawa,2009;Bun 和 Windmeijer,2010)。在实践中,大多数系统 GMM 的应用简单地假设工具变量是强的。本文认为,工具变量强度是一个实证问题,可以也应该直接检验。
本文研究了系统 GMM 在各种应用中的工具变量强度。首先是在模拟数据中,然后是最近在顶级领域和大众关注的期刊上发表的几个有影响力的增长回归。我们采用一种简单的方法来评估动态面板 GMM 回归中的工具强度,这是 Bun 和 Windmeijer (2010) 与 Hayakawa (2009) 提出的分析方法。此外,本文在各种情况下采用探索式方法对工具变量强度进行评估。
具体而言,本文为系统估计量的差分和水平方程构造了 GMM 工具矩阵,并利用 2SLS 进行了相应的回归。Blundell 等 (2000) 证明了系统估计是差分方程和水平方程的加权平均,水平方程的权重随着差分方程工具变弱而增加。因此,如果一期、两期或多个滞后水平对同期差分的测度是微弱的,而滞后差分对同期水平的测度是微弱的,则 GMM 估计产生强识别的能力是值得怀疑的。
首先我们证明了系统 GMM 估计量的估计效力可能是很差的,这关键取决于工具变量内生性的程度以及强度。我们模拟
其中,初始条件
以及
冲击的相关系数是
图 1 展示了
差分 GMM 估计量的估计效果较差。在任何情况下,我们都不能拒绝
系统 GMM 估计量表现较好。只有在
图 2 表明这些偏误跟弱工具变量或识别不足的问题有关。纵轴展示了 Kleibergen-Paap LM 检验的 p 值,零假设是图 1 相应的差分和水平方程的 2SLS 回归是识别不足的。在图 2 的上半部分,当期的差分方程使用了与图 1 中差分 GMM 估计相同的滞后水平 GMM 工具矩阵。在图 2 的下半部分,当期的水平方程使用了与图 1 中系统 GMM 估计中水平方程相同的滞后差分工具变量矩阵。LM 检验 p 值大于 0.1(或者更保守地,0.05)说明可能存在严重的识别不足。
结合两张图,可以看出,当工具变量在图 2 中的 2SLS 方程中显示为弱工具变量时,图 1 中相应的差分和系统 GMM 对
蒙特卡罗模拟的结果显示,在合理的参数假设下,系统 GMM 估计可能引导研究人员得出虚假的结论。这可能是因为,在许多情况下,没有很好的理由相信回归量的滞后水平项可以解释当期差分中的很大一部分变动,反之亦然。
Levine 等 (2000) 使用动态面板 GMM 考察了流动负债对增长的影响。本文对此作出检验,结果如下表。第 1 列复制了原文增长对“流动负债”的代表性回归。第 2 列给出了本文使用作者的原始数据集所能得到的最接近的回归重现结果,结果匹配得相对较好。
再次,我们进行了识别不足检验 (Kleibergen-Paap LM 检验) 和弱工具变量检验 (Cragg-Donald and Kleibergen-Paap Wald 检验)。第 3 列使用简单的 Pooled OLS 进行相同的回归。在第 4 列和第 5 列中,我们通过一阶差分 (FD) 和组内变换 (FE) 从回归中去除国家固定效应。识别不足的 Kleibergen-Paap LM 检验和 Cragg-Donald and Kleibergen-Paap Wald-type 统计量都表明工具变量非常弱,以至于无法消除相当一部分OLS偏差。
以Hausmann 等 (2007) 与 Hauk 和 Wacziarg (2009)的研究为例,我们对 2SLS 差分和水平方程进行弱工具稳健推断。本文利用 Kleibergen (2002) 的检验步骤,在存在多个工具变量的情况下,它比传统的 Anderson 和 Rubin (1949) 检验具有更好的特性。利用得到的
在下图中,Panel A 绘制 Hausmann 等 ( 2007 ) 五年面板中三个内生变量子集的二维弱工具稳健置信集:对数初始出口多样性 (EXPY)、对数人力资本和对数初始人均 GDP。图中的 95% 置信度椭圆表示 (近似) 全三维置信度椭球中第三个内生变量上的最大面积水平集的边界。
我们不能拒绝 2SLS 差分方程中对数初始出口多样性和人力资本对经济增长的影响均为零。然而,回到水平方程,我们不能拒绝对数初始出口多样性具有积极的影响。
Panel B 绘制了 Hauk 和 Wacziarg (2009) 中四个内生变量子集的二维弱工具稳健置信集:实物资本、人力资本、人口和滞后收入。我们不能拒绝在 2SLS 差分和水平方程中,对数人力资本和对数物质资本对经济增长的影响均为零。
本文为增长经验提供了一些指导方针:
使理论基础更加一般化,以解释使用同一工具变量的其他已发表的结果。 当工具变量已经在其他文献中被使用时,新的使用者有责任证明使用该工具变量的其他重要发现,不会使得该工具变量在新研究中是无效的。这可以通过使用一个更一般化的模型来完成,该模型包含了该工具在其他地方探索的因果路径。通过“统一增长理论”来解释所有看似合理的路径的标准太高了,但解释已发表的重要路径应该是最低标准。
使用最新的方法来检验有效性。 寻找增长决定因素的完美工具变量是困难的,但许多未得到充分利用的方法,可以为我们现有的工具变量的使用带来启示。例如,Hahn 等 (2011) 检验在弱工具变量存在的情况下强工具变量的有效性。Imbens (2003) 提供了一种透明的方法,以评估增长效应的估计对工具变量和误差项相关程度的敏感性。
打开 GMM 的黑箱。 仅仅使用系统 GMM 未必能充分解决动态面板模型中弱工具变量的问题。研究增长决定因素的论文应进行更多探索,如两阶段最小二乘回归中备选工具变量的强度,工具变量矩阵折叠的稳健性,应利用为动态面板 GMM 定制的最优工具变量选择程序 (Okui 2009),并应探索弱工具稳健性方法。稳健推断步骤使增长研究人员不仅能识别弱工具,而且能够刻画它们对关键结构参数推断的影响。
Note:产生如下推文列表的 Stata 命令为:
lianxh 工具变量, m
安装最新版lianxh
命令:
ssc install lianxh, replace
免费公开课
最新课程-直播课
专题 | 嘉宾 | 直播/回看视频 |
---|---|---|
⭐ 最新专题 | 文本分析、机器学习、效率专题、生存分析等 | |
研究设计 | 连玉君 | 我的特斯拉-实证研究设计,-幻灯片- |
面板模型 | 连玉君 | 动态面板模型,-幻灯片- |
面板模型 | 连玉君 | 直击面板数据模型 [免费公开课,2小时] |
⛳ 课程主页
⛳ 课程主页
关于我们
课程, 直播, 视频, 客服, 模型设定, 研究设计, stata, plus, 绘图, 编程, 面板, 论文重现, 可视化, RDD, DID, PSM, 合成控制法
等
连享会小程序:扫一扫,看推文,看视频……
扫码加入连享会微信群,提问交流更方便
✏ 连享会-常见问题解答:
✨ https://gitee.com/lianxh/Course/wikis
New!
lianxh
和songbl
命令发布了:
随时搜索连享会推文、Stata 资源,安装命令如下:
. ssc install lianxh
使用详情参见帮助文件 (有惊喜):
. help lianxh