Stata连享会 主页 || 视频 || 推文 || 知乎 || Bilibili 站
温馨提示: 定期 清理浏览器缓存,可以获得最佳浏览体验。
New!
lianxh
命令发布了:
随时搜索推文、Stata 资源。安装:
. ssc install lianxh
详情参见帮助文件 (有惊喜):
. help lianxh
连享会新命令:cnssc
,ihelp
,rdbalance
,gitee
,installpkg
⛳ Stata 系列推文:
作者:尚佳雪 (中山大学)
邮箱 shangjx5@mail2.sysu.edu.cn
目录
本推文主要源于如下论文,特此致谢!
Source: Mellon, Jonathan, Rain, Rain, Go Away: 192 Potential Exclusion-Restriction Violations for Studies Using Weather as an Instrumental Variable (July 18, 2022). -PDF-
内生性 是研究中面临的最普遍的挑战之一,两个变量
我们通常会使用工具变量 ( IV ) 来应对内生性问题,如图1中的 " Instrumental Variable " 板块所示,
任何工具变量估计需要满足识别假设,其中最重要假设之一是排他性约束假设,即工具变量
违反排他性约束假设会对估计结果造成干扰,Bartels ( 1991 ) 表明即使是微弱地违反工具变量估计假设也会极大造成 IV 回归有偏,甚至有时还不如 OLS 回归。
一个广泛使用的工具变量是天气 ( Weather ) 。天气被广泛作为外生变量是有原因的,首先天气本质上是随机的,其次它只通过特定的狭窄因果路径与人类的活动结果相关。
但是天气做为工具变量也受到了很多质疑与批评。Sarsons ( 2015 ) 指出降雨量对经济增长的 IV估计可能违反了排他性约束假设,因为她发现,即使收入不受影响,降雨也会预测到印度的冲突。Gallen and Raymond ( 2019 ) 将降雨量作为几个过度使用的工具变量之一。Cooperman ( 2017 ) 和 Betz, Cook and Hollenbach ( 2019 ) 指出,降雨和许多其他工具存在空间相互依赖性,但这在实际研究中很少被充分考虑。
因此本文收集了 156 篇使用天气作为工具变量的文献和另外 132 篇研究天气对其他变量直接影响的文献。总的来说,作者保守地确定了社会科学家感兴趣的 192 个变量 ,现有的研究已经通过许多不同的因果途径将这些变量与天气联系起来。
通过这些文献,作者使用天气对可能的
本文结论发现,在很多已有文献中,天气作为工具变量并不符合 DAG 基本假设,即存在违反排他性约束假设,这表明他们的研究结果可能是有偏甚至是错误的。此外,本文还提供了一种系统列举现有文献存在的潜在违反排他性约束的步骤,见 4.3。
我们来举一个例子。研究 1 将
然而,一种可能的情况是,
在实际中,不同研究违反排他性约束假设的程度会有很大不同,因此因果估计中的结果偏差也会相应变化。如果
本节概述了收集将 "天气" 作为工具变量的研究、识别可能的违反排他性约束的情况以及可能的测量 IV 估计的敏感性的方法。
作者收集了在谷歌学术搜索 " weather " 工具变量的前 500 个结果,又添加了搜索 "rain" 工具变量的前 100 个结果,以及作者之前确定的一些研究以及最初搜索中引用的相关研究,共收集了 156 项以天气做为工具变量的研究,以及另外 132 项使用天气作为感兴趣的独立变量的研究。
本文尽可能广泛地确定天气作为 IV 研究的潜在违反排他性约束的情况。在研究 A 中,使用
一个值得注意的一点是,已有研究使用各种天气现象作为工具变量,尽管天气类型不同,但不同的天气类型是复杂因果网络的一部分,它们通常有很大的相关性。例如,
在不同的时间频率与经济发展水平情况下,将天气作为工具变量来测量因果关系也可能会有不同的结果:
时间频率
天气可以在不同的时间频率上进行测量。一些研究着眼于降雨量的每日变化,而另一些研究则侧重于降雨量的年变化。如果天气的每日变化影响了一个变量,那么这种影响可能会在更长的时期内累积起来影响这个变量。因此,长期的天气 IV 研究相对容易受到所有其他短期天气 IV 研究的影响,从而发生违反排他性约束假设情况。然而,反过来则不一定。如果短期的研究控制了长期的天气变量,那么就有可能消除通过长期天气起作用的违反排他性约束情况。因此,作者将这些研究分为短期研究和长期研究,短期研究中,关注天气的月变化或更频繁,反之则是长期研究。
经济发展水平
较贫穷的国家倾向于以农业和原材料开采为基础的初级经济,而较富裕的国家则拥有更加多样化的经济。因此,在不同经济发展环境中,天气的影响可能大不相同。为了缓解这一问题,作者根据世界银行中国家目前的发展水平对每项研究涵盖的国家进行分类,将高或中高收入国家归入高收入类别,将中低收入国家归入低收入类别。
违反排他性约束假设并不一定就意味着IV估计将有很大偏差,因此需要测算Z是否严重违反了排他性约束假设,从而改变IV研究的结论。违反排他性约束假设将在多大程度上改变天气IV研究的结论取决于两个量:
这样,估计系数的偏差就表示为:
其中,
矫正后的标准误为:
对于回归第一阶段的
前两点已在 3.1 中阐释,接下来阐释 第 3、4 点 。
在图 1 的第三个板块 " Instrumental Variable " 中,天气只通过感兴趣的单个
在因果网络中最常见的天气类型是 " 降雨量 ",下图显示了 191 篇文献中包含" 降雨量 "的文献构成的因果网络。
图中圆圈大小表示文献中出现的次数,绿色圆圈表示天气变量,橙色圆圈表示内生变量,紫色圆圈表示结果变量,可以看到明显违背排他性约束假设的现象。
下图显示了按国家经济水平和时间频率分类的天气 IV 研究 (所有类型的天气) 的因果网络。其中针对低收入国家并使用天气短期变化的研究相对较少,只有 11 个变量与天气相关。另外三个板块显示了一个需要考虑潜在排他性约束违例的网络,高收入-短期有 74 个变量,低收入-长期有 83 个变量,高收入-长期有 119 个变量。对于绝大多数研究,存在违反排他性约束假设的情况。
在对高收入和低收入国家进行的天气 IV 研究中,使用最广泛的内生变量是 收入,无论是个人收入、家庭收入还是总收入。收入是一个非常重要的变量,因此对于其他使用天气 IV 的研究来说,就存在很大的违反排他性约束假设的概率。
大多数人认为"直升机飞行条件"和"海盗袭击"不可能违反排他性约束假设,但结果可能并非如此,有多条路线表明存在这样的违例。
第一条因果路线是 情绪 (mood) ,几项研究称天气和情绪之间存在联系 ( Meier, Schmid and Stutzer 2019;Khanthavit 2017;Jacobsen and Marquering 2008;Duhaime and Moulton 2018;Bassi 2013;Guven and Hoxha 2015 )。Guven and Hoxha ( 2015 )表示情绪被认为与决策速度、投资决策、通胀预期、风险规避、财务决策和预期寿命有关。很难想象一个变量不会受到这些变量中至少一个变量的因果影响或直接受到情绪的影响。
第二条因果路径是 污染 (pollution) ,多种天气变量对污染进行了工具变量估计,包括风速 ( Peet 2020;Zheng et al. 2019; Bondy,Roth and Sager 2020 )、风向( Luechinger 2014;Fan and Wang 2020 ),大气逆温( Bondy,Roth,and Sager 2020;Sager 2019 ),以及降雨量 ( Peet 2020;Fontenla,Goodwin,and Gonzalez 2019 )。反过来,污染与犯罪( Bondy,Roth,and Sager 2020 )、心理健康 ( Gu et al. 2020 )、死亡率( Fan and Wang 2020 )、道路事故( Sager 2019 )、零售 ( H. Kang,Suh,and Yu 2019 )、房价( Fontenla,Goodwin,and Gonzalez 2019 )、流动性( Cui et al. 2019 )、认知( Peet 2020 )和情绪( Zheng et al. 2019 )相关联。很难认为任何社会科学研究变量都不会受到这些因素的影响。
第三条因果路径是 肤色 (skin tone)。Katz等 ( 2020 ) 表明一些工人暴露在阳光下时皮肤变得更黑,而其他人则不会晒黑,在阳光明媚的时期,晒太阳的人和不晒太阳的人在劳动力市场上的差距扩大了。鉴于色彩主义无处不在,肤色与天气的混合效应是因果网络中的的一个主要切入点。
此外,还有数百个其他变量,涉及范围很广,包括自闭症 ( autism )、政府支出 ( government spending )、无人机袭击 ( drone strikes )、全球变暖信念 ( global warming beliefs )、电力消费 ( alcohol consumption )、回收 ( recycling )、疟疾 ( malaria )等等。
下图显示了敏感性分析结果。其中的阴影与数字表示要多强能够使已有文献的结果不再显著,越小的数值表明
虽然一些研究可能违反了排他性约束假设,但它们的结果对
另一方面,一些研究只需要排他性约束变量和因变量之间的微小关系就能够推翻结果,使结果变得不显著。Moreno-Medina ( 2021 ) 通过使用一年中周日上午 9 点至下午 1 点之间下雨的周数作为是否去教堂的工具变量,来考察去教堂对各种类型犯罪的影响。根据第一阶段结果,存在五种相关的违反排他性约束假设的情况:移民、侵蚀、收入、作物产量和农业生产率。其中,这些变量中的任何一个都只需要解释 " alcohol arrests " 中方差的0.05%,就可以使结果不显著。
大多数的研究至少有一个使结果不显著的排他性约束变量。这些敏感度分析结果仅涵盖了一小部分可能的排他性约束假设违例,因此,这仅代表了天气IV估计敏感度分析的下限,是保守的分析。
我们应该如何避免使用已知的违反排他性约束假设的工具变量呢? 作者给出了一套搜索程序步骤,如下。
本推文介绍了 Rain, Rain, Go Away: 192 Potential Exclusion-Restriction Violations for Studies Using Weather as an Instrumental Variable 这篇文章,阐释工具变量作用机制、DAG 图形、以及各种违反排他性约束的情形,并总结系统搜索排他性约束违例的步骤,对大家进一步理解 IV 及其识别条件有一定帮助。
Note:产生如下推文列表的 Stata 命令为:
lianxh 外生 内生 排他性
安装最新版lianxh
命令:
ssc install lianxh, replace
免费公开课
最新课程-直播课
专题 | 嘉宾 | 直播/回看视频 |
---|---|---|
⭐ 最新专题 | 文本分析、机器学习、效率专题、生存分析等 | |
研究设计 | 连玉君 | 我的特斯拉-实证研究设计,-幻灯片- |
面板模型 | 连玉君 | 动态面板模型,-幻灯片- |
面板模型 | 连玉君 | 直击面板数据模型 [免费公开课,2小时] |
⛳ 课程主页
⛳ 课程主页
关于我们
课程, 直播, 视频, 客服, 模型设定, 研究设计, stata, plus, 绘图, 编程, 面板, 论文重现, 可视化, RDD, DID, PSM, 合成控制法
等
连享会小程序:扫一扫,看推文,看视频……
扫码加入连享会微信群,提问交流更方便
✏ 连享会-常见问题解答:
✨ https://gitee.com/lianxh/Course/wikis
New!
lianxh
命令发布了:
随时搜索连享会推文、Stata 资源,安装命令如下:
. ssc install lianxh
使用详情参见帮助文件 (有惊喜):
. help lianxh