Stata连享会 主页 || 视频 || 推文 || 知乎 || Bilibili 站
温馨提示: 定期 清理浏览器缓存,可以获得最佳浏览体验。
New!
lianxh
命令发布了:
随时搜索推文、Stata 资源。安装:
. ssc install lianxh
详情参见帮助文件 (有惊喜):
. help lianxh
连享会新命令:cnssc
,ihelp
,rdbalance
,gitee
,installpkg
⛳ Stata 系列推文:
作者:董涵敏 (华中科技大学)
邮箱:hanmindong@hust.edu.cn
编者按:本文主要摘译自下文,特此致谢!
Source:Armstrong C, Kepler J D, Samuels D, et al. Causality redux: The evolution of empirical methods in accounting research and the growth of quasi-experiments[J]. Journal of Accounting and Economics, 2022: 101521. -PDF-
目录
实证论文是否必须进行因果推断?因果推断有哪些具体的方法,又有哪些注意事项?会计研究中如何权衡“新理论”与“新选题”?虽然这些问题的答案不是唯一的,但不妨碍我们去思考解决这些问题的可能方法。
通过收集和分析 2005-2019 年发表在会计学顶刊上的权威论文,本文发现会计研究人员对于因果推断和准实验的兴趣愈加浓厚。尽管准实验可以帮助我们进行因果推断,但我们也不能过度“迷信”,还应综合考虑研究问题背后的理论和制度知识,并使用多个研究设计和实证分析进行充分论证。
正如柯南所说,只有排除了所有不可能的,剩下的才会是真相。
识别实证论文:
识别准实验论文:
调查结果:
随着准实验的应用愈加广泛,研究人员更容易得到可信的结论,这反过来又增加了论文创新的难度。从贝叶斯学习框架的角度来看,如果想推翻已被证实的理论,需要更具有说服力的证据来改变人们的想法。
下图展示了理论创新和边际贡献所需的证据标准之间的权衡。其中左上象限为新理论+初步证据,右下象限为成熟理论+新证据 (如因果推断) ,大多数使用准实验方法的论文位于右下象限。论文正从左上象限向右下象限倾斜,其边际贡献在于研究背景和研究设计的创新,将推论从“相关”推进至“因果”,而非基础概念和理论的创新。
在我们调查的论文中,大多数论文采用了面板数据进行线性回归,其一般式如下:
然而,当回归遗漏了与
这一部分有两个关键要点:一是数据生成过程是未知的,因此没有一种方法是万能的;二是因果推断隐含着理论假设,应当从多种方法和不同假设中寻求一致的结果。
准实验通过将样本随机分配为实验组和对照组,并观察二者之间平均结果的差异来获得干预的因果效应。然而,在实践中并不存在真正的随机分配。“准实验”的准就体现在找到一个近似随机分配的理想实验,但这种分配可能不是完全随机的。一方面,我们需要观察分配的随机性;另一方面,我们也要尝试减少分配的非随机性。
基于此,倍分法 (difference-in-differences,DID) 提供了一种基于面板 OLS 回归估计的研究范式来近似随机分配,其主要类型如下:
其中,当
差异 | |||
---|---|---|---|
需要注意的是,假设关键是所有的观测值都在同一时间点接受干预。观察重点不是实验组和对照组之间的差异 (即
广义 DID:包括企业和年度固定效应,以控制实验组和对照组的任意固定差异和共同时间趋势。
渐进 DID:允许每个样本在不同的时间点接受干预。
本部分有如下两个关键要点:一是经典 DID 是横截面交互模型中的一种,二者估计方法和理论假设相似,也均受到遗漏变量偏误的影响。二是若分组变量取决于时间而非公司特征,随机分配的假设更可能成立。
理论对实证分析的重要性如下:
在真正随机分配下,理论不是估计因果的必要条件。鉴于随机分配的重要性,应当鼓励会计研究中实验室和田野实验。但是,我们仍需要运用理论区分因果关系和相关关系:
普适性是指将单一研究设计中得到的理论和推论推广至样本之外,其关键是理论基础。如果理论缺乏说服力,那么推论就必然具有局限性。研究背景即使再重要 (如,大萧条、金融危机和会计欺诈 ),研究结论也难以被推广。
对普适性的关注取决于研究人员的目标,而对特定研究设计的推广依赖于研究人员的能力。大量的实证论文是基于法规背景的因果推断。尽管监管的效果取决于当前的制度环境,由此得到的因果推断难以具有普适性的,但这不妨碍从中获得政策启示。
我们提出三个可以减轻对普适性担忧的方法:
“外生”冲击是指由系统以外的因素引发的冲击。但这只说明了冲击的起源,无法判断受冲击的对象是否是随机分配的。例如,加州的董事会性别多样性法规只适用于在法规前董事会没有女性的公司。但如果性别多样性给公司带来了好处,那么公司可能早已内生地拥有女性董事。因此,这条法规在分配实验组和对照组时存在选择偏差。
非随机分配导致 DID 的估计结果不是平均处置效应 (ATE),而是实验组的平均处置效应与选择偏差。因此,我们鼓励文献将推论限制在监管本身 (如,加州董事会性别多样性规定的因果效应),而不要推广至因监管产生的行为变化 (如,董事会性别多样性的因果效应)。
DID 估计的关键性假设是平行趋势假设。该假设要求在没有干预的情况下,实验组与对照组的结果趋势相似。这一假设背后的直觉是,如果干预前两组的变化趋势不一致,那么未观察到的干预后趋势也不大可能一致,所以我们就无法在干预后通过对照组的变化,来推测实验组如果未接受干预的可能变化。如下图所示,
另一种常见的方法是观察实验组和对照组之间差异的变化。在经典的 DID 回归设计中,我们替换指标
其中,
下图展示的是一个选择 2000 年为干预时间,1999 年为基期的平行趋势检验,其中系数
平行趋势检验需要评估:干预前实验组和对照组是否存在显著差异;干预后处置效应开始显著的时间,即是否存在滞后或预期效应;处置效应是否具有持续性。
同时,这些检验方法也不是万能的:检验依赖于一个本质上无法验证的假设,即人们可以从前期观察到的关系中推断后期未观察的反事实关系;不同读者对同一图形的理解不同,因此对平行趋势图的判断较为主观;总之,平行趋势检验可以提供有用的信息,但这也不足以进行因果推断。
许多文献在 DID 设计中包含高维固定效应。尽管固定效应可以缓解部分遗漏变量偏误,但它也不是万能的:
为解决以上问题,我们鼓励在使用高维固定效应时:考虑不同固定效应的结果,报告方差膨胀因子,报告变量的标准差和回归的
在会计文献中,有大量实际且有趣的因果问题,并不是通过准实验得到的。例如,Healy (1985) 研究了基于收益的奖金合同是否会激励经理人操纵收益。
又如,一篇避税的文献,Asay 等 (2021) 研究了特定的避税策略如何影响消费者行为:
下图展示了因果推理语境中的“估计”和“识别”:
在因果链的每个环节都没有随机变化的情况下,可以将非实验方法和准实验方法相结合,进行三角互证,以估计因果效应,同时提供与特定机制一致的证据。
准实验和非准实验的结合及其一致性可以提供可信的推论。当二者之间的证据发生冲突时,应该如何解决?
通过回顾会计文献,我们发现可靠的因果推断需要:
当难以找到准实验时,非实验方法也可以提供谨慎的证据。我们提醒:
Note:产生如下推文列表的 Stata 命令为:
lianxh 因果推断, m
安装最新版lianxh
命令:
ssc install lianxh, replace
免费公开课
最新课程-直播课
专题 | 嘉宾 | 直播/回看视频 |
---|---|---|
⭐ 最新专题 | 文本分析、机器学习、效率专题、生存分析等 | |
研究设计 | 连玉君 | 我的特斯拉-实证研究设计,-幻灯片- |
面板模型 | 连玉君 | 动态面板模型,-幻灯片- |
面板模型 | 连玉君 | 直击面板数据模型 [免费公开课,2小时] |
⛳ 课程主页
⛳ 课程主页
关于我们
课程, 直播, 视频, 客服, 模型设定, 研究设计, stata, plus, 绘图, 编程, 面板, 论文重现, 可视化, RDD, DID, PSM, 合成控制法
等
连享会小程序:扫一扫,看推文,看视频……
扫码加入连享会微信群,提问交流更方便
✏ 连享会-常见问题解答:
✨ https://gitee.com/lianxh/Course/wikis
New!
lianxh
和songbl
命令发布了:
随时搜索连享会推文、Stata 资源,安装命令如下:
. ssc install lianxh
使用详情参见帮助文件 (有惊喜):
. help lianxh