DID最新进展:异质性处理条件下的双向固定效应DID估计量 (TWFEDD)

发布时间:2022-01-09 阅读 9476

Stata连享会   主页 || 视频 || 推文 || 知乎 || Bilibili 站

温馨提示: 定期 清理浏览器缓存,可以获得最佳浏览体验。

New! lianxh 命令发布了:
随时搜索推文、Stata 资源。安装:
. ssc install lianxh
详情参见帮助文件 (有惊喜):
. help lianxh
连享会新命令:cnssc, ihelp, rdbalance, gitee, installpkg

课程详情 https://gitee.com/lianxh/Course

课程主页 https://gitee.com/lianxh/Course

⛳ Stata 系列推文:

PDF下载 - 推文合集

作者:杜静玄 (雪城大学)
邮箱jdu115@syr.edu

编者按:本文主要摘译自下文,特此致谢!
Source:de Chaisemartin C, D'Haultfœuille X. Two-Way Fixed Effects and Differences-in-Differences with Heterogeneous Treatment Effects: A Survey[J]. Available at SSRN, 2021. -PDF-


目录


1. 简介

双向固定效应 (TWFE) 是评估处理效应的流行方法之一,研究者长期以来都将 TWFE 看做 DID 的等价估计量。在传统设定中:

并且依赖于平行趋势假定:E[Ys,t(0)Ys,t(0)]=E[Yn,t(0)Yn,t(0)]。在满足该假定的前提下,DID 对平均处理效应 (ATE) 的估计是无偏的。

最近的研究表明,要想获得 ATE 的无偏估计,除以上假设外,TWFE 估计量必须还满足另外一个条件:处理效应不论在组间还是不同时期都为常数。这一假设通常不易满足,比如最低工资对于雇佣的影响在不同国家、不同教育程度的工人中都不一样。

有很多学者已提出了对异质性处理情况下的 TWFE 估计量进行诊断或修正的方法,本文对这些文献进行了回顾和梳理,并简要介绍了相关的 Stata 命令。

2. 异质性处理情况下的 TWFE 回归

2.1 TWFE 回归无法识别处理效应的凸组合

观测可被分为 G 组和 T 个时间段,β^fe 为 Dg,t 的系数,则在平行趋势假设下,无处理 Yg,t(0) 的潜在因果为:

若处理为哑变量,则 TEg,t=Yg,t(1)Tg,t(0),若为离散或连续变量,则 TEg,t=(Yg,t(Dg,t)Yg,t(0))/Dg,tWg,t 是总和为 1 的权重,它们与下式成正比且符号相同:

Ng,t 是 (g,t) 的观测值个数,Dg,. 是组 g 在所有期间的平均处理,D.,t 是 t 期所有组的平均处理,D.,. 是所有组在所有时期的平均处理。

式 (2) 和 (3) 存在两个重要问题。首先,式 (3) 表明 Wg,t 对 Ng,t 不成比例,因而 β^fe 对于所有被处理的 (g,t) 的平均处理效应来说是有偏的,除非:(1) 只有两种处理;(2) 各组可以转移但不可以移除处理;(3) 处理时点都是一样的。在该情况下,可证明 Dg,tDg,.D.,t+D.,. 为常数。同时,若假设该式与 TEg,t 无关,则 β^fe 也是 ATT 的无偏估计量。

其次,更令人担心的是,(3) 式表明一些权重 Wg,t 很可能为负数—— β^fe 很可能不满足 “无符号反向” 的假定。在处理多于两种的情形下,更可能发生的情况是一些权重为负数。Stata 中的 twowayfeweights 命令可以计算 (2) 式中的权重,具体使用可见之前的系列推文。

2.2 问题原因:被禁止的比较

Goodman-Bacon (2021) 证明,当仅有两种处理且在交错设计的情况下:

其中,DIDg,g,v,v 为比较组 g 与组 g 从 t 到 t 的结果,vg,g,t,t 是和为 1 的非负权重,当且仅当 g 在 t 与 t 之间改变处理状态,而 g 不变时为正。(2) 式中的负权重来源于对转换组以及一直处理组的比较。Borusyak 和 Jaravel (2017) 介绍了一个简单的例子,包含两组和三期,组 e 在时期 2 就被处理,而组 l 直到时期 3 才被处理。此时 (4) 式变为:

DIDe,l,1,2 与 (1) 式中的 DID 估计量类似,且在平行趋势假定下,它也是 e 组在第二期处理效应的无偏估计量:

DIDl,e,2,3 则比较了组 l 在第 2 期到第 3 期之间转换与组 e 在这期间 (一直被处理) 的结果。由于,

且中间两项在平行趋势的假定下取消了。根据 (5)-(7) 式,可得:

式 (8) 的右侧是三个 TE 的加权平均,其中 TEe,3 的权重为负。若 TEe,2=TEe,3,则该负权重会消失。bacondecomp 命令可以计算 (4) 中的 DIDg,g,t,t 和相应的权重。

2.3 TWFE 回归其他系数的分解结果

在两种处理的交错设计中,Sun 和 Abraham (2020) 用事件分析研究了 TWFE 回归:

其中,Fg 是组 g 被处理的第一期,当 l0β^l 可用来估计 l+1 处理期的累积效应,而当 l2β^l 是用来检验平行趋势的安慰剂系数。在平行趋势假设下,他们证明:

一个重要的启示是,在异质性处理效果的情况下,β^l 不能用来检验平行趋势。命令 eventstudyweights 可以用来计算这一回归的权重。

3. 异质性处理效应下其他稳健估计量

3.1 排除动态效应的估计量

在这种情况下,组的状态仅取决于其现期处理而非过去的处理。Chaisemartin 和 d'Haultfoeuille (2020b) 提出 DIDM 估计量,其对两种 DID 处理如下:

  • 移入组:比较 t1 和 t 期从未处理到处理的组别,以及在两期均未处理的组别的结果;
  • 移出组:比较在两期均接受处理与从处理到未处理的组别的结果。DIDM 估计量依赖于 Yg,t(0) 和 Yg,t(1) 的平行趋势假设,并可用移动组 (switchers) 和不变组在移动组变化之前的结果趋势来进行安慰剂检验。

此外,这一估计量也容易拓展到多个处理的情况,其相应的 Stata 命令为 did_multiplegt

3.2 允许动态效应的估计量

在该情况下,组 g 的结果与其过去接受的处理相关。0t 是一个数为 t 的 0 向量,则对于所有 gg,平行趋势假设变为:

这里简单回顾一下 Callaway 和 Sant’Anna (2020)、Sun 和 Abraham (2020)、以及 Borusyak 等 (2021) 提出的三种估计量。

Callaway 和 Sant’Anna (2020) 估计量:在交错设计中,组可以被加总到在同一期接受处理的族群。Callaway 和 Sant’Anna (2020) 将他们感兴趣的参数定义为 TEc,c+l,即从 c 期开始接受处理的组在第 c+l 期的平均处理效应。他们提出了一个比较处理组与从未处理组在两期之间结果变化的无偏估计量:

他们还提出了估计量来估计更高层面的处理效应,以尚未处理组替代从未处理组作为控制组的估计量 (在缺乏从未处理组的情况下很有用),以及基于条件平行趋势假设——即要求不同组别的相同的时间不变变量服从一样的变化趋势。他们的一系列估计量可以通过 Stata 命令 csdid 实现。

Sun 和 Abraham (2020) 估计量:他们的估计量与前者类似,但与前者相比,还可以使用晚处理组作为控制组。在操作上,他们允许用简单的线性回归进行估计,而 Callaway 和 Sant'Anna (2020) 则使用自助法。在 Stata 中,可使用 eventstudyinteract 命令。

Borusyak 等 (2021) 估计量:他们提出了在一定假设下比前两种更有效的估计量。该估计量可以通过 TWFE 回归获得,同时控制时间、组别以及每个每个被处理的 (g,t) 单元的固定效应。在高斯-马尔科夫定理下,该估计量是最有效的,而在满足平行趋势假设下,则实际上等于最小方差的 TEg,t。有这些估计量,TEc,c+l 可以通过对所有在时期 c 和 t=c+l 接受处理的组 g 加权平均得到。

相比于其他估计量,他们提出的估计量是方差最小的,可以通过 Stata 命令 did_imputation 得到。

如何选择不同的估计量:在考虑选择哪种估计量时,需要注意以下两点:首先,Borusyak 等 (2021) 估计量的有效性仅在高斯——马尔科夫定理下满足,而这一定理要求从未处理组的潜在结果 Yg,t(0t) 不论在组间还是不同时间段都是独立的。在序列相关的情况下,这一定理就不再满足。

更为严重的是,在平行趋势假设不满足的情况下,Borusyak 等 (2021) 估计量甚至会比之前两种估计量产生更大偏误。Callaway 和 Sant’Anna (2020) 以及 Sun 和 Abraham (2020) 都用 ts1 期的结果作为基准结果,而 Borusyak 等 (2021) 则使用 1 到 ts1 期的平均结果作为基准,这在使其更准确的同时,也承担了更大的风险:Roth (2021) 证明,在满足单调性的不同趋势假设下,利用先前时期的结果会增加 DID 的偏误。因此在选择合适估计量时需要明确数据满足哪些假设。

Chaisemartin 和 d'Haultfoeuille (2020a) 提出了在异质性和动态处理效应下仍然稳健的估计量,且在处理不止两种或研究并非交错时依然适用。这里仅简单描述两种处理但并非交错的情况。此时,在 t=1 时刻未被处理的组仍可根据他们第一次被处理的日期加总到相同的群内,则对于所有 c>2l>2 使得 l+cT,Chaisemartin 和 d'Haultfoeuille (2020a) 令 Nc 代表群 c 中组的个数,且定义下式为 c 群的平均效应:

该效应是基于组在 c+1 到 c+l 之间的处理轨迹 (Dg,c+1,...Dg,c+l) 定义的,在式 (11) 的平行趋势假设下,FTTc,c+l 可以通过计算组 c 在 cl 到 c+l 的结果变化的 DID 估计量获得。 在交错设计中,FTTc,c+l 是在 l+1 阶段均被处理的累积效应。

此时最多有 T+1 个处理轨迹,而在非交错的设计中会有 2T 种情况,若分别估计所有轨迹的效应,会产生不准确的估计。他们证明 FTTc,c+l 可被加总到整体层面用于比较处理的成本收益,而该成本收益比率等于从 c 到 l 组 FTTc,c+l 的加权平均。他们的估计量可以通过 Stata 命令 did_multiplegt 获得。

4. 总结与展望

该文回顾了当 TWFE 回归不能估计处理效应的凸组合时的各种情况,并介绍了基于异质性处理效应下的多种 DID 估计量。然而,非交错设计的连续性处理例如降雨量、关税等等,依然未得到足够深入的研究。

5. 参考文献

  • Abadie, A. (2005), Semiparametric difference-in-differences estimators, Review of Economic Studies 72(1), 1–19. -PDF-
  • Athey, S. and Imbens, G. W. (2021), Design-based analysis in difference-in-differences settings with staggered adoption, Journal of Econometrics forthcoming. -PDF-
  • Bilinski, A. and Hatfield, L. A. (2018), Nothing to see here? non-inferiority approaches to parallel trends and other model assumptions. arXiv preprint arXiv:1805.03273. -PDF-
  • Borusyak, K. and Jaravel, X. (2017), Revisiting event study designs. Working Paper. -PDF-
  • Callaway, B., Goodman-Bacon, A. and Sant’Anna, P. H. (2021), Difference-in-differences with a continuous treatment. arXiv preprint arXiv:2107.02637. -PDF-
  • Callaway, B. and Sant’Anna, P. H. (2020),Difference-in-differences with multiple time periods, Journal of Econometrics forthcoming. -PDF-
  • de Chaisemartin, C. and D’Haultfoeuille, X. (2018), Fuzzy differences-in-differences, The Review of Economic Studies 85(2), 999–1028. -PDF-
  • de Chaisemartin, C. and D’Haultfoeuille, X. (2020a), Difference-in-differences estimators of intertemporal treatment effects. arXiv preprint arXiv:2007.04267. -PDF-
  • de Chaisemartin, C. and D’Haultfoeuille, X. (2020b), Two-way fixed effects estimators with heterogeneous treatment effects, American Economic Review 110(9), 2964–2996. -PDF-
  • de Chaisemartin, C. and D’Haultfoeuille, X. (2020c), Two-way fixed effects regressions with several treatments. arXiv preprint arXiv:2012.10077.20 -PDF-
  • Wooldridge, J. (2021), Two-way fixed effects, the two-way mundlak regression, and differencein-differences estimators, Available at SSRN 3906345 . -PDF-

6. 相关推文

Note:产生如下推文列表的 Stata 命令为:
lianxh did, m
安装最新版 lianxh 命令:
ssc install lianxh, replace

相关课程

免费公开课

最新课程-直播课

专题 嘉宾 直播/回看视频
最新专题 文本分析、机器学习、效率专题、生存分析等
研究设计 连玉君 我的特斯拉-实证研究设计-幻灯片-
面板模型 连玉君 动态面板模型-幻灯片-
面板模型 连玉君 直击面板数据模型 [免费公开课,2小时]
  • Note: 部分课程的资料,PPT 等可以前往 连享会-直播课 主页查看,下载。

课程主页

课程主页

关于我们

  • Stata连享会 由中山大学连玉君老师团队创办,定期分享实证分析经验。
  • 连享会-主页知乎专栏,700+ 推文,实证分析不再抓狂。直播间 有很多视频课程,可以随时观看。
  • 公众号关键词搜索/回复 功能已经上线。大家可以在公众号左下角点击键盘图标,输入简要关键词,以便快速呈现历史推文,获取工具软件和数据下载。常见关键词:课程, 直播, 视频, 客服, 模型设定, 研究设计, stata, plus, 绘图, 编程, 面板, 论文重现, 可视化, RDD, DID, PSM, 合成控制法

连享会小程序:扫一扫,看推文,看视频……

扫码加入连享会微信群,提问交流更方便

✏ 连享会-常见问题解答:
https://gitee.com/lianxh/Course/wikis

New! lianxhsongbl 命令发布了:
随时搜索连享会推文、Stata 资源,安装命令如下:
. ssc install lianxh
使用详情参见帮助文件 (有惊喜):
. help lianxh