DIDM:多期多个体倍分法-did_multiplegt

发布时间:2021-04-18 阅读 1504

Stata连享会   主页 || 视频 || 推文 || 知乎

温馨提示: 定期 清理浏览器缓存,可以获得最佳浏览体验。

New! lianxh 命令发布了:
随时搜索推文、Stata 资源。安装命令如下:
. ssc install lianxh
详情参见帮助文件 (有惊喜):
. help lianxh

课程详情 https://gitee.com/lianxh/Course

课程主页 https://gitee.com/lianxh/Course

⛳ Stata 系列推文:

作者:宋燕欣 (中山大学)
邮箱songyx6@mail2.sysu.edu.cn


目录


1. 引言

标准的双边固定效应 DID 模型研究的是两组样本在两个时期下二元处理的事件效果,而多期多个体倍分法 (DIDM) 是在标准 DID 模型下的扩展,研究多组样本在多个时间段非二元处理的事件效果。关于标准 DID 模型实现的相关推文已经很多,本文将主要介绍 DIDM 模型的估计命令 did_multiplegt

2. 模型介绍

2.1 传统DID模型

​在双向固定效应基础上,传统 DID 模型加入了两个虚拟变量,即处理组变量 treat (处理组为 1,控制组为 0) 和处理期变量 post (受到处理的时间点为 1,其他时间为 0)。基本模型设定如下:

其中,y 是因变量,μ 代表个体固定效应,λ 代表时间固定效应,x 代表随时间和个体变化的控制变量,ϵ 为误差项。

2.2 多期 DID 模型

传统 DID 模型中只有两期数据,并且假设处理组中所有的样本受到处理是同时的,这个设定在实际的研究中有较大的限制。例如,不同地区的政策出台时间不同,此时传统的 DID 模型就不适用了。多期的 DID 模型解决了处理时间点不同的问题,模型设定为:

与传统 DID 模型的唯一不同是变量 post 的设定。具体来看,在传统 DID 中,变量 post 只受时间 t 的影响,而在多期 DID 中,变量 post 同时受个体 i 和时间 t 的影响。

2.3 多期多个体 DIDM 模型

双边固定效应多期 DID 模型假设对于样本的处理是不变的,这样的假设在现实中常常不成立。首先,处理变量可能不是一个二元变量,如不同地区的政策力度不同。其次,处理也并非是一次性的,样本不能简单地一分为二处理组和控制组,如降雨对于地区的影响,会出现从有到无、从无到有的多个交替过程,这时就需要一个动态的处理组。

动态处理组的设定放松了传统 DID 模型中处理不变的设定,可以有效解决了上述的问题。并且,在模型中处理变量 D 可以为二元变量,也可以是非二元变量,本文以二元变量为例。

固定效应 (Fixed Effect)

固定效应是设定组间固定效应和时间固定效应的 OLS 回归,有:

其中,

Dg,t 代表在 g 组 t 时的平均处理量,Yg,t(0) 代表不受政策处理的组平均结果,Yg,t(1) 则是受到政策处理的组平均结果。

固定效应的系数估计也可以理解为 ATE ( Average Treatment Effects ) 的加权平均,它的估计可以由两步得到。第一步是个体固定效应和时间固定效应对处理变量 D 的回归,可以理解为去掉了政策效果中时间和个体的特征,得到权重 W。第二步得到 βfe 的估计 。

需要注意的是,权重允许为负数,这是因为在模型中,“控制组” 有时是所有时间段中都没有受到政策影响的样本,有时则是指两个时间点都受到处理的组,这两种更贴切的名称是稳定组 (stable)。那么对于两个时间点都受到处理的组,在第二个时间点上的权重是负数,但如果负权重太大,估计值是否会出现负数呢?尤其是模型中的时间、组数太多的情形,出现较大负权重的概率更大,最终的固定效应估计值就会出现负数。

为此,De Chaisemartin 和 d'Haultfoeuille (2020) 列举了一个简单的例子,具体如下:

设定两组实验组,在 t=0 时,两组都不受处理;在 t=1 时,A 组受处理,B 组不受处理;在 t=2 时,两组都受到处理。此时,A 组在两期的权重分别是 1/3,-1/6,B 组在第二期的权重为 1/6。双边固定效应的表达式是 βfe=1/2Δ0,2+Δ1,11/2Δ1,2,如果 Δ1,2 特别大,就会出现负数结果,如 βfe=1/2×1+11/2×4=1/2

明明政策是正向的,但是估计出现负数。这是因为,在异质性问题上,不同组的共同趋势不同,该模型的负数权重可能带来偏误,即如果一个政策效果是正的,太多负数的权重可能会导致系数估计结果为负。

异质性检验

De Chaisemartin 和 d'Haultfoeuille (2020) 提供了两个检验异质性处理效应稳健性的方法:第一个是 σ_fe,系数估计值除以权重的标准差,如果接近 0,说明双边固定效应是不稳健的,容易导致系数估计的符号与实际相反。

第二个是 σ__fe,只考虑有权重为负数的情况,检验系数估计接近 0,说明双边固定效应是不稳健的。如果是 Δg,ts 比较小,σ_fe 的结果很大,但第二个检验仍能接近于 0,则能更好地检验异质性。

对于这个问题,提出了下文的估计方法:

转换效应 (Switching Effect)

为了解决上述的异质性问题,De Chaisemartin 和 d'Haultfoeuille (2020) 提出了新的估计量,即将政策处理从无到有、从有到无两个正负方向的效果进行加权平均,而将两期的处理不变 (如:两期都是 1 或两期都是 0) 的样本作为控制组。对比多期 DID 模型,仅考虑了政策从无到有的情况。

DID+,t 指的是政策从 0 到 1 的平均结果减去稳定组 (两期都是 0) 的平均结果,DID,t 指的是稳定组 (两期都是 1) 的平均结果减去政策从 0 到 1 的平均结果。

共同趋势假定:稳定组组内共同趋势,即对于在 t 和 t1 都无政策的组有共同趋势,而在 t 和 t1 都有政策的组有共同趋势。这个设定比上面的设定要宽松,固定效应的模型要求不同组的共同趋势也相同。

安慰剂效应 (Placebo Test)

在 DID 模型估计中,常常用到安慰剂检验,证明政策的有效性。在 t1 时期实施安慰剂检验,即在 t1 期模拟 t 期的政策,对比 t1 和 t2 的因变量。

在 DIDM 模型中,对于 t 期政策为 1 的,找出 t1 和 t2 期政策都是 0 的样本,对比三期都是 0 的样本,比较两组的平均结果之差 DID+,tpl。另外,对于 t 期政策为 0 的,找出  t1 和  t2 政策都是 1 的样本,对比三期政策都为 1 的样本,比较平均结果的差别 DID,tpl。因为 t1 和 t2 期实际上没有政策的变化,所以如果模型的设定符合,DID 应该接近于 0。

安慰剂 Wald-TC 估计量表达式:

3. Stata 应用

3.1 命令介绍

命令安装

ssc install did_multiplegt, replace

语法介绍

did_multiplegt Y G T D [if] [in] [, options]

其中,输入的变量定义如下:

  • Y 输入结果变量;
  • G 输入分组变量;
  • T 是时间变量;
  • D 是处理变量。

options 选项定义如下:

  • placebo(#):输入安慰剂效应的数量;
  • controls(varlist):加入控制变量;
  • breps(#):输入重抽样的次数,用以计算标准误。

报告的结果保存到 e() 中,具体如下:

  • e(effect_0):估计政策转换的效应;
  • e(N_effect_0):估计的样本数;
  • e(N_switchers_effect_0):估计中出现政策转换 (0 到 1、1 到 0) 的数量;
  • e(se_effect_0:当启用 breps() 时报告标准误;
  • e(placebo_i) 是在政策转换之前 i 期的安慰剂效应估计;
  • e(N_placebo_i) 是估计安慰剂用到的样本数;
  • e(se_placebo_i) 是安慰剂效应的标准误。

3.2 论文示例

Vella 和 Verbeek (1998) 研究发现,工会工人的平均工资增长相比于非工会工人高 20% 左右。在本文中,我们使用这篇论文相同的面板数据估计工会对于工资的影响。首先使用 twowayfeweights 估计双边固定效应的系数,检验异质处理的稳健性,再使用 did_multiplegt 命令估计状态转换 (switchers) 的平均处理效应。

. *下载数据
. ssc install bcuse, replace
checking bcuse consistency and verifying not already installed...
all files already exist and are up to date.

. bcuse wagepan

. *数据的基本统计情况
. sum lwage nr year union

    Variable |        Obs        Mean    Std. Dev.       Min        Max
-------------+---------------------------------------------------------
       lwage |      4,360    1.649147    .5326094  -3.579079    4.05186
          nr |      4,360    5262.059     3496.15         13      12548
        year |      4,360      1983.5    2.291551       1980       1987
       union |      4,360    .2440367    .4295639          0          1

其中,结果变量 lwage 是工资对数,分组变量 nr 相当于每一个人的 ID,时间变量 year 是 1980-1987 年,处理变量 union 是二元变量,并且 1 表示属于工会,0 表示不属于工会。

. *固定效应估计和检验
. ssc install twowayfeweights, replace
checking twowayfeweights consistency and verifying not already installed...
all files already exist and are up to date.

. twowayfeweights lwage nr year union, type(feTR)
Under the common trends assumption, beta estimates a weighted sum of 1064 ATTs. 
860 ATTs receive a positive weight, and 204 receive a negative weight.
The sum of the positive weights is equal to 1.0054686.
The sum of the negative weights is equal to -.00546854.
beta is compatible with a DGP where the average of those ATTs is equal to 0,
while their standard deviation is equal to .09357625.
beta is compatible with a DGP where those ATTs all are of a different sign than beta,
while their standard deviation is equal to 5.389153.

固定效应估计中,有 860 个正权重,204 个负权重,两个检验发现系数估计在异质处理下接近于 0,是不稳健的。因此,我们使用 DIDM 模型 did_multiplegt 进一步观察工会对于工人工资的影响。

. *模型估计
. did_multiplegt lwage nr year union, placebo(1) breps(50) cluster(nr)

DID estimators of the instantaneous treatment effect, of dynamic treatment effects if the dynamic option is used, and of placebo tests
of the parallel trends assumption if the placebo option is used. The estimators are robust to heterogeneous effects, and to dynamic
effects if the robust_dynamic option is used.

             |  Estimate         SE      LB CI      UB CI          N  Switchers 
-------------+------------------------------------------------------------------
    Effect_0 |  .0261226   .0194753  -.0120489   .0642941       3815        508 
   Placebo_1 |  .0993211   .0315587   .0374661   .1611761       2842        247 

. *显示结果
. ereturn list

scalars:
           e(effect_0) =  .0261225951945861
        e(se_effect_0) =  .0194752588662298
         e(N_effect_0) =  3815
  e(N_switchers_effec
    t_0)               =  508
          e(placebo_1) =  .0993211109434541
       e(se_placebo_1) =  .0315586535625052
        e(N_placebo_1) =  2842
  e(N_switchers_place
    bo_1)              =  247

当命令启用了重抽样后,结果会返回一幅包含估计值、安慰剂效应、以及 95% 置信区间图,具体如下所示:

结果显示,工会的作用效果为 0.026,即加入工会能够提高工资 2.6%,此结果与原论文的估计 20% 差异较大,说明异质性处理确实影响了系数的估计。在安慰剂效应中估计值为 0.099,拒接安慰剂估计为 0 的假设,说明模型可能不符合共同趋势的设定。再来看时间处理前后 5 期的效果,具体如下所示:

. did_multiplegt lwage nr year union, placebo(5) breps(50) cluster(nr) dynamic(5)

可以看出,加入工会在 0-3 期的作用持续上升,到第 4 期回到 0 的水平上。在 t = 0 之前的安慰剂检验波动较大,再次说明模型可能不符合共同趋势的设定。

4. 参考文献

  • De Chaisemartin C, d'Haultfoeuille X. Two-way fixed effects estimators with heterogeneous treatment effects[J]. American Economic Review, 2020, 110(9): 2964-96. -PDF-
  • Vella F, Verbeek M. Whose wages do unions raise? A dynamic model of unionism and wage rate determination for young men[J]. Journal of Applied Econometrics, 1998, 13(2): 163-183. -PDF-

5. 相关推文

Note:产生如下推文列表的 Stata 命令为:
lianxh DID 倍分 差分
安装最新版 lianxh 命令:
ssc install lianxh, replace

相关课程

免费公开课

最新课程-直播课

专题 嘉宾 直播/回看视频
最新专题 文本分析、机器学习、效率专题、生存分析等
研究设计 连玉君 我的特斯拉-实证研究设计-幻灯片-
面板模型 连玉君 动态面板模型-幻灯片-
面板模型 连玉君 直击面板数据模型 [免费公开课,2小时]
  • Note: 部分课程的资料,PPT 等可以前往 连享会-直播课 主页查看,下载。

课程主页

课程主页

关于我们

  • Stata连享会 由中山大学连玉君老师团队创办,定期分享实证分析经验。
  • 连享会-主页知乎专栏,400+ 推文,实证分析不再抓狂。直播间 有很多视频课程,可以随时观看。
  • 公众号关键词搜索/回复 功能已经上线。大家可以在公众号左下角点击键盘图标,输入简要关键词,以便快速呈现历史推文,获取工具软件和数据下载。常见关键词:课程, 直播, 视频, 客服, 模型设定, 研究设计, stata, plus, 绘图, 编程, 面板, 论文重现, 可视化, RDD, DID, PSM, 合成控制法

连享会小程序:扫一扫,看推文,看视频……

扫码加入连享会微信群,提问交流更方便

✏ 连享会-常见问题解答:
https://gitee.com/lianxh/Course/wikis

New! lianxh 命令发布了:
随时搜索连享会推文、Stata 资源,安装命令如下:
. ssc install lianxh
使用详情参见帮助文件 (有惊喜):
. help lianxh