Stata论文复现:政策评估中的交互效应

发布时间:2022-12-23 阅读 980

Stata连享会   主页 || 视频 || 推文 || 知乎 || Bilibili 站

温馨提示: 定期 清理浏览器缓存,可以获得最佳浏览体验。

New! lianxh 命令发布了:
随时搜索推文、Stata 资源。安装:
. ssc install lianxh
详情参见帮助文件 (有惊喜):
. help lianxh
连享会新命令:cnssc, ihelp, rdbalance, gitee, installpkg

课程详情 https://gitee.com/lianxh/Course

课程主页 https://gitee.com/lianxh/Course

⛳ Stata 系列推文:

PDF下载 - 推文合集

作者:徐安宇 (中山大学)
邮箱xuany@mail2.sysu.edu.cn

编者按:本文主要摘译自下文,特此致谢!
Source:Gobillon L, Magnac T. Regional policy evaluation: Interactive fixed effects and synthetic controls[J]. Review of Economics and Statistics, 2016, 98(3): 535-551. -PDF- -Appendix- -Data-


目录


1. 引言

Gobillon 和 Magnac (2016) 研究了交互效应与线性因子模型在地区政策评估中的应用。他们比较了 Bai (2009) 以及传统的双重差分模型与合成控制法对处理效应的估计效果。同时证明了如果个体异质性很大双重差分法是有偏的,并推导了合成控制法的使用条件。他们还通过蒙特卡洛模拟比较小样本下这些估计方法,并使用 20 世纪 90 年代法国实施的企业区政策对当地的影响进行一个实证说明。

Gobillon 和 Magnac (2016) 的主要贡献有以下三方面:

  • 第一,提供理论设置的结果,确定了线性因子模型中的限制条件,在这些限制条件下,平均确定了处理参数的处理方法;
  • 第二,将线性因子模型的估计与 Abadie 和 Gardeazabal (2003) 提出的合成控制法的替代方法进行对比;
  • 第三,通过蒙特卡洛实验评估了交互效应、合成控制法和双重差分法的相关性,并分析了它们的特性。

在本文中,我们主要聚焦于 Gobillon 和 Magnac (2016) 的实证部分。

2. 蒙特卡罗模拟

在这部分中作者分别使用不同的模型估计政策对地区的处理效应,并通过蒙特卡罗模拟比较和评估不同模型的估计效果。我们以基线的蒙特卡罗模拟为例,它的数据生成方法为:

  • 生成城市观察值 143 个,其中控制组 13 个,对照组 130 个;
  • 生成 20 年的时间变量,其中政策处理时期为第 8 年;
  • 因子服从 (0, 1) 的均匀分布;
  • 因子载荷服从 (0, 1) 的均匀分布;
  • 扰动项服从 [3,3] 的均匀分布。

作者设定处理效应 α=0.3,并对以下几个回归进行比较:

  • 不加入任何时间和个体的处理变量,记为 "Interactive effects, counterfactual";
  • 加入估计参数 α,使用 Bai (2009) 的方法进行估计,记为 "Interactive effects, treatment dummy";
  • 与上式类似,对因子载荷施加约束 λi=ΛUω(i),其中 ΛU 是未处理的因子载荷,ω(i) 是合成控制法中得到的权重,记为 "Interactive effects, constrained";

  • 使用普通的双重差分法估计参数,记为 "Diff-in-diffs"。

然后,得到每个模型估计的平均偏误、中位数偏误和方差,并记录在表格中 (以 Table B1 为例):

3. 实证研究

3.1 数据描述

文章实证部分的数据来源为巴黎地区国家就业机构 (ANPE) 求职者的历史档案数据,主要使用了 1989 年 7 月到 2003 年 6 月法国失业期的失业率,入职率等数据,目的是研究 1997 年 1 月企业区计划实施对巴黎各地区的失业率的影响。

我们按处理组和对照组分组绘制失业率随时间变化的折线图,可以发现对照组的曲线总体呈下降趋势,并在整个期间与处理组呈现平行趋势。在第 1 时期至第 12 时期 (1993 下半年至 1999 上半年),处理组的曲线与对照组的曲线有所不同,尤其是在政策实施后的第 7 至第 8 个时期 (1996 年下半年和 1997 上半年),处理组的失业率保持不变,而对照组的失业率则在下降。

lxhuse gm2016.dta, clear // 完整代码:https://file.lianxh.cn/data/g/gm2016.do
gen avg_e = 0
forvalues i = 1/20{
    qui sum e if treat == 1 & t == `i'
    replace avg_e = r(mean) if treat == 1 & t == `i'
}
forvalues i = 1/20{
    qui sum e if treat == 0 & t == `i'
    replace avg_e = r(mean) if treat == 0 & t == `i'
}
bys treat t: keep if _n == _N
set scheme white_tableau  // 设定绘图风格为white_tableau
twoway (connected avg_e t if treat==1) (connected avg_e t if treat==0), ///
    xline(8) xtitle("Semester") ytitle("Exit rate to job")              ///
    legend(order(1 "Enterprise Zones" 2 "Non−EZ" ) row(2))

3.2 主要结果

我们同样比较了交互效应模型、交互效应,加入处理虚拟变量和 DID 估计的模型在控制倾向得分时,企业区对入职率和失业率的影响。在这种情况下,当模型中包含四个或更少的因子时,处置效应的估计值会更大。交互效应,加入处理虚拟变量方法得到的结果与基准情况下得到的结果比较接近。总体结果与不控制倾向得分时的结果保持一致。

. * Exit rate to a job
. lxhuse gm2016.dta, clear // 完整代码:https://file.lianxh.cn/data/g/gm2016.do
. regife e z p, ife(i t, 1)
REGIFE                                            Number of obs   =       2960
Panel structure: i, t                             F(   3,   2789) =      12.20
Factor dimension: 1                               Prob > F        =     0.0000
Converged: false                                  Root MSE        =     0.0186
                                                  Iterations      =      10000
------------------------------------------------------------------------------
           e | Coefficient  Std. err.      t    P>|t|     [95% conf. interval]
-------------+----------------------------------------------------------------
       _cons |     -0.232      0.042    -5.54   0.000       -0.314      -0.150
           z |      0.001      0.003     0.35   0.726       -0.004       0.006
           p |     -0.024      0.027    -0.86   0.388       -0.077       0.030
------------------------------------------------------------------------------

. regife e z p, a(i t) ife(i t, 1)
REGIFE                                            Number of obs   =       2960
Panel structure: i, t                             F(   1,   2624) =       5.99
Factor dimension: 1                               Prob > F        =     0.0145
Converged: true                                   Root MSE        =     0.0171
                                                  Iterations      =         32
------------------------------------------------------------------------------
           e | Coefficient  Std. err.      t    P>|t|     [95% conf. interval]
-------------+----------------------------------------------------------------
           z |      0.009      0.004     2.45   0.014        0.002       0.016
           p |      0.000  (omitted)
       _cons |      0.181      0.000   479.01   0.000        0.181       0.182
------------------------------------------------------------------------------

. diff e z p, t(treat) p(d)
DIFFERENCE-IN-DIFFERENCES ESTIMATION RESULTS
Number of observations in the DIFF-IN-DIFF: 2960
            Before         After    
   Control: 945            1755        2700
   Treated: 91             169         260
            1036           1924
--------------------------------------------------------
 Outcome var.   | e       | S. Err. |   |t|   |  P>|t|
----------------+---------+---------+---------+---------
Before          |         |         |         | 
   Control      | 0.216   |         |         | 
   Treated      | 0.182   |         |         | 
   Diff (T-C)   | -0.034  | 0.005   | -7.25   | 0.000***
After           |         |         |         | 
   Control      | 0.168   |         |         | 
   Treated      | 0.138   |         |         | 
   Diff (T-C)   | -0.030  | 0.003   | 8.79    | 0.000***
                |         |         |         | 
Diff-in-Diff    | 0.004   | 0.006   | 0.65    | 0.516
--------------------------------------------------------
R-square:    0.24
* Means and Standard Errors are estimated by linear regression
**Inference: *** p<0.01; ** p<0.05; * p<0.1
. * Exit rate for unknown reasons
. regife u z p, ife(i t, 1)
REGIFE                                            Number of obs   =       2960
Panel structure: i, t                             F(   3,   2789) =     319.98
Factor dimension: 1                               Prob > F        =     0.0000
Converged: true                                   Root MSE        =     0.0323
                                                  Iterations      =       2341
------------------------------------------------------------------------------
           u | Coefficient  Std. err.      t    P>|t|     [95% conf. interval]
-------------+----------------------------------------------------------------
       _cons |      0.239      0.008    30.66   0.000        0.224       0.255
           z |      0.018      0.005     3.76   0.000        0.009       0.027
           p |      0.014      0.010     1.41   0.159       -0.005       0.033
------------------------------------------------------------------------------

. regife u z p, a(i t) ife(i t, 1)
REGIFE                                            Number of obs   =       2960
Panel structure: i, t                             F(   1,   2624) =       0.03
Factor dimension: 1                               Prob > F        =     0.8595
Converged: true                                   Root MSE        =     0.0291
                                                  Iterations      =         61
------------------------------------------------------------------------------
           u | Coefficient  Std. err.      t    P>|t|     [95% conf. interval]
-------------+----------------------------------------------------------------
           z |     -0.001      0.008    -0.18   0.860       -0.017       0.014
           p |      0.000  (omitted)
       _cons |      0.365      0.001   517.62   0.000        0.363       0.366
------------------------------------------------------------------------------

. diff u z p, t(treat) p(d)
DIFFERENCE-IN-DIFFERENCES ESTIMATION RESULTS
Number of observations in the DIFF-IN-DIFF: 2960
            Before         After    
   Control: 945            1755        2700
   Treated: 91             169         260
            1036           1924
--------------------------------------------------------
 Outcome var.   | u       | S. Err. |   |t|   |  P>|t|
----------------+---------+---------+---------+---------
Before          |         |         |         | 
   Control      | 0.342   |         |         | 
   Treated      | 0.345   |         |         | 
   Diff (T-C)   | 0.003   | 0.006   | 0.51    | 0.611
After           |         |         |         | 
   Control      | 0.374   |         |         | 
   Treated      | 0.403   |         |         | 
   Diff (T-C)   | 0.029   | 0.005   | 6.17    | 0.000***
                |         |         |         | 
Diff-in-Diff    | 0.026   | 0.008   | 3.24    | 0.001***
--------------------------------------------------------
R-square:    0.08
* Means and Standard Errors are estimated by linear regression
**Inference: *** p<0.01; ** p<0.05; * p<0.1
. * Entry rate
. regife entry z p, ife(i t, 1)
REGIFE                                            Number of obs   =       2960
Panel structure: i, t                             F(   3,   2789) =     119.95
Factor dimension: 1                               Prob > F        =     0.0000
Converged: true                                   Root MSE        =     0.0500
                                                  Iterations      =       7297
------------------------------------------------------------------------------
       entry | Coefficient  Std. err.      t    P>|t|     [95% conf. interval]
-------------+----------------------------------------------------------------
       _cons |      0.386      0.023    16.98   0.000        0.342       0.431
           z |      0.021      0.006     3.40   0.001        0.009       0.033
           p |     -0.001      0.018    -0.05   0.963       -0.037       0.035
------------------------------------------------------------------------------

. regife entry z p, a(i t) ife(i t, 1)
REGIFE                                            Number of obs   =       2960
Panel structure: i, t                             F(   1,   2624) =       0.13
Factor dimension: 1                               Prob > F        =     0.7152
Converged: true                                   Root MSE        =     0.0469
                                                  Iterations      =         46
------------------------------------------------------------------------------
       entry | Coefficient  Std. err.      t    P>|t|     [95% conf. interval]
-------------+----------------------------------------------------------------
           z |      0.004      0.011     0.36   0.715       -0.018       0.027
           p |      0.000  (omitted)
       _cons |      0.694      0.001   641.33   0.000        0.692       0.696
------------------------------------------------------------------------------

. diff entry z p, t(treat) p(d)
DIFFERENCE-IN-DIFFERENCES ESTIMATION RESULTS
Number of observations in the DIFF-IN-DIFF: 2960
            Before         After    
   Control: 945            1755        2700
   Treated: 91             169         260
            1036           1924
--------------------------------------------------------
 Outcome var.   | entry   | S. Err. |   |t|   |  P>|t|
----------------+---------+---------+---------+---------
Before          |         |         |         | 
   Control      | 0.728   |         |         | 
   Treated      | 0.684   |         |         | 
   Diff (T-C)   | -0.044  | 0.012   | -3.58   | 0.000***
After           |         |         |         | 
   Control      | 0.680   |         |         | 
   Treated      | 0.665   |         |         | 
   Diff (T-C)   | -0.014  | 0.009   | 1.60    | 0.109
                |         |         |         | 
Diff-in-Diff    | 0.029   | 0.015   | 1.94    | 0.052*
--------------------------------------------------------
R-square:    0.04
* Means and Standard Errors are estimated by linear regression
**Inference: *** p<0.01; ** p<0.05; * p<0.1

4. 相关推文

Note:产生如下推文列表的 Stata 命令为:
lianxh did, m
安装最新版 lianxh 命令:
ssc install lianxh, replace

相关课程

免费公开课

最新课程-直播课

专题 嘉宾 直播/回看视频
最新专题 文本分析、机器学习、效率专题、生存分析等
研究设计 连玉君 我的特斯拉-实证研究设计-幻灯片-
面板模型 连玉君 动态面板模型-幻灯片-
面板模型 连玉君 直击面板数据模型 [免费公开课,2小时]
  • Note: 部分课程的资料,PPT 等可以前往 连享会-直播课 主页查看,下载。

课程主页

课程主页

关于我们

  • Stata连享会 由中山大学连玉君老师团队创办,定期分享实证分析经验。
  • 连享会-主页知乎专栏,700+ 推文,实证分析不再抓狂。直播间 有很多视频课程,可以随时观看。
  • 公众号关键词搜索/回复 功能已经上线。大家可以在公众号左下角点击键盘图标,输入简要关键词,以便快速呈现历史推文,获取工具软件和数据下载。常见关键词:课程, 直播, 视频, 客服, 模型设定, 研究设计, stata, plus, 绘图, 编程, 面板, 论文重现, 可视化, RDD, DID, PSM, 合成控制法

连享会小程序:扫一扫,看推文,看视频……

扫码加入连享会微信群,提问交流更方便

✏ 连享会-常见问题解答:
https://gitee.com/lianxh/Course/wikis

New! lianxhsongbl 命令发布了:
随时搜索连享会推文、Stata 资源,安装命令如下:
. ssc install lianxh
使用详情参见帮助文件 (有惊喜):
. help lianxh