温馨提示: 定期 清理浏览器缓存,可以获得最佳浏览体验。
New!
lianxh
命令发布了:
随时搜索连享会推文、Stata 资源,安装命令如下:
. ssc install lianxh
使用详情参见帮助文件 (有惊喜):
. help lianxh
作者:谭睿鹏 (南京大学)
邮箱:rptan@nju.edu.cn
编者按:本文摘译自以下文献,特此致谢!
Source: Calonico S, Cattaneo M D, Farrell M H, et al. Regression discontinuity designs using covariates[J]. Review of Economics and Statistics, 2019, 101(3): 442-451. -PDF-
目录
断点回归 (RDD) 由于其依赖的假设较弱,并可以为局部政策效应提供稳健的估计和推断,故被广泛应用于实证研究中。在断点回归中,若使用最小二乘法估计,研究者通常会加入不受政策影响的协变量,如人口统计特征;而使用非参数局部多项式法,研究者大都不考虑协变量,这使得估计量并不总是参数的一致估计。为此,Calonico 等 (2019) 将协变量纳入非参数多项式回归中,以估计局部政策效应,并对相应的统计推断进行了数理论证。
当然,本文的目的是对 Calonico 等 (2019) 方法的具体应用进行介绍。
Calonico 等 (2019) 论证了包括协变量以后,非参数多项式回归中估计量的一致性和大样本性质。同时,该方法也具有以下优点:
接下来,将使用 Calonico 等 (2019) 的方法估计美国 “启智计划” 对儿童死亡率的影响 (Ludwig 和 Miller,2007)。“启智计划” 是美国联邦政府为贫困家庭设立的幼儿园资金项目,该政策于 1965 年向美国 300 个最贫困的县提供了援助。作为向贫困宣战的一种策略,“启智计划” 每年为 90 多万名 3 至 5 岁的贫困儿童、及其家庭提供学前教育、健康和其他方面的社会服务。
其中,实施对象的选择是根据 1960 年的美国县级贫困指数,当该指数在 59.1984 以上时,联邦政府就在该县实施 “启智计划”,反之,则不实施。这里的 59.1984 就是一个很好的断点,学者可以利用该断点设计 RDD,来估计 “启智计划” 的政策效应。
但是,影响儿童死亡率的因素还很多,除 “启智计划” 外,还应包括人口数、黑人比例,城市人口比例,3-5 岁的儿童人口数及占比、14-17 岁的人口数及占比、以及 25 岁以上的人口数及占比。因此,在估计 “启智计划” 对儿童死亡率的影响时,应该控制这些协变量。
在本节,本文将展示标准 RD 和纳入协变量后的 RD 政策效应估计量。需要用到的 Stata 命令为 rdrobust
,安装代码和数据如下:
*命令安装
ssc install rdrobust, replace // 或链接:http://fmwww.bc.edu/repec/bocode/r/
*数据地址
*https://gitee.com/arlionn/data/raw/master/data01/headstart.dta
*https://dataverse.harvard.edu/dataset.xhtml?persistentId=doi:10.7910/DVN/LPZLBF
定义全局暂元:
use headstart.dta, clear
global y mort_age59_related_postHS // y 为因变量 (儿童死亡率)
global x povrate60 // x 为分配变量 (forcing variable), 美国县级 1960 年贫困指数
global z census1960_pop census1960_pctsch1417 census1960_pctsch534 ///
census1960_pctsch25plus census1960_pop1417 census1960_pop534 ///
census1960_pop25plus census1960_pcturban census1960_pctblack // z 为上文提到的协变量
对于 RD 的点估计和偏差估计可以有不同的窗宽,这里分别用 h 和 b 来表示,在实际操作中可以限制 h = b,也可以不加限制。在统计推断时,可以使用 RD 标准的统计推断方法,也可以使用协变量调整的 RD 统计推断方法。因此,又可以分为以下几种情形进行讨论:
情形一:对 h 和 b 间关系不加限制,选择使得未考虑协变量时,政策估计效应的 MSE 最小化方法来挑选最优窗宽,RD 标准统计推断方法如下:
rdrobust $y $x, c(59.1968)
global h = e(h_l)
global b = e(b_l)
global IL = e(ci_r_rb) - e(ci_l_rb)
其中,y 为被解释变量,x 为解释变量,c 括号中为分配变量的值,暂元 h 中存储了 RD 点估计时使用的窗宽,暂元 b 中存储了 RD 偏差估计时使用的窗宽,IL 为 95% 置信区间对应的区间长度。
Sharp RD estimates using local polynomial regression.
Cutoff c = 59.1968| Left of c Right of c Number of obs = 2783
-------------------+---------------------- BW type = mserd
Number of obs | 2489 294 Kernel = Triangular
Eff. Number of obs | 234 180 VCE method = NN
Order est. (p) | 1 1
Order bias (q) | 2 2
BW est. (h) | 6.809 6.809
BW bias (b) | 10.724 10.724
rho (h/b) | 0.635 0.635
Outcome: mort_age59_related_postHS. Running variable: povrate60.
--------------------------------------------------------------------------
Method | Coef. Std. Err. z P>|z| [95% Conf. Interval]
-------------+------------------------------------------------------------
Conventional | -2.4102 1.2053 -1.9996 0.046 -4.77264 -.047753
Robust | - - -2.0340 0.042 -5.46284 -.10125
--------------------------------------------------------------------------
可以看出,此时政策效应大小为 -2.41,p 值为 0.042,h 值为 6.809,b 值为 10.724,稳健性 95% 置信区间为
情形二:对 h 和 b 间关系不加限制,选择使得未考虑协变量时,政策估计效应的 MSE 最小化方法来挑选最优窗宽,协变量调整的 RD 统计推断方法如下:
rdrobust $y $x, c(59.1968) covs($z) h($h) b($b)
h 为情形一中计算 RD 点估计时使用的窗宽,b 为情形一计算 RD 偏差估计时使用的窗宽。h($h)
和 b($b)
这两个选项很重要,只有加了它们,才能保证情形二是在情形一的基础上进行的计算,并且使用了协变量调整的 RD 统计推断方法。
Covariate-adjusted sharp RD estimates using local polynomial regression.
Cutoff c = 59.1968| Left of c Right of c Number of obs = 2779
-------------------+---------------------- BW type = Manual
Number of obs | 2485 294 Kernel = Triangular
Eff. Number of obs | 234 180 VCE method = NN
Order est. (p) | 1 1
Order bias (q) | 2 2
BW est. (h) | 6.809 6.809
BW bias (b) | 10.724 10.724
rho (h/b) | 0.635 0.635
Outcome: mort_age59_related_postHS. Running variable: povrate60.
--------------------------------------------------------------------------
Method | Coef. Std. Err. z P>|z| [95% Conf. Interval]
-------------+------------------------------------------------------------
Conventional | -2.5073 1.0973 -2.2849 0.022 -4.65808 -.356569
Robust | - - -2.3160 0.021 -5.36613 -.446789
--------------------------------------------------------------------------
Covariate-adjusted estimates. Additional covariates included: 9
此时,政策效应大小为 -2.51,p 值为 0.022,h 值为 6.809,b 值为 10.724,稳健性 95% 置信区间为
情形三:对 h 和 b 间关系不加限制,选择使得考虑协变量时,政策估计效应的 MSE 最小化方法来挑选最优窗宽,协变量调整的 RD 统计推断方法如下:
rdrobust $y $x, c(59.1968) covs($z)
Covariate-adjusted sharp RD estimates using local polynomial regression.
Cutoff c = 59.1968| Left of c Right of c Number of obs = 2779
-------------------+---------------------- BW type = mserd
Number of obs | 2485 294 Kernel = Triangular
Eff. Number of obs | 240 184 VCE method = NN
Order est. (p) | 1 1
Order bias (q) | 2 2
BW est. (h) | 6.977 6.977
BW bias (b) | 11.636 11.636
rho (h/b) | 0.600 0.600
Outcome: mort_age59_related_postHS. Running variable: povrate60.
--------------------------------------------------------------------------
Method | Coef. Std. Err. z P>|z| [95% Conf. Interval]
-------------+------------------------------------------------------------
Conventional | -2.4746 1.0888 -2.2729 0.023 -4.60858 -.340674
Robust | - - -2.2586 0.024 -5.20688 -.368638
--------------------------------------------------------------------------
Covariate-adjusted estimates. Additional covariates included: 9
此时,政策效应大小为 -2.4746,p 值为 0.023,h 值为 6.977,b 值为 11.636,稳健性 95% 置信区间为
情形四:限制 h=b,选择使得不考虑协变量时,政策估计效应的 MSE 最小化方法来挑选最优窗宽,同时,不加入协变量,RD 标准统计推断方法如下:
rdrobust $y $x, c(59.1968) rho(1)
global h1 = e(h_l)
global b1 = e(b_l)
其中,rho 括号中写 1,表示限制 h 和 b 相同。
Sharp RD estimates using local polynomial regression.
Cutoff c = 59.1968| Left of c Right of c Number of obs = 2783
-------------------+---------------------- BW type = mserd
Number of obs | 2489 294 Kernel = Triangular
Eff. Number of obs | 234 180 VCE method = NN
Order est. (p) | 1 1
Order bias (q) | 2 2
BW est. (h) | 6.809 6.809
BW bias (b) | 6.809 6.809
rho (h/b) | 1.000 1.000
Outcome: mort_age59_related_postHS. Running variable: povrate60.
--------------------------------------------------------------------------
Method | Coef. Std. Err. z P>|z| [95% Conf. Interval]
-------------+------------------------------------------------------------
Conventional | -2.4102 1.2053 -1.9996 0.046 -4.77264 -.047753
Robust | - - -2.7627 0.006 -6.41372 -1.09023
--------------------------------------------------------------------------
如果不加入协变量,但限制 h=b,政策效应大小的估计值为 -2.4102,p 值为 0.046,b 和 h 值均为 6.809,稳健性 95% 置信区间为
情形五:限制 h=b,选择使得不考虑协变量时,政策估计效应的 MSE 最小化方法来挑选最优窗宽,协变量调整的 RD 统计推断方法如下:
rdrobust $y $x, c(59.1968) covs($z) h($h1) b($b1) rho(1)
其中,h 为情形四中计算 RD 点估计时使用的窗宽,b 为情形四计算 RD 偏差估计时使用的窗宽。h($h1)
和 b($b1)
这两个选项很重要,只有加了它们,才能保证情形五是在情形四的基础上进行的计算,并且使用了协变量调整的 RD 统计推断方法。
Covariate-adjusted sharp RD estimates using local polynomial regression.
Cutoff c = 59.1968| Left of c Right of c Number of obs = 2779
-------------------+---------------------- BW type = Manual
Number of obs | 2485 294 Kernel = Triangular
Eff. Number of obs | 234 180 VCE method = NN
Order est. (p) | 1 1
Order bias (q) | 2 2
BW est. (h) | 6.809 6.809
BW bias (b) | 6.809 6.809
rho (h/b) | 1.000 1.000
Outcome: mort_age59_related_postHS. Running variable: povrate60.
--------------------------------------------------------------------------
Method | Coef. Std. Err. z P>|z| [95% Conf. Interval]
-------------+------------------------------------------------------------
Conventional | -2.5073 1.0973 -2.2849 0.022 -4.65808 -.356569
Robust | - - -3.0701 0.002 -6.63546 -1.46441
--------------------------------------------------------------------------
Covariate-adjusted estimates. Additional covariates included: 9
在限制 h=b 后,政策效应大小的估计值为 -2.5073,p 值为 0.022,b 和 h 值均为 6.809,稳健性 95% 置信区间为
情形六:限制 h=b,选择使得考虑协变量时,政策估计效应的 MSE 最小化方法来挑选最优窗宽,协变量调整的 RD 统计推断方法如下:
rdrobust $y $x, c(59.1968) covs($z) rho(1)
Covariate-adjusted sharp RD estimates using local polynomial regression.
Cutoff c = 59.1968| Left of c Right of c Number of obs = 2779
-------------------+---------------------- BW type = mserd
Number of obs | 2485 294 Kernel = Triangular
Eff. Number of obs | 240 184 VCE method = NN
Order est. (p) | 1 1
Order bias (q) | 2 2
BW est. (h) | 6.977 6.977
BW bias (b) | 6.977 6.977
rho (h/b) | 1.000 1.000
Outcome: mort_age59_related_postHS. Running variable: povrate60.
--------------------------------------------------------------------------
Method | Coef. Std. Err. z P>|z| [95% Conf. Interval]
-------------+------------------------------------------------------------
Conventional | -2.4746 1.0888 -2.2729 0.023 -4.60858 -.340674
Robust | - - -3.0182 0.003 -6.5421 -1.39074
--------------------------------------------------------------------------
Covariate-adjusted estimates. Additional covariates included: 9
此时,政策效应大小的估计值为 -2.4746,p 值为 0.023,b 和 h 值均为 6.977,稳健性 95% 置信区间为
Note: 产生如下推文列表的命令为:
lianxh RDD, m
安装最新版lianxh
命令:
ssc install lianxh, replace
连享会-直播课 上线了!
http://lianxh.duanshu.com
免费公开课:
直击面板数据模型 - 连玉君,时长:1小时40分钟,课程主页 Stata 33 讲 - 连玉君, 每讲 15 分钟. Stata 小白的取经之路 - 龙志能,时长:2 小时,课程主页 部分直播课 课程资料下载 (PPT,dofiles等)
支持回看
专题 | 嘉宾 | 直播/回看视频 |
---|---|---|
⭐ 最新专题 | 因果推断, 空间计量,寒暑假班等 | |
⭕ 数据清洗系列 | 游万海 | 直播, 88 元,已上线 |
研究设计 | 连玉君 | 我的特斯拉-实证研究设计,-幻灯片- |
面板模型 | 连玉君 | 动态面板模型,-幻灯片- |
面板模型 | 连玉君 | 直击面板数据模型 [免费公开课,2小时] |
Note: 部分课程的资料,PPT 等可以前往 连享会-直播课 主页查看,下载。
关于我们
课程, 直播, 视频, 客服, 模型设定, 研究设计, stata, plus, 绘图, 编程, 面板, 论文重现, 可视化, RDD, DID, PSM, 合成控制法
等
连享会小程序:扫一扫,看推文,看视频……
扫码加入连享会微信群,提问交流更方便
✏ 连享会学习群-常见问题解答汇总:
✨ https://gitee.com/arlionn/WD
New!
lianxh
命令发布了:
随时搜索连享会推文、Stata 资源,安装命令如下:
. ssc install lianxh
使用详情参见帮助文件 (有惊喜):
. help lianxh