Stata:拐点回归的分位数处理效应估计-rkqte

发布时间:2023-06-15 阅读 871

Stata连享会   主页 || 视频 || 推文 || 知乎 || Bilibili 站

温馨提示: 定期 清理浏览器缓存,可以获得最佳浏览体验。

New! lianxh 命令发布了:
随时搜索推文、Stata 资源。安装:
. ssc install lianxh
详情参见帮助文件 (有惊喜):
. help lianxh
连享会新命令:cnssc, ihelp, rdbalance, gitee, installpkg

课程详情 https://gitee.com/lianxh/Course

课程主页 https://gitee.com/lianxh/Course

⛳ Stata 系列推文:

PDF下载 - 推文合集

作者:梁宇超 (中国人民大学)
邮箱liangyuchao1997@126.com


目录


1. 简介

在断点回归设计 (RDD) 中,我们主要利用结果变量和处理状态在断点处的跳跃进行因果推断。但是当两者在断点处是连续变量时,RDD 就难以识别因果效应,这种问题在研究中经常会出现,导致无法使用 RDD 来估计因果效应。

在这种情况下,如果两者在断点处存在拐点/弯折 (Kink),即斜率存在变化,则可以通过与 RDD 类似的思路,利用拐点回归设计 (Regression Kink Design, RKD) 的思路来识别因果效应。

在拐点回归设计 (RKD) 中,结果变量 Y 和处理状态 D 在断点处可以存在跳跃,也可以是连续的。但要求它们相对于配置变量 X 的导数在断点处存在跳跃,从而 RKD 就可以利用断点处的导数变化 (即斜率变化) 来进行因果识别。

简言之,拐点回归设计就是将结果变量在断点处的弯折归因于处理状态 D 在断点处的弯折,相当于结果变量 Y 和处理状态 D 相对于配置变量 X 导数的断点回归设计。

在拐点回归设计中,处理状态 D 可以是二元变量,也可以是关于配置变量 X 的连续函数。已有文献对拐点回归设计中的平均处理效应、连续处理变量下的分位数处理效应进行了研究。在此基础上,Chen et al., (2020) 开发了一个方法来估计二元处理变量下的拐点回归设计中的分位数处理效应。

rkqte 命令是在 Chen et al., (2020) 的基础上,对拐点回归设计 (RKD) 中的分位数处理效应 (QTE) 进行估计和稳健推断。该命令包含一个被解释变量  Y、一个二元处理变量 D 和一个配置变量 X。主要结果包括多个分位数的分位数处理效应估计值和统一的 95% 置信区间。

该命令还能提供两个检验,即分位数处理效应在各个分位数均为 0 的原假设,以及分位数处理效应是常数的零假设 (不存在异质性处理效应)。注意,该命令仅适用于估计处理变量 D 为二元变量的情况,对于连续处理变量,参考 qrkd 命令。

2. 基本原理

rkqte 命令由 Chen et al., (2020) 提出,该文的主要贡献是提出了一种识别策略,具体的识别公式采用函数导数的局部瓦尔德比的形式。具体来说,利用条件期望函数导数的两个局部瓦尔德比的左逆差值来识别 RKD 中二元处理的分位数效应。

本文首先通过以下因果结构对随机向量 (Y,D,X,U,V) 进行建模,其中:

在方程 (1) 中,结果变量 Y 通过函数 g 由二元处理变量 D、连续运行变量 X 和扰动因素 U 产生。方程 (2) 表示具有属性 (X,U) 的个体在每个假设处理选择 d(0,1) 下产生的潜在结果随机变量。

实际处理选择 D 由 X 和 V 通过阈值交叉方程 (2) 确定。然而,我们无法观测到 U 或 V。本文在这个模型中不强加任何统计独立性条件,因此,现有的工具变量分位数回归方法在这里不适用。特别地,本文不假定运行变量 X 与不可观测量 (U,V) 之间的统计独立性。相反,对 RKD 做出以下假设。

假设 1 (RKD):设 x0=0X 为设计的拐点位置。

  • (i) h 在 x0=0 的删除邻域 IX{0}X 中连续可微。
  • (ii) h 在 x0=0 处连续。
  • (iii) limx0h(x)limx0h(x),其中 h 表示 dh/dx
  • (iv) 给定 X 的 V 的条件分布是绝对连续的,具有连续可微的条件密度函数 fV|X(·|·)
  • (v) 对于每个 yY,对于每个 d0,1,条件累积分布函数 FYd|VX(y|·,·) 是连续可微的。
  • (vi) fV|X(h(0)|0)>0

根据假设 1 所需的研究设计包括三个组成部分。首先,处理分配规则 h 在设计位置 x0=0 处有一个拐点,但这个分配规则 h 在其他地方是平滑的。其次,每个其他函数都是平滑的。最后,在设计的拐点位置 x0=0 处有足够的数据。在这种设计下,可以获得以下关于潜在结果 Yd 给定 (V,X)=(h(0),0) 事件的条件分布的识别结果。

定理 1 (识别):设定假设 1 (RKD) 适用于公式 (1) 和 (2)。然后有:

对所有的 yY 成立。

一旦通过定理 1 中提出的公式确定了条件累积分布函数 FYd|VX(·|h(0),0),其中 d0,1,则条件分位数处理效应也相应地被确定。

在论文中,作者还对提出了对于条件分位数处理效应的估计和推断的过程指导,并在附录中附上了严格数学证明和推导过程,有兴趣的读者可自行查阅。

3. 命令介绍

在二元处理变量下的拐点回归设计中的分位数处理效应估计需要借助 rkqte 命令。

命令安装:

. ssc install rkqte, replace

命令语法:

. rkqte y d x [if] [in] [, k(real) cover(real) ql(real) qh(real) qn(real) bw(real)]

各个选择项的具体含义如下:

  • k(real):设置拐点的位置,默认值为 k(0)
  • cover(real):设置覆盖真实的分位数回归估计量的均匀置信区间的概率,默认置信区间值 cover(.95)
  • ql(real):设置分位数处理效应估计量的最低分位数,默认值为 ql(.25)
  • qh(real):设置分位数处理效应估计量的最高分位数,默认值为 qh(.75)
  • qn(real):设置分位数点的数量,默认值为 qn(3)
  • bw(real):设置于估计分位数处理效应估计量的带宽。

4. 应用示范

为了演示 rkqte 命令的基本语法与输出结果,我们采用 Lee (2008) 在论文中使用的美国议员选举结果的面板数据进行演示。值得注意的是,这份数据集最初是运用于断点回归设计 (RDD),主要研究上一届选举获胜的议员,是否会利用在位优势,在下一届选举中获得更高的支持率。

其中,变量 margin 取值范围为 -100 到 100,衡量议员在上一届选举中的支持率,定义为民主党的投票率减去最强对手的投票率。当支持优势高于零时,民主党将赢得该席位的选举,否则就会失败。变量 vote 取值范围为 0 到 100,衡量议员在本届选举中的支持率。在原文采用 RDD 设计进行研究时,margin 为驱动变量,根据 margin 是否大于 0,生成相应的状态变量 treatmentvote 为被解释变量。

首先,我们演示采用 rdrobust 命令进行普通拐点回归估计的结果。

. lxhuse rdrobust_senate.dta, clear 
. rdrobust vote margin, deriv(1)

Sharp Kink RD estimates using local polynomial regression.
      Cutoff c = 0 | Left of c  Right of c  Number of obs =       1297
-------------------+----------------------  BW type       =      mserd
     Number of obs |       595         702  Kernel        = Triangular
Eff. Number of obs |       389         346  VCE method    =         NN
    Order est. (p) |         2           2
    Order bias (q) |         3           3
       BW est. (h) |    19.842      19.842
       BW bias (b) |    33.284      33.284
         rho (h/b) |     0.596       0.596
Outcome: vote. Running variable: margin.
---------------------------------------------------------------------
      Method |  Coef.  Std. Err.    z    P>|z|   [95% Conf. Interval]
-------------+-------------------------------------------------------
Conventional | .70748     .535   1.3224  0.186  -.341104      1.75606
      Robust |    -        -     1.4156  0.157  -.385993      2.39346
---------------------------------------------------------------------

然后,我们采用本文主要介绍的 rkqte 命令进行拐点回归分位数效应的结果,结果默认展示了 0.25、0.5 以及 0.75 分位数的估计结果和置信区间。

. gen treatment = (margin > 0)
. rkqte vote treatment margin

-------------------------------------------------------------------------
Executing:Chen, H., Chiang, H.D., & Sasaki, Y. (2020): Quantile Treatment 
          Effects in Regression Kink Designs. Econometric Theory, 36 (6): 
          1167-1191.                                                      
-------------------------------------------------------------------------
Estimating QTE
Estimating Variance
-------------------------------------------------------------------------
Fuzzy Regression Kink Design
Number of observations:                                        n = 1297
The kink location of the running variable:                     k = 0
-------------------------------------------------------------------------
Quantile          QTE     [95% Unif. Conf. Band]
------------------------------------------------
   0.250      3.75843    -16.03067     23.54753
   0.500      3.75843    -16.03067     23.54753
   0.750      6.26406    -13.52504     26.05316
------------------------------------------------------------------------------
Test of the hypothesis that QTE=0 for all quantiles:           p-value = 1.000
Test of the hypothesis that QTE is constant across quantiles:  p-value = 1.000
------------------------------------------------------------------------------

我们还可以通过添加选择项的方式,提供不同分位数处的估计结果。如下结果演示了从最低分位数 0.1,到最高分位数 0.9,并提供 9 个分位数点的估计结果。

. rkqte vote treatment margin, ql(0.1) qh(0.9) qn(9)

-------------------------------------------------------------------------
Executing:Chen, H., Chiang, H.D., & Sasaki, Y. (2020): Quantile Treatment 
          Effects in Regression Kink Designs. Econometric Theory, 36 (6): 
          1167-1191.                                                      
-------------------------------------------------------------------------
Estimating QTE
Estimating Variance
-------------------------------------------------------------------------
Fuzzy Regression Kink Design
Number of observations:                                        n = 1297
The kink location of the running variable:                     k = 0
-------------------------------------------------------------------------
Quantile          QTE     [95% Unif. Conf. Band]
------------------------------------------------
   0.100      0.00000    -32.15933     32.15933
   0.200      0.73081    -31.42852     32.89013
   0.300      3.75843    -28.40089     35.91776
   0.400      3.75843    -28.40089     35.91776
   0.500      3.75843    -28.40089     35.91776
   0.600      6.26406    -25.89527     38.42338
   0.700      6.26406    -25.89527     38.42338
   0.800      5.84645    -26.31287     38.00578
   0.900      7.83007    -24.32926     39.98940
------------------------------------------------------------------------------
Test of the hypothesis that QTE=0 for all quantiles:           p-value = 1.000
Test of the hypothesis that QTE is constant across quantiles:  p-value = 1.000
------------------------------------------------------------------------------

5. 参考资料

  • Chen H, Chiang H D, Sasaki Y. Quantile treatment effects in regression kink designs[J]. Econometric Theory, 2020, 36(6): 1167-1191. -PDF-
  • 刘冲, 诸宇灵, 李皓宇. 断点回归设计:理论前沿进展与新应用场景[J]. 经济学报, 2022, 9(03):325-366. -PDF-
  • 拐点回归设计RKD概览, 及其开展实证研究的经典示例 -Link-
  • Lee D S. Randomized experiments from non-random selection in US House elections[J]. Journal of Econometrics, 2008, 142(2): 675-697. -PDF-

6. 相关推文

Note:产生如下推文列表的 Stata 命令为:
lianxh
安装最新版 lianxh 命令:
ssc install lianxh, replace

相关课程

免费公开课

最新课程-直播课

专题 嘉宾 直播/回看视频
最新专题 文本分析、机器学习、效率专题、生存分析等
研究设计 连玉君 我的特斯拉-实证研究设计-幻灯片-
面板模型 连玉君 动态面板模型-幻灯片-
面板模型 连玉君 直击面板数据模型 [免费公开课,2小时]
  • Note: 部分课程的资料,PPT 等可以前往 连享会-直播课 主页查看,下载。

课程主页

课程主页

关于我们

  • Stata连享会 由中山大学连玉君老师团队创办,定期分享实证分析经验。
  • 连享会-主页知乎专栏,700+ 推文,实证分析不再抓狂。直播间 有很多视频课程,可以随时观看。
  • 公众号关键词搜索/回复 功能已经上线。大家可以在公众号左下角点击键盘图标,输入简要关键词,以便快速呈现历史推文,获取工具软件和数据下载。常见关键词:课程, 直播, 视频, 客服, 模型设定, 研究设计, stata, plus, 绘图, 编程, 面板, 论文重现, 可视化, RDD, DID, PSM, 合成控制法

连享会小程序:扫一扫,看推文,看视频……

扫码加入连享会微信群,提问交流更方便

✏ 连享会-常见问题解答:
https://gitee.com/lianxh/Course/wikis

New! lianxhsongbl 命令发布了:
随时搜索连享会推文、Stata 资源,安装命令如下:
. ssc install lianxh
使用详情参见帮助文件 (有惊喜):
. help lianxh