Stata:拐点回归的分位数处理效应估计-rkqte
2023-06-14
梁宇超
4597

连享会   主页 || 推文 || 知乎 || B 站 || 在线课堂

New! 搜推文,找资料,用 lianxh 命令:
安装: ssc install lianxh, replace
使用: lianxh 合成控制
       lianxh DID + 多期, w


⛳ Stata 系列推文:

PDF下载 - 推文合集

作者:梁宇超 (中国人民大学)
邮箱liangyuchao1997@126.com


目录
[[TOC]]


1. 简介

在断点回归设计 (RDD) 中,我们主要利用结果变量和处理状态在断点处的跳跃进行因果推断。但是当两者在断点处是连续变量时,RDD 就难以识别因果效应,这种问题在研究中经常会出现,导致无法使用 RDD 来估计因果效应。

在这种情况下,如果两者在断点处存在拐点/弯折 (Kink),即斜率存在变化,则可以通过与 RDD 类似的思路,利用拐点回归设计 (Regression Kink Design, RKD) 的思路来识别因果效应。

在拐点回归设计 (RKD) 中,结果变量 YY 和处理状态 DD 在断点处可以存在跳跃,也可以是连续的。但要求它们相对于配置变量 XX 的导数在断点处存在跳跃,从而 RKD 就可以利用断点处的导数变化 (即斜率变化) 来进行因果识别。

简言之,拐点回归设计就是将结果变量在断点处的弯折归因于处理状态 DD 在断点处的弯折,相当于结果变量 YY 和处理状态 DD 相对于配置变量 XX 导数的断点回归设计。

在拐点回归设计中,处理状态 DD 可以是二元变量,也可以是关于配置变量 XX 的连续函数。已有文献对拐点回归设计中的平均处理效应、连续处理变量下的分位数处理效应进行了研究。在此基础上,Chen et al., (2020) 开发了一个方法来估计二元处理变量下的拐点回归设计中的分位数处理效应。

rkqte 命令是在 Chen et al., (2020) 的基础上,对拐点回归设计 (RKD) 中的分位数处理效应 (QTE) 进行估计和稳健推断。该命令包含一个被解释变量 YY、一个二元处理变量 DD 和一个配置变量 XX。主要结果包括多个分位数的分位数处理效应估计值和统一的 95% 置信区间。

该命令还能提供两个检验,即分位数处理效应在各个分位数均为 0 的原假设,以及分位数处理效应是常数的零假设 (不存在异质性处理效应)。注意,该命令仅适用于估计处理变量 DD 为二元变量的情况,对于连续处理变量,参考 qrkd 命令。

2. 基本原理

rkqte 命令由 Chen et al., (2020) 提出,该文的主要贡献是提出了一种识别策略,具体的识别公式采用函数导数的局部瓦尔德比的形式。具体来说,利用条件期望函数导数的两个局部瓦尔德比的左逆差值来识别 RKD 中二元处理的分位数效应。

本文首先通过以下因果结构对随机向量 (Y,D,X,U,V)(Y,D,X,U,V) 进行建模,其中:

YR,D={0,1},XR,URdU for dUN, and VR.Y \subset R, D = \{0,1\}, X \subset R, U \subset R^{dU} \text{ for } dU \in N, \text{ and } V \subset R.

Y=g(D,X,U)(1)Y = g(D,X,U) \quad (1)

D=1{h(X)V}(2)D = 1\{h(X) \geq V\} \quad (2)

在方程 (1) 中,结果变量 YY 通过函数 gg 由二元处理变量 DD、连续运行变量 XX 和扰动因素 UU 产生。方程 (2) 表示具有属性 (X,U)(X,U) 的个体在每个假设处理选择 d(0,1)d∈(0,1) 下产生的潜在结果随机变量。

实际处理选择 DDXXVV 通过阈值交叉方程 (2) 确定。然而,我们无法观测到 UUVV。本文在这个模型中不强加任何统计独立性条件,因此,现有的工具变量分位数回归方法在这里不适用。特别地,本文不假定运行变量 XX 与不可观测量 (U,V)(U,V) 之间的统计独立性。相反,对 RKD 做出以下假设。

假设 1 (RKD):设 x0=0Xx_0 = 0∈X 为设计的拐点位置。

  • (i) h 在 x0=0x_0 = 0 的删除邻域 IX{0}XIX\{0\} \subset X 中连续可微。
  • (ii) h 在 x0=0x_0 = 0 处连续。
  • (iii) limx0h(x)limx0h(x)\lim_{x↓0} h′(x)≠\lim_{x↑0} h′(x),其中 hh′ 表示 dh/dxdh/dx
  • (iv) 给定 XXVV 的条件分布是绝对连续的,具有连续可微的条件密度函数 fVX()fV|X(·|·)
  • (v) 对于每个 yYy∈Y,对于每个 d0,1d∈{0,1},条件累积分布函数 FYdVX(y,)FYd|VX(y|·,·) 是连续可微的。
  • (vi) fVX(h(0)0)>0fV|X(h(0)|0) > 0

根据假设 1 所需的研究设计包括三个组成部分。首先,处理分配规则 h 在设计位置 x0=0x0 = 0 处有一个拐点,但这个分配规则 h 在其他地方是平滑的。其次,每个其他函数都是平滑的。最后,在设计的拐点位置 x0=0x0 = 0 处有足够的数据。在这种设计下,可以获得以下关于潜在结果 YdYd 给定 (V,X)=(h(0),0)(V,X)=(h(0),0) 事件的条件分布的识别结果。

定理 1 (识别):设定假设 1 (RKD) 适用于公式 (1) 和 (2)。然后有:

FY1VX(yh(0),0)=limx0ddxE[1{Yy}DX=x]limx0ddxE[1{Yy}DX=x]limx0ddxE[DX=x]limx0ddxFY_1|VX(y|h(0),0) = \frac{\lim_{x↓0} \frac{d}{dx}E[1\{Y \leq y\}·D|X = x]-\lim_{x↑0} \frac{d}{dx}E[1\{Y \leq y\}·D|X = x]}{\lim_{x↓0} \frac{d}{dx}E[D|X = x]-\lim_{x↑0} \frac{d}{dx}}

FY0VX(yh(0),0)=limx0ddxE[1{Yy}(1D)X=x]limx0ddxE[1{Yy}(1D)X=x]limx0ddxE[1DX=x]limx0ddxE[1DX=x]FY_0|VX(y|h(0),0) = \frac{\lim_{x↓0} \frac{d}{dx}E[1\{Y \leq y\}·(1-D)|X = x]-\lim_{x↑0} \frac{d}{dx}E[1\{Y \leq y\}·(1-D)|X = x]}{\lim_{x↓0} \frac{d}{dx}E[1-D|X = x]-\lim_{x↑0} \frac{d}{dx}E[1-D|X = x]}

对所有的 yYy∈Y 成立。

一旦通过定理 1 中提出的公式确定了条件累积分布函数 FYdVX(h(0),0)FYd|VX(·|h(0),0),其中 d0,1d∈{0,1},则条件分位数处理效应也相应地被确定。

τ(θ)=inf{yY:FY1VX(yh(0),0)θ}inf{yY:FY0VX(yh(0),0)θ}(3)\tau (\theta) = \inf\{y \in Y : FY_1|VX(y|h(0),0) \geq \theta\} - \inf\{y \in Y : FY_0|VX(y|h(0),0) \geq \theta\} \quad (3)

在论文中,作者还对提出了对于条件分位数处理效应的估计和推断的过程指导,并在附录中附上了严格数学证明和推导过程,有兴趣的读者可自行查阅。

3. 命令介绍

在二元处理变量下的拐点回归设计中的分位数处理效应估计需要借助 rkqte 命令。

命令安装:

. ssc install rkqte, replace

命令语法:

. rkqte y d x [if] [in] [, k(real) cover(real) ql(real) qh(real) qn(real) bw(real)]

各个选择项的具体含义如下:

  • k(real):设置拐点的位置,默认值为 k(0)
  • cover(real):设置覆盖真实的分位数回归估计量的均匀置信区间的概率,默认置信区间值 cover(.95)
  • ql(real):设置分位数处理效应估计量的最低分位数,默认值为 ql(.25)
  • qh(real):设置分位数处理效应估计量的最高分位数,默认值为 qh(.75)
  • qn(real):设置分位数点的数量,默认值为 qn(3)
  • bw(real):设置于估计分位数处理效应估计量的带宽。

4. 应用示范

为了演示 rkqte 命令的基本语法与输出结果,我们采用 Lee (2008) 在论文中使用的美国议员选举结果的面板数据进行演示。值得注意的是,这份数据集最初是运用于断点回归设计 (RDD),主要研究上一届选举获胜的议员,是否会利用在位优势,在下一届选举中获得更高的支持率。

其中,变量 margin 取值范围为 -100 到 100,衡量议员在上一届选举中的支持率,定义为民主党的投票率减去最强对手的投票率。当支持优势高于零时,民主党将赢得该席位的选举,否则就会失败。变量 vote 取值范围为 0 到 100,衡量议员在本届选举中的支持率。在原文采用 RDD 设计进行研究时,margin 为驱动变量,根据 margin 是否大于 0,生成相应的状态变量 treatmentvote 为被解释变量。

首先,我们演示采用 rdrobust 命令进行普通拐点回归估计的结果。

. lxhuse rdrobust_senate.dta, clear 
. rdrobust vote margin, deriv(1)

Sharp Kink RD estimates using local polynomial regression.
      Cutoff c = 0 | Left of c  Right of c  Number of obs =       1297
-------------------+----------------------  BW type       =      mserd
     Number of obs |       595         702  Kernel        = Triangular
Eff. Number of obs |       389         346  VCE method    =         NN
    Order est. (p) |         2           2
    Order bias (q) |         3           3
       BW est. (h) |    19.842      19.842
       BW bias (b) |    33.284      33.284
         rho (h/b) |     0.596       0.596
Outcome: vote. Running variable: margin.
---------------------------------------------------------------------
      Method |  Coef.  Std. Err.    z    P>|z|   [95% Conf. Interval]
-------------+-------------------------------------------------------
Conventional | .70748     .535   1.3224  0.186  -.341104      1.75606
      Robust |    -        -     1.4156  0.157  -.385993      2.39346
---------------------------------------------------------------------

然后,我们采用本文主要介绍的 rkqte 命令进行拐点回归分位数效应的结果,结果默认展示了 0.25、0.5 以及 0.75 分位数的估计结果和置信区间。

. gen treatment = (margin > 0)
. rkqte vote treatment margin

-------------------------------------------------------------------------
Executing:Chen, H., Chiang, H.D., & Sasaki, Y. (2020): Quantile Treatment 
          Effects in Regression Kink Designs. Econometric Theory, 36 (6): 
          1167-1191.                                                      
-------------------------------------------------------------------------
Estimating QTE
Estimating Variance
-------------------------------------------------------------------------
Fuzzy Regression Kink Design
Number of observations:                                        n = 1297
The kink location of the running variable:                     k = 0
-------------------------------------------------------------------------
Quantile          QTE     [95% Unif. Conf. Band]
------------------------------------------------
   0.250      3.75843    -16.03067     23.54753
   0.500      3.75843    -16.03067     23.54753
   0.750      6.26406    -13.52504     26.05316
------------------------------------------------------------------------------
Test of the hypothesis that QTE=0 for all quantiles:           p-value = 1.000
Test of the hypothesis that QTE is constant across quantiles:  p-value = 1.000
------------------------------------------------------------------------------

我们还可以通过添加选择项的方式,提供不同分位数处的估计结果。如下结果演示了从最低分位数 0.1,到最高分位数 0.9,并提供 9 个分位数点的估计结果。

. rkqte vote treatment margin, ql(0.1) qh(0.9) qn(9)

-------------------------------------------------------------------------
Executing:Chen, H., Chiang, H.D., & Sasaki, Y. (2020): Quantile Treatment 
          Effects in Regression Kink Designs. Econometric Theory, 36 (6): 
          1167-1191.                                                      
-------------------------------------------------------------------------
Estimating QTE
Estimating Variance
-------------------------------------------------------------------------
Fuzzy Regression Kink Design
Number of observations:                                        n = 1297
The kink location of the running variable:                     k = 0
-------------------------------------------------------------------------
Quantile          QTE     [95% Unif. Conf. Band]
------------------------------------------------
   0.100      0.00000    -32.15933     32.15933
   0.200      0.73081    -31.42852     32.89013
   0.300      3.75843    -28.40089     35.91776
   0.400      3.75843    -28.40089     35.91776
   0.500      3.75843    -28.40089     35.91776
   0.600      6.26406    -25.89527     38.42338
   0.700      6.26406    -25.89527     38.42338
   0.800      5.84645    -26.31287     38.00578
   0.900      7.83007    -24.32926     39.98940
------------------------------------------------------------------------------
Test of the hypothesis that QTE=0 for all quantiles:           p-value = 1.000
Test of the hypothesis that QTE is constant across quantiles:  p-value = 1.000
------------------------------------------------------------------------------

5. 参考资料

  • Chen H, Chiang H D, Sasaki Y. Quantile treatment effects in regression kink designs[J]. Econometric Theory, 2020, 36(6): 1167-1191. -PDF-
  • 刘冲, 诸宇灵, 李皓宇. 断点回归设计:理论前沿进展与新应用场景[J]. 经济学报, 2022, 9(03):325-366. -PDF-
  • 拐点回归设计RKD概览, 及其开展实证研究的经典示例 -Link-
  • Lee D S. Randomized experiments from non-random selection in US House elections[J]. Journal of Econometrics, 2008, 142(2): 675-697. -PDF-

6. 相关推文

Note:产生如下推文列表的 Stata 命令为:
lianxh
安装最新版 lianxh 命令:
ssc install lianxh, replace

[(https://www.lianxh.cn/details/1543.html)

资源共享


尊敬的老师 / 亲爱的同学们:
连享会致力于不断优化和丰富课程内容,以确保每位学员都能获得最有价值的学习体验。为了更精准地满足您的学习需求,我们诚挚地邀请您参与到我们的课程规划中来。
请您在下面的问卷中,分享您 感兴趣的学习主题或您希望深入了解的知识领域 。您的每一条建议都是我们宝贵的资源,将直接影响到我们课程的改进和创新。
我们期待您的反馈,因为您的参与和支持是我们不断前进的动力。感谢您抽出宝贵时间,与我们共同塑造更加精彩的学习旅程!https://www.wjx.cn/vm/YgPfdsJ.aspx# 再次感谢大家宝贵的意见!


关于我们

  • Stata连享会 由中山大学连玉君老师团队创办,定期分享实证分析经验。more……
  • 扫码加入连享会微信群,提问交流更方便