温馨提示: 定期 清理浏览器缓存,可以获得最佳浏览体验。
作者: 亢延锟 (中央财经大学)
E-mail: kangyankun@126.com
目录
谢谦等 (2019) 对目前学术界断点回归 (regression-discontinuity designs) 应用的最新进展做了详细的综述,但他们侧重于强调在五大期刊中出现的应用,对还未在五大上出现的多配置变量 RDD (RDD with assignment variables)、分位数 RDD 、拐点回归设计 (regression kink designs)、多断点RDD (RDD with multiple cutoffs)、远离断点处的处理效应的识别方法( methods for extrapolation away from the cutoff)、离散型配置变量 RDD 等新进展未做涉及。
这篇推文主要结合几篇文章对多配置变量 RDD 、多断点 RDD 和远离断点处的处理效应这几种情况的核心思想和文章的主要结论做一大体介绍。值得一提的是,assignment variable 又叫 running variable 和 forcing variable,中文被翻译成配置变量、分配变量、驱动变量、分组变量等不同叫法。在国内大家的使用也各有不同,张川川和陈斌开 (2015) 使用特征变量或驱动变量,邹红和喻开志 (2015) 、雷晓燕等 (2010) 、张川川等 (2014) 也使用驱动变量的说法,黄新飞等 (2014) 和李宏斌等 (2014) 使用运行变量的叫法,秦学征等 (2018) 使用指派变量,刘生龙等 (2016) 使用设计变量的翻译,但是其含义都是一样。
Wong et al. (2013) 介绍了一个多配置变量的断点回归 (multivariate regression-discontinuity design) ,即可以允许有多个配置变量和断点。文章中以有两个配置变量的 MRDD 为例,指出临界平均处理效应 (frontier average treatment effect) 可以被分解成两个单变量 RDD 效应的加权平均,并介绍了边界法 (frontier approach) 、中心化方法 (centering approach) 、单变量方法 (univariate approach) 和工具变量方法 (IV approach) 四种估计方法及其优劣。
举个例子,假设学校要开设一个补习班,如果学校要求阅读成绩低于 60 分的同学参加,那么我们可以用传统的断点回归来评估补习班的效果。如果学校要求阅读成绩和数学成绩有任何一个低于 60 分,都要参加补习班。这时如果还需要评估补习班的作用,传统的断点回归方法就不适用了,而要使用上文提出的多多配置变量的断点回归 (MRDD) 。
图 1
如上图所示,T1 部分是阅读成绩不达标的同学,T3 是数学成绩不达标的同学,T2 是都不达标的同学。在这种情况下,会有三个处理效应,首先根据传统 RD 的思路,会在阅读成绩和数学成绩 60 分处形成两个特定边界效应 (frontier-specific effect) ,另外一个是边界平均处理效应 (frontier average treatment effect) ,即总体的平均效应,用潜在因果框架可以写成:
Wong et al. (2013) 指出,边界平均处理效应可以被分解成两个特定边界效应的加权平均值,即:
正因为如此,MRDD 要求在两个独立的断点处,满足传统 RD 的所有假设,同时,MRDD 估计的有效性还高度依赖于配置变量的度量和标准差。例如,当两个配置变量是收入和年龄时,当收入的单位由万元改为元时,收入处的处理效应在平均处理效应中的权重也会改变,从而使 MRDD 的平均处理效应的估计发生改变,类似的,对配置变量的极端值的处理也会产生相同的影响。
对于 MRDD 的四种估计方法 Frontier Approach,Centering Approach ,Univariate Approach 和 IV Approach,这四种方法的做法各异,依赖的前提假设也不同,限于篇幅原因,感兴趣的同学可以详细阅读文章的第三部分。在这里根据文章对四种方法的优劣做简单的总结。
Frontier Approach 的优点在于可以同时估计所有的处理效应 (
Centering Approach 的优点在于使用相对容易的方法处理具有许多配置变量的 MRDD ,因为这一方法的本质是一个降维的过程。缺点在于降维的过程掩盖了处理效应的异质性,并且这一过程依赖于较为复杂的方程形式来刻画配置变量和结果变量之间的关系,不如 Frontier Approach 有效。
Univariate Approach 的优点在于可以直接计算和发现处理效应的异质性,比 IV 方法更有效率,即拥有更小的标准误。缺点是不能计算
接下来做一个简单总结:
对于 MRDD 的经济意义需要研究者谨慎考虑,在许多情况下,边界平均治疗效果可能没有一个有意义的解释。如果在一个边界,估计表明没有影响,在另一个边界,显示出有显著的积极影响,那么的平均影响取决于一个与单位和度量相关的加权方案。
如果没有相当强的假设,MRDD 中
作者不建议使用 IV 进行估计,虽然在满足分析假设的情况下,它会产生无偏估计,但文章的模拟结果表明,与其他三种方法相比,IV 方法降低了统计精度,同时在文章中模拟环境中,IV方法也没有展现出其他一些比较优势。
在传统的断点回归设计中,研究者往往根据断点来估计 LATE 来进行因果效应的识别,但是在实际情况中断点的数量可能并不唯一,比如要研究国家贫困县补贴的影响,但是不同省份贫困县的标准不一样,在使用 RD 时便会出现多个断点的情况,此时可以对其进行标准化之后在进行传统 RD 的操作,但是这种处理方式的具体形式和经济意义仍然值得商榷,并且研究者同样失去了对不同断点异质性的考察。
利用 Cattaneo et al. (2016) 文中的一个例子,在一个两党制的选举中,50% 的得票率自然而然可以被当作胜选的断点,但是在有三个或三个以上政党参与的选举中,可能胜选的政党得票率不超过40%也是极有可能的,这种情况在在政治学研究中普遍存在,这也是促使作者探究允许多个断点存在的rd的主要原因。
Cattaneo et al. (2016) 指出,在一系列严格的假设下,这种将多个断点标准化的做法所得到的效应仍然是多个断点效应的加权平均值,并且权重取决于在各断点附近样本观察值的多少。作者在文中指出,允许多个断点 RDD 的估计方法在一定的假设下可以改写成上文介绍的多个配置变量的 RDD, 并在文中介绍了相应的估计方法。
作者在文中还给予研究者一些对允许多个断点 RDD 的使用建议,作者认为应该先画图,看看样本分布图是否很直观的存在多个断点,如果分布中大量样本集中于一个断点,也可以视同使用单个断点进行传统的断点回归,当确实存在多个断点时,研究者可以有以下几个处理方法:
可以使用单个断点的估计方法,直接忽略不同断点之间的异质性问题,或者假设每个断点的效应都是一样的,当然这需要结合理论和具体问题进行论述。
研究者可以承认异质性的存在,但声明我们关注的重点是平均处理效应,异质性问题并不重要。
可以先用单个断点的回归方法,再将另外一部分集中于第二个断点附近的样本剔除,如果回归结果不发生大的变化,则有理由相信这样的处理是合理的。
如果最后要使用多个断点的 RDD,则必须要确定断点是否是累积的,如果断点是累积的,那么每一个样本面临的断点是配置变量的一个确定的函数,那么这就使得断点回归中样本分组不能是内生的假设无法满足。
我们知道,RD 估计的是一个局部平均处理效应 (LATE),这仅对断点两侧的样本有意义,离断点较远的样本实际上并不参与处理效应的识别。有时候 RD 估计的 LATE 本身是重要的,例如该不该给数学和阅读不及格的孩子上补习课,但是有时候这个 LATE 对于政策执行者的意义仍然不足。比如这一结果不能说明是否对所有孩子都上补习班也有相同的效果,这就是一个政策是否可以推广的问题。可惜传统的 RD 并不能回答这一问题。
Cattaneo et al. (2018) 在一个一个允许多个断点回归的框架下构造了一个处理效应的合理外推,这一思路借鉴了双重差分方法的思路,核心是解决潜在因果识别中的数据缺失问题。
图 2
如图 2 所示,一个拥有两个断点的 RDD, 一部分样本在 l 处断开,一部分样本在 h 处断开,此时根据上文的介绍,我们可以得到
图 3
看到 图 3, 熟悉双重差分方法的读者可以很容易理解作者外推的思路。作者需要估计
从 图 3 中可以看到,我们可以观测的点是
此时,在估计
连享会-直播课 上线了!
http://lianxh.duanshu.com
免费公开课:
直击面板数据模型 - 连玉君,时长:1小时40分钟 Stata 33 讲 - 连玉君, 每讲 15 分钟. 部分直播课 课程资料下载 (PPT,dofiles等)
支持回看,所有课程可以随时购买观看。
专题 | 嘉宾 | 直播/回看视频 |
---|---|---|
⭐ 最新专题 ⭐ | DSGE, 因果推断, 空间计量等 | |
⭕ Stata数据清洗 | 游万海 | 直播, 2 小时,已上线 |
研究设计 | 连玉君 | 我的特斯拉-实证研究设计,-幻灯片- |
面板模型 | 连玉君 | 动态面板模型,-幻灯片- |
面板模型 | 连玉君 | 直击面板数据模型 [免费公开课,2小时] |
Note: 部分课程的资料,PPT 等可以前往 连享会-直播课 主页查看,下载。
关于我们
课程, 直播, 视频, 客服, 模型设定, 研究设计, stata, plus, 绘图, 编程, 面板, 论文重现, 可视化, RDD, DID, PSM, 合成控制法
等
连享会小程序:扫一扫,看推文,看视频……
扫码加入连享会微信群,提问交流更方便
✏ 连享会学习群-常见问题解答汇总:
✨ https://gitee.com/arlionn/WD