Stata:无条件分位数回归及应用

发布时间:2021-11-01 阅读 400

Stata连享会   主页 || 视频 || 推文 || 知乎 || Bilibili 站

温馨提示: 定期 清理浏览器缓存,可以获得最佳浏览体验。

New! lianxh 命令发布了:
随时搜索推文、Stata 资源。安装:
. ssc install lianxh
详情参见帮助文件 (有惊喜):
. help lianxh
连享会新命令:cnssc, ihelp, rdbalance, gitee, installpkg

课程详情 https://gitee.com/lianxh/Course

课程主页 https://gitee.com/lianxh/Course

⛳ Stata 系列推文:

PDF下载 - 推文合集

作者: 杨雪 (南开大学)
邮箱: yangx0322@qq.com


目录


1. 简介

Koenker and Bassett (1978) 提出了条件分位数回归 (CQR) 方法,从此开启了大家对均值回归以外的新天地。然而,由于 QCR 的结果基于过多甚至是不必要的个体特征,当我们想要知道解释变量对被解释变量的一般边际影响而无所谓样本个体的其他观测特征时,继续用 QCR 显然无法得到我们想要的结果。由此,无条件分位数回归 (UQR) 应运而生。UQR 是对 CQR 的补充和拓展,在劳动经济学与政策评估中具有重要应用价值 (朱平芳和张征宇,2012)。

2. 基于再中心化影响函数 (RIF) 的 UQR 模型

RIF 是一种稳健估计,最早由 Firpo、Fortin and Lemieux (FFL, 2009) 引入分位数回归,用以分析解释变量 X 分布的微小变化对 Y 无条件分布 τ 分位数的影响。 对于如下 RIF,无论是线性模型还是 Logit 模型,都可以通过积分得到无条件分位:

其中 RIF(qτ,y,Fy) 表示 Fy 的 τ 分位数对应的在中心化影响函数,qτ 是 Y 的无条件分位数,满足 Fy(qτ)=τfy() 是 Y 的密度函数。利用条件期望的迭代法则可将 (1) 式写为:

FFL 令 X 每一个分量进行一个虚拟的无穷小平移变换 (location shift),以获得 Fx 的边际变化对 qτ(Y) 的影响,如此(2)式右边变为:

(3)-(2),除以增量 Δx 并令 Δx 趋向于 0,可以得到 X 的单位平移对 Y 的 τ 无条件分位数的边际影响,即无条件分位数偏效应 (UQPE):

归纳起来,获得 UQPE 一致估计的一般步骤有三步:

  1. 首先,基于样本信息获得 qτ 的一致估计 q^τ,然后用 1(yiq^τ) 对 xi 作 Probit 或 Logit 回归,获得 E(1(yi>qτ)|x)=Φ(xβ) 中 β 的一致估计,其中 Φ() 是正态分布函数或 Logistic 分布函数。
  2. 然后,计算 (3) 式中偏导数可得到其一致估计为:
  1. 最后,可以通过计算:

获得 UQPE(τ) 的一致估计。

3. RIF 分位数回归的 Stata 命令

3.1 无条件固定效应面板分位数回归

Borgen (2016) 在 FFL (2009) rifreg 基础上,提供了 xtrifreg 命令,可以在高维固定效应存在的情况下有效地估计 UQR。 xtrifreg 首先用 pctile 确定在指定分位数处的结果变量,然后用 kdensity 来确定 Y 在该分位数处的密度,并计算 RIF,最后将 RIF 作为 xtreg 中的被解释变量进行回归。其语法结构为:

xtrifreg depvar indepvars [if] [in] [weight], 
         fe i(varname) [options]
  • weight:设置权重,可采用 Stata 四种权重中的三种:aweights, fweights, 和 iweights
  • i(varname): xtrifreg 要求在 i(varname) 选项中指定一个固定效应变量 (必须为哑变量) xtrifreg 默认报告聚类标准误,放宽了误差项的 iid 假设。也可以通过 norobust 等选项,得到其他类型的标准误。

3.2 基于 RIF 回归的 UQR

uqreg 可以专门用于估计基于 RIF 回归的 UQR。如 FFL (2009) 所言,由于分位数 RIF 在不同观测值之间的唯一变化元素是一个指示观测值高于或低于给定分位数的二元变量,任何线性或二项式模型都可以用来估计 UQR。默认情况下, uqreg 只提供平均处理效应的点估计,在 UQR 框架中可以解释为无条件的偏效应。该命令语法结构如下:

 uqreg depvar [indepvars] [if] [in] [weight], 
       q(#p) method(str) [bw(#) kernel(kernel) 
       method_options noisily]
  • weight:设置权重,可采用 Stata 的所有权重类型,有 aweights, fweights, iweights 和 pweights
  • q(#p): 指定无条件分位数,限一个
  • method(str):指定估计 UQR 的方法,有 regress、reghdfe、logit、probit、cloglog 和 hetprobit
  • bw(#) kernel(kernel):指定用于估计密度函数的带宽函数或 (和) 核函数
  • method_options:指定与所选估计方法相适应的选项
  • noisily:显示初步步骤

4. 部分无条件分位数回归

Powell (2010) 认为,FFL (2009) 将所有解释变量都等同于控制变量,无法区分政策变量和控制变量。RIF 回归无法同时基于一些变量的条件分位数回归计算另一些变量的无条件分位数回归。区分政策变量与控制变量的目的主要是为了计算 Y 关于 D 是有条件的分位数回归, 同时关于 X 的部分分量是无条件分位数回归。

这种情形下可以采用 genqreg 命令。包含额外的协变量改变了对处理变量的估计系数的解释,通过 gengreg ,即使存在额外的控制变量,也会产生无条件的分位数处理效应。具体应用可参见如下推文:

5. 参考资料

  • Rios-Avila, F. 2020, Recentered influence functions (RIFs) in Stata: RIF regression and RIF decomposition, Stata Journal, 20(1):51-94. -Link-, -PDF-
  • Borgen, N. T. 2016, Fixed effects in unconditional quantile regression, Stata Journal 16:403–415. -Link-, -PDF-
  • Firpo, S., N. M. Fortin, and T. Lemieux. 2009, Unconditional quantile regressions. Econometrica, 77: 953-973. -Link-, -PDF-
  • 朱平芳,张征宇. 2012,无条件分位数回归:文献综述与应用实例,统计研究,29(03):88-96. -Link-

6. 相关推文

Note:产生如下推文列表的 Stata 命令为:
lianxh 分位数
安装最新版 lianxh 命令:
ssc install lianxh, replace

相关课程

免费公开课

最新课程-直播课

专题 嘉宾 直播/回看视频
最新专题 文本分析、机器学习、效率专题、生存分析等
研究设计 连玉君 我的特斯拉-实证研究设计-幻灯片-
面板模型 连玉君 动态面板模型-幻灯片-
面板模型 连玉君 直击面板数据模型 [免费公开课,2小时]
  • Note: 部分课程的资料,PPT 等可以前往 连享会-直播课 主页查看,下载。

课程主页

课程主页

关于我们

  • Stata连享会 由中山大学连玉君老师团队创办,定期分享实证分析经验。
  • 连享会-主页知乎专栏,700+ 推文,实证分析不再抓狂。直播间 有很多视频课程,可以随时观看。
  • 公众号关键词搜索/回复 功能已经上线。大家可以在公众号左下角点击键盘图标,输入简要关键词,以便快速呈现历史推文,获取工具软件和数据下载。常见关键词:课程, 直播, 视频, 客服, 模型设定, 研究设计, stata, plus, 绘图, 编程, 面板, 论文重现, 可视化, RDD, DID, PSM, 合成控制法

连享会小程序:扫一扫,看推文,看视频……

扫码加入连享会微信群,提问交流更方便

✏ 连享会-常见问题解答:
https://gitee.com/lianxh/Course/wikis

New! lianxh 命令发布了:
随时搜索连享会推文、Stata 资源,安装命令如下:
. ssc install lianxh
使用详情参见帮助文件 (有惊喜):
. help lianxh