Stata:IV估计新方法-ivreg2m

发布时间:2022-07-23 阅读 1122

Stata连享会   主页 || 视频 || 推文 || 知乎 || Bilibili 站

温馨提示: 定期 清理浏览器缓存,可以获得最佳浏览体验。

New! lianxh 命令发布了:
随时搜索推文、Stata 资源。安装:
. ssc install lianxh
详情参见帮助文件 (有惊喜):
. help lianxh
连享会新命令:cnssc, ihelp, rdbalance, gitee, installpkg

课程详情 https://gitee.com/lianxh/Course

课程主页 https://gitee.com/lianxh/Course

⛳ Stata 系列推文:

PDF下载 - 推文合集

作者:董洁妙 (暨南大学)
邮箱graceveio@163.com


目录


1. 背景简介

当某些观测值处理组划分的结果不是随机缺失,或者这些结果普遍存在错误测量时,对局部平均处理效果 (LATE) 的估计结果是有偏的。

具体地,Calvi 等 (2021) 在探讨印度妇女对家庭资源的控制权与家庭健康之间的因果关系时,使用妇女对家庭资源的控制程度作为 Treatment,并利用 1976 年至 2005 年间印度几个州颁布的《印度教继承法》修正案 (这一法案的颁布意味着赋予妇女继承其出生家庭财产的权利,改善了她们的外部选择) 构建工具变量并进行 IV 估计。

但是事实上,妇女对家庭资源的控制程度是不能被直接观测得到的,为了识别这一因果关系,作者提出使用结构模型进行估计。因此,Treatment 能否被准确识别将变得非常重要,错误识别将会导致 LATE 的估计结果出现较大的偏误。为了解决这些问题,Calvi 等 (2021) 提出了一种新的估计方法 (Mismeasurement Robust LATE,MR-LATE) 来修正 LATE 估计结果。

  • 首先,将 Treatment 拆分为 Ta (Ta=1 表示获得处理的状态,Ta=0 表示未获得处理的状态) 和 Tb (Tb=1 表示处理数据缺失或处理数据存在偏误的状态,Tb=0 表示未获得处理的状态) 两组二元处理变量,对应构建双方程的结构模型;
  • 接着,通过非线性似不相关回归 (SUR) 估计 Ta 的系数,捕捉修正后的 LATE,估计 Tb 的系数,用于隔绝遗漏变量或误差所造成的影响。

在新方法下,当处理组的识别指标包含缺失值时,MR-LATE 可以识别并一致地估计 LATE。当处理组的划分出现错误时,MR-LATE 可以减少传统 LATE 的估计偏差。为了推广这一估计方法的使用,Calvi 等 (2021) 编写了 MR-LATE 的估计命令 ivreg2m。本文的目的是介绍 ivreg2m 命令的使用方法。

在正式介绍之前,本文先对 ivreg2m 命令的使用补充以下几个重要事项:

  • 第一,ivreg2m 不仅可以分别估计处理组的识别指标缺失和识别错误条件下的 LATE,还可以估计同时存在上述问题条件下的 LATE。
  • 第二,ivreg2m 是在现有的 xtivreg2ivreg2 的框架上建立的,所以一切关于 xtivreg2ivreg2 的拓展指令几乎都可以在 ivreg2m 中使用。
  • 第三,ivreg2mivreg2 之间存在三个主要区别。首先,在运行该命令之前,用户必须生成一个离散的处理变量,并至少包含以下三个赋值:是否位于处理组,是否位于控制组,是否为缺失、误测或者其他未知的状态。其次,在估计过程中,可以同时设定一个或多个工具变量,但工具变量也必须满足二元或离散 (整数) 值的变量设定。最后,该命令只支持 VCE 的单向聚类。
  • 第四,ivreg2ranktest 软件包必须从 SSC 中安装。同时,不应使用 ivreg2 的早期版本。

2. 命令介绍

命令安装:

ssc install ivreg2m, replace

命令语法:

ivreg2m depvar [varlist] (treatment=varlist_iv) [weight] [if exp] [in range] [, ta(string) tb(string) options]
  • depvar:指定回归的被解释变量;
  • treatment:指定回归中存在错误的原始处理变量的名称;
  • ta(string):定义处理组中处理变量 Ta 的数字值,默认为 ta(1)
  • tb(string):定义控制组中处理变量 Ta 的数字值,默认为 tb(-1)

3. Stata 实操

为了更好地理解 MR-LATE 在实际分析中的应用,Calvi 等 (2021) 使用是否加入美国退休金 401k 计划对个人净固定资产的影响进行举例。401k 计划是指美国 1978 年《国内税收法》新增的第 401 条 k 项条款的规定,具体指代一种由雇员、雇主共同缴费建立起来的完全基金式的养老保险制度。

但是,在美国养老保险制度的选择并不唯一。美国还推出了个人退休金账户计划 (以下简称 IRA计划) 作为备选。那么,在分析个是否加入 401k 计划对个人净固定资产的影响时,难免会面临着遗漏 IRA 计划所造成 LATE 的偏误。这种情况,可以通过 ivreg2m 命令估计 MR-LATE 进行解决:

第一,调用数据进行回归分析。

. ssc install bcuse, replace
. bcuse 401ksubs, clear

第二,生成一个处理变量 (离散型),至少包含三个不同的取值。

. generate treat = (p401k & pira)
. replace treat = -1 if (p401k==0 & pira==0)

第三,使用 ivreg2m 命令进行估计,解释变量包括错误分类的 Treatment 变量,以及一个二元的工具变量。

. ivreg2m nettfa (treat = e401k), ta(1) tb(-1) 

MR-LATE point and interval estimate: 
(1)  treat_a - treat_b = 0
------------------------------------------------------------------------------
      nettfa | Coefficient  Std. err.      z    P>|z|     [95% conf. interval]
-------------+----------------------------------------------------------------
         (1) |     72.666      2.613    27.81   0.000       67.545      77.788
------------------------------------------------------------------------------

第四,在第三步基础上加入控制变量和采用 Robust 标准误的回归结果。

. ivreg2m nettfa (treat = e401k) inc, robust ta(1) tb(-1)

MR-LATE point and interval estimate: 
(1)  treat_a - treat_b = 0
------------------------------------------------------------------------------
      nettfa | Coefficient  Std. err.      z    P>|z|     [95% conf. interval]
-------------+----------------------------------------------------------------
         (1) |     58.839      3.154    18.66   0.000       52.657      65.021
------------------------------------------------------------------------------

第五,在第四步基础上加入多项工具变量以及 cluster-robust 标准误的回归结果。

. ivreg2m nettfa (treat = e401k pira) inc, cluster(age) ta(1) tb(-1)

MR-LATE point and interval estimate: 
(1)  treat_a - treat_b = 0
------------------------------------------------------------------------------
      nettfa | Coefficient  Std. err.      z    P>|z|     [95% conf. interval]
-------------+----------------------------------------------------------------
         (1) |     58.104      3.386    17.16   0.000       51.467      64.741
------------------------------------------------------------------------------

4. 结语

相信大家在阅读本推文后,对如何使用 ivreg2m 命令估计修正后的 LATE (即 MR-LATE) 有了更深入的理解。不过,它也存在一些不足,比如只能够考虑单一偏误冲击所造成的影响。未来,几个可能性的优化方向包括:

  • 允许估计两个以上的冲击偏误下的 MR-LATE;
  • 对于多个工具变量的处理,可以根据每个工具平均 MR-LATEs,或者对错误分类概率施加同质性。

5. 参考资料

  • Baum, C., M. Schaffer, and S. Stillman. 2007. ivreg2: Stata module for extended instrumental variables/2SLS and GMM and AC/HAC, LIML and k-class regression. -Link-
  • Schaffer, M. 2020. XTIVREG2: Stata module to perform extended IV/2SLS, GMM and AC/HAC, LIML and k-class regression for panel data models. -Link-
  • Calvi, R., A. Lewbel, and D. Tommasi. 2021. LATE With Missing or Mismeasured Treatment. Journal of Business & Economic Statistics, forthcoming. -PDF-
  • Imbens, G. W., and J. D. Angrist. 1994. Identification and Estimation of Local Average Treatment Effects. Econometrica 62(2): 467-475. -PDF-
  • Tommasi, D., and L. Zhang. 2022. Identifying Program Benefits When Participation Is Misreported. IZA Discussion Paper 13430. -PDF-

6. 相关推文

Note:产生如下推文列表的 Stata 命令为:
lianxh 工具变量, m
安装最新版 lianxh 命令:
ssc install lianxh, replace

相关课程

免费公开课

最新课程-直播课

专题 嘉宾 直播/回看视频
最新专题 文本分析、机器学习、效率专题、生存分析等
研究设计 连玉君 我的特斯拉-实证研究设计-幻灯片-
面板模型 连玉君 动态面板模型-幻灯片-
面板模型 连玉君 直击面板数据模型 [免费公开课,2小时]
  • Note: 部分课程的资料,PPT 等可以前往 连享会-直播课 主页查看,下载。

课程主页

课程主页

关于我们

  • Stata连享会 由中山大学连玉君老师团队创办,定期分享实证分析经验。
  • 连享会-主页知乎专栏,700+ 推文,实证分析不再抓狂。直播间 有很多视频课程,可以随时观看。
  • 公众号关键词搜索/回复 功能已经上线。大家可以在公众号左下角点击键盘图标,输入简要关键词,以便快速呈现历史推文,获取工具软件和数据下载。常见关键词:课程, 直播, 视频, 客服, 模型设定, 研究设计, stata, plus, 绘图, 编程, 面板, 论文重现, 可视化, RDD, DID, PSM, 合成控制法

连享会小程序:扫一扫,看推文,看视频……

扫码加入连享会微信群,提问交流更方便

✏ 连享会-常见问题解答:
https://gitee.com/lianxh/Course/wikis

New! lianxhsongbl 命令发布了:
随时搜索连享会推文、Stata 资源,安装命令如下:
. ssc install lianxh
使用详情参见帮助文件 (有惊喜):
. help lianxh