温馨提示: 定期 清理浏览器缓存,可以获得最佳浏览体验。
New!
lianxh
命令发布了:
随时搜索推文、Stata 资源。安装命令如下:
. ssc install lianxh
详情参见帮助文件 (有惊喜):
. help lianxh
⛳ Stata 系列推文:
整理人:吴芳倩 (中国人民大学)
邮箱:wufangqian704@163.com
目录
异方差自相关一直是计量经济学领域非常重要的问题。在过去的 20 年里,学者们在异方差自相关稳健(HAR)推论方面取得了很大的进展,尤其是发展出了固定平滑渐近理论(Kiefer & Vogelsang,2005; Sun,2014a)。相较于传统递增平滑渐近近似(卡方近似、正态近似),固定平滑渐近近似被证明更为精确(Jansson,2004; Sun, Philips $ Jin,2008)。 但在实证估计中,固定平滑渐近近似却没有被广泛采用。这主要是因为:
为此,Ye & Sun (2018) 提供了两对新的估计命令和估计后检验命令来解决这一问题。 这两对命令分别为:
har
和 hart
命令gmmhar
和 gmmhart
命令本文以 Ye & Sun (2018) 为基础,介绍它们的适用场景、优势和使用方法。相关理论推导和证明参见原文:
Xiaoqing Ye, Yixiao Sun, 2018, Heteroskedasticity- and Autocorrelation-robust F and t Tests in Stata, Stata Journal, 18(4): 951–980. -PDF-, -PDF2-
原文摘要. 在这篇文章中,我们考虑了时间序列、OLS 和 IV 回归,介绍了一对新的命令:har
和 hart
。它们紧跟学界在 HAR 推论上的最新进展——使用更精确的异方差自相关稳健(HAR)的 har
和估计后检验命令 hart
时,既可以选择核 HAR 方差估计量,也可以选择正交序列 HAR 方差估计量。此外,文章还介绍了另一对新命令:gmmhar
和gmmhart
。它们实现了两步 GMM 框架下的
Abstract. In this article, we consider time-series, ordinary least-squares, and instrumental-variable regressions and introduce a new pair of commands, har and hart, that implement more accurate heteroskedasticity-and autocorrelationrobust (HAR)
今天介绍的命令以固定平滑渐近理论为基础,适用于对时间序列数据、线性回归模型进行 OLS 或 IV 估计。
相较于以往的 Stata 命令,今天要介绍的命令至少具备如下优势:
har
和 hart
newey
使用标准正态近似,而 har
使用 newey
和 test
使用卡方近似,而 har
和 hart
使用 har
和 hart
基于最小化损失函数的原则,对不同的检验使用不同的最佳平滑参数。而 newey
和 test
对所有检验使用单一的平滑参数;har
基于固定平滑近似来构造置信区间,而以往命令 newey
基于传统正态近似来构造置信区间。当一阶自相关系数为 0.75 时,前者对应的置信区间依然非常准确,但后者对应的置信区间准确度严重恶化。gmmhar
和 gmmhart
gmmhar
和 gmmhart
得到的 HAR 方差估计量不仅出现在协方差估计量中,而且在第二步的 GMM 准则函数中起到最优加权矩阵的作用;gmmhar
基于固定平滑近似来构造置信区间,而以往估计命令 ivregress gmm
基于传统正态近似来构造置信区间。当工具变量数量增大时,由以往命令得到的置信区间精度严重恶化,而由新的估计命令得到的置信区间仍保持良好的精确性。har
和 hart
命令配对出现,前者用于估计模型,后者用于检验;gmmhar
和 gmmhart
命令的关系亦是如此。
在 Stata 命令窗口中输入如下命令,即可打开安装页面,按提示点击相应按钮即可:
. net describe st0548, from(http://www.stata-journal.com/software/sj18-4)
当然,我们也可以直接执行如下命令直接安装上述文件:
. net install st0548.pkg // 安装程序文件
. net get st0548.pkg // 下载相关附件到当前工作路径下
完成安装后,输入 help har
即可查看 har
命令的帮助文件。其它三个命令的帮助文件也可以采用这种方式获取。
har
和 gmmhar
的语法结构如下:
har depvar [varlist1] (varlist2 = varlist_iv) [if] [in] , ///
kernel(string) [noconstant level(#)]
gmmhar depvar [varlist1] (varlist2 = varlist_iv) [if] [in] ///
[ , noconstant level(#)]
部分输入项的解释如下:
depvar
:被解释变量;varlist2
:内生解释变量;varlist_iv
:varlist2 的工具变量;kernel(string)
;必需,设置核函数 (kernel) 的类型,详情参见 Ye & Sun (2018):
nonconstant
:略去截距项估计;level(#)
:设置置信区间的置信水平 (默认 95%) 。这部分介绍 hart
和 gmmhart
两个估计后的检验命令。这两个命令需分别于 har
和 gmmhar
命令后立刻执行。它们利用 Wald 检验,但使用了更准确的固定平滑临界值。
检验系数联合为 0:
hart coeflist, kernel(string) [accumulate level(#)]
gmmhart coeflist [, accumulate]
检验一个或多个线性约束:
hart exp = exp [= ...], kernel(string) [accumulate level(#)]
gmmhart exp = exp [= ...] [, accumulate]
下面我们用一个公开的时间序列数据来操作此对命令。数据来源:http://www.stata-press.com/data/r15/idle2.dta。
. webuse idle2, clear
. tsset time
. har usr idle wio, kernel(bartlett)
Regression with HAR standard errors Number of obs = 30
Kernel: Bartlett F( 2, 17) = 47.66
Data-driven optimal lag: 2 Prob > F = 0.0000
-----------------------------------------------------------------------
usr | Coef. HAR Std. Err. t df P>|t| [95% Conf. Interval]
-------+---------------------------------------------------------------
idle | -.6670978 .0715786 -9.32 22 0.000 -.8155428 -.5186529
wio | -.7792461 .11897 -6.55 13 0.000 -1.036265 -.522227
_cons | 66.21805 6.984346 9.48 19 0.000 51.59965 80.83646
-----------------------------------------------------------------------
. hart idle=wio=0, kernel(bartlett)
F( 2, 17) = 47.6645
Prob > F = 0.0000
. quietly hart idle=0, kernel(bartlett)
. hart idle=wio, kernel(bartlett) acc
F( 2, 17) = 47.6645
Prob > F = 0.0000
. hart 1.168*idle=wio, kernel(bartlett)
F( 1, 14) = 0.0000
Prob > F = 0.9989
估计结果显示:变量 idle 和 wio 都显著影响 usr。后估计检验结果显示: (1) 前两个命令检验 idle 和 wio 前的系数是否都为零。
下面我们用一个季度时间序列模型来说明这一对命令的使用。该模型将 1959 年第一季度至 2000 年第四季度美国通胀率的变化与失业率联系起来。我们使用季度 GDP 增长的滞后二期,国债利率、贸易加权汇率和国债中期利率的滞后一期作为工具变量,采用两步有效 GMM 方法进行模型估计。
. use http://fmwww.bc.edu/ec-p/data/stockwatson/macrodat, clear
. generate inf =100 * log( CPI / L4.CPI )
(4 missing values generated)
. generate ggdp=100 * log( GDP / L4.GDP )
(10 missing values generated)
. gmmhar D.inf (UR=L2.ggdp L.TBILL L.ER L.TBON)
Two-step Efficient GMM Estimation Number of obs = 158
Data-driven optimal K: 46 F( 1, 43) = 2.05
Prob > F = 0.1597
-----------------------------------------------------------------------
D.inf | Coef. HAR Std. Err. t df P>|t| [95% Conf. Interval]
-------+---------------------------------------------------------------
UR | -.0971458 .067901 -1.43 43 0.160 -.2340812 .0397895
_cons | .5631061 .3936908 1.43 43 0.160 -.2308471 1.357059
-----------------------------------------------------------------------
HAR J statistic = .92614349
Reference Dist for the J test: F( 3, 44)
P-value of the J test = 0.4361
Instrumented: UR
Instruments: L2.ggdp L.TBILL L.ER L.TBON
. gmmhart UR=0
(10 missing values generated)
F( 1, 43) = 2.05
Prob > F = 0.1597
. gmmhart UR // a shorter command of “gmmhart UR=0”
(10 missing values generated)
F( 1, 43) = 2.05
Prob > F = 0.1597
. gmmhart UR=-0.09715
(10 missing values generated)
F( 1, 43) = 0.00
Prob > F = 1.0000
估计结果显示:失业率 (UR) 系数显著为负,这与基本宏观经济理论一致:将失业率降至自然失业率以下将导致价格通胀加速。固定平滑
本文主要介绍了两对命令:
har
和 gmmhar
;hart
和 gmmhart
。由于在固定平滑渐近性下,修正的 Wald 统计量是渐近
总之,在对于含有时间序列的 OLS 和 IV 估计中,相较于以往的 Stata 命令,本文介绍的命令提供了更准确的置信区间,增强了假设检验的可信度。
免费公开课
最新课程-直播课
专题 | 嘉宾 | 直播/回看视频 |
---|---|---|
⭐ 最新专题 | 文本分析、机器学习、效率专题、生存分析等 | |
研究设计 | 连玉君 | 我的特斯拉-实证研究设计,-幻灯片- |
面板模型 | 连玉君 | 动态面板模型,-幻灯片- |
面板模型 | 连玉君 | 直击面板数据模型 [免费公开课,2小时] |
⛳ 课程主页
⛳ 课程主页
关于我们
课程, 直播, 视频, 客服, 模型设定, 研究设计, stata, plus, 绘图, 编程, 面板, 论文重现, 可视化, RDD, DID, PSM, 合成控制法
等
连享会小程序:扫一扫,看推文,看视频……
扫码加入连享会微信群,提问交流更方便
✏ 连享会-常见问题解答:
✨ https://gitee.com/lianxh/Course/wikis
New!
lianxh
命令发布了:
随时搜索连享会推文、Stata 资源,安装命令如下:
. ssc install lianxh
使用详情参见帮助文件 (有惊喜):
. help lianxh