Stata:面板变斜率检验-xthst

发布时间:2023-05-12 阅读 604

Stata连享会   主页 || 视频 || 推文 || 知乎 || Bilibili 站

温馨提示: 定期 清理浏览器缓存,可以获得最佳浏览体验。

New! lianxh 命令发布了:
随时搜索推文、Stata 资源。安装:
. ssc install lianxh
详情参见帮助文件 (有惊喜):
. help lianxh
连享会新命令:cnssc, ihelp, rdbalance, gitee, installpkg

课程详情 https://gitee.com/lianxh/Course

课程主页 https://gitee.com/lianxh/Course

⛳ Stata 系列推文:

PDF下载 - 推文合集

作者:唐雪梅 (南京审计大学)
邮箱tangxuemei2018@163.com

编者按:本文主要整理自下文,特此致谢!
Source:Bersvendsen T, Ditzen J. Testing for slope heterogeneity in Stata[J]. The Stata Journal, 2021, 21(1): 51-80. -PDF-


目录


1. 面板估计中潜在的变斜率问题

面板数据在多个研究领域被广泛用于实证研究 (Baltagi,2013)。值得注意的是,面板估计中的固定效应 (FEs) 和随机效应 (REs) 模型的基本假定是主要参数是同质的。如果忽略斜率异质性可能会使结果产生偏差 (Pesaran 和 Smith,1995)。

具体地,如果真实的模型具有斜率同质性,则斜率异质性的估计结果具有一致性,但如果真实的模型是由异质性斜率组成,则强加斜率同质性会产生不一致和有偏差的结果,导致估计效率低下。因而在模型估计前,需要验证同质性假设是否成立。

2. 检验原理及方法

2.1 基本原理

检验的主要方法:用 F 检验观测混合普通最小二乘 (Pooled OLS) 和特定于截面单位的 OLS 回归的残差平方和的差异是否显著 (Baltagi,2013)。具体来说,检验估计了两个模型,并对它们进行了比较。一个是包含加权固定效应的限制模型,该模型强加了斜率的同质性。另一个是非限制模型,即针对横截面单位的 OLS 回归模型。

根据两个模型的差异来进行检验,检验统计量的值较大意味着固定效应和横截面单位特定估计之间存在分歧,拒绝斜率同质性假设,即模型估计存在变斜率问题。

Bersvendsen 和 Ditzen (2020) 在 Pesaran 和 Yamagata (2008) 提出的斜率同质性检验和 Blomquist 和 Westerlund (2013) 提出的异方差自相关 (HAC) 一致性检验的基础上,将截面平均值添加到模型中,使得该检验能够进一步适用于存在截面相关 (cross-sectional dependence, CSD) 的情形。

xthst 可以使用 xtcd2 检查截面相关性 (CSD)。此外,它还可以显示标准 delta 检验和 hac 稳健版本的结果,以提供帮助找到选项的最优集合。

2.2 模型设定和检验统计量

2.2.1 具有斜率异质性的经典面板模型

ui 为单元特定系数,如果对于所有的 i 来说,β2i=β2,则满足斜率同质性假设,否则斜率存在异质性。

2.2.2 标准 delta 检验

基于 Swamy(1970) 检验的标准化版本,Pesaran 和 Yamagata(2008) 提出了对 N 和 T 较大的面板数据的斜率同质性检验。该项检验假定扰动项独立分布,但允许有异方差,统计量如下所示:

其中 Var(Z~i,Ti)=2k2(Tik1)Tik1+1

2.2.3 HAC 稳健性检验

在 Pesaran 和 Yamagata (2008) 的基础上,Blomquist 和 Westerlund (2013) 提出了 HAC 的扩展,给出了 HAC 的稳健性检验统计量。

在具有许多截面单元和时间周期的面板中,可能会出现截面相关 (CSD)。文献区分了弱 CSD 和强 CSD (Chudik 等,2011)。弱 CSD 通常采用用空间方法缓解,强 CSD 由一个常见的时间特定因子 ft 和因子负荷 γi 来模拟。

其中 V¯t=1Nj=1N(x1j,t,x21j,tyi,t)Vt 是 CSA,x1i,t 或 x2i,t 包括因变量的滞后。CCE 估计量可以应用于混合平均组(pooled and a mean group model, PMG) 模型。因此,现有的 delta 检验可以扩展到包含 CSA,并就是否使用混合平均回归模型提供指导。

对于 CSD 稳健增量检验,作者建议将 CSA 从模型中去除强 CSD。假设矩阵 Vt 包含 CSA 及其滞后,并按照如下方式分拆:

然后用分解后的变量根据 (2) 和 (3) 构造 e∆CSA 进行 HAC 稳健检验。Blomquist 和 Westerlund (2013) 在他们的蒙特卡洛模拟中表明,残差中的 CSD 确实影响 HAC 稳健 delta 检验的大小和功率。然而,他们的模拟不包括变量是横截面相关的情况。本文的蒙特卡罗模拟表明,即使变量是横截面相关的,e∆CSA 也表现良好。

3. Stata 范例

3.1 xthst 命令

命令安装:

. ssc install xthst, replace

命令语法:

xthst depvar indepvars [if] [,partial(varlist_p) noconstant 
      ar hac bw(integer) whitening kernel(qs|bartlett|truncated) 
      crosssectional(varlist_cr [,cr_lags(numlist)]) nooutput comparehac ]

使用 xthst 命令前必须先用 xtset 命令设定面板,varlist_cr 为 CSA 添加的变量,用 xthst 计算得出的。下面,我们具体解释一下该语法结构。其中,

  • noconstant:个体异质性常数,ui
  • partial(varlist_p):要求将 varlist_p 中的外生回归量部分去除。如果包含在模型中,则该常数将自动被分割。varlist 中的回归量将包含在 zit 中,并假定具有异质性斜率。
  • ar:允许自回归模型。σ~2 的自由度是调整后的,不能与 hac 结合使用。
  • hac:实现 Blomquist 和 Westerlund (2013) 的 HAC 检验。如果 kernel()bw() 没有指定,kernel() 被设置为 bartlett,并且使用数据驱动的带宽选择,不与 ar 结合使用。
  • kernel(kernel):用于计算 HAC 检验统计量的核函数,可用的核函数有 bartlett、qs (QS) 和 truncated,只有包含 hac 才被允许使用。
  • bw(#):将 HAC 检验统计量的带宽设置为 #,其中 # 是大于零的整数,同样只有包含 hac 时才被允许,默认是数据驱动的带宽选择。
  • whitening:在 HAC 估计中进行预白以减少小样本偏差,只有包含 hac 时才允许使用。
  • crosssectional(varlist_cr [, cr_lag (numlist) ]):定义添加 CSA 后以粗略估计强 CSD 的变量。varlist_cr 中的变量被局部化。子选项 cr_lag (numlist) 设置 CSA 的滞后次数。如果没有定义,但 crosssectional() 包含 varlist,且同时添加 CSA,但不包括滞后项,cr_lags(0) 与之等价。滞后的数量可以是特定的变量,其中顺序与 crosssectional() 中定义的相同。
  • nooutput:省略输出。
  • comparehac:比较标准 delta 检验和 HAC稳 健版本检验。首先运行标准增量测试,然后运行 HAC 稳健版本检验,将显示两个检验的结果。如果检验不一致,则仅会一条消息。此外,使用 xtcd2 对所有变量进行 CSD 检验。如果找到 CSD,就会发布一条消息。

3.2 变斜率检验

本文用 Penn World Tables 8.0 (Feenstra 等,2015) 的增长模型举了几个例子,将数据集限制在 1960 年至 2007 年的 48 年间,涉及 93 个国家。Penn World Tables 包括 2011 年之前的数据,但由于金融危机,剔除了 2008 年之后的数据。

3.2.1 标准 Δ~ 检验

为了检验一个跨国增长回归的系数是同质的还是异质的,本文按照 Mankiw 等 (1992),Islam (1995),Lee 等 (1997) 的思路拟合了一个经济增长模型。因变量是实际国内生产总值 (GDP) 人均增长的对数 (log_rgdpo)。解释变量为人力资本 (log_hc),物质资本 (log_ck),人口增长加上 5% 的盈亏平衡投资 (log_ngd)。 对于第一个示例模型,首先假设一个静态模型,不包含因变量的滞后,检验斜率系数是同质的还是异质的。

. net get st0627.pkg, replace
. use xthst_sample_dataset.dta, clear
. xtset
. xthst d.log_rgdpo log_hc log_ck log_ngd

Testing for slope heterogeneity
(Pesaran, Yamagata. 2008. Journal of Econometrics)
H0: slope coefficients are homogenous
-------------------------------------
         Delta          p-value
          6.328           0.000
 adj.     6.694           0.000
-------------------------------------
Variables partialled out: constant

xthst 自动假定一个异构常量。Delta 检验统计量足够大,可以排除斜率同质性。因此,在运行该模型时,应该使用允许异质斜率的估计量,例如平均组估计量。

进一步添加了 GDP 增长的一阶滞后,因此回归模型是一个实际的增长模型,用 L.d.log_rgdpo 扩展上面的命令行:

. xthst d.log_rgdpo L.d.log_rgdpo log_hc log_ck log_ngd
Testing for slope heterogeneity
(Pesaran, Yamagata. 2008. Journal of Econometrics)
H0: slope coefficients are homogenous
-------------------------------------
         Delta          p-value
          2.957           0.003
 adj.     3.171           0.002
-------------------------------------
Variables partialled out: constant

同样,结果在 5% 的显著性水平上拒绝零假设,但检验统计量的值下降了。

3.2.2 系数子集检验

如果假设除 GDP 增长滞后外的所有变量都是异质的,则可以使用 partial(varlist_p) 选项。在这种情况下,varlist_p 中的所有变量都被局部化,并假设为异构的:

. xthst d.log_rgdpo L.d.log_rgdpo log_hc log_ck log_ngd, ///
>     partial(log_hc log_ck log_ngd)
Testing for slope heterogeneity
(Pesaran, Yamagata. 2008. Journal of Econometrics)
H0: slope coefficients are homogenous
-------------------------------------
         Delta          p-value
          2.324           0.020
 adj.     2.409           0.016
-------------------------------------
Variables partialled out: log_hc log_ck log_ngd constant

检验结果表明,GDP 增长滞后系数具有异质性。与上述模型相比,检验统计量有所下降。

3.2.2 允许异方差和序列相关误差

考虑到在动态宏观数据集中,数据很可能出现序列相关性,进一步添加选项 hac,用 Blomquist 和 Westerlund(2013) 的 HAC 稳健标准误差来解释残差中的自相关性:

. xthst d.log_rgdpo L.d.log_rgdpo log_hc log_ck log_ngd, hac
Testing for slope heterogeneity
(Blomquist, Westerlund. 2013. Economic Letters)
H0: slope coefficients are homogenous
-------------------------------------
         Delta          p-value
         12.203           0.000
 adj.    13.086           0.000
-------------------------------------
HAC Kernel: bartlett 
with average bandwith 3
Variables partialled out: constant

默认情况下,按照 Andrews 和 Monahan (1992) 以及 Newey 和 West (1994) 的方法,使用自动选择带宽的 Bartlett 核函数。除了 Bartlett 核函数,xthst 还支持 QS 核函数和 truncated 核函数。核函数可以用 kernel() 选项设置,带宽可以用 bw() 设置。要使用带宽为 5 的 QS 核函数,可以输入:

. xthst d.log_rgdpo L.d.log_rgdpo log_hc log_ck log_ngd, hac bw(5) kernel(qs)
Testing for slope heterogeneity
(Blomquist, Westerlund. 2013. Economic Letters)
H0: slope coefficients are homogenous
-------------------------------------
         Delta          p-value
         -1.843           0.065
 adj.    -1.977           0.048
-------------------------------------
HAC Kernel: quadratic spectral (QS) 
with average bandwith 5
Variables partialled out: constant

3.2.3 CSD 核算

在大面板中,截面相关问题 (CSD) 是可能的,且大部分无法观测。如果不处理,会导致有偏差和不一致的回归估计。一种常用的近似强 CSD 的方法是添加 CSA 作为进一步的协变量。这个估计量被称为 CCE 估计量 (Pesaran,2006;Chudik 和 Pesaran,2015b)。

可以使用 xtcd2xtcse2 (Ditzen 2018,2019) 来检验弱 CSD 并估计它的强度。本文遵循 Chudik 和 Pesaran (2015b) 的理论,添加 [T1/3] = [381/3] = [3.36] = 3 阶滞后。结果表明,所有变量都有很强的 CSD,包括 CSA。

. xthst d.log_rgdpo L.d.log_rgdpo log_hc log_ck log_ngd, ///
>     crosssectional(d.log_rgdpo log_hc log_ck log_ngd, cr_lags(3))
Testing for slope heterogeneity
(Pesaran, Yamagata. 2008. Journal of Econometrics)
H0: slope coefficients are homogenous
-------------------------------------
         Delta          p-value
          5.286           0.000
 adj.     5.994           0.000
-------------------------------------
Variables partialled out: constant
Cross Sectional Averaged Variables: D.log_rgdpo log_hc log_ck log_ngd

4. 面板变斜率检验的运用

Murshed (2023) 研究了 2000-2020 年期间来自全球 6 个地区的 61 个发展中国家电力接入率的促进和抑制因素。尽管区域国家之间的全球化缓解了截面相关性 (CSD) 问题的担忧,但各国在微观和宏观上各不相同,从而导致有偏差和不一致的估计结果。

考虑到潜在的异质斜率系数 (HSC) 问题,作者使用了 Bersvendsen 和 Ditzen (2020) 提出的面板变斜率检验方法,结果显示,对于整个面板和区域子面板数据集,预测的增量和调整后的增量统计数据都具有统计显著性,表明这篇文章使用的数据集存在变斜率问题。

关于如何解决变斜率系数问题,本文使用了 Herwartz 等 (2018) 提出的面板单位根估计量 (panel unit root estimator) 来解决数据处理中的截面相关性 (CSD) 问题和异方差问题 (Salim et al 2020)。

Maza 和 Gutiérrez-Portilla (2022) 利用西班牙 1995 年至 2019 年期间对前 50 大接受国的流量,探讨了对外直接投资 (OFDI) 和出口之间的联系。通过将异质面板方法与截面相关的处理相结合,解决了空间数据的异质性和截面相关问题。

具体地,文章采用了 Bersvendsen 和 Ditzen(2021) 提出的 Stata 命令验证了文章潜在的面板变斜率问题。对于原始数据,调整后的 delta 检验值为 1.97 (p 值为 0.049),而处理后的数据 delta 检验值和 p 值分别为 1.68 和 0.093。

5. 相关推文

Note:产生如下推文列表的 Stata 命令为:
lianxh 系数, m
安装最新版 lianxh 命令:
ssc install lianxh, replace

相关课程

免费公开课

最新课程-直播课

专题 嘉宾 直播/回看视频
最新专题 文本分析、机器学习、效率专题、生存分析等
研究设计 连玉君 我的特斯拉-实证研究设计-幻灯片-
面板模型 连玉君 动态面板模型-幻灯片-
面板模型 连玉君 直击面板数据模型 [免费公开课,2小时]
  • Note: 部分课程的资料,PPT 等可以前往 连享会-直播课 主页查看,下载。

课程主页

课程主页

关于我们

  • Stata连享会 由中山大学连玉君老师团队创办,定期分享实证分析经验。
  • 连享会-主页知乎专栏,700+ 推文,实证分析不再抓狂。直播间 有很多视频课程,可以随时观看。
  • 公众号关键词搜索/回复 功能已经上线。大家可以在公众号左下角点击键盘图标,输入简要关键词,以便快速呈现历史推文,获取工具软件和数据下载。常见关键词:课程, 直播, 视频, 客服, 模型设定, 研究设计, stata, plus, 绘图, 编程, 面板, 论文重现, 可视化, RDD, DID, PSM, 合成控制法

连享会小程序:扫一扫,看推文,看视频……

扫码加入连享会微信群,提问交流更方便

✏ 连享会-常见问题解答:
https://gitee.com/lianxh/Course/wikis

New! lianxhsongbl 命令发布了:
随时搜索连享会推文、Stata 资源,安装命令如下:
. ssc install lianxh
使用详情参见帮助文件 (有惊喜):
. help lianxh