Stata连享会 主页 || 视频 || 推文 || 知乎 || Bilibili 站
温馨提示: 定期 清理浏览器缓存,可以获得最佳浏览体验。
New!
lianxh
命令发布了:
随时搜索推文、Stata 资源。安装:
. ssc install lianxh
详情参见帮助文件 (有惊喜):
. help lianxh
连享会新命令:cnssc
,ihelp
,rdbalance
,gitee
,installpkg
⛳ Stata 系列推文:
作者:吕媛 (北京大学)
邮箱:ly1562495qy@163.com
编者按:本文主要摘译自下文,特此致谢!
Source:Asali M. vgets: A command to estimate general-to-specific VARs, Granger causality, steady-state effects, and cumulative impulse–responses[J]. The Stata Journal, 2020, 20(2): 426-434. -PDF-
目录
Granger 因果关系检验是于 1969 年首次提出的一种统计假设检验,用于确定一个时间序列是否可用于预测另一个时间序列。通常,一般回归分析反映仅是变量之间的相关性,但 Clive Granger 认为,经济学中的因果关系可以通过测量使用另一个时间序列的先验值来预测一个时间序列的未来值。
由于 “真正的因果关系” 的问题具有深刻的哲学意义,并且假设一件事在另一件事之前可以用作因果关系的证据与另一件事后存在谬误。计量经济学家断言格兰杰测试 (Granger test) 仅发现 “预测因果关系”,单独使用 “因果关系”一词是不当的。因为格兰杰因果关系被更好地描述为 “优先级”,正如格兰杰本人在 1977 年声称的 “时间相关性”,即格兰杰因果关系不是检验
近年来,时变 Granger 因果性的研究得到了发展,Dolado 和 Lütkepohl (1996)、Shi 和 Hurn (2018)、Shi 和 Phillips (2020) 均对时变 Granger 检验作出了相关研究。传统的 Granger 因果检验方法基于时间不变模型,不能捕捉到时间序列动态行为。
在处理不同变量之间的 Granger 因果检验分析时,有一个容易忽略的问题,即 Granger 因果与时间序列的样本具有直接关系,不同时间序列的样本,得到的结果可能不一样。实际上,研究给定其他分量序列的条件下,序列间的直接动态 Granger 因果关系是将两个序列的时变 Granger 因果关系检验的 Rolling Hong 检验方法推广到多维情形,利用时变偏 Grange r因果检验对变量之间的因果关系进行再检验的方法较为合理。
定义1:设
其中
定义
对于考虑
考虑
另外一个需要考虑的问题是滞后值
根据前文所述的不失一般性原则,假设要检验分量序列
分别得到
对于选定的子样大小参数
计算
同理,可以计算出
其中
如果序列
基于以上定义的 Rolling 偏相关系数
定义
同理,定义
此外,在合适的正则化条件下,如果序列
综合时变偏 Granger 因果关系定义与时变偏 Granger 因果关系检验分析,时变偏 Granger 因果关系的检验步骤如下:
本小节我们来看一个实际应用案例,选取 2010 年 1 月 4 日至 2021 年 7 月 5 日的上证指数 (000001.SH)、深证指数 (399001.SZ)、恒生指数 (HSI.HI) 的日收盘价数据作为原始数据,共 2794 组数据,数据来源于万德(wind)数据库。本文采用计算对数收益率来衡量各个股票市场的收益情况,计算公式如下:
上述公式中,
从上图可以看出,上证指数 (000001.SH) 和深证指数 (399001.SZ) 的日收益率波动范围在 [0.03,-0.04] 之间,而香港恒生指数 (HSI.HI) 的日收益率波动范围在 [0.04,-0.03] 之间,上证股市、深圳股市和香港股市的整体日收益率波动不是太大,但上证指数 (000001.SH) 和深证指数 (399001.SZ) 相较于恒生指数 (HSI.HI),明显波动更大一些。
在 Stata 数据集中,date 为日期,shratio 为上证指数收益率,szratio 为深证成指收益率, hisratio 为恒生指数收益率。
上述式子中,
. cnssc install lxhuse, replace
. lxhuse indextvgc.dta, clear
. sum sh_ratio sz_ratio his_ratio
Variable | Obs Mean Std. dev. Min Max
-------------+---------------------------------------------------------
sh_ratio | 2,794 .0000133 .0058304 -.0385357 .0243359
sz_ratio | 2,794 .000013 .0070651 -.0383245 .0271617
his_ratio | 2,794 .0000395 .0050928 -.0261371 .0303439
通过上证指数 (000001.SH)、深证指数 (399001.SZ)、恒生指数 (HSI.HI) 的日收益率数据图及上述的描述性统计分析结果可知,三类指数数据较为平稳。
(1) 设置时间序列。将数据导入 Stata 软件中,文件 .dta 中 date 变量为 string 类型。需要将 string 类型的 date 变量,通过 Encode string variable to labled numerical 操作转变为 labled numerical 类型,再将 date 变量定义为时间变量,输入命令为:
. tsset datetime
(2) VAR 模型确定滞后阶数。为了估计 VAR,首先需要根据信息准则确定 VAR 模型的滞后阶数,本文用以下命令来计算不同滞后期的信息准则,其中 soc
表示 “Selection-Older Criteria”,选择项 maxlag(8)
表示最多滞后 8 阶。
. varsoc sh_ratio sz_ratio his_ratio, maxlag(8)
Lag-order selection criteria
Sample: 9 thru 2794 Number of obs = 2,786
+---------------------------------------------------------------------------+
| Lag | LL LR df p FPE AIC HQIC SBIC |
|-----+---------------------------------------------------------------------|
| 0 | 34263.7 4.2e-15 -24.5949 -24.5926* -24.5885* |
| 1 | 34273.2 18.977 9 0.025 4.2e-15 -24.5953 -24.586 -24.5697 |
| 2 | 34281.1 15.892 9 0.069 4.2e-15 -24.5945 -24.5784 -24.5498 |
| 3 | 34292.4 22.556 9 0.007 4.2e-15 -24.5961 -24.5731 -24.5323 |
| 4 | 34300.6 16.356 9 0.060 4.2e-15 -24.5955 -24.5656 -24.5125 |
| 5 | 34313 24.792 9 0.003 4.2e-15 -24.598 -24.5611 -24.4958 |
| 6 | 34326.6 27.258* 9 0.001 4.2e-15* -24.6013* -24.5575 -24.4799 |
| 7 | 34334.8 16.336 9 0.060 4.2e-15 -24.6007 -24.55 -24.4602 |
| 8 | 34341.2 12.78 9 0.173 4.2e-15 -24.5988 -24.5412 -24.4391 |
+---------------------------------------------------------------------------+
* optimal lag
Endogenous: sh_ratio sz_ratio his_ratio
Exogenous: _cons
上述命令的输出结果中,“LL” 表示对数似然函数;“LR” 表示似然比检验,即对最后一阶系数的联合显著性进行似然比检验,随后的 df 和 P 分别表示此似然比统计量的自由度与 P 值;“FPE” 表示 Akaike's Final Prediction Error,度量向前一期预测的均方误差 (MSE of one-step ahead forest)。由下表的星号可知,根据 LR 准则、FPE 准则和 AIC 准则,选择滞后阶数 lag = 6。
(3) 模型估计。下面估计 6 阶向量自回归模型,dfk small 为使用选项进行小样本自由度调整。
. var sh_ratio sz_ratio his_ratio, lags(1/6) dfk small
. *部分输出结果
Vector autoregression
Sample: 7 thru 2794 Number of obs = 2,788
Log likelihood = 34351.26 AIC = -24.60133
FPE = 4.15e-15 HQIC = -24.55754
Det(Sigma_ml) = 3.99e-15 SBIC = -24.48003
Equation Parms RMSE R-sq F P > F
----------------------------------------------------------------
sh_ratio 19 .005806 0.0139 2.163903 0.0030
sz_ratio 19 .007049 0.0112 1.739651 0.0271
his_ratio 19 .00509 0.0076 1.183077 0.2658
----------------------------------------------------------------
------------------------------------------------------------------------------
| Coefficient Std. err. t P>|t| [95% conf. interval]
-------------+----------------------------------------------------------------
sh_ratio |
sh_ratio |
L1. | 0.011 0.053 0.21 0.832 -0.092 0.115
L2. | -0.110 0.053 -2.10 0.036 -0.214 -0.007
L3. | 0.081 0.053 1.52 0.127 -0.023 0.184
L4. | 0.120 0.053 2.27 0.023 0.016 0.224
L5. | 0.078 0.053 1.48 0.140 -0.026 0.182
L6. | -0.032 0.053 -0.60 0.550 -0.135 0.072
|
sz_ratio |
L1. | 0.013 0.042 0.30 0.761 -0.070 0.095
L2. | 0.048 0.042 1.15 0.252 -0.034 0.131
L3. | -0.048 0.042 -1.13 0.258 -0.130 0.035
L4. | -0.111 0.042 -2.64 0.008 -0.194 -0.029
L5. | -0.052 0.042 -1.23 0.221 -0.134 0.031
L6. | -0.035 0.042 -0.83 0.409 -0.117 0.048
|
his_ratio |
L1. | 0.017 0.026 0.66 0.512 -0.034 0.069
L2. | 0.028 0.026 1.06 0.291 -0.024 0.079
L3. | -0.010 0.026 -0.38 0.706 -0.061 0.042
L4. | -0.015 0.026 -0.59 0.558 -0.067 0.036
L5. | -0.046 0.026 -1.74 0.081 -0.097 0.006
L6. | 0.008 0.026 0.31 0.755 -0.043 0.060
|
_cons | 0.000 0.000 0.12 0.902 -0.000 0.000
-------------+----------------------------------------------------------------
(4) 检验各阶系数的联合显著性。结果显示,虽然单一方差的某些系数不显著,但是作为三个方程的整体,各阶系数均高度显著。
. varwle
Equation: sh_ratio
+---------------------------------------+
| lag | F df df_r Prob > F |
|-----+---------------------------------|
| 1 | 1.24895 3 2769 0.2904 |
| 2 | 2.47807 3 2769 0.0595 |
| 3 | .919191 3 2769 0.4307 |
| 4 | 2.57827 3 2769 0.0520 |
| 5 | 1.49589 3 2769 0.2136 |
| 6 | 4.40154 3 2769 0.0043 |
+---------------------------------------+
Equation: sz_ratio
+---------------------------------------+
| lag | F df df_r Prob > F |
|-----+---------------------------------|
| 1 | .782853 3 2769 0.5034 |
| 2 | 1.20098 3 2769 0.3079 |
| 3 | .32652 3 2769 0.8062 |
| 4 | 4.13559 3 2769 0.0062 |
| 5 | 1.86684 3 2769 0.1330 |
| 6 | 2.10341 3 2769 0.0977 |
+---------------------------------------+
Equation: his_ratio
+---------------------------------------+
| lag | F df df_r Prob > F |
|-----+---------------------------------|
| 1 | .700641 3 2769 0.5516 |
| 2 | 1.72143 3 2769 0.1604 |
| 3 | 3.66909 3 2769 0.0118 |
| 4 | .367195 3 2769 0.7767 |
| 5 | .264106 3 2769 0.8513 |
| 6 | .136004 3 2769 0.9386 |
+---------------------------------------+
Equation: All
+---------------------------------------+
| lag | F df df_r Prob > F |
|-----+---------------------------------|
| 1 | 1.92316 9 2769 0.0446 |
| 2 | 1.99728 9 2769 0.0359 |
| 3 | 2.67929 9 2769 0.0042 |
| 4 | 1.91337 9 2769 0.0458 |
| 5 | 2.9537 9 2769 0.0017 |
| 6 | 3.05162 9 2769 0.0012 |
+---------------------------------------+
(5) 检验残差是否为白噪声 (residual whitenoise)。检验残差是否为白噪声 (residual whitenoise),即残差是否存在自相关。结果显示,可以接受残差 “无自相关” 的原假设,即认为扰动项为白噪声。
. varlmar
Lagrange-multiplier test
+--------------------------------------+
| lag | chi2 df Prob > chi2 |
|------+-------------------------------|
| 1 | 16.4265 9 0.05849 |
| 2 | 22.9053 9 0.00641 |
+--------------------------------------+
H0: no autocorrelation at lag order
(6) 平稳过程检验。为了进一步检验该VAR模型是否具有稳定性,即是否为平稳过程,本文还做了稳定性分析。表与图的结果显示,所有特征值均在单位圆之内,故此 VAR 系统是稳定的
. varstable, graph
Eigenvalue stability condition
+----------------------------------------+
| Eigenvalue | Modulus |
|--------------------------+-------------|
| .0471517 + .6534008i | .6551 |
| .0471517 - .6534008i | .6551 |
| -.5572945 + .328331i | .646822 |
| -.5572945 - .328331i | .646822 |
| -.4816658 + .4277156i | .64416 |
| -.4816658 - .4277156i | .64416 |
| .5665538 + .2329757i | .612585 |
| .5665538 - .2329757i | .612585 |
| .00378917 + .5691465i | .569159 |
| .00378917 - .5691465i | .569159 |
| .3481306 + .4143969i | .541221 |
| .3481306 - .4143969i | .541221 |
| .3715601 + .3064064i | .481603 |
| .3715601 - .3064064i | .481603 |
| .4477283 | .447728 |
| -.4447225 | .444723 |
| -.2748956 + .3151223i | .418174 |
| -.2748956 - .3151223i | .418174 |
+----------------------------------------+
All the eigenvalues lie inside the unit circle.
VAR satisfies stability condition.
(7) 正态分布检验。为进一步检验VAR模型的残差是否服从正态分布,本文作出如下命令检验分析。以下结果说明,所有检验结果在 1% 的显著水平上拒绝这三个变量的扰动项服从正态分布的原假设。尽管扰动项不服从正态分布对 VAR 模型的影响不大,但残差项的非正态性暗示模型可能偏离了真实的数据生成过程 (GDP)。
. varnorm
Jarque-Bera test
+--------------------------------------------------------+
| Equation | chi2 df Prob > chi2 |
|--------------------+-----------------------------------|
| sh_ratio | 4264.744 2 0.00000 |
| sz_ratio | 1926.447 2 0.00000 |
| his_ratio | 604.225 2 0.00000 |
| ALL | 6795.415 6 0.00000 |
+--------------------------------------------------------+
Skewness test
+--------------------------------------------------------+
| Equation | Skewness chi2 df Prob > chi2 |
|--------------------+-----------------------------------|
| sh_ratio | -.898 374.712 1 0.00000 |
| sz_ratio | -.27387 34.851 1 0.00000 |
| his_ratio | -.12117 6.822 1 0.00901 |
| ALL | 416.384 3 0.00000 |
+--------------------------------------------------------+
Kurtosis test
+--------------------------------------------------------+
| Equation | Kurtosis chi2 df Prob > chi2 |
|--------------------+-----------------------------------|
| sh_ratio | 8.7868 3890.032 1 0.00000 |
| sz_ratio | 7.0353 1891.596 1 0.00000 |
| his_ratio | 5.2677 597.403 1 0.00000 |
| ALL | 6379.031 3 0.00000 |
+--------------------------------------------------------+
dfk estimator used in computations
. vargranger
Granger causality Wald tests
+------------------------------------------------------------------------+
| Equation Excluded | F df df_r Prob > F |
|--------------------------------------+---------------------------------|
| sh_ratio sz_ratio | 1.9867 6 2769 0.0642 |
| sh_ratio his_ratio | .89529 6 2769 0.4973 |
| sh_ratio ALL | 1.4721 12 2769 0.1270 |
|--------------------------------------+---------------------------------|
| sz_ratio sh_ratio | 1.7219 6 2769 0.1118 |
| sz_ratio his_ratio | 1.2818 6 2769 0.2621 |
| sz_ratio ALL | 1.4243 12 2769 0.1470 |
|--------------------------------------+---------------------------------|
| his_ratio sh_ratio | 2.037 6 2769 0.0576 |
| his_ratio sz_ratio | 1.2082 6 2769 0.2988 |
| his_ratio ALL | 1.6115 12 2769 0.0814 |
+------------------------------------------------------------------------+
在以 sh_ratio 为被解释变量的方程中,检验变量 sz_ratio 的卡方统计量为 1.9867,相应的 p 值为 0.0642,故可以认为 sz_ratio 是 sh_ratio 的格兰杰原因。同理,检验变量 his_ratio 的卡方统计量为 0.89529,相应的 p 值为 0.4973,故可以认为 his_ratio 不是 sh_ratio 的格兰杰原因。在以 his_ratio 为被解释变量的方程中,检验变量 sz_ratio 的卡方统计量为 1.2082,相应的 p 值为 0.2988,故可以认为 sz_ratio 不是 his_ratio 的格兰杰原因。但 sh_ratio 的卡方统计量为 2.037,相应的 p 值为 0.0576,且 sh_ratio 和 sz_ratio 的联合显著性卡方统计值为 1.6115,相应的 p 值为 0.0814,因此强烈拒绝 sh_ratio 和 sz_ratio 都不是 his_ratio 的格兰杰原因的原假设。
上述结果综合来看,his_ratio 不是 sh_ratio 的格兰杰原因,但 sh_ratio 是 his_ratio 的格兰杰原因。sz_ratio 是 sh_ratio 的格兰杰原因,但 sh_ratio 不是 sz_ratio 的格兰杰原因。显然,传统的 Granger 因果关系并未给出唯一的变量作用次序。
Note:产生如下推文列表的 Stata 命令为:
lianxh 格兰杰 var grange, m
安装最新版lianxh
命令:
ssc install lianxh, replace
免费公开课
最新课程-直播课
专题 | 嘉宾 | 直播/回看视频 |
---|---|---|
⭐ 最新专题 | 文本分析、机器学习、效率专题、生存分析等 | |
研究设计 | 连玉君 | 我的特斯拉-实证研究设计,-幻灯片- |
面板模型 | 连玉君 | 动态面板模型,-幻灯片- |
面板模型 | 连玉君 | 直击面板数据模型 [免费公开课,2小时] |
⛳ 课程主页
⛳ 课程主页
关于我们
课程, 直播, 视频, 客服, 模型设定, 研究设计, stata, plus, 绘图, 编程, 面板, 论文重现, 可视化, RDD, DID, PSM, 合成控制法
等
连享会小程序:扫一扫,看推文,看视频……
扫码加入连享会微信群,提问交流更方便
✏ 连享会-常见问题解答:
✨ https://gitee.com/lianxh/Course/wikis
New!
lianxh
命令发布了:
随时搜索连享会推文、Stata 资源,安装命令如下:
. ssc install lianxh
使用详情参见帮助文件 (有惊喜):
. help lianxh