Stata: VAR - 模拟、估计和推断
2020-02-04
许梦洁
9053

连享会   主页 || 推文 || 知乎 || B 站 || 在线课堂

New! 搜推文,找资料,用 lianxh 命令:
安装: ssc install lianxh, replace
使用: lianxh 合成控制
       lianxh DID + 多期, w


⛳ Stata 系列推文:

PDF下载 - 推文合集

编译: 许梦洁 (Frankfurt School of Finance and Management)
E-mail: m.xu@fs.de

Source: Ashish RajbhandariVector autoregression—simulation, estimation, and inference in Stata

Stata 连享会时间序列专题:


目录

[[TOC]]


VAR 是分析多维时间序列动态变化的利器,该模型设定为由一组时间序列组成的序列是其自己滞后项的函数。

1. 模拟

首先使用如下设定模拟双变量 VAR(2) :

[y1,ty2,t]=μ+A1+[y1,t1y2,t1]+A2+[y1,t2y2,t2]+ϵt\left[\begin{array}{l} y_{1, t} \\ y_{2, t} \end{array}\right]=\mu+A_{1}+\left[\begin{array}{l} y_{1, t-1} \\ y_{2, t-1} \end{array}\right]+A_{2}+\left[\begin{array}{l} y_{1, t-2} \\ y_{2, t-2} \end{array}\right]+\epsilon_{t}

其中,y1,ty_{ 1,t } 是在时间 tt 的观测变量,μ\mu 是一个 2×12\times 1 的截距项向量, A1A_1A2A_2 均为 2×22\times 2 的参数矩阵,ϵt\epsilon _{ t } 是不与时间相关的扰动项。我假设 ϵt\epsilon _{ t } 服从分布 N(0,Σ)N(0,\Sigma) ,其中Σ\Sigma 是一个 2×22\times 2 的协方差矩阵。

设定样本量为 1000 ,并在 Stata 中生成需要的变量:

clear all

. set seed 2016

. local T = 1100

. set obs `T'
number of observations (_N) was 0, now 1,100

. gen time = _n

. tsset time
        time variable:  time, 1 to 1100
                delta:  1 unit

. generate y1 = .
(1,100 missing values generated)

. generate y2 = .
(1,100 missing values generated)

. generate eps1 = .
(1,100 missing values generated)

. generate eps2 = .
(1,100 missing values generated)

在第 1-6 行,我设定了随机种子,将样本量设为 1000,并且生成了一个时间变量 time 。接下来,我生成了变量 y1y2eps1eps2 来存放观测序列和扰动项。

2. 设定系数值

我为本文的 VAR(2) 模型选择了如下的参数值:

A1=[0.60.30.40.2],A2=[0.20.30.10.1]A_{ 1 }= \begin{bmatrix} 0.6 &-0.3 \\ 0.4& 0.2 \end{bmatrix},\quad A_{ 2 }= \begin{bmatrix} 0.2 &0.3 \\ -0.1& 0.1 \end{bmatrix}

. mata:
------------------------------------ mata (type end to exit) -----
: mu = (0.1\0.4)

: A1 = (0.6,-0.3\0.4,0.2)

: A2 = (0.2,0.3\-0.1,0.1)

: Sigma = (1,0.5\0.5,1)

: end
------------------------------------------------------------------

在 Mata 中,我分别创建了矩阵 μ\muA1A_1A2A_2Σ\Sigma 来放置参数值。在模拟得到样本之前,我检查了由这些参数值是否会得到一个平稳的 VAR(2) 模型。令:

F=[A1A2I20]F= \begin{bmatrix} A_{ 1 }&A_{ 2 } \\ I_{ 2 } & 0 \end{bmatrix}

其中 I2I_22×22\times 2 的识别矩阵,00 是一个每个元素均为 0 的 2×22\times 2 矩阵。如果矩阵 F 的所有特征根均小于 1 ,则此 VAR(2) 过程即为一个平稳过程。下面放上计算特征根的代码:

. mata:
----------------------------------- mata (type end to exit) -----
: K = p = 2               // K = number of variables; p = number of lags

: F = J(K*p,K*p,0)

: F[1..2,1..2] = A1

: F[1..2,3..4] = A2

: F[3..4,1..2] = I(K)

: X = L = .

: eigensystem(F,X,L)

: L'
                              1
    +----------------------------+
  1 |                .858715598  |
  2 |  -.217760515 + .32727213i  |
  3 |  -.217760515 - .32727213i  |
  4 |                .376805431  |
    +----------------------------+

: end
----------------------------------------------------------------

我根据之前的设定创建了矩阵 F 并使用函数 eigensystem( ) 计算其特征根。 矩阵 X 中存储了特征向量,L 中保存特征根。所有 L 中的特征根均小于 1 ,因此该 VAR(2) 过程是平稳的。在检验过是否平稳之后,接下来生成 VAR(2) 模型的扰动项。

3. 由多维正态分布中生成扰动项

我从分布 N(0,Σ)N(0,\Sigma) 中生成两个随机正态变量,并将它们分别赋值给变量 eps1eps2

. mata:
--------------------------------------- mata (type end to exit) -----
: T = strtoreal(st_local("T"))

: u = rnormal(T,2,0,1)*cholesky(Sigma)

: epsmat = .

: st_view(epsmat,.,"eps1 eps2")

: epsmat[1..T,.] = u

: end
--------------------------------------------------------------------

我将样本规模(在 Stata 中定义为一个局部宏变量 T )赋值给一个 Mata 数值变量,这步将可以简化之后的工作。在 Mata 中,我使用了两个函数:st_local( )strtoreal( ) 来存储样本大小。第一个函数可以从 Stata 宏中获取文本值,第二个函数则可以将文本值转变为实数值。

第二行生成了一个 1100×21100\times 2 的正态扰动项矩阵,其每个元素都服从分布 N(0,Σ)N(0,\Sigma) 。我使用函数 st_view( ) 将生成的正态扰动项存放到变量 eps1eps2 中。这个函数会以目前 Stata 中的数据集创建一个矩阵。首先,我创建了一个空矩阵 epsmat ,然后将变量 eps1eps2 填入到该矩阵中。最后,我使用矩阵 epsmat 的前 T 行位置来存储 u 中的数据。

3. 生成观测序列

沿用 Lütkepohl(2005) 的做法,我先生成了前两个观测值并使得它们的相关性与余下的样本一致。我假设前两项服从一个二维联合正态分布,其无条件期望为 θ=(IKA1A2)1μ\theta = (I_K-A_1-A_2)^{-1}\mu,其协方差矩阵满足:

vec(Σy)=(I16FF)1vec(Σϵ)vec(\Sigma_{ y })=(I_{ 16 }-F\otimes F)^{ -1 }vec(\Sigma_{ \epsilon })

其中 vec()vec( ) 是一个计算矩阵列数的算子,I16I_{16} 是一个 16×1616\times 16 的识别矩阵,

Σϵ=[Σ000]\Sigma_{ \epsilon }=\begin{bmatrix} \Sigma & 0 \\ 0 & 0 \end{bmatrix}

是一个 4×44\times 4 的矩阵。观测的前两项于是被生成为:

(y0y1)=Qμ+Θ\begin{pmatrix} y_{ 0 } \\ y_{ 1 } \end{pmatrix}= Q\mu+\Theta

其中 Q 是一个 4×44\times 4 的矩阵,满足 QQ=ΣyQQ'=\Sigma _{ y }μ\mu4×14\times 1 的矩阵,其每个元素为服从标准正态分布的扰动项,Θ=(θθ)\Theta =\begin{pmatrix} \theta \\ \theta \end{pmatrix} 则为 4×14\times 1 的期望矩阵。

下面的代码展示了如何生成前两个观测并给变量 y1y2 赋值的过程:

. mata:
----------------------------------- mata (type end to exit) -----
: Sigma_e = J(K*p,K*p,0)

: Sigma_e[1..K,1..K] = Sigma

: Sigma_y = luinv(I((K*p)^2)-F#F)*vec(Sigma_e)

: Sigma_y = rowshape(Sigma_y,K*p)'

: theta = luinv(I(K)-A1-A2)*mu

: Q = cholesky(Sigma_y)*rnormal(K*p,1,0,1)

: data = .

: st_view(data,.,"y1 y2")

: data[1..p,.] = ((Q[3..4],Q[1..2]):+mu)'

: end
-----------------------------------------------------------------

生成前两个观测后,我们可以使用如下的代码生成余下的序列:

. forvalues i=3/`T' {
.         qui {
. replace y1 = 0.1 + 0.6*l.y1 - 0.3*l.y2 + 0.2*l2.y1 + 0.3*l2.y2 + eps1 in `i'
. replace y2 = 0.4 + 0.4*l.y1 + 0.2*l.y2 - 0.1*l2.y1 + 0.1*l2.y2 + eps2 in `i'
.         }
. }
. drop in 1/100
(100 observations deleted)

我在 replace 命令后加入了 quietly 选项来筛选掉不必要显示的输出结果。最后,我删掉了前 100 个观测来避免模拟效果受到初值的影响。

4. 估计

我使用 var 命令来拟合 VAR(2) 模型;

. var y1 y2

Vector autoregression

Sample:  103 - 1100                        Number of obs     =        998
Log likelihood =  -2693.949                AIC               =   5.418735
FPE            =   .7733536                HQIC              =    5.43742
Det(Sigma_ml)  =   .7580097                SBIC              =   5.467891

Equation        Parms      RMSE     R-sq      chi2     P>chi2
-------------------------------------------------------------
y1                5     1.14546   0.5261   1108.039   0.0000
y2                5     .865602   0.4794   919.1433   0.0000
-------------------------------------------------------------

------------------------------------------------------------------------
         |    Coef.   Std. Err.      z    P>|z|     [95% Conf. Interval]
---------+--------------------------------------------------------------
y1       
      y1 
     L1. | .5510793   .0324494    16.98   0.000     .4874797     .614679
     L2. | .2749983   .0367192     7.49   0.000       .20303    .3469667
         
      y2 
     L1. |-.3080881    .046611    -6.61   0.000    -.3994439   -.2167323
     L2. | .2551285   .0425803     5.99   0.000     .1716727    .3385844
         
   _cons | .1285357   .0496933     2.59   0.010     .0311387    .2259327
---------+--------------------------------------------------------------
y2       
      y1 
     L1. | .3890191   .0245214    15.86   0.000      .340958    .4370801
     L2. |-.0190324    .027748    -0.69   0.493    -.0734175    .0353527
         
      y2 
     L1. | .1944531    .035223     5.52   0.000     .1254172     .263489
     L2. | .0459445   .0321771     1.43   0.153    -.0171215    .1090106
         
   _cons | .4603854   .0375523    12.26   0.000     .3867843    .5339865
------------------------------------------------------------------------

var 命令在估计模型系数时默认为两阶滞后,参数估计是显著的并且与用来生成两个序列的参数真实值接近。

5. 推断:脉冲响应函数

脉冲响应函数 (IRF) 可以用来分析 VAR 模型中的内生变量如何对扰动项的冲击进行反应。比如,在由通胀和利率组成的双变量 VAR 模型中,脉冲响应函数可以追踪来自通胀方程的外生冲击如何对利率造成影响。

考虑最开始提到的双变量模型,假如我想估计一单位 ϵt\epsilon_t 的变动对系统中的内生变量会造成怎样的冲击。我可以将 VAR(2) 过程通过数学变换变形为 MA(\infty) 过程:

yt=p=0Φpμ+p=0Φpϵtpy_{ t }=\sum _{ p=0 }^{ \infty } \Phi _{ p }\mu +\sum _{ p=0 }^{ \infty } \Phi _{ p }\epsilon _{ t-p }

其中 Φp\Phi _{ p } 是 MA(\infty) 过程系数矩阵的的第 p 阶滞后。根据Lütkepohl(2005),MA 系数矩阵与 AR 过程的系数矩阵有如下联系:

Φ0=I2Φ1=A1Φ2=Φ1A1+A2=A12+A2Φi=Φi1A1+Φi2A2\begin{aligned} &\Phi_{0}=I_{2}\\ &\Phi_{1}=A_{1}\\ &\Phi_{2}=\Phi_{1} A_{1}+A_{2}=A_{1}^{2}+A_{2} \\ &\cdots \\ &\Phi_{i}=\Phi_{i-1} A_{1}+\Phi_{i-2} A_{2} \end{aligned}

也就是说,第 ii 个变量在未来 hh 期对第 jj 个方程在时点 tt 的单位冲击作出的反应为:

yi,t+hϵj,t={Φh}i,j\frac { \partial y_{ i,t+h } }{ \partial \epsilon _{ j,t } } =\{ \Phi _{ h }\} _{ i,j }

该式意味着第 ii 个变量在未来 hh 期对第 jj 个方程在时点 tt 的单位冲击作出的反应为 MA(\infty) 过程系数矩阵中第 iijj 列的元素值。对于 VAR(2) 过程,使用估计 AR 参数得到的前若干个反应值为:

[y1,0y2,0]=Φ0=I2=[1001][y1,1y2,1]=Φ^1=A^1=[0.55100.30810.38900.1945][y1,2y2,2]=Φ^2=A^12+A^2=[0.45880.02540.27100.0361]\begin{aligned} &\left[\begin{array}{l} y_{1,0} \\ y_{2,0} \end{array}\right]=\Phi_{0}=I_{2}=\left[\begin{array}{ll} 1 & 0 \\ 0 & 1 \end{array}\right]\\ &\left[\begin{array}{l} y_{1,1} \\ y_{2,1} \end{array}\right]=\hat{\Phi}_{1}=\hat{A}_{1}=\left[\begin{array}{cc} 0.5510 & -0.3081 \\ 0.3890 & 0.1945 \end{array}\right]\\ &\left[\begin{array}{l} y_{1,2} \\ y_{2,2} \end{array}\right]=\hat{\Phi}_{2}=\hat{A}_{1}^{2}+\hat{A}_{2}=\left[\begin{array}{cc} 0.4588 & 0.0254 \\ 0.2710 & -0.0361 \end{array}\right] \end{aligned}

对于 t>2t>2yty_t 的响应使用类似的递归即可得到,第一个方程的冲击对第一个变量的影响为向量(1,0.5510,0.4588,)(1,0.5510,0.4588,\cdots)。我使用 irf create 命令来得到脉冲影响的结果:

. irf create firstirf, set(myirf)
(file myirf.irf created)
(file myirf.irf now active)
(file myirf.irf updated)

这个命令估计了 firstirf 模型中的脉冲响应函数和其他的统计量,并存储在文件 myirf.irf 中。选项 set( ) 将文件名为 myirf.irf 的文件激活。我可以在表格中列示来自同一方程扰动项的外生冲击对 y1y_1 的影响:

. irf table irf, impulse(y1) response(y1) noci

Results from firstirf

+--------------------+
|        |    (1)    |
|  step  |   irf     |
|--------+-----------|
|0       | 1         |
|1       | .551079   |
|2       | .458835   |
|3       | .42016    |
|4       | .353356   |
|5       | .305343   |
|6       | .263868   |
|7       | .227355   |
|8       | .196142   |
+--------------------+
(1) irfname = firstirf, impulse = y1, and response = y1

默认的期数为 8 期,我加入 noci 选项选择不显示置信区间。注意 Stata 算出的前几期响应结果与我之前手动算的结果非常接近。带 95% 置信带的脉冲响应函数图如下:

. irf graph irf, impulse(y1) response(y1)

由上图可知,来自同一方程的一单位冲击将使 y1y_1 立即增加一个单位,然后在中长期随着时间逐渐衰减。

6. 正交化的脉冲响应函数

在前面的部分中,我展示了其他条件不变时,来自同一方程的一单位冲击对 y1y_1 造成的影响。然而,如下表所示,方差-协方差矩阵 Σ^\hat{\Sigma} 显示了两个等式之间较强的正相关关系。

. matrix list e(Sigma)

symmetric e(Sigma)[2,2]
           y1         y2
y1  1.3055041
y2   .4639629  .74551376

两个等式的估计协方差是正的,这意味着我不能假设一个扰动项变动而另一个扰动项保持不变。来自 y2y_2 方程的冲击会对 y1y_1 造成同期影响,反之亦然。

正交脉冲响应函数 (OIRF) 通过将估计方差-协方差矩阵 Σ^\hat{\Sigma} 分解为一个下三角矩阵来解决此问题。这种类型的分解可以将来自同一方程的冲击对 y1y_1 的同期影响分离出来。然而,来自第一个方程的冲击依然会同期影响 y2y_2 。比如,如果 y1y_1 是通胀而 y1y_1 是利率,这个分解意味着通胀的冲击会同时影响通胀和利率,但是来自利率的冲击则只会影响利率。

为了估计 OIRFs,令 P 表示 Σ\Sigma 的 Cholesky 分解,即满足 PP=ΣPP'=\Sigma 。令 utu_t 表示一个 2×12\times 1 的向量使得 Put=ϵtPu_t=\epsilon_t ,也即是 ut=P1ϵtu_t=P^{-1}\epsilon_tutu_t 中的误差与构造不相关,因为 E(utut)=P1E(ϵtϵt)P1=I2E(u_tu'_t)=P^{-1}E(\epsilon_t\epsilon'_t)P'^{-1}=I_2。这允许我们将 OIRFs 解读为来自 utu_t 的一个标准差的外生冲击造成的影响。

重写以 utu_t 向量表示的 MA(\infty) 过程:

yt=p=0Φpμ+p=0Φputpy_t=\sum_{p=0}^{\infty} \Phi_p \mu+\sum_{p=0}^{\infty} \Phi_p u_{t-p}

OIRFs 则为 MA 过程的系数矩阵与下三角矩阵 P 的积:

yi,t+huj,t={ΦhP}i,j\frac { \partial y_{ i,t+h } }{ \partial u_{ j,t } } =\{ \Phi_{ h } P\} _{ i,j }

通过以下代码得到 P^\hat{P} 的估计:

. matrix Sigma_hat = e(Sigma)

. matrix P_hat = cholesky(Sigma_hat)

. matrix list P_hat

P_hat[2,2]
           y1         y2
y1  1.1425866          0
y2  .40606367  .76198823

使用这个矩阵,我可以计算前若干期的响应:

[y1,0y2,0]=Φ0P^=I2P^=[1.142600.40610.7620][y1,1y2,1]=Φ^1P^=A^1P^=[0.50460.23480.52340.1482][y1,2y2,2]=Φ^2P^=(A^12+A^2)P^=[0.53460.01940.29500.0275]\begin{aligned} &\left[\begin{array}{l} y_{1,0} \\ y_{2,0} \end{array}\right]=\Phi_{0} \hat{P}=I_{2} \hat{P}=\left[\begin{array}{cc} 1.1426 & 0 \\ 0.4061 & 0.7620 \end{array}\right]\\ &\left[\begin{array}{l} y_{1,1} \\ y_{2,1} \end{array}\right]=\hat{\Phi}_{1} \hat{P}=\hat{A}_{1} \hat{P}=\left[\begin{array}{cc} 0.5046 & -0.2348 \\ 0.5234 & 0.1482 \end{array}\right]\\ &\left[\begin{array}{l} y_{1,2} \\ y_{2,2} \end{array}\right]=\hat{\Phi}_{2} \hat{P}=\left(\hat{A}_{1}^{2}+\hat{A}_{2}\right) \hat{P}=\left[\begin{array}{cc} 0.5346 & 0.0194 \\ 0.2950 & -0.0275 \end{array}\right] \end{aligned}

我将所有的 OIRFs 列示在一个表格中并画出了 y1 的脉冲响应图:

. irf table oirf, noci

                 Results from firstirf

+--------------------------------------------------------+
|        |    (1)    |    (2)    |    (3)    |    (4)    |
|  step  |   oirf    |   oirf    |   oirf    |   oirf    |
|--------+-----------+-----------+-----------+-----------|
|0       | 1.14259   | .406064   | 0         | .761988   |
|1       | .504552   | .523448   | -.23476   | .148171   |
|2       | .534588   | .294977   | .019384   | -.027504  |
|3       | .476019   | .279771   | -.0076    | .013468   |
|4       | .398398   | .242961   | -.010024  | -.00197   |
|5       | .346978   | .206023   | -.003571  | -.003519  |
|6       | .299284   | .178623   | -.004143  | -.001973  |
|7       | .257878   | .154023   | -.003555  | -.002089  |
|8       | .222533   | .13278    | -.002958  | -.001801  |
+--------------------------------------------------------+
(1) irfname = firstirf, impulse = y1, and response = y1
(2) irfname = firstirf, impulse = y1, and response = y2
(3) irfname = firstirf, impulse = y2, and response = y1
(4) irfname = firstirf, impulse = y2, and response = y2

irf table oirf 要求输出 OIRFs 的结果。注意前三行的估计结果与我们之前手算的结果相同。

. irf graph oirf, impulse(y1) response(y1)

上图即为 y1y_1 对来自同一个方程的一个单位的冲击的脉冲响应图。

7. 结论

在这篇推文中,我展示了怎么模拟一个平稳的 VAR(2) 模型,使用 var 命令估计了这个模型的参数,展示了如何估计 IRFs 和 OIRFs ,其中 OIRFs 由对协方差矩阵的下三角分解得到。

8. 参考文献

  • Lütkepohl, H. 2005. New Introduction to Multiple Time Series Analysis. New York: Springer.

资源共享


尊敬的老师 / 亲爱的同学们:
连享会致力于不断优化和丰富课程内容,以确保每位学员都能获得最有价值的学习体验。为了更精准地满足您的学习需求,我们诚挚地邀请您参与到我们的课程规划中来。
请您在下面的问卷中,分享您 感兴趣的学习主题或您希望深入了解的知识领域 。您的每一条建议都是我们宝贵的资源,将直接影响到我们课程的改进和创新。
我们期待您的反馈,因为您的参与和支持是我们不断前进的动力。感谢您抽出宝贵时间,与我们共同塑造更加精彩的学习旅程!https://www.wjx.cn/vm/YgPfdsJ.aspx# 再次感谢大家宝贵的意见!


关于我们

  • Stata连享会 由中山大学连玉君老师团队创办,定期分享实证分析经验。more……
  • 扫码加入连享会微信群,提问交流更方便