Stata:异质性空间自回归模型 (HSAR)-hetsar

发布时间:2021-11-14 阅读 5006

Stata连享会   主页 || 视频 || 推文 || 知乎 || Bilibili 站

温馨提示: 定期 清理浏览器缓存,可以获得最佳浏览体验。

New! lianxh 命令发布了:
随时搜索推文、Stata 资源。安装:
. ssc install lianxh
详情参见帮助文件 (有惊喜):
. help lianxh
连享会新命令:cnssc, ihelp, rdbalance, gitee, installpkg

课程详情 https://gitee.com/lianxh/Course

课程主页 https://gitee.com/lianxh/Course

⛳ Stata 系列推文:

PDF下载 - 推文合集

作者:李祉豪 (厦门大学)
邮箱andycristone@163.com


目录


1. 背景简介

在标准的空间自回归模型中,即使在考虑固定效应的情况下,也只是估计了所有地理单位空间溢出效应的平均值,无法捕捉不同地理单位所产生的不同的空间溢出效应。为了探究不同地理单位空间溢出效应的异质性,Aquaro 等建立了异质性空间自回归模型 (Heterogeneous SAR model,简称 HSAR model)。

标准的空间自回归莫模型中,除了可能存在的个体固定效应外,空间溢出或者网络效应被认为是同质的。但在这种网络中即使所有个体都拥有相同数目的连接单位,每个个体也并非同等重要。而这正是作者们提出该模型以估计不同不同溢出效应的研究动机。

2. 异质性空间自回归模型

一个带外生解释变量的标准空间自回归模型如下:

在该模型中,空间溢出效应即系数 β0 是基于所有样本观测值的结果给出的平均效应,不能反映每个观测点自身所受到的空间溢出效应的差异大小。在各观测点因自身属性不同而存在较大差异时,这种平均效应不能准确捕捉各观测点空间联系与互动的强弱。为此 Aquaro 等人建立了异质性空间自回归模型,即 HSAR model:

此时,我们可以看到在不同观测点 i 处具有不同的估计系数 β0i,从而具有不同的空间溢出效应。该模型考虑了不同观测个体存在较大差异表现出的异质性。作者使用近似极大似然估计 (QML) 方法对该系数进行估计,同时论证了这些待估参数及其组平均估计值在统计上具有一致性和渐进正态分布性。

当引入弱外生变量如滞后一期的被解释变量 y 及其空间滞后项 Wy,或者在误差项存在异方差时,该估计量一致性和渐进正态分布性依然有效。在小样本条件下,作者采用蒙特卡洛模拟对上述 QML 估计量的统计表现进行了检验,即使在放宽时间维度 T 和截面单位数 N 后仍然保持较好的性质,这与文章的主要结论保持一致。

3. 命令介绍

*命令安装
ssc install hetsar, all replace

安装好命令之后,可以输入 help hetsar,查看 hetsar 的帮助文档。该命令在进行模型估计时的空间权重矩阵采用 spmat 或 spmatrix 格式均可。运行该命令时需注意,被解释变量和空间权重矩阵是必选项,并且要确保样本数据和空间权重矩阵数据在同一个运行目录下。

*命令语法
hetsar depvar [indepvars] [if] [in], wmatrix(name) [options]

其中,

  • depvar:被解释变量;
  • indepvars:解释变量,中间用空格隔开;
  • wmatrix(name):设定模型估计时所采用的权权重矩阵,括号内填入该矩阵的名称。

options 选择项如下:

  • detailed:输出模型的个体异质性估计系数、方差估计值和空间滞后项等细节信息,不加则默认输出组平均估计系数;
  • ivarlag(durb_varlist):使用空间杜宾模型时生成指定被解释变量的空间滞后项;
  • timelag([y wy x wx]):设定动态模型时指定生成 yx 及其空间滞后项 WyWx 的时间滞后项。若 y 的时间滞后项已包含在模型中,则该选项表示采用完全动态异质性空间杜宾模型进行估计;
  • noconstant:估计时去掉常数项。

4. 应用实例

本节使用该命令自带实例进行回归估计,可在 help 文档中 Examples 一栏点击相应行命令即可看到不同空间计量模型的估计结果。

4.1 数据导入

首先我们需要使用如下命令导入空间权重矩阵:

. cnssc install lxhget, replace
. lxhget hetsar.pkg, replace

copying into current directory...
      copying  hetsar_demo.csv
      copying  wrook_25.txt
ancillary files successfully copied.

. spmat import w using wrook_25.txt, replace noid normalize(row)

在完成上述权重矩阵导入后,可使用 spmat summarize w 命令查看该矩阵的描述性统计特征,如下所示:

. spmat summarize w

Summary of spatial-weighting object w
--------------------------------------
        Matrix |          Description
---------------+----------------------
    Dimensions |              25 x 25
     Stored as |              25 x 25
 Values        |
           min |                    0
         min>0 |                  .25
          mean |                  .04
           max |                   .5
--------------------------------------

在完成权重矩阵导入后,我们按照如下命令导入样本数据,并设定面板数据格式:

. import delimited hetsar_demo.csv, clear
. xtset id time

4.2 模型估计

针对样本数据,我们建立进行静态空间自回归模型:

通过以下命令,我们可以看到组平均估计系数的估计结果如下:

. *静态空间自回归模型
. hetsar y x, wmatrix(w) //若要汇报个体异质性估计系数则在后面加上 detailed

SAR model with heterogenous coefficients                 Number of obs = 5,025
Mean-group estimator
------------------------------------------------------------------------------
           y | Coefficient  Std. err.      z    P>|z|     [95% conf. interval]
-------------+----------------------------------------------------------------
          Wy |      0.743      0.103     7.21   0.000        0.541       0.944
       _cons |      0.502      0.220     2.29   0.022        0.072       0.933
           x |      1.114      0.107    10.41   0.000        0.905       1.324
     sigmasq |      2.543      0.328     7.74   0.000        1.899       3.187
------------------------------------------------------------------------------

回归结果显示空间滞后项和解释变量的组平均估计系数分别为 0.743 和 1.114,均在 1% 的水平上显著,表现出正向的空间溢出效应。若想得到个体异质性估计系数,我们可以在该命令后面加上 detailed 语句。该命令汇报了空间滞后项 Wy 的回归系数 β0i、常数项 αix 的回归系数 β1i、方差 σi2 在每个样本观测点的估计结果。在这里,我们只截取 x 的回归系数 β1i 的估计结果,具体如下所示:

. hetsar y x, wmatrix(w) detailed
-------------+----------------------------------------------------------------
x            |
         id1 |      0.434      0.295     1.47   0.141       -0.144       1.011
         id2 |      1.145      0.149     7.67   0.000        0.852       1.437
         id3 |      0.506      0.162     3.12   0.002        0.188       0.823
         ...        
        id23 |      1.481      0.140    10.55   0.000        1.206       1.756
        id24 |      0.291      0.154     1.88   0.060       -0.012       0.593
        id25 |      1.197      0.106    11.30   0.000        0.990       1.405
-------------+----------------------------------------------------------------

同样我们可以建立动态空间自回归模型进行估计:

组平均系数估计结果如下:

. hetsar y x, wmatrix(w) timelag(y wy)

Dynamic SAR model with heterogenous coefficients         Number of obs = 5,000
Mean-group estimator
------------------------------------------------------------------------------
           y | Coefficient  Std. err.      z    P>|z|     [95% conf. interval]
-------------+----------------------------------------------------------------
          Wy |      0.501      0.137     3.64   0.000        0.231       0.770
       _cons |     -1.938      0.435    -4.46   0.000       -2.790      -1.087
             |
           y |
         L1. |      0.682      0.099     6.88   0.000        0.487       0.876
             |
          Wy |
         L1. |      0.623      0.111     5.63   0.000        0.406       0.839
             |
           x |      1.346      0.124    10.86   0.000        1.103       1.589
     sigmasq |      9.458      1.746     5.42   0.000        6.036      12.879
------------------------------------------------------------------------------

上述各组平均估计系数均在 1% 的水平上显著,存在正向的空间溢出效应。其中 yL1 和 WyL1 报告的是滞后一期的 y 和 Wy 的系数估计结果。同样我们可以在该命令后面添加 detailed 语句查看在不同观测点的异质性估计系数。在这里,我们只截取 Wyi,t1 的回归系数 β2i 的估计结果,具体如下所示:

. hetsar y x, wmatrix(w) timelag(y wy) detailed

-------------+----------------------------------------------------------------
L.Wy         |
         id1 |      0.995      0.197     5.06   0.000        0.609       1.381
         id2 |      0.995      0.232     4.29   0.000        0.540       1.450
         id3 |      0.995      0.185     5.37   0.000        0.632       1.358
         ...
        id23 |      0.995      0.326     3.05   0.002        0.357       1.633
        id24 |      0.995      0.106     9.38   0.000        0.787       1.203
        id25 |      0.995      0.284     3.50   0.000        0.438       1.552
-------------+----------------------------------------------------------------

5. 参考文献

  • Aquaro M, Bailey N, Pesaran M H. Estimation and inference for spatial models with heterogeneous coefficients: an application to US house prices[J]. Journal of Applied Econometrics, 2021, 36(1): 18-44. -PDF-
  • Belotti F. HETSAR: Stata module to estimate spatial autoregressive models with heterogeneous coefficients[J]. 2021. -Link-

6. 相关推文

Note:产生如下推文列表的 Stata 命令为:
lianxh 空间 自回归, m
安装最新版 lianxh 命令:
ssc install lianxh, replace

相关课程

免费公开课

最新课程-直播课

专题 嘉宾 直播/回看视频
最新专题 文本分析、机器学习、效率专题、生存分析等
研究设计 连玉君 我的特斯拉-实证研究设计-幻灯片-
面板模型 连玉君 动态面板模型-幻灯片-
面板模型 连玉君 直击面板数据模型 [免费公开课,2小时]
  • Note: 部分课程的资料,PPT 等可以前往 连享会-直播课 主页查看,下载。

课程主页

课程主页

关于我们

  • Stata连享会 由中山大学连玉君老师团队创办,定期分享实证分析经验。
  • 连享会-主页知乎专栏,700+ 推文,实证分析不再抓狂。直播间 有很多视频课程,可以随时观看。
  • 公众号关键词搜索/回复 功能已经上线。大家可以在公众号左下角点击键盘图标,输入简要关键词,以便快速呈现历史推文,获取工具软件和数据下载。常见关键词:课程, 直播, 视频, 客服, 模型设定, 研究设计, stata, plus, 绘图, 编程, 面板, 论文重现, 可视化, RDD, DID, PSM, 合成控制法

连享会小程序:扫一扫,看推文,看视频……

扫码加入连享会微信群,提问交流更方便

✏ 连享会-常见问题解答:
https://gitee.com/lianxh/Course/wikis

New! lianxhsongbl 命令发布了:
随时搜索连享会推文、Stata 资源,安装命令如下:
. ssc install lianxh
使用详情参见帮助文件 (有惊喜):
. help lianxh