Stata:空间计量模型双权重-spm

发布时间:2021-11-11 阅读 330

Stata连享会   主页 || 视频 || 推文 || 知乎 || Bilibili 站

温馨提示: 定期 清理浏览器缓存,可以获得最佳浏览体验。

New! lianxh 命令发布了:
随时搜索推文、Stata 资源。安装:
. ssc install lianxh
详情参见帮助文件 (有惊喜):
. help lianxh
连享会新命令:cnssc, ihelp, rdbalance, gitee, installpkg

课程详情 https://gitee.com/lianxh/Course

课程主页 https://gitee.com/lianxh/Course

⛳ Stata 系列推文:

PDF下载 - 推文合集

作者:彭甲超 (中国地质大学)
邮箱pengjiachao@cug.edu.cn

编者按:本文摘译自下文,特此致谢!
Source:Atella V, Belotti F, Depalo D, et al. Measuring spatial effects in the presence of institutional constraints: The case of Italian Local Health Authority expenditure[J]. Regional Science and Urban Economics, 2014, 49: 232-241. -PDF-


目录


1. 简介

已有文献认为地理上接近的样本数据不是独立的,而是在空间上相关,这意味着更接近样本单元的观测值往往比其他样本单元的观测值更相似。经济和社会人口变量,如失业率、犯罪率、房价、人均卫生支出等,经常观察到空间聚集或基于地理的相关性特征。理论模型通常承认空间溢出的存在,空间溢出随着单元之间距离的增加而下降。

从经验上讲,这些特征可以通过权重矩阵的方法,将较高的权重附加到邻近地区。比如邻近样本单元的环境污染可能影响当地的环境,那么在实际研究中该如何控制临近样本单元对当地的环境污染呢?通常利用引入空间权重的方式考察这种空间溢出。引入空间计量主要有2个好处:一是可以防止空间溢出效应性影响内生性,二是可以考察空间溢出的影响方向。

一般常见的引入空间权重仅使用单一权重,但实际中仅依赖单一空间权重缺乏经济含义。以空间杜宾模型 (SDM) 为例:

其中,y 为被解释变量;λWy 表示与相邻地区 y 的空间自相关部分,W 为空间权重矩阵,显示 y 与相邻地区的其他 y 有关系;Xβ1 表示与自变量相关部分,y 与自变量 X 有关,也就是最简单的线性回归模型;WXβ2 表示与相邻地区 X 的空间自相关部分,y 与相邻地区的其它 X 有关系。

公式中使用的 W 一般仅可引入单一的空间权重,如地理距离等,但现实环境污染也不仅仅与地理距离或是空间邻接相关,也可能与邻近地区经济发展需要额外排放污染相关,那么此时仅使用地理距离或是空间邻接权重就无法控制经济发展权重带来的影响。spm 命令能够很好的解决两种空间权重对被解释变量的影响。

2. 双权重模型

spm 命令主要适用平衡面板双权重的空间自回归模型 (SAR)、空间误差模型 (SEM) 和 SDM 固定效应空间计量模型。SE 其实就是将回归项放到了误差里面,简单的来说,SAR 是研究因变量自相关,而 SEM 是研究误差项自相关。SDM 是 SAR 和 SEM 的扩展形式,同时考虑了因变量和自变量的自相关性含有空间权重矩阵的模型。

SDM 模型可以计算变量的直接效应、间接效应和总效应,因而被广泛使用。其中直接效应表示区域的变量对区域的被解释变量产生的影响,总效应表示所有区域的变量变动对区域的被解释变量产生的影响,间接效应表示其他区域变量变动对本区域的被解释变量产生的影响,也为空间溢出效应。

以 SDM 模型为例,双权重主要模型形式为 (Manski,1993;Atell 等 2014):

其中 Wij1 和 Wij2 表示两种不同的空间权重,其他参数解释与一般情形下的 SDM 一致。

需要注意的是,spm 允许使用双权重矩阵估计平衡空间面板数据模型 (Atella 等,2014),当方差-协方差矩阵不是正定时,使用 Rebonato 和 Jackel (1999) 中的修正正定矩阵计算直接、间接和总效应标准误差。

3. 命令介绍

  • ounter(line
  • ounter(line
  • ounter(line
*命令安装cnssc install lxhget, replacelxhget spm.pkg, install
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
*命令语法Spatial Autoregressive (SAR) model  spm depvar [indepvars] [if] [in] [weight] [, SAR_options]
Spatial Error (SEM) model spm depvar [indepvars] [if] [in] [weight] , model(sem) [SEM_options]
Spatial Durbin (SDM) model spm depvar [indepvars] [if] [in] [weight] , model(durbin) [DURBIN_options]
  • spm:仅适用 SAR、SEM、Durbin 模型;
  • depvar:被解释变量;
  • indepvars:解释变量;
  • SAR_options:包括 sarwmat(name)sarw2mat(name)、固定效应选项,稳健性估计选择和置信区间选项。其中 sarwmat(name) 代表第一个 Stata 空间权重,sarw2mat(name) 代表第二个 Stata 空间权重,固定效应选择可设定控制个体效应和时间效应;
  • SEM_options:与 SAR_options 类似,包括 sarwmat(name)sarw2mat(name)、固定效应选项、稳健性估计选择和置信区间选项,含义与 SAR_options 类似;
  • DURBIN_options:与 SAR_optionsSEM_options 具体内容差别不大。但需要注意 durbin(varlist [, SDM_options]) 中,SDM_options 包含 indirectnsim(#),分别用于展示不同变量的空间溢出效应,设置 Lesage 和 Pace (2009) 过程的模拟次数以计算直接和间接影响的标准误差。

4. Stata 实例操作

示例数据中的空间矩阵是一个一阶 188×188 邻接矩阵 Wijall,如果区域 i 和 j 共享公共边界,则其对角线元素等于 0,非对角线元素等于 1。如果区域 i 和 j 共享共同边界并且属于同一机构群集,则记为 Wij1,如果区域 i 和 j 虽然共享共同边界但属于不同群集,则记为 Wij2

首先,下载示例数据,并载入两种空间权重 Wij1 和 Wij2

  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
. lxhget spm.pkg, replace. use spm_demo.dta, clear. mata mata matuse w1.mmat, replace. mata st_matrix("W1", W1). mata mata matuse w2.mmat, replace. mata st_matrix("W2", W2)

特别需要注意的是,spm 使用的空间权重矩阵是 mmat 格式而非 dta 格式数据,下文将给出具体转化代码。

  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
matamata clearmata stata use W1.dta,clearW1=st_data(.,.)W1endmata st_matrix("W1", W1)

其次,结合 spm 的参考命令执行,结果如下:

  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
. *SDM. xtset id t. spm y x1, model(durbin) sarwmat(W1) sarw2mat(W2)
SDM with spatial fixed effects Number of obs = 940Group variable: id Number of groups = 188Time variable: t Obs per group: min = 5 avg = 5.0 max = 5Log-likelihood = -1319.3380------------------------------------------------------------------------------ y | Coefficient Std. err. t P>|t| [95% conf. interval]-------------+----------------------------------------------------------------Main | x1 | 0.411 0.034 12.09 0.000 0.345 0.478-------------+----------------------------------------------------------------Durbin | x1 | 0.601 0.063 9.55 0.000 0.478 0.725-------------+----------------------------------------------------------------Durbin2 | x1 | 0.321 0.064 4.98 0.000 0.195 0.448-------------+----------------------------------------------------------------Spatial | rho | 0.237 0.022 10.97 0.000 0.195 0.279 rho2 | 0.674 0.019 36.38 0.000 0.638 0.710-------------+----------------------------------------------------------------Variance | sigma2 | 1.016 0.038 26.62 0.000 0.941 1.091------------------------------------------------------------------------------

其中,

  • y 表示人均卫生费用支出,x1 为核心变量,具体指标解释请参阅 Atella 等 (2014);
  • Main 汇报的是 xitβ 部分;
  • Durbin 和 Durbin2 汇报的分别是 j=1nWij1zjtθ1j=1nWij2zjt
  • rho 和 rho2 则分别对应 ρ1j=1nWij1yjtρ2j=1nWij2yjt
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
. *SAR. spm y x1, model(sar) sarwmat(W1) sarw2mat(W2)
SLM with spatial fixed effects Number of obs = 940Group variable: id Number of groups = 188Time variable: t Obs per group: min = 5 avg = 5.0 max = 5Log-likelihood = -1378.5699------------------------------------------------------------------------------ y | Coefficient Std. err. t P>|t| [95% conf. interval]-------------+----------------------------------------------------------------Main | x1 | 0.434 0.036 12.21 0.000 0.364 0.503-------------+----------------------------------------------------------------Spatial | rho | 0.306 0.020 15.16 0.000 0.267 0.346 rho2 | 0.660 0.018 37.26 0.000 0.625 0.695-------------+----------------------------------------------------------------Variance | sigma2 | 1.121 0.042 26.49 0.000 1.038 1.204------------------------------------------------------------------------------
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
. *SEM. spm y x1, sarwmat(W1) sarw2mat(W2)
SLM with spatial fixed effects Number of obs = 940Group variable: id Number of groups = 188Time variable: t Obs per group: min = 5 avg = 5.0 max = 5Log-likelihood = -1378.5699------------------------------------------------------------------------------ y | Coefficient Std. err. t P>|t| [95% conf. interval]-------------+----------------------------------------------------------------Main | x1 | 0.434 0.036 12.21 0.000 0.364 0.503-------------+----------------------------------------------------------------Spatial | rho | 0.306 0.020 15.16 0.000 0.267 0.346 rho2 | 0.660 0.018 37.26 0.000 0.625 0.695-------------+----------------------------------------------------------------Variance | sigma2 | 1.121 0.042 26.49 0.000 1.038 1.204------------------------------------------------------------------------------

5. 结语

与传统的单一空间权重分析相比,spm 命令同时引入两种空间权重是对空间计量模型的一种改进。此外,spm 命令能够汇报 SDM 模型的直接效应、间接效应和总效应,本文不在此赘述。

6. 参考资料

  • Cameron A C, Gelbach J B, Miller D L. Robust inference with multiway clustering[J]. Journal of Business & Economic Statistics, 2011, 29(2): 238-249. -PDF-
  • Atella V, Belotti F, Depalo D, et al. Measuring spatial effects in the presence of institutional constraints: The case of Italian Local Health Authority expenditure[J]. Regional Science and Urban Economics, 2014, 49: 232-241. -PDF-
  • Manski C F. Identification of endogenous social effects: The reflection problem[J]. The review of economic studies, 1993, 60(3): 531-542. -PDF-
  • Rebonato R, Jäckel P. The most general methodology to create a valid correlation matrix for risk management and option pricing purposes[J]. Available at SSRN 1969689, 2011. -PDF-

7. 相关推文

Note:产生如下推文列表的 Stata 命令为:
lianxh 空间, m
安装最新版 lianxh 命令:
ssc install lianxh, replace

相关课程

免费公开课

最新课程-直播课

专题 嘉宾 直播/回看视频
最新专题 文本分析、机器学习、效率专题、生存分析等
研究设计 连玉君 我的特斯拉-实证研究设计-幻灯片-
面板模型 连玉君 动态面板模型-幻灯片-
面板模型 连玉君 直击面板数据模型 [免费公开课,2小时]
  • Note: 部分课程的资料,PPT 等可以前往 连享会-直播课 主页查看,下载。

课程主页

课程主页

关于我们

  • Stata连享会 由中山大学连玉君老师团队创办,定期分享实证分析经验。
  • 连享会-主页知乎专栏,700+ 推文,实证分析不再抓狂。直播间 有很多视频课程,可以随时观看。
  • 公众号关键词搜索/回复 功能已经上线。大家可以在公众号左下角点击键盘图标,输入简要关键词,以便快速呈现历史推文,获取工具软件和数据下载。常见关键词:课程, 直播, 视频, 客服, 模型设定, 研究设计, stata, plus, 绘图, 编程, 面板, 论文重现, 可视化, RDD, DID, PSM, 合成控制法

连享会小程序:扫一扫,看推文,看视频……

扫码加入连享会微信群,提问交流更方便

✏ 连享会-常见问题解答:
https://gitee.com/lianxh/Course/wikis

New! lianxhsongbl 命令发布了:
随时搜索连享会推文、Stata 资源,安装命令如下:
. ssc install lianxh
使用详情参见帮助文件 (有惊喜):
. help lianxh