温馨提示: 定期 清理浏览器缓存,可以获得最佳浏览体验。
作者: 陈凤 (西安交通大学)
Email: chenfengscsfdx@163.com
目录
空间数据在地理学、经济学、环境学、生态学以及气象学等众多领域中广泛存在。根据 Tobler 提出的 「地理学第一定律」:任何事物之间都是空间相关的,距离越近的事物之间的空间相关性越大。因此,不同于传统的截面数据,空间数据的空间相关性会导致回归关系的空间非平稳性 (空间异质性)。为了探索空间数据的空间非平稳性, Brunsdon 等 (1996) 首次提出了 地理加权回归模型,设定如下:
其中,
以某城市的房屋价格
其中,
其中,
上述例子说明有必要对空间数据建立地理加权回归模型来探索空间数据的非平稳性。
根据 Tobler 地理学第一定律,距离越近的事物之间的相关性越大。故对于一个给定的地理位置
其中,
其中,
令
注1:
在核光滑方法中,常用的核函数如下:
其中,
给一个
给定
对于任意的观测点来说,
在地理加权回归模型中,常用的最优窗宽选取准则有交叉确认方法、广义交叉确认方法以及AICc信息准则。这三种准则的定义分别如下所示。
交叉确认方法的具体过程如下:给定一个
则最优窗宽
设
其中,
则最优窗宽
令
最优窗宽
注:模拟实验以及经验表明,
在R软件中,可以调用 Rpacakge-GWmodel (Lu, B. B, et al. 2014) 来实现地理加权回归模型的参数过程。以都柏林 2014 年的选举数据为例,下面介绍 GWR 在 R 中的实现过程:
# 1. 加载 Rpacakge:
library("GWmodel")
# 2. 加载数据
data(DubVoter)
# 3. 选择最优窗宽
Dub<cbind(Dub.voter\$DiffAdd,Dub.voter\$LARent,Dub.voter\$SC1,Dub.voter\$Unempl,Dub.voter\$LowEduc,Dub.voter\$Age18_24,Dub.voter\$Age25_44,Dub.voter\$Age45_64,Dub.voter\$GenEl2004)
DubCoord<-cbind(Dub.voter\$X,Dub.voter\$Y) %地理位置
DIS<-gw.dist(dp.locat=DubCoord)% 计算距离矩阵
bw1<bw.gwr(GenEl2004~DiffAdd+LARent+SC1+Unempl+LowEduc+Age18_24+Age25_44+Age45_64, approach="AICc",adaptive=TRUE, data=Dub.voter,
kernel = "bisquare",dMat=DIS) %选择bi-square函数作为核函数,使用AICc准则选择最优窗宽
# 4. 拟合GWR模型
gwr.res1<gwr.basic(GenEl2004~DiffAdd+LARent+SC1+Unempl+LowEduc+Age18_24+Age25_44+Age45_64, data=Dub.voter, bw=bw1,adaptive=TRUE,kernel = "bisquare", dMat=DIS)
# 5. 将局部估计值画在对应的地图上面
library("RColorBrewer")
Mcolor<-1;mypalette <- colorRampPalette(brewer.pal(9, "Greys"))(200)
map.na=list("SpatialPolygonsRescale", layout.north.arrow(),
offset=c(329000, 261500), scale=4000,col=1)
map.scale.1=list("SpatialPolygonsRescale",layout.scale.bar(),
offset=c(326500, 217000), scale=5000,col=1,
fill=c("transparent","black"))
map.scale.2=list("sp.text",c(326500, 217900),"0",cex=0.9,col=1)
map.scale.3=list("sp.text",c(331500, 217900),"5km",cex=0.9,col=1)
map.layout<-list(map.na,map.scale.1,map.scale.2,map.scale.3)
mypalette.9<-brewer.pal(9,"Greys")
spplot(gwr.res1$SDF, "LowEduc",key.space="right",
col.regions=mypalette.6, at=c(-8,-6,-4,-2,0,2,4),
sp.layout=map.layout)
在都柏林 2014 年选择数据中,使用 AICc 准则确定的最优窗宽为 115,其中变量 LowEduc 的回归系数的局部估计值如下:
连享会-直播课 上线了!
http://lianxh.duanshu.com
免费公开课:
直击面板数据模型 - 连玉君,时长:1小时40分钟 Stata 33 讲 - 连玉君, 每讲 15 分钟. 部分直播课 课程资料下载 (PPT,dofiles等)
支持回看,所有课程可以随时购买观看。
专题 | 嘉宾 | 直播/回看视频 |
---|---|---|
⭐ 最新专题 ⭐ | DSGE, 因果推断, 空间计量等 | |
⭕ Stata数据清洗 | 游万海 | 直播, 2 小时,已上线 |
研究设计 | 连玉君 | 我的特斯拉-实证研究设计,-幻灯片- |
面板模型 | 连玉君 | 动态面板模型,-幻灯片- |
面板模型 | 连玉君 | 直击面板数据模型 [免费公开课,2小时] |
Note: 部分课程的资料,PPT 等可以前往 连享会-直播课 主页查看,下载。
关于我们
课程, 直播, 视频, 客服, 模型设定, 研究设计, stata, plus, 绘图, 编程, 面板, 论文重现, 可视化, RDD, DID, PSM, 合成控制法
等
连享会小程序:扫一扫,看推文,看视频……
扫码加入连享会微信群,提问交流更方便
✏ 连享会学习群-常见问题解答汇总:
✨ https://gitee.com/arlionn/WD