温馨提示: 定期 清理浏览器缓存,可以获得最佳浏览体验。
作者: 陈贤孟 (厦门大学)
邮箱: cxminjnu@163.com
目录
编者按: 本文主要源于江艇老师和连玉君老师在「连享会-2020 暑期班」上讲授的内容,特此致谢!
在研究过程中,当得到实证结果后,除了看系数的正负和统计显著性以外,如何对系数进行解释以及评估系数的大小,同样也是一个重要的问题。本文对不同模型设定形式下的估计系数的解释进行梳理,同时也对如何评估系数的大小进行一定的讨论。
在实证研究过程中,根据研究目的的需要,研究者往往会对变量进行取对数的处理。根据变量是否取对数,我们可以将模型设定分成如下四种情形。
情形 1:
在
情形 2:
在
情形 3:
在
情形 3 下的系数解释,可结合以下式子进行理解:
情形 4:
在
情形 4 下的系数解释,可结合以下式子进行理解:
交互项模型作为实证研究过程中一种常见的模型,其基本设定如下:
首先,通过
由式 (8) 可知,
值得注意的是,在交互项模型中,对
因此,在交互项模型中,
更多关于交互项系数的讨论,可参考连享会推文专题:【交乘-调节-中介】。
在实证研究过程中,研究者除了关心系数的统计显著性以外,为了评估研究结果的经济意义,往往需要对估计系数的大小进行相应的评估。一般而言,可以通过检验系数的经济显著性和变量的解释力来评估系数大小。
吴小康 (2019) 一文详细地阐述了统计显著性与经济显著性的区别,以及经济显著性的重要性。该文指出,考虑用一个采用新药治疗癌症的例子,统计显著性告诉我们的往往是该药是否有效,而现实生活中,患者更关心的往往是该药的效果究竟有多大。后一个问题所涉及的,便是研究结果的经济显著性的问题。关于经济显著性的评估,目前尚未有一种统一的方法与标准,此处梳理了较为常见的两种方法:
方法 1:与
Chen and Lan (2020) 的文章研究了家庭联产承包责任制对农民耕地技术的影响。该文指出,在家庭联产承包责任制实施以后,小规模的家庭农场更多地采用了役畜进行耕地,拖拉机逐渐被役畜所取代。在文章的实证结果描述中,有着这样的一段表述:
After six years, the gradual buildup accumulated into a large causal effect: an increase of 69 head or 66 percent of the pre-reform mean.
这段话的含义是,在实施家庭联产承包责任制以后,每 100 公顷的役畜数量六年内增长了 69 头,是改革前平均值的 66%。
作者通过把
通过将系数大小以
方法 2:评估
数据的标准差表示数据的平均偏离幅度,相比评估
Huang et al. (2017) 的论文研究了企业到当地政府的距离与国企权力下放的关系,以验证哈耶克假说。该文在表述实证研究结果的经济含义时,采用了如下的表述方式:
Using the pooled sample estimates, increasing the distance by one standard deviation (SD, here 2.40) would increase the probability of decentralization by 1.3 percentage points, or 9 percent of the SD of the dependent variable.
这一段的含义为,当
通过评估标准差的相对变动来说明系数的经济显著性的文献还有 Nunn and Wantchekon (2011)、 Adit & Franck (2015)、Hoynes et al.(2016) 等。
除了通过判断经济显著性来解释系数的经济含义外,还可以通过评估
式 (10) 为我们提供了一种计算
Nunn and Wantchekon (2011) 研究奴隶贸易对当今非洲人民的信任程度的影响,在原文中,有如下一段表述:
" We find that slave exports and the other covariates together explain 5.4 percent of the total variation of trust in neighbors. Of this 5.4 percent, 16–27 percent is explained by slave exports"
该段话的含义为:除了国家固定效应以外,奴隶贸易和其他解释变量,一共解释了对邻居的信任的变动中的 5.4%, 在这 5.4%中,大约有 16%-27% 是由奴隶贸易解释的。
考虑以下模型:
具体到本例中,
为理解式 (10) 的分子部分,下面结合连享会推文:加入控制变量后结果悲催了?!(微信版) 中的图 6 进行解读。(有关
上图表明:
相关的 Stata 代码如下所示 (你可以到 连享会推文数据主页 下载范例中使用的数据文件) :
// 调用数据
*-数据下载地址:
* https://gitee.com/arlionn/data/tree/master/data01
use "nunnw_2011.dta", clear
preserve
// 删除缺失值
global x1 "trust_neighbors ln_export_area murdock_name age age2 male urban_dum "
global x2 "education occupation religion living_conditions "
global x3 "district_ethnic_frac frac_ethnicity_in_district isocode"
global x "$x1 $x2 $x3"
foreach v of varlist $x{
drop if missing(`v')==1
}
/* None */
quietly xi: reg trust_neighbors i.isocode
gen r_w=e(r2) //计算仅加入国家固定效应时的R方
/* Slave Trade Only */
quietly xi: reg trust_neighbors ln_export_area i.isocode
gen r_x1_w=e(r2) //计算加入奴隶贸易变量及国家固定效应时的R方
/* Other Characteristics */
quietly xi: reg trust_neighbors age age2 male urban_dum i.education i.occupation i.religion i.living_conditions district_ethnic_frac frac_ethnicity_in_district i.isocode
gen r_x2_w=e(r2) //计算加入其他控制变量及国家固定效应时的R方
/* Both */
quietly xi: reg trust_neighbors ln_export_area age age2 male urban_dum i.education i.occupation i.religion i.living_conditions district_ethnic_frac frac_ethnicity_in_district i.isocode
gen r_x1_x2_w=e(r2) //计算加入所有变量时的R方
dis r_x1_x2_w - r_w //计算X1、X2对 Y 的variation的贡献
.05397503
dis (r_x1_x2_w-r_x2_w)/(r_x1_x2_w-r_w) //计算下界
.16039986
dis (r_x1_w-r_w)/(r_x1_x2_w-r_w) //计算上界
.27154186
restore
连享会-直播课 上线了!
http://lianxh.duanshu.com
免费公开课:
直击面板数据模型 - 连玉君,时长:1小时40分钟 Stata 33 讲 - 连玉君, 每讲 15 分钟. 部分直播课 课程资料下载 (PPT,dofiles等)
支持回看,所有课程可以随时购买观看。
专题 | 嘉宾 | 直播/回看视频 |
---|---|---|
⭐ 最新专题 ⭐ | DSGE, 因果推断, 空间计量等 | |
⭕ Stata数据清洗 | 游万海 | 直播, 2 小时,已上线 |
研究设计 | 连玉君 | 我的特斯拉-实证研究设计,-幻灯片- |
面板模型 | 连玉君 | 动态面板模型,-幻灯片- |
面板模型 | 连玉君 | 直击面板数据模型 [免费公开课,2小时] |
Note: 部分课程的资料,PPT 等可以前往 连享会-直播课 主页查看,下载。
关于我们
课程, 直播, 视频, 客服, 模型设定, 研究设计, stata, plus, 绘图, 编程, 面板, 论文重现, 可视化, RDD, DID, PSM, 合成控制法
等
连享会小程序:扫一扫,看推文,看视频……
扫码加入连享会微信群,提问交流更方便
✏ 连享会学习群-常见问题解答汇总:
✨ https://gitee.com/arlionn/WD