温馨提示: 定期 清理浏览器缓存,可以获得最佳浏览体验。
作者:连玉君 (中山大学)
E-Mail: arlionn@163.com
编者按: 这篇文章源自一个知乎问题:研究两个变量对另一变量的影响程度哪个显著,应该用什么模型?
就我目前看到的资料,实证分析中主要有两种方法:
在 Flannery and Rangan (2006,PDF) 文中 Table 5 Panel B 中,作者采用了这种方法对比了三种资本结构理论的相对重要性。详情参见
所谓标准化系数,就是对每一个变量都减掉均值除以对应的标准差。本质上是一个去除量纲的操作。例如,对于面板数据模型而言,我们可以采用如下方式进行标准化:
其中,
先设定一个包含两个变量的线性模型,假设所有变量都已经做了标准化处理:
此时,
用 Stata 自带的 auto.dta 数据集进行演示:
sysuse "auto.dta", clear
sum mpg
global sd_y = r(sd) //被解释变量的标准差
dis "s.d.(mpg) = " r(sd)
reg mpg len wei foreign, beta //标准化系数
est store m0
*-手动
center mpg len wei foreign, standardize inplace // 可以简写为 s inplace
regress mpg len wei foreign
est store msd
*-第一个变量的相对重要性
*-原始数据
dis "% y's Std. Dev. of x_1 = " -0.318/5.785503
*-百分比形式
dis "% y's Std. Dev. of x_1 = " %6.2f _b[len]/$sd_y *100 "%"
对应结果如下:
. sysuse "auto.dta", clear
(1978 Automobile Data)
. sum mpg
Variable | Obs Mean Std. Dev. Min Max
-------------+---------------------------------------------------------
mpg | 74 21.2973 5.785503 12 41
. global sd_y = r(sd) //被解释变量的标准差
. dis "s.d.(mpg) = " r(sd)
s.d.(mpg) = 5.7855032
.
. reg mpg len wei foreign, beta //标准化系数
Source | SS df MS Number of obs = 74
-------------+---------------------------------- F(3, 70) = 48.10
Model | 1645.2889 3 548.429632 Prob > F = 0.0000
Residual | 798.170563 70 11.4024366 R-squared = 0.6733
-------------+---------------------------------- Adj R-squared = 0.6593
Total | 2443.45946 73 33.4720474 Root MSE = 3.3767
------------------------------------------------------------------------------
mpg | Coef. Std. Err. t P>|t| Beta
-------------+----------------------------------------------------------------
length | -0.083 0.055 -1.51 0.136 -0.318
weight | -0.004 0.002 -2.73 0.008 -0.586
foreign | -1.708 1.067 -1.60 0.114 -0.136
_cons | 50.537 6.246 8.09 0.000 .
------------------------------------------------------------------------------
. est store m0
.
. *-手动
. center mpg len wei foreign, standardize inplace // 可以简写为 s inplace
. regress mpg len wei foreign
Source | SS df MS Number of obs = 74
-------------+---------------------------------- F(3, 70) = 48.10
Model | 49.1541155 3 16.3847052 Prob > F = 0.0000
Residual | 23.845884 70 .340655486 R-squared = 0.6733
-------------+---------------------------------- Adj R-squared = 0.6593
Total | 72.9999996 73 .999999994 Root MSE = .58366
------------------------------------------------------------------------------
mpg | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
length | -0.318 0.211 -1.51 0.136 -0.739 0.102
weight | -0.586 0.215 -2.73 0.008 -1.015 -0.157
foreign | -0.136 0.085 -1.60 0.114 -0.305 0.033
_cons | -0.000 0.068 -0.00 1.000 -0.135 0.135
------------------------------------------------------------------------------
. est store msd
.
. *-第一个变量的相对重要性
.
. *-原始数据
. dis "% y's Std. Dev. of x_1 = " -0.318/5.785503
% y's Std. Dev. of x_1 = -.05496497
.
. *-百分比形式
. dis "% y's Std. Dev. of x_1 = " %6.2f _b[len]/$sd_y *100 "%"
% y's Std. Dev. of x_1 = -5.50%
参见 R2分解:相对重要性分析 (Dominance Analysis)。
连享会-直播课 上线了!
http://lianxh.duanshu.com
免费公开课:
直击面板数据模型 - 连玉君,时长:1小时40分钟 Stata 33 讲 - 连玉君, 每讲 15 分钟. 部分直播课 课程资料下载 (PPT,dofiles等)
支持回看,所有课程可以随时购买观看。
专题 | 嘉宾 | 直播/回看视频 |
---|---|---|
⭐ 最新专题 ⭐ | DSGE, 因果推断, 空间计量等 | |
⭕ Stata数据清洗 | 游万海 | 直播, 2 小时,已上线 |
研究设计 | 连玉君 | 我的特斯拉-实证研究设计,-幻灯片- |
面板模型 | 连玉君 | 动态面板模型,-幻灯片- |
面板模型 | 连玉君 | 直击面板数据模型 [免费公开课,2小时] |
Note: 部分课程的资料,PPT 等可以前往 连享会-直播课 主页查看,下载。
关于我们
课程, 直播, 视频, 客服, 模型设定, 研究设计, stata, plus, 绘图, 编程, 面板, 论文重现, 可视化, RDD, DID, PSM, 合成控制法
等
连享会小程序:扫一扫,看推文,看视频……
扫码加入连享会微信群,提问交流更方便
✏ 连享会学习群-常见问题解答汇总:
✨ https://gitee.com/arlionn/WD