如何比较解释变量的系数相对大小?

发布时间:2020-03-08 阅读 11134

Stata 连享会   主页 || 视频 || 推文

温馨提示: 定期 清理浏览器缓存,可以获得最佳浏览体验。

课程详情 https://gitee.com/arlionn/Course   |   lianxh.cn

课程主页 https://gitee.com/arlionn/Course

作者:连玉君 (中山大学)
E-Mail: arlionn@163.com

编者按: 这篇文章源自一个知乎问题:研究两个变量对另一变量的影响程度哪个显著,应该用什么模型?

就我目前看到的资料,实证分析中主要有两种方法:

  • 标准化系数法
  • R2 分解法

A. 标准化系数法

在 Flannery and Rangan (2006,PDF) 文中 Table 5 Panel B 中,作者采用了这种方法对比了三种资本结构理论的相对重要性。详情参见

标准化系数

所谓标准化系数,就是对每一个变量都减掉均值除以对应的标准差。本质上是一个去除量纲的操作。例如,对于面板数据模型而言,我们可以采用如下方式进行标准化:

其中,y~it=yity¯is.d.(yit)

  • β~ 的含义:x 变动一个标准差,y 变动 β~ 个标准差

各个解释变量相对重要性衡量

先设定一个包含两个变量的线性模型,假设所有变量都已经做了标准化处理:

y~=x~1β~1+x~2β~2+ε~

此时,β~1 的含义是:x1 变动一个标准差,y 变动 β~1 个标准差。

  • x1 的相对重要性 (或曰「x1 对 y 的影响程度」) 可以定义为:C1=β~1/s.d(y)= 「% y's Std. Dev. of x1
  • 假设被解释变量的标准差为 s.d(y)=2β~1=0.5β~2=0.8,则 C1=25%C2=40%。相较而言,x2 对 y 的影响更大一些。
  • 评价: 虽然在本例中,β~1 和 β~2 都小于 s.d(y),但在有些情况下,可能出现 tildeβj>s.d(y),此时的 Cj>1。这类似于金融中的 Beta 系数,它可能小于零,也可能大于 1。简言之,这种方法能对比变量的相对重要性,但无法对 y 的总方差进行分解。此外,对于离散型 y 或 x 而言,此法未必适用。

Stata 范例

用 Stata 自带的 auto.dta 数据集进行演示:

sysuse "auto.dta", clear
sum mpg
global sd_y = r(sd)  //被解释变量的标准差
dis "s.d.(mpg) = " r(sd)

reg mpg len wei foreign, beta      //标准化系数
est store m0

*-手动
center  mpg len wei foreign, standardize inplace  // 可以简写为 s inplace
regress mpg len wei foreign
est store msd 

*-第一个变量的相对重要性

*-原始数据
dis "% y's Std. Dev. of x_1 = " -0.318/5.785503

*-百分比形式
dis "% y's Std. Dev. of x_1 = " %6.2f _b[len]/$sd_y *100 "%"

对应结果如下:

. sysuse "auto.dta", clear
(1978 Automobile Data)

. sum mpg

    Variable |        Obs        Mean    Std. Dev.       Min        Max
-------------+---------------------------------------------------------
         mpg |         74     21.2973    5.785503         12         41

. global sd_y = r(sd)  //被解释变量的标准差

. dis "s.d.(mpg) = " r(sd)
s.d.(mpg) = 5.7855032

. 
. reg mpg len wei foreign, beta      //标准化系数

      Source |       SS           df       MS      Number of obs   =        74
-------------+----------------------------------   F(3, 70)        =     48.10
       Model |   1645.2889         3  548.429632   Prob > F        =    0.0000
    Residual |  798.170563        70  11.4024366   R-squared       =    0.6733
-------------+----------------------------------   Adj R-squared   =    0.6593
       Total |  2443.45946        73  33.4720474   Root MSE        =    3.3767

------------------------------------------------------------------------------
         mpg |      Coef.   Std. Err.      t    P>|t|                     Beta
-------------+----------------------------------------------------------------
      length |     -0.083      0.055    -1.51   0.136                   -0.318
      weight |     -0.004      0.002    -2.73   0.008                   -0.586
     foreign |     -1.708      1.067    -1.60   0.114                   -0.136
       _cons |     50.537      6.246     8.09   0.000                        .
------------------------------------------------------------------------------

. est store m0

. 
. *-手动
. center  mpg len wei foreign, standardize inplace  // 可以简写为 s inplace

. regress mpg len wei foreign

      Source |       SS           df       MS      Number of obs   =        74
-------------+----------------------------------   F(3, 70)        =     48.10
       Model |  49.1541155         3  16.3847052   Prob > F        =    0.0000
    Residual |   23.845884        70  .340655486   R-squared       =    0.6733
-------------+----------------------------------   Adj R-squared   =    0.6593
       Total |  72.9999996        73  .999999994   Root MSE        =    .58366

------------------------------------------------------------------------------
         mpg |      Coef.   Std. Err.      t    P>|t|     [95% Conf. Interval]
-------------+----------------------------------------------------------------
      length |     -0.318      0.211    -1.51   0.136       -0.739       0.102
      weight |     -0.586      0.215    -2.73   0.008       -1.015      -0.157
     foreign |     -0.136      0.085    -1.60   0.114       -0.305       0.033
       _cons |     -0.000      0.068    -0.00   1.000       -0.135       0.135
------------------------------------------------------------------------------

. est store msd 

. 
. *-第一个变量的相对重要性
. 
. *-原始数据
. dis "% y's Std. Dev. of x_1 = " -0.318/5.785503
% y's Std. Dev. of x_1 = -.05496497

. 
. *-百分比形式
. dis "% y's Std. Dev. of x_1 = " %6.2f _b[len]/$sd_y *100 "%"
% y's Std. Dev. of x_1 =  -5.50%

B. R2 分解法

参见 R2分解:相对重要性分析 (Dominance Analysis)

相关课程

连享会-直播课 上线了!
http://lianxh.duanshu.com

免费公开课:


课程一览

支持回看,所有课程可以随时购买观看。

专题 嘉宾 直播/回看视频
最新专题 DSGE, 因果推断, 空间计量等
Stata数据清洗 游万海 直播, 2 小时,已上线
研究设计 连玉君 我的特斯拉-实证研究设计-幻灯片-
面板模型 连玉君 动态面板模型-幻灯片-
面板模型 连玉君 直击面板数据模型 [免费公开课,2小时]

Note: 部分课程的资料,PPT 等可以前往 连享会-直播课 主页查看,下载。


关于我们

  • Stata连享会 由中山大学连玉君老师团队创办,定期分享实证分析经验。直播间 有很多视频课程,可以随时观看。
  • 连享会-主页知乎专栏,300+ 推文,实证分析不再抓狂。
  • 公众号推文分类: 计量专题 | 分类推文 | 资源工具。推文分成 内生性 | 空间计量 | 时序面板 | 结果输出 | 交乘调节 五类,主流方法介绍一目了然:DID, RDD, IV, GMM, FE, Probit 等。
  • 公众号关键词搜索/回复 功能已经上线。大家可以在公众号左下角点击键盘图标,输入简要关键词,以便快速呈现历史推文,获取工具软件和数据下载。常见关键词:课程, 直播, 视频, 客服, 模型设定, 研究设计, stata, plus, 绘图, 编程, 面板, 论文重现, 可视化, RDD, DID, PSM, 合成控制法

连享会主页  lianxh.cn
连享会主页 lianxh.cn

连享会小程序:扫一扫,看推文,看视频……

扫码加入连享会微信群,提问交流更方便

✏ 连享会学习群-常见问题解答汇总:
https://gitee.com/arlionn/WD