如何比较解释变量的系数相对大小?
2020-03-07
连玉君
15739

连享会   主页 || 推文 || 知乎 || B 站 || 在线课堂

New! 搜推文,找资料,用 lianxh 命令:
安装: ssc install lianxh, replace
使用: lianxh 合成控制
       lianxh DID + 多期, w


作者:连玉君 (中山大学)
E-Mail: arlionn@163.com

编者按: 这篇文章源自一个知乎问题:研究两个变量对另一变量的影响程度哪个显著,应该用什么模型?

就我目前看到的资料,实证分析中主要有两种方法:

  • 标准化系数法
  • R2R^2 分解法

A. 标准化系数法

在 Flannery and Rangan (2006,PDF) 文中 Table 5 Panel B 中,作者采用了这种方法对比了三种资本结构理论的相对重要性。详情参见

标准化系数

所谓标准化系数,就是对每一个变量都减掉均值除以对应的标准差。本质上是一个去除量纲的操作。例如,对于面板数据模型而言,我们可以采用如下方式进行标准化:

yit=xitβ+εit  y~it=x~itβ~+ε~ity_{it} = x_{it} \beta + \varepsilon_{it}\ \rightarrow \ \tilde{y}_{it}=\tilde{x}_{it}{\color{red}{\tilde{\beta}}} + \tilde{\varepsilon}_{it}

其中,y~it=yityˉis.d.(yit)\tilde{y}_{it} = \frac{y_{it}-\bar{y}_{i}}{s.d.(y_{it})}

  • β~\tilde{\beta} 的含义:xx 变动一个标准差,yy 变动 β~\tilde{\beta} 个标准差

各个解释变量相对重要性衡量

先设定一个包含两个变量的线性模型,假设所有变量都已经做了标准化处理:

y~=x~1β~1+x~2β~2+ε~\tilde{y} = \tilde{x}_{1} \tilde{\beta}_1 + \tilde{x}_{2} \tilde{\beta}_2+\tilde{\varepsilon}

此时,β~1\tilde{\beta}_1 的含义是:x1x_1 变动一个标准差,yy 变动 β~1\tilde{\beta}_1 个标准差。

  • x1x_1 的相对重要性 (或曰「x1x_1yy 的影响程度」) 可以定义为:C1=β~1/s.d(y)=C_1= \tilde{\beta}_{1}/s.d(y) = 「% yy's Std. Dev. of x1x_1
  • 假设被解释变量的标准差为 s.d(y)=2s.d(y) = 2β~1=0.5\tilde{\beta}_1=0.5β~2=0.8\tilde{\beta}_2=0.8,则 C1=25%C_1 = 25\%C2=40%C_2 = 40\%。相较而言,x2x_2yy 的影响更大一些。
  • 评价: 虽然在本例中,β~1\tilde{\beta}_1β~2\tilde{\beta}_2 都小于 s.d(y)s.d(y),但在有些情况下,可能出现 tildeβj>s.d(y)tilde{\beta}_j>s.d(y),此时的 Cj>1C_j>1。这类似于金融中的 Beta 系数,它可能小于零,也可能大于 1。简言之,这种方法能对比变量的相对重要性,但无法对 yy 的总方差进行分解。此外,对于离散型 yyxx 而言,此法未必适用。

Stata 范例

用 Stata 自带的 auto.dta 数据集进行演示:

sysuse "auto.dta", clear
sum mpg
global sd_y = r(sd)  //被解释变量的标准差
dis "s.d.(mpg) = " r(sd)

reg mpg len wei foreign, beta      //标准化系数
est store m0

*-手动
center  mpg len wei foreign, standardize inplace  // 可以简写为 s inplace
regress mpg len wei foreign
est store msd 

*-第一个变量的相对重要性

*-原始数据
dis "% y's Std. Dev. of x_1 = " -0.318/5.785503

*-百分比形式
dis "% y's Std. Dev. of x_1 = " %6.2f _b[len]/$sd_y *100 "%"

对应结果如下:

. sysuse "auto.dta", clear
(1978 Automobile Data)

. sum mpg

    Variable |        Obs        Mean    Std. Dev.       Min        Max
-------------+---------------------------------------------------------
         mpg |         74     21.2973    5.785503         12         41

. global sd_y = r(sd)  //被解释变量的标准差

. dis "s.d.(mpg) = " r(sd)
s.d.(mpg) = 5.7855032

. 
. reg mpg len wei foreign, beta      //标准化系数

      Source |       SS           df       MS      Number of obs   =        74
-------------+----------------------------------   F(3, 70)        =     48.10
       Model |   1645.2889         3  548.429632   Prob > F        =    0.0000
    Residual |  798.170563        70  11.4024366   R-squared       =    0.6733
-------------+----------------------------------   Adj R-squared   =    0.6593
       Total |  2443.45946        73  33.4720474   Root MSE        =    3.3767

------------------------------------------------------------------------------
         mpg |      Coef.   Std. Err.      t    P>|t|                     Beta
-------------+----------------------------------------------------------------
      length |     -0.083      0.055    -1.51   0.136                   -0.318
      weight |     -0.004      0.002    -2.73   0.008                   -0.586
     foreign |     -1.708      1.067    -1.60   0.114                   -0.136
       _cons |     50.537      6.246     8.09   0.000                        .
------------------------------------------------------------------------------

. est store m0

. 
. *-手动
. center  mpg len wei foreign, standardize inplace  // 可以简写为 s inplace

. regress mpg len wei foreign

      Source |       SS           df       MS      Number of obs   =        74
-------------+----------------------------------   F(3, 70)        =     48.10
       Model |  49.1541155         3  16.3847052   Prob > F        =    0.0000
    Residual |   23.845884        70  .340655486   R-squared       =    0.6733
-------------+----------------------------------   Adj R-squared   =    0.6593
       Total |  72.9999996        73  .999999994   Root MSE        =    .58366

------------------------------------------------------------------------------
         mpg |      Coef.   Std. Err.      t    P>|t|     [95% Conf. Interval]
-------------+----------------------------------------------------------------
      length |     -0.318      0.211    -1.51   0.136       -0.739       0.102
      weight |     -0.586      0.215    -2.73   0.008       -1.015      -0.157
     foreign |     -0.136      0.085    -1.60   0.114       -0.305       0.033
       _cons |     -0.000      0.068    -0.00   1.000       -0.135       0.135
------------------------------------------------------------------------------

. est store msd 

. 
. *-第一个变量的相对重要性
. 
. *-原始数据
. dis "% y's Std. Dev. of x_1 = " -0.318/5.785503
% y's Std. Dev. of x_1 = -.05496497

. 
. *-百分比形式
. dis "% y's Std. Dev. of x_1 = " %6.2f _b[len]/$sd_y *100 "%"
% y's Std. Dev. of x_1 =  -5.50%

B. R2R^2 分解法

参见 R2分解:相对重要性分析 (Dominance Analysis)

资源共享


尊敬的老师 / 亲爱的同学们:
连享会致力于不断优化和丰富课程内容,以确保每位学员都能获得最有价值的学习体验。为了更精准地满足您的学习需求,我们诚挚地邀请您参与到我们的课程规划中来。
请您在下面的问卷中,分享您 感兴趣的学习主题或您希望深入了解的知识领域 。您的每一条建议都是我们宝贵的资源,将直接影响到我们课程的改进和创新。
我们期待您的反馈,因为您的参与和支持是我们不断前进的动力。感谢您抽出宝贵时间,与我们共同塑造更加精彩的学习旅程!https://www.wjx.cn/vm/YgPfdsJ.aspx# 再次感谢大家宝贵的意见!


关于我们

  • Stata连享会 由中山大学连玉君老师团队创办,定期分享实证分析经验。more……
  • 扫码加入连享会微信群,提问交流更方便

两种方法:标准化系数法,R2分解。

最新课程推荐:

课程一:结构模型 · 2025 · 现场班

课程二:连享会 · 面板数据因果推断

FAQ往期课程板书和答疑文档

选题征集,点击 此处 或者扫码填写问卷留下您的宝贵意见,感谢!


NEW!视频课堂lianxh-class.cn

⚡ 新版 lianxh 命令:使用说明
. ssc install lianxh, replace
. lianxh 多期DID

ihelp:帮助文件 PDF 版
. ssc install ihelp, replace
. ihelp xtreg


lianxh_cn_saoma

连玉君 · Stata 33 讲 - 免费
  o 点击观看dofile 下载, --Book--