Stata连享会 主页 || 视频 || 推文 || 知乎 || Bilibili 站
温馨提示: 定期 清理浏览器缓存,可以获得最佳浏览体验。
New!
lianxh
命令发布了:
随时搜索推文、Stata 资源。安装:
. ssc install lianxh
详情参见帮助文件 (有惊喜):
. help lianxh
连享会新命令:cnssc
,ihelp
,rdbalance
,gitee
,installpkg
⛳ Stata 系列推文:
作者:陈炜 (中山大学)
邮箱:1139457876@qq.com
目录
在进行研究的过程中,有时自变量
国内学者在研究中介效应的时候往往会参考温忠麟和叶宝娟在 2014 年写的《中介效应分析:方法和模型发展》一文,该文章提出了逐步回归法、系数乘积法 (Sobel 检验)、差异系数法、Bootstrapping 检验法四种中介效应检验方法。文章自身引用量也破万,成为中介效应学习与研究的重要参考。
我们对一般的连续变量进行中介效应的分析是检验假设
上述的方法对一般连续变量是有效的。但是如果因变量是分类或者等级变量等非连续变量,而自变量是连续变量,应该用 Logistic 回归代替通常的线性回归,回归系数的尺度也将由连续变量量尺转换为 Logit 量尺。
但是,这样一来,中介变量
对于这样的模型,目前学者已提出多个解决方法:
除上述方法之外,还有学者提出 KHB 方法,即本文介绍重点。KHB 方法与上述方法相比往往有相同或者更好的结果 (这里的结果是指
在这一部分,为了更好的理解 KHB 方法的原理,会将一般方法与 KHB 方法进行对照,再说明 KHB 方法使用原因的同时说明其原理。
定义:
常规方法对于连续变量中介效应检验分以下几步走:
对二元响应模型而言,由于因变量
如果我们设定其为二元 Logit 模型,那么基础系数的估计结果为
这样一来,类似
KHB 方法对于连续变量中介效应检验分以下几步走:
这个式子中有几点需要说明:
根据以上三点可以计算出式 (5)。
回归尺度问题:线性回归中回归
在显著性检验中分以下两种情况。
一个关键变量和一个中介变量:此时,我们需要检验假设
若想使
然后基于上述观察,推导出基于 delta 方法 (Sobel 1982) 的间接效应的检验统计量:
其中
多个关键变量和多个中介变量:这是一种更加常规的情况,包含了上面提及的简单情况。我们设定
我们假设第
其中
* 命令安装
ssc install khb, replace
* 命令语法
khb model-type depvar key-vars || z-vars [if] [in] [weight] [ , options ]
其中,
model-type
:模型类型,如 reg
、logit
、probit
等;depvar
:因变量;key-vars
:自变量,可以有因子变量;z-vars
:中介变量,可以有因子变量;options
包括:
concomitant(varlist)
指定控制变量,允许因子变量;disentangle
向程序请求一个表,该表显示每个控制变量提供的完整模型 (总效应) 和简化模型 (直接效应) 之间的差异;summary
请求所有自变量的分解情况,默认情况下 khb
报告完整模型和简化模型的效果、它们的差异以及它们的标准误。由于未能找到 U. Kohler, K. B. Karlson, and A. Holm (2011) 中所用的实操数据,因此用了另一套数据来进行本部分的数据实操。以下数据回归实操是为了通过实操让读者更好地了解 KHB 法的用处,并未考虑是否有学术文献支撑以及学术研究价值。该数据为 Long and Freese (2006) 提供的范例数据 nomocc2.dta。
. lxhuse ordwarm2.dta, clear
. * 数据处理,将非连续变量转化为数字
. gen W=string(warm)
. destring W, gen(W1)
. gen white1=string(white)
. destring white1, gen(white2)
猜测年龄会对态度有所影响,且这种影响可能会通过受教育程度 (以受教育年限衡量) 影响人们的态度。中介变量通过 ||
与自变量隔开,concomitant()
中加入控制变量,在这里控制了性别及研究年份。
. khb mlogit W1 age || ed, concomitant(male yr89)
Decomposition using the KHB-Method
Model-Type: mlogit Number of obs = 2293
Variables of Interest: age Pseudo R2 = 0.06
Z-variable(s): ed
Concomitant: male yr89
Results for outcome 1 and base outcome 3
-----------------------------------------------------
W1 | Coeff SE z P>|z| [95% CI]
-------------+---------------------------------------
age |
Reduced | 0.031 0.004 7.55 0.000 0.023 0.040
Full | 0.025 0.004 5.80 0.000 0.017 0.034
Diff | 0.006 0.001 4.54 0.000 0.003 0.009
-----------------------------------------------------
KHB 方法确保在相同尺度上测量所呈现出来的系数,但是有时 Logit 系数的大小很难解释。Karlson, Holm, and Breen (2010) 提出了由式 (6) 和式 (7) 定义的比率和百分比来克服这些问题,而且这两个指标都可以通过一条 Stata 命令实现。
. khb mlogit W1 age || ed,concomitant(male yr89) summary notable
Decomposition using the KHB-Method
Model-Type: mlogit Number of obs = 2293
Variables of Interest: age Pseudo R2 = 0.06
Z-variable(s): ed
Concomitant: male yr89
Results for outcome 1 and base outcome 3
Summary of confounding
Variable | Conf_ratio Conf_Pct Resc_Fact
-------------+-------------------------------------
age | 1.2382813 19.24 .98449812
---------------------------------------------------
通过结果可以看出,总效应比直接效应大了 1.2 倍,总效应的 19% 是因为教育年限。
实际应用中,有无
. khb mlogit W1 age || ed,concomitant(male yr89) ape summary
Decomposition using the APE-Method
Model-Type: mlogit Number of obs = 2293
Variables of Interest: age Pseudo R2 = 0.06
Z-variable(s): ed
Concomitant: male yr89
Results for outcome 1 and base outcome 3
-----------------------------------------------------
W1 | Coeff SE z P>|z| [95% CI]
-------------+---------------------------------------
age |
Reduced | 0.002 0.000 6.23 0.000 0.002 0.003
Full | 0.002 0.000 4.48 0.000 0.001 0.003
Diff | 0.001 . . . . .
-----------------------------------------------------
Note: Standard errors of difference not known for APE method
Summary of confounding
Variable | Conf_ratio Conf_Pct Dist_Sens
-------------+-------------------------------------
age | 1.3007402 23.12 .9571126
---------------------------------------------------
平均而言,由于年龄发生标准差变化,态度向好发展的概率增加了 0.2%,在控制教育年限后,这一概率基本不变,也就是说,教育年限的提升并不会导致人们态度向好或向差方向发展。
如果有一个以上的中介变量,disentangle
选项能帮助回答哪一个中介变量影响更大的问题。该选项会通过制表显示每个中介变量的贡献。
. khb mlogit W1 age || ed male yr89, summary disentangle notable
Decomposition using the KHB-Method
Model-Type: mlogit Number of obs = 2293
Variables of Interest: age Pseudo R2 = 0.06
Z-variable(s): ed male yr89
Results for outcome 1 and base outcome 3
Summary of confounding
Variable | Conf_ratio Conf_Pct Resc_Fact
-------------+-------------------------------------
age | 1.2064567 17.11 1.0421457
---------------------------------------------------
Components of Difference
Z-Variable | Coef Std_Err P_Diff P_Reduced
-------------+---------------------------------------------
age |
ed | .0060526 .0013359 115.30 19.73
male | -.0005025 .0002982 -9.57 -1.64
yr89 | -.0003009 .0006816 -5.73 -0.98
-----------------------------------------------------------
分解表的前两列显示了每种中介变量的效应差异及其标准误。第一列值的总和为 0.005,这是间接效应的总和,第三列标识各种中介变量对间接效应的贡献。最后一列显示总效应的多少是由于各自中介变量的混杂引起的,总计 17.1,即总体混杂百分比。
我们将要分解的变量定义为关键变量。一个命令里可以存在一个关键变量,亦可存在多个。在这种情况下,我们希望能通过一个命令分解每个关键变量。下面,我们将对性别和职业声望进行分解,以年龄和研究年份为控制变量。
. khb mlogit W1 male prst || ed, concomitant(age yr89) summary
Decomposition using the KHB-Method
Model-Type: mlogit Number of obs = 2293
Variables of Interest: male prst Pseudo R2 = 0.06
Z-variable(s): ed
Concomitant: age yr89
Results for outcome 1 and base outcome 3
------------------------------------------------------
W1 | Coeff SE z P>|z| [95% CI]
-------------+----------------------------------------
male |
Reduced | 0.366 0.141 2.60 0.009 0.090 0.642
Full | 0.365 0.141 2.59 0.010 0.088 0.641
Diff | 0.001 0.011 0.11 0.910 -0.020 0.022
-------------+----------------------------------------
prst |
Reduced |-0.014 0.005 -2.75 0.006 -0.024 -0.004
Full |-0.001 0.006 -0.21 0.831 -0.013 0.011
Diff |-0.013 0.011 -1.13 0.259 -0.034 0.009
------------------------------------------------------
Summary of confounding
Variable | Conf_ratio Conf_Pct Resc_Fact
-------------+-------------------------------------
male | 1.0032987 0.33 .94421228
prst | 10.616178 90.58 .96294939
---------------------------------------------------
通过上述结果可以发现,职业声望的影响受教育年限的影响比性别影响受教育影响程度大。
KHB 的其他用途至少还包括:
由于前几条为 KHB 法相较于原有方法更为显著的优点,且 nomocc2.dta 数据并不符合进行上述三点实操的条件,因此在此并没有详细阐述。
KHB 方法可以适用于多种情况,如上述提到的一个自变量和一个中介变量、多个自变量和多个中介变量。另外,中介效应的应用主要是在国内论文的心理学领域而非经济学领域。在国外顶刊论文中非常少,即使文章有使用也会进行调整。因此,虽然对中介效应的不断探索有助于我们不断在计量方面能有更加深入的认知,但是在经济学论文中使用中介效应仍需谨慎。
Note:产生如下推文列表的 Stata 命令为:
lianxh 中介效应, m
安装最新版lianxh
命令:
ssc install lianxh, replace
免费公开课
最新课程-直播课
专题 | 嘉宾 | 直播/回看视频 |
---|---|---|
⭐ 最新专题 | 文本分析、机器学习、效率专题、生存分析等 | |
研究设计 | 连玉君 | 我的特斯拉-实证研究设计,-幻灯片- |
面板模型 | 连玉君 | 动态面板模型,-幻灯片- |
面板模型 | 连玉君 | 直击面板数据模型 [免费公开课,2小时] |
⛳ 课程主页
⛳ 课程主页
关于我们
课程, 直播, 视频, 客服, 模型设定, 研究设计, stata, plus, 绘图, 编程, 面板, 论文重现, 可视化, RDD, DID, PSM, 合成控制法
等
连享会小程序:扫一扫,看推文,看视频……
扫码加入连享会微信群,提问交流更方便
✏ 连享会-常见问题解答:
✨ https://gitee.com/lianxh/Course/wikis
New!
lianxh
和songbl
命令发布了:
随时搜索连享会推文、Stata 资源,安装命令如下:
. ssc install lianxh
使用详情参见帮助文件 (有惊喜):
. help lianxh