调节变量与中介变量介绍

发布时间:2023-04-28 阅读 2095

Stata连享会   主页 || 视频 || 推文 || 知乎 || Bilibili 站

温馨提示: 定期 清理浏览器缓存,可以获得最佳浏览体验。

New! lianxh 命令发布了:
随时搜索推文、Stata 资源。安装:
. ssc install lianxh
详情参见帮助文件 (有惊喜):
. help lianxh
连享会新命令:cnssc, ihelp, rdbalance, gitee, installpkg

课程详情 https://gitee.com/lianxh/Course

课程主页 https://gitee.com/lianxh/Course

⛳ Stata 系列推文:

PDF下载 - 推文合集

作者:赵雨鑫 (吉林大学)
邮箱2471814525@qq.com


目录


1. 调节变量

1.1 调节变量的意义

调节变量所解释的不是关系内部的机制,而是一个关系在不同的条件下是否会有所变化。调节变量的一个主要作用是为现有的理论划出限制条件和适用范围。因此,在研究调节变量时,我们正是通过研究一组关系在不同条件下的变化及其背后的原因,来丰富原有的理论。

1.2 调节变量的原理

什么是调节变量?简单来说,如果变量 X 与变量 Y 有关系,但是 X 与 Y 的关系受第三个变量 Z 的影响,那么变量 Z 就是调节变量。调节变量所起的作用称为调节作用。

例如,当研究工作与家庭的冲突对职业满意度的影响时,普遍认为工作与家庭冲突越大,职业满意度应该是越差的。Martins 等 (2002) 在这个基础上考虑了性别,结果发现:对于女性来说,这个关系在任何年龄段都显著;但是对于男性来说,这个关系仅在职业生涯后期才成立,也就是男性年轻的时候,工作与家庭的冲突对职业满意度不会有影响。

在这个研究中,性别就是一个调节变量,因为对于不同性别的群体 (调节变量) ,工作与家庭的冲突 (自变量) 和职业满意度 (因变量) 之间的关系也不同。

好的调节变量本身应该比较稳定,或者其变动是外生的,不受 X 和 Y 的影响。

当研究中有调节变量时,在研究假设中一定要说清楚,到底这个调节变量的作用是什么、具体如何影响变量的关系。研究假设的提出应该尽量准确,我们不应该笼统地假设“Z 在 X 与 Y 的关系中起到了调节作用”,应该具体说明 Z 是如何调节 X 和 Y 的关系的。例如“当 Z 高的时候,X 对 Y 会有正面的影响;当 Z 低的时候,X 会对 Y 有负面的影响”。

1.3 检验调节的方法

检验调节变量最普遍的方法是多元调节回归分析 (moderated multiple regression,MMR),具体步骤如下:

1.3.1 用虚拟变量代表类别变量

如果自变量或调节变量中有一个是类别变量,那么第一步首先是将类别变量转换为虚拟变量。所需的虚拟变量的数目等于类别变量的水平个数减 1。研究者可以根据不同的研究问题选择不同的编码方法。

1.3.2 对连续变量进行中心化或标准化

用回归的方法检验调节变量的一个重要步骤就是把自变量和调节变量中的连续变量进行整理。一些统计学家建议把这些变量进行中心化,即用这个变量中的每个数据点减去均值,使得新得到的数据样本均值为 0。

这是因为预测变量和调节变量往往与他们的乘积项高度相关。中心化的目的是减小回归方程中变量间多重共线性的问题。当然,也可以对连续型的自变量和调节变量进行标准化 (如使用 Z 分数),作用基本相同。

1.3.3 构造乘积项

构造乘积变量时,只需要把经过编码或中心化 (或标准化) 处理以后的自变量和调节变量相乘即可。

注:Xc 和 Mc 表示经过中心化处理后的变量。

如果使用了虚拟变量,那么每一个虚拟变量都应该有一个相应的乘积变量。比如,如果用一个虚拟变量表示包含两个水平的一个类别变量,那么就有一个乘积项;如果用两个虚拟变量表示包含三个水平的一个类别变量,那么就有两个乘积项)。

1.3.4 构造方程

构造出乘积项后,把自变量、因变量 (这里要使用未中心化的自变量和因变量) 和乘积项都放到多元回归方程中就可以检验交互作用了。这时,我们最关注的是乘积项的系数是否显著。如果显著,就可以说明调节作用的存在了。

需要指出的是,既然检验调节作用的时候,只需要看乘积项就可以了,那么为何回归方程中还要有前面“主效应”的项目呢?主要原因是在回归方程中凡是有二阶变量的话,所有的一阶变量都应该被包括。

1.4 调节效应的现状

调节效应分析的使用比较普遍,调节效应分析几乎成为国内经济学经验研究的必要步骤。但是江艇 (2022) 对国内经济学领域一些权威期刊最近几年所刊发论文进行研究发现,这一研究实践尚存在如下几个问题:

  • 大多数文章没有把调节效应分析,或者说机制检验,提高到强化因果关系论证的高度。
  • 没有明确分析当前的研究方法仍受制于何种因果识别的威胁,而特定的机制检验在何种意义上能够缓解这一威胁。
  • 很多文章同时包含机制检验和异质性分析两部分,此时异质性分析的目的并不明确,很多时候只是为做而做,而没有进一步分析这种异质性出现的原因。即使稍有着墨,也往往是用现象解释现象,更谈不上讨论这种异质性如何服务于因果识别。甚至会出现两组异质性结果的理论解释互相冲突,无法自洽。
  • 有一些调节变量存在明显的内生性问题,受到 X 或 Y 的直接影响,此时不但难以解释调节效应,而且存在估计偏误。

1.5 调节效应的建议

关于调节效应分析,江艇 (2022) 提出了一些建议:

  • 将因果关系的作用机制检验视为因果识别的重要手段,尽量正式地讨论其如何有助于强化对文章主题 (从 X 到 Y 的因果关系)的论证;
  • 在研究设计部分详细阐述调节变量与调节效应的理论依据,而不是等到报告实证结果时再附会解释。
  • 直观地展示调节效应,讨论其数值大小在经济上的重要性。

2. 中介变量

2.1 中介变量的意义

一般来说,当一个变量能够解释自变量和因变量之间的关系时,我们就认为它起到了中介作用。因此,研究中介作用的目的是在我们已知某些关系的基础上,探索这个关系产生的内部作用机制。中介变量在理论上至少有以下两个重要的意义:

  • 中介变量整合已有的理论或研究;
  • 中介变量解释关系背后的作用机制。

2.2 中介变量的原理

简单地说,凡是 X 影响 Y,并且 X 是通过一个中间的变量 M 对 Y 产生影响的,M 就是中介变量。中介变量可以用来解释现象,在研究中起着非常重要的角色。中介变量可以分为两类:

  • 完全中介 (full mediation);
  • 部分中介 (partial mediation)。

完全中介就是 X 对 Y 的影响完全通过 M,即没有 M 的作用,X 就不会影响 Y;部分中介就是 X 对 Y 的影响部分是直接的,部分是透过 M 的。可以用如下结构模型来刻画:

其中,(3) 式表示 X 对 Y 有因果影响;(5) 式表示 X 对 M 有因果影响;(4) 式一方面表示 M 对 Y 有因果影响,从而建立起 XMY 的因果链条,另一方面表示在 M 之外,X 还可能独立影响 Y

2.3 检验中介的方法

从上面介绍的中介作用的概念中,我们可以看到两个关键:

  • X 和 Y 之间存在因果关系;
  • M 是这个因果关系中间的媒介,M 受到 X 的影响后,再影响 Y,因此传递了 X 的作用。

这个过程并不复杂,我们现有的检验中介作用的方法正是通过验证这几个因果关系来实现的。最常用也是最传统的检验中介变量的方法,是 Baron 和 Kenny (1986) 的方法,如果仅仅简单从数据关系上来讲是三部曲:

  • 自变量影响因变量;
  • 自变量影响中介变量;
  • 控制中介变量后,自变量对因变量的作用消失了,或是明显地减小了。

具体表现为,如果一个变量满足以下条件,我们就说它起到了中介变量的作用:

  • 自变量的变化能够显著地解释因变量的变化;
  • 自变量的变化能显著地解释中介变量的变化;
  • 控制中介变量后,自变量对因变量的影响应等于零,或者显著降低,同时中介变量显著影响因变量。

2.4 中介效应的现状

在经济学因果推断经验研究中使用中介效应检验是国内学术界一种独特的现象。关于中介变量的验证,存在很多争议。无论用什么方法检验中介变量,都存在一个同样的问题,即一个同样的统计结果背后存在着很多个可能的模型。因为存在等同模型,所以假如仅仅从数据的统计关系上就推导出中介作用的模型,我们很容易会被数据蒙骗。建立变量之间的因果关系是排除其他等同模型的唯一方法。

温忠麟等 (2004) 明确指出,在中介效应检验中,因变量和自变量之间的关系不一定是因果关系,而可能只是相关关系。中介效应检验不能验证因果关系,中介效应模型的因果关系都要有理有据。在研究中需要依赖以下方法来验证因果关系:

  • 首先就一定要有理论基础,成熟理论的作用是帮助我们建立可信的因果关系,这比根据逻辑推演随意建立的因果关系要更为可靠;
  • 其次才是用统计检验的方法看数据是否与我们的假设模型相匹配,这样才能减少我们犯错误的可能性。

所以,研究中不能从统计检验结果推到理论,而要先有理论,然后用统计工具来检验理论。统计方法只能用来检验所假设的模型,不能用来反推模型。

但是国内经济学经验研究中进行中介效应检验时,多数似乎并没有听从这样的忠告。通过对国内某权威期刊近两年发表的文章统计,江艇 (2022) 指出:

  • 近半数的文章没有进行中介效应检验,只是分别估计了 (3) 和 (5) 式;
  • 超过半数的文章或多或少地进行了中介效应检验;
  • 绝大多数文章使用 Baron 和 Kenny (1986) 逐步法进行分析,有的文章运用有误,所有文章都没有讨论中介变量 M 在 (4) 式中可能存在的内生性问题。

2.5 中介效应的建议

关于中介效应分析,江艇 (2022) 提出了一些操作建议:

  • 一是停止使用中介效应的逐步法检验,把研究的重心重新聚焦到如何提高 X 对 Y 的因果关系的识别可信度。
  • 二是根据经济学理论,提出一个或几个能够反映 X 对 Y 的作用渠道的中介变量 MM 对 Y 的影响应该是直接而显然的,采用和第一条中同样的方法识别 x 对 M 的因果关系。
  • 三是尽量避免提出与 Y 的因果关系不明显、因果链条过长或者明显受到 Y 反向影响的中介变量 M
  • 四是在绝大多数时候,做好前两条就足够了。如果要考察 X 对 Y 的效应在多大程度上可以被 M 这一作用渠道所捕捉,可以尝试在 Y 对 X 的回归中控制 M,但必须先弄清楚这种考察对理解 X 对 Y 的因果关系有何帮助,并审慎解释回归结果。如有可能,尽量论证这一结果受到 M 的潜在内生性的影响是有限的。当存在多个 M 时,尤其要谨慎采用这种做法。

3. 结语

管理理论日趋复杂,过往的管理知识往往是自变量与因变量的单一关系,现在很多管理的模型都包括中介变量和调节变量。中介效应分析和调节效应分析作为社会科学工作者积极探索和深入理解因果关系的重要研究手段,本就是应规范性要求而生的,但由于社会科学的因果问题特别复杂,研究实践的初衷和最终呈现效果之间难免存在一定的错位。

中介效应分析的问题在于方法使用过度,研究者需要充分认识中介效应逐步法检验的局限性,小心从事因果识别。调节效应分析的问题在于方法发挥不足,研究者需要充分认识调节效应分析对于夯实因果识别的重要意义,大胆进行因果论证。

我们希望强调的是,统计工具日新月异,研究人员必须坚持所用的统计方法都只是我们的工具。更重要的是理论的基础和严谨的科学态度。这样才可以好好地利用这些工具来帮助我们发展崭新的、实用的管理科学模型。

4. 相关推文

Note:产生如下推文列表的 Stata 命令为:
lianxh 中介 调节, m
安装最新版 lianxh 命令:
ssc install lianxh, replace

相关课程

免费公开课

最新课程-直播课

专题 嘉宾 直播/回看视频
最新专题 文本分析、机器学习、效率专题、生存分析等
研究设计 连玉君 我的特斯拉-实证研究设计-幻灯片-
面板模型 连玉君 动态面板模型-幻灯片-
面板模型 连玉君 直击面板数据模型 [免费公开课,2小时]
  • Note: 部分课程的资料,PPT 等可以前往 连享会-直播课 主页查看,下载。

课程主页

课程主页

关于我们

  • Stata连享会 由中山大学连玉君老师团队创办,定期分享实证分析经验。
  • 连享会-主页知乎专栏,700+ 推文,实证分析不再抓狂。直播间 有很多视频课程,可以随时观看。
  • 公众号关键词搜索/回复 功能已经上线。大家可以在公众号左下角点击键盘图标,输入简要关键词,以便快速呈现历史推文,获取工具软件和数据下载。常见关键词:课程, 直播, 视频, 客服, 模型设定, 研究设计, stata, plus, 绘图, 编程, 面板, 论文重现, 可视化, RDD, DID, PSM, 合成控制法

连享会小程序:扫一扫,看推文,看视频……

扫码加入连享会微信群,提问交流更方便

✏ 连享会-常见问题解答:
https://gitee.com/lianxh/Course/wikis

New! lianxhsongbl 命令发布了:
随时搜索连享会推文、Stata 资源,安装命令如下:
. ssc install lianxh
使用详情参见帮助文件 (有惊喜):
. help lianxh