中介效应:有序因果中介分析的半参数估计A-理论

发布时间:2023-03-17 阅读 1570

Stata连享会   主页 || 视频 || 推文 || 知乎 || Bilibili 站

温馨提示: 定期 清理浏览器缓存,可以获得最佳浏览体验。

New! lianxh 命令发布了:
随时搜索推文、Stata 资源。安装:
. ssc install lianxh
详情参见帮助文件 (有惊喜):
. help lianxh
连享会新命令:cnssc, ihelp, rdbalance, gitee, installpkg

课程详情 https://gitee.com/lianxh/Course

课程主页 https://gitee.com/lianxh/Course

⛳ Stata 系列推文:

PDF下载 - 推文合集

作者: 余坚 (贵州财经大学)
邮箱: yujiangeren@163.com

Source: Xiang Zhou, 2021, Semiparametric estimation for causal mediation analysis with multiple causally ordered mediators. Journal of the Royal Statistical Society: Series B (Statistical Methodology), 84(3), 794– 821. -Link--Data-


目录


1. 引言

因果中介分析旨在厘清一个处理变量影响一个结果变量的路径。大量新近出现的因果推断文献解决了因果机制的定义、识别和估计问题。这组研究使用潜在结果框架,提出了无需设定具体模型的直接和间接效应的定义,证明了非参数识别所需的假设,并开发了一系列输入,加权和多重稳健的估计方法。在此背景下,随着因果中介分析的研究方向从单一中介向多重中介深入,路径特定效应 (path-specific effects,PSEs) 逐渐引人关注。然而,目前大多数关于 PSEs 的文献都集中在两个中介的情况下,如何将以往研究中开发的估计方法推广到 K(1) 个因果有序中介的情况,仍然没有得到充分的探索。本文旨在弥补这一差距。

2. 符号、定义和识别

为便于说明,我们先从两个因果有序中介的情况开始,然后再讨论 K 个中介的一般设定。

2.1 两个因果有序中介的情况

2.1.1 定义PSEs

设 A 表示二元处理变量,Y 表示关注的结果变量,X 表示一组预处理的协变量向量。另外,设 M1 和 M2 表示两个因果有序中介,并假设 M1 在 M2 之前。我们允许这些中介是多元的,在这种情况下,组成变量之间的因果关系是不确定的。下图为这些变量之间关系的有向无环图 (directed acyclic graph, DAG) 。

在这个 DAG 中,从处理变量到结果变量存在四种可能的因果路径:

(a) A  Y; (b) A  M2  Y; (c) A  M1  Y; (d) A  M1  M2  Y

对 PSEs 进行正式定义需要对结果变量和中介变量使用潜在结果形式的符号。具体来说,设 Y(a,m1,m2) 表示处理状态为 a,中介值 M1 = m1 和 M2 = m2 时的潜在结果; M2(a,m1) 表示处理状态为 a,中介值 M1m1 时中介 M2 的潜在值;M1(a) 表示处理状态为 a 时中介 M1 的潜在值。

这一符号允许我们以 Y(a,m1,m2) 和 M2(a,m1) 的形式定义嵌套式反事实 (nested counterfactual) Y(a,M1(a1),M2(a2,M1(a12))) ,其中 aa1a2a12 都可以取 0 或 1。此外,如果我们让 Y(a) 表示当处理状态为a,中介 M1 和 M2 为处理状态 a 下自然值时 (即 M1(a) 和 M2(a,M1(a))) 的潜在结果,我们可以构建 Y(a) = Y(a,M1(a),M2(a,M1(a))))。这有时被称为 “构成” 假设。

根据上述符号,图中每条因果路径的 PSE 都可以通过八种不同方式进行定义,这取决于其他三条路径每条的处理变量 A 被选择的参考级别。例如,A 对 Y 的平均直接效应,即处理效应通过路径 A  Y 生效的部分,可以定义为

τAY(a1,a2,a12) = E[Y(1,M1(a1),M2(a2,M1(a12)))Y(0,M1(a1),M2(a2,M1(a12)))]

其中a1a2a12 都可以取 0 或 1。特别是在将中介 M1 和 M2 作为一个整体时,τAY(0,0,0) 对应自然直接效应 (natural direct effect, NDE) 或净直接效应 (pure direct effect, PDE)。

类似地,A  M2  Y, A  M1  YA  M1  M2  Y 的 PSEs 可以定义为

τAM2Y(a,a1,a12) = E[Y(a,M1(a1),M2(1,M1(a12)))Y(a,M1(a1),M2(0,M1(a12)))]

τAM1Y(a,a1,a12) = E[Y(a,M1(1),M2(a2,M1(a12)))Y(a,M1(0),M2(a2,M1(a12)))]

τAM1M2Y(a,a1,a2) = E[Y(a,M1(a1),M2(a2,M1(1)))Y(a,M1(a1),M2(a2,M1(0)))]

此外,如果我们使用 A  M1  Y 表示因果路径 A  M1  Y 和 A  M1  M2  Y ,则这一复合路径对应的 PSE 可定义为

τAM1Y(a,a2) = E[Y(a,M1(1),M2(a2,M1(1)))Y(a,M1(0),M2(a2,M1(0)))]

该量反映了处理效应通过 M1 生效的部分,无论它是否进一步作用于 M2τAM1Y(0,0) 常被称为自然间接效应 (natural indirect effect, NIE) 或纯粹间接效应 (pure indirect effect, PIE) 。τAM1Y(1,1) 常被称为总间接效应 (total indirect effect, TIE) 。根据定义,如果对应的期望潜在结果 Y(a,M1(a1),M2(a2,M1(a12))) 被识别了,则这些 PSEs 也将被识别。

2.1.2 识别PSEs

下面,我们回顾从观察性数据中识别这些期望潜在结果的假设。

根据 Pearl (2009) ,我们使用一个 DAG 来编译具有相互独立误差项的非参数结构方程模型 (nonparametric structural equation model, NPSEM) 。在这一框架中,从之前提出的图里的上半部分可以看到,任何处理 - 中介、处理 - 结果、中介 - 中介、中介 - 结果的关系中都没有未观察到的混淆因素。我们正式地引用以下假设。

假设 1  A 对 M1(A,M1) 对 M2(A,M1,M2) 对 Y 的一致性:

  • 对任一单位及任何 a,m1,m2 , 若 A=a 则 M1=M1(a) ; 若 A=a 且 M1=m1 则 M2=M2(a) ; 若 A=aM1=m1 且 M2=m2 则 Y=Y(a,m1,m2)

假设 2 处理变量和潜在结果变量之间的条件独立性:

  • 对任何 a,a1,a2,m1,m1,m2, 有 (M1(a1),M2(a2,m1),Y(a,m1,m2))A|X ;  (M2(a2,m1),Y(a,m1,m2))M1(a1)|X,AY(a,m1,m2)M2(a2,M1)|X,A,M1

假设 3 正值性:

  • 只要 pX(x)>0 , 则 pA|X(a|x)>ε>0 ; 只要 pX,M1(x,m1)>0 , 则 pA|X,M1(a|x,m1)>ε>0 ; 只要 pX,M1,M2(x,m1,m2)>0 , 则 pA|X,M1,M2(a|x,m1,m2)>ε>0 。此处 p() 表示概率密度函数。

注意到假设 2 涉及所谓的跨世界反事实之间的条件独立性,如 (M2(a2,m1),Y(a,m1,m2))M1(a1)|X,A 。这一假设是 Pearl (2009) 的具有相互独立误差项的 NPSEM 的直接结果。它暗示着 (但不是被暗示) Robins (2003) 在解释因果图时引用的顺序可忽略性假设。此外,假设 2 并没有排除 X 对其子代 (descendant) 的因果效应中所有形式的未观察到的混淆因素。例如,在上述 DAG 中允许共同影响 X 和 Y 的未观察到的变量存在 (尽管没有画出) 。

假设 13 下,可以得出当且仅当 a12=a1 时 E[Y(a,M1(a1),M2(a2,M1(a12)))] 被识别。因此,由于给定 a12 时 E[Y(a,M1(1),M2(a2,M1(a12)))] 和 E[Y(a,M1(0),M2(a2,M1(a12)))] 无法被识别,路径 A  M1  Y 中将没有 PSEs 被识别。类似地,路径 A  M1  M2  Y 也将没有 PSEs 被识别。而有趣的是,复合路径 A  M1  Y 的 PSEs 却都能被识别,即使 aa2 。这些结果与 Avin 等 (2005) 开发的撤回见证准则 (recanting witness criterion) 相一致,即若且唯若关注的路径不包含 “撤回见证” ,当所有其他路径的 A 设为 0 或 1 时,A 到 Y 路径的 PSE 能被识别 (撤回见证即一个变量 W ,它有一条到 Y 的额外路径,该路径不在关注的路径之中) 。更进一步,因为 M1 有一条到 Y(M1M2Y) 的额外路径没有在 AM1Y 之中,所以 PSE τAM1Y(0,0,0) 将无法被识别。但 PSE