Stata连享会 主页 || 视频 || 推文 || 知乎 || Bilibili 站
温馨提示: 定期 清理浏览器缓存 ,可以获得最佳浏览体验。
New! lianxh
命令发布了:
随时搜索推文、Stata 资源。安装:
. ssc install lianxh
详情参见帮助文件 (有惊喜):
. help lianxh
连享会新命令:cnssc
, ihelp
, rdbalance
, gitee
, installpkg
✌ 课程详情 : https://gitee.com/lianxh/Course
⛳ 课程主页 : https://gitee.com/lianxh/Course
⛳ Stata 系列推文:
☝ PDF下载 - 推文合集
作者: 余坚 (贵州财经大学)
邮箱: yujiangeren@163.com
Source: Xiang Zhou, 2021 , Semiparametric estimation for causal mediation analysis with multiple causally ordered mediators. Journal of the Royal Statistical Society: Series B (Statistical Methodology), 84(3), 794– 821. -Link- ,-Data-
目录
1. 引言
因果中介分析旨在厘清一个处理变量影响一个结果变量的路径。大量新近出现的因果推断文献解决了因果机制的定义、识别和估计问题。这组研究使用潜在结果框架,提出了无需设定具体模型的直接和间接效应的定义,证明了非参数识别所需的假设,并开发了一系列输入,加权和多重稳健的估计方法。在此背景下,随着因果中介分析的研究方向从单一中介向多重中介深入,路径特定效应 (path-specific effects,PSEs) 逐渐引人关注。然而,目前大多数关于 PSEs 的文献都集中在两个中介的情况下,如何将以往研究中开发的估计方法推广到 K ( ≥ 1 ) 个因果有序中介的情况,仍然没有得到充分的探索。本文旨在弥补这一差距。
2. 符号、定义和识别
为便于说明,我们先从两个因果有序中介的情况开始,然后再讨论 K 个中介的一般设定。
2.1 两个因果有序中介的情况
2.1.1 定义PSEs
设 A 表示二元处理变量,Y 表示关注的结果变量,X 表示一组预处理的协变量向量。另外,设 M 1 和 M 2 表示两个因果有序中介,并假设 M 1 在 M 2 之前。我们允许这些中介是多元的,在这种情况下,组成变量之间的因果关系是不确定的。下图为这些变量之间关系的有向无环图 (directed acyclic graph, DAG) 。
在这个 DAG 中,从处理变量到结果变量存在四种可能的因果路径:
(a) A → Y ; (b) A → M 2 → Y ; (c) A → M 1 → Y ; (d) A → M 1 → M 2 → Y
对 PSEs 进行正式定义需要对结果变量和中介变量使用潜在结果形式的符号。具体来说,设 Y ( a , m 1 , m 2 ) 表示处理状态为 a ,中介值 M 1 = m 1 和 M 2 = m 2 时的潜在结果; M 2 ( a , m 1 ) 表示处理状态为 a ,中介值 M 1 = m 1 时中介 M 2 的潜在值;M 1 ( a ) 表示处理状态为 a 时中介 M 1 的潜在值。
这一符号允许我们以 Y ( a , m 1 , m 2 ) 和 M 2 ( a , m 1 ) 的形式定义嵌套式反事实 (nested counterfactual) Y ( a , M 1 ( a 1 ) , M 2 ( a 2 , M 1 ( a 12 ) ) ) ,其中 a ,a 1 ,a 2 ,a 12 都可以取 0 或 1。此外,如果我们让 Y ( a ) 表示当处理状态为a ,中介 M 1 和 M 2 为处理状态 a 下自然值时 (即 M 1 ( a ) 和 M 2 ( a , M 1 ( a ) ) ) 的潜在结果,我们可以构建 Y ( a ) = Y ( a , M 1 ( a ) , M 2 ( a , M 1 ( a ) ) ) ) 。这有时被称为 “构成” 假设。
根据上述符号,图中每条因果路径的 PSE 都可以通过八种不同方式进行定义,这取决于其他三条路径每条的处理变量 A 被选择的参考级别。例如,A 对 Y 的平均直接效应,即处理效应通过路径 A → Y 生效的部分,可以定义为
τ A → Y ( a 1 , a 2 , a 12 ) = E [ Y ( 1 , M 1 ( a 1 ) , M 2 ( a 2 , M 1 ( a 12 ) ) ) − Y ( 0 , M 1 ( a 1 ) , M 2 ( a 2 , M 1 ( a 12 ) ) ) ]
其中a 1 ,a 2 ,a 12 都可以取 0 或 1。特别是在将中介 M 1 和 M 2 作为一个整体时,τ A → Y ( 0 , 0 , 0 ) 对应自然直接效应 (natural direct effect, NDE) 或净直接效应 (pure direct effect, PDE)。
类似地,A → M 2 → Y , A → M 1 → Y ,A → M 1 → M 2 → Y 的 PSEs 可以定义为
τ A → M 2 → Y ( a , a 1 , a 12 ) = E [ Y ( a , M 1 ( a 1 ) , M 2 ( 1 , M 1 ( a 12 ) ) ) − Y ( a , M 1 ( a 1 ) , M 2 ( 0 , M 1 ( a 12 ) ) ) ]
τ A → M 1 → Y ( a , a 1 , a 12 ) = E [ Y ( a , M 1 ( 1 ) , M 2 ( a 2 , M 1 ( a 12 ) ) ) − Y ( a , M 1 ( 0 ) , M 2 ( a 2 , M 1 ( a 12 ) ) ) ]
τ A → M 1 → M 2 → Y ( a , a 1 , a 2 ) = E [ Y ( a , M 1 ( a 1 ) , M 2 ( a 2 , M 1 ( 1 ) ) ) − Y ( a , M 1 ( a 1 ) , M 2 ( a 2 , M 1 ( 0 ) ) ) ]
此外,如果我们使用 A → M 1 ⇝ Y 表示因果路径 A → M 1 → Y 和 A → M 1 → M 2 → Y ,则这一复合路径对应的 PSE 可定义为
τ A → M 1 ⇝ Y ( a , a 2 ) = E [ Y ( a , M 1 ( 1 ) , M 2 ( a 2 , M 1 ( 1 ) ) ) − Y ( a , M 1 ( 0 ) , M 2 ( a 2 , M 1 ( 0 ) ) ) ]
该量反映了处理效应通过 M 1 生效的部分,无论它是否进一步作用于 M 2 。τ A → M 1 ⇝ Y ( 0 , 0 ) 常被称为自然间接效应 (natural indirect effect, NIE) 或纯粹间接效应 (pure indirect effect, PIE) 。τ A → M 1 ⇝ Y ( 1 , 1 ) 常被称为总间接效应 (total indirect effect, TIE) 。根据定义,如果对应的期望潜在结果 Y ( a , M 1 ( a 1 ) , M 2 ( a 2 , M 1 ( a 12 ) ) ) 被识别了,则这些 PSEs 也将被识别。
2.1.2 识别PSEs
下面,我们回顾从观察性数据中识别这些期望潜在结果的假设。
根据 Pearl (2009) ,我们使用一个 DAG 来编译具有相互独立误差项的非参数结构方程模型 (nonparametric structural equation model, NPSEM) 。在这一框架中,从之前提出的图里的上半部分可以看到,任何处理 - 中介、处理 - 结果、中介 - 中介、中介 - 结果的关系中都没有未观察到的混淆因素。我们正式地引用以下假设。
假设 1 A 对 M 1 , ( A , M 1 ) 对 M 2 , ( A , M 1 , M 2 ) 对 Y 的一致性:
对任一单位及任何 a , m 1 , m 2 , 若 A = a 则 M 1 = M 1 ( a ) ; 若 A = a 且 M 1 = m 1 则 M 2 = M 2 ( a ) ; 若 A = a , M 1 = m 1 且 M 2 = m 2 则 Y = Y ( a , m 1 , m 2 )
假设 2 处理变量和潜在结果变量之间的条件独立性:
对任何 a , a 1 , a 2 , m 1 , m 1 ∗ , m 2 , 有 ( M 1 ( a 1 ) , M 2 ( a 2 , m 1 ) , Y ( a , m 1 , m 2 ) ) ⊥ ⊥ A | X ; ( M 2 ( a 2 , m 1 ) , Y ( a , m 1 , m 2 ) ) ⊥ ⊥ M 1 ( a 1 ) | X , A ; Y ( a , m 1 , m 2 ) ⊥ ⊥ M 2 ( a 2 , M 1 ∗ ) | X , A , M 1
假设 3 正值性:
只要 p X ( x ) > 0 , 则 p A | X ( a | x ) > ε > 0 ; 只要 p X , M 1 ( x , m 1 ) > 0 , 则 p A | X , M 1 ( a | x , m 1 ) > ε > 0 ; 只要 p X , M 1 , M 2 ( x , m 1 , m 2 ) > 0 , 则 p A | X , M 1 , M 2 ( a | x , m 1 , m 2 ) > ε > 0 。此处 p ( ⋅ ) 表示概率密度函数。
注意到假设 2 涉及所谓的跨世界反事实之间的条件独立性,如 ( M 2 ( a 2 , m 1 ) , Y ( a , m 1 , m 2 ) ) ⊥ ⊥ M 1 ( a 1 ) | X , A 。这一假设是 Pearl (2009) 的具有相互独立误差项的 NPSEM 的直接结果。它暗示着 (但不是被暗示) Robins (2003) 在解释因果图时引用的顺序可忽略性假设。此外,假设 2 并没有排除 X 对其子代 (descendant) 的因果效应中所有形式的未观察到的混淆因素。例如,在上述 DAG 中允许共同影响 X 和 Y 的未观察到的变量存在 (尽管没有画出) 。
在假设 1 − 3 下,可以得出当且仅当 a 12 = a 1 时 E [ Y ( a , M 1 ( a 1 ) , M 2 ( a 2 , M 1 ( a 12 ) ) ) ] 被识别。因此,由于给定 a 12 时 E [ Y ( a , M 1 ( 1 ) , M 2 ( a 2 , M 1 ( a 12 ) ) ) ] 和 E [ Y ( a , M 1 ( 0 ) , M 2 ( a 2 , M 1 ( a 12 ) ) ) ] 无法被识别,路径 A → M 1 → Y 中将没有 PSEs 被识别。类似地,路径 A → M 1 → M 2 → Y 也将没有 PSEs 被识别。而有趣的是,复合路径 A → M 1 ⇝ Y 的 PSEs 却都能被识别,即使 a ≠ a 2 。这些结果与 Avin 等 (2005) 开发的撤回见证准则 (recanting witness criterion) 相一致,即若且唯若关注的路径不包含 “撤回见证” ,当所有其他路径的 A 设为 0 或 1 时,A 到 Y 路径的 PSE 能被识别 (撤回见证即一个变量 W ,它有一条到 Y 的额外路径,该路径不在关注的路径之中) 。更进一步,因为 M 1 有一条到 Y ( M 1 → M 2 → Y ) 的额外路径没有在 A → M 1 → Y 之中,所以 PSE τ A → M 1 → Y ( 0 , 0 , 0 ) 将无法被识别。但 PSE