论文复现:包含交互项的假设检验

发布时间:2023-01-04 阅读 662

Stata连享会   主页 || 视频 || 推文 || 知乎 || Bilibili 站

温馨提示: 定期 清理浏览器缓存,可以获得最佳浏览体验。

New! lianxh 命令发布了:
随时搜索推文、Stata 资源。安装:
. ssc install lianxh
详情参见帮助文件 (有惊喜):
. help lianxh
连享会新命令:cnssc, ihelp, rdbalance, gitee, installpkg

课程详情 https://gitee.com/lianxh/Course

课程主页 https://gitee.com/lianxh/Course

⛳ Stata 系列推文:

PDF下载 - 推文合集

作者:李烨阳 (浙江大学)
邮箱li_yeyang95@163.com

编者按:本文主要摘译自下文,特此致谢!
Source:Berry W D, Golder M, Milton D. Improving tests of theories positing interaction[J]. The Journal of Politics, 2012, 74(3): 653-671. -PDF- -Appendix- -Replication-


目录


1. 引言

在政治经济学的研究中经常会分析交互效应,例如研究者会提出一个条件情形预测 (conditional hypotheses):

  • X 对 Y 具有正向的影响,且这一效应会随着 Z 取值的增大而增大。

研究者会用一个包含交互项的模型来对这一预测进行检验。需要注意的是,含有交互项的模型具有对称性,例如:

它既表示 X 对 Y 的影响条件于 Z 的取值,也表示 Z 对 Y 的影响条件于 X 的取值。然而在实证检验中,研究者常常主观的将这两个变量赋予不同的角色,例如将变量 Z 看做已知的条件变量,它的作用是调节 X 对 Y 影响系数的大小,而将另一个变量 X 放置于此条件下。

包含交互项模型的假设检验步骤是:

  1. 将其中一个变量,例如 Z,视作条件变量;
  2. 提出一个关于 X 的边际效应如何随 Z 变化的预测;
  3. 通过绘制 X 的边际效应图的方式检验预测。

研究者往往忽略了与之对称的预测的检验:即将 X 视作条件变量,检验 Z 的边际效应如何随 X 变化,并绘制 Z 的边际效应图。当然,本文并不是建议研究者增加一个对称性的理论预测,而是论述额外提供 Z 的边际效应如何随 X 变化的检验可以提高检验力度,如果忽略这一步骤,有可能低估或夸大了对理论实证检验的可信度。

2. 交互效应对称性在理论检验中的作用

假如 X 对连续变量 Y 的影响条件于 Z 的假设,并用含交互项的模型表示:

此时,X 的边际效应为:

因此,除非 βXZ 等于 0,否则 X 的边际效应条件于 Z 的取值。作者用 ME(X|Z) 代表 X 的边际效应,ME(X|Z=z) 代表 Z 取值 z 时 X 对 Y 的边际效应。下图表示当 βX 和 βXZ 均为正数时,ME(X|Z) 如何随 Z 变化而变化的图像。在这一关系图中有两个地方需要注意:

  • 截距项为 βX,它的含义是当 Z=0 时,X 对 Y 的边际效应为 βX
  • 斜率项为  βXZ ,代表 Z 每增加一单位,X 对 Y 的边际效应变化  βXZ

由于交互效应模型的对称性,Z 的边际效应是条件于 X 的取值的,即:

同样的,βZ 可以看做当 X=0 时,Z 对 Y 的边际效应。βXZ 可以看做 X 每增加一单位,Z 对 Y 的边际效应变化 βXZ。需要注意的是,βXZ 既是 ME(X|Z) 随 Z 变化的斜率,也是 ME(Z|X) 随 X 变化的斜率。因此,当作者提出一个“X 对连续变量 Y 的影响如何随 Z 的变化而变化”的预测,并且使用交互效应模型来刻画时,作者等于同时提出了“Z 对连续变量 Y 的影响如何随 X 的变化而变化”的预测。

然而研究者惯常做法是将其中一个变量看做给定条件,只关注另一个变量在此条件下边际效应的变化。特别是当 Z 为一个虚拟变量,可以非常简明直观地理解为 X 对 Y 的影响在两种不同情境 (Z=0) 和 (Z=1) 时有所不同。由于这样的理解方式非常符合直觉,作者往往会忽视,二元变量 Z 对 Y 的影响同样会受到 X 的影响。这种对称性对于理论检验的意义往往被研究者所忽略。

假如只关注式 (2),即仅提供 ME(X|Z) 随 Z 变化的结果,此时没有提供任何有关 βZ 的信息,也就无法获得关于 ME(Z|X) 的信息。因此,只给定 βZβXZ 时,作者并不能确定条件于 X 任意取值时,Z 边际效应的符号。

为了说明这一问题,作者举了一个形如式 (1) 的具体的例子。例如作者提出一个这样的理论预测:X 对 Y 的边际效应始终为正,并且这种正向影响随着 Z 的增加而增加。一般作者会通过实证估计 βX 和 βXZ 均显著为正来检验该预测,此时 ME(X|Z) 的图像形如图 1。为了更方便举例论述,作者进一步假设 βX 为 0.10,βXZ 为 0.004,X 和 Z 均可以在 0 ~ 100 的范围内任意取值,仅看此图形,ME(X|Z) 的取值范围为 0.10+0×0.004=0.100.10+100×0.004=0.50

然而,如图 2 所示,满足这一条件的 XZ 和 Y 的关系存在多种可能。图 2 的左侧是 XZ 和 Y 关系的 3D 图像,右侧为与之对应的 ME(Z|X) 图像,可以看出,在给定的取值范围内,βZ 的取值符号是不确定的,X 和 Z 共同决定 Y 的方式也是不同的,例如:

  • 在图 2a 中,Z 对 Y 的影响始终为正,当 XZ 均取最大 (最小) 值时,Y 也达到最大 (最小) 值;
  • 在图 2b 中,虽然,Z 对 Y 的影响也始终为正,但当 X 取最大 (最小) 值且 Z 取最小 (最大) 值时,Y达到最大 (最小) 值;
  • 在图 2c 中,Z 对 Y 影响不再始终为正,并且当 XZ 均取最大值时 Y 达到最大值,当 X 取最大值 Z 取最小值时 Y 达到最小值。

在具体的研究情境中,当提出形如“X 对 连续变量 Y 的影响随 Z 的增加而增加”的预测时,需要注意理论情境是否需要增加额外的条件。例如如果额外要求“当 X 取最大值时,Z 对 Y 有正向影响”,那么图 2b 与理论不一致。如果额外要求“当 X 取小值时,Z 对 Y 有正向影响”,那么图 2b 和 2c 均与理论不一致。无论是哪一种情形,额外增加 ME(X|Z) 估计图均可以为条件情形预测的检验提供更完善的证据。

简单总结一下,本部分阐释的重点在于:忽略对称性,按照惯常方法指定一个变量为条件变量 (例如 Z),只关注另一个变量 (例如 X) 的边际效应如何随 Z 的变化而变化。此时在 XZ 的所有可能取值空间内,虽然可以获得 X 的边际效应与 Z 变量取值相关关系的正负性,以及 X 边际效应的正负性,但是 Z 边际效应的正负性是无法确定的,它可能随着 X 的取值始终为正/为负,也有可能发生正负号的逆转。但由于在具体研究情境中,条件理论往往同时隐含了 Z 对 Y 边际效应的符号要求,此时惯常的单一检验是不全面的。

3. 在条件理论框架下尽可能多的提供假设检验证据

3.1 五项关键预测

对于形如式 (1) 的交互项模型,考察 X 和 $Z4 对 ¥Y¥ 的边际效应考虑如下五项预测:

  1. PPX|Zmin:当 Z 取最小值时,X 的边际效是 [正/负/零];
  2. PPX|Zmax:当 Z 取最大值时,X 的边际效是 [正/负/零];
  3. PPZ|Xmin:当 X 取最小值时,Z 的边际效是 [正/负/零];
  4. PPZ|Xmax:当 X 取最大值时,Z 的边际效是 [正/负/零];
  5. PPXZX 的边际效应与 Z 变量 [正相关/负相关],反之亦然。

需要注意的是,这里的取最大/最小值指的是可能取值范围内的最大/最小值,在假设检验中往往用样本的最大/最小值。

上述五项预测无需进行五次独立的假设检验,他们都可以被囊括在 X 的边际效应如何随 Z 变化,以及 Z 的边际效应如何随 X 变化的假设检验中。例如,若作者提出的 PPX|Zmin 和 PPX|Zmax 预测是正的,PPZ|Xmin 预测是正的,PPZ|Xmax 是负的,PPXZ 预测是负相关,可以表述为如下的形式:

  • HHX|Z:无论 Z 取何值,X 对 Y 的边际效应始终是正的,该效应随着 Z 的增加而降低,当 Z 处于最低值时,该效应达到最大值。
  • HHZ|X:当 X 取最小值时,Z 对 Y 的边际效应为正。该效应随着 X 的增加而降低,在 X 的某些取值下,Z 对 Y 没有影响。随着 X 的进一步增加,Z 对 Y 的边际效应变为负值,并随着 X 增加这种负向的影响增强。

3.2 检验交互效应模型时的实证结果典型模式

假如希望检验前面提到的预测,一个强的证据是 ME(X|Z=zmin)ME(X|Z=zmax) 和 ME(Z|X=xmin) 的点估计都是正向显著的,ME(Z|X=xmax) 的点估计和 βXZ 都是负向显著的。但如果其中任意一个预测被违反,都视作对整体理论的拒绝,是不合理的,这是因为统计检验的结果不是告诉研究者确定的结果,而是在一定的风险水平下是否接受或拒绝原假设。

不过,研究者可以通过逐个分析交互模型可能得到的几个估计典型模式,得到每一个估计结果的典型模式在其代表的经验证据下,支持条件理论的程度。以检验 HHX|Z 为例,即需要检验:

  1. ME(X|Z=zmin)>0
  2. ME(X|Z=zmax)>0
  3. βXZ<0

图 3 以 X 边际效应图的方式展示了六种不同的典型模式。图中的黑色实线代表 X 的边际效应,它旁边的两条虚线代表其 95% 置信区间的范围,也可以据此判断其统计显著性。横纵标的标粗部分代表 Z 在该范围内,X 的边际效应具有实质意义上的显著性 ( substantive significance),即其值大到足以被视为非平凡的量级,当然这里确定实质意义显著性的标准具有主观性。

此外,在每个图的下方标注了交乘项系数 βXZ 的显著性,它对于确定经验证据是否支持 X 和 Z 之间存在相互作用至关重要。如式 (4) 所示,βXZ 代表 ME(X|Z) 和 Z,以及 ME(Z|X) 和 X 之间关系的强度。

在图 3(a) 中,X 的边际效应是正,且在 Z 的取值范围内始终是显著的,βXZ 是负向且显著的,该图为 HHX|Z 假设提供了强有力的证据,因为它对其中包括的三个预测都提供了充分得实证支持。

若结果形如图 3(b),当 Z 取最大值时,X 的边际效应不再显著。但是由于HHX|Z 假设蕴含着 X 对 Y 的边际效应随着 Z 的增加而减小,这就为 Z 变大时效应变的微乎其微的可能性留有余地,因此即使 ME(X|Z=zmax) 不显著,该图仍然对 HHX|Z 假设有很强的支持。

若结果形如图 3(c),与 (b) 相比可以令 X 边际效应正向显著的 Z 的取值范围更窄,且 ME(X|Z=zmax) 的点估计实际上为负,但由于其值无论在统计意义上还是实质意义上都是微不足道的,因此作者并不并不十分担心符号“错误”的问题。

在这种情况下,其对 HHX|Z 假设的支持力度取决于令 X 边际效应正向显著的 Z 的取值范围内的观测值占全部观测值的比例,即 Z<z 范围内的观测值的比例。这个百分比越高,研究者就越倾向于接受实证结果支持 HHX|Z 假设,但这个临界值的确定标准是主观的。因此,作者建议报告这一百分比,并推荐在横轴上绘制变量频率分布图。

在检验条件理论时,作者强烈反对的一种做法是“计数游戏”,即计算得到统计支持的预测的数量。例如在图 3(d) 中,有两个预测得到了统计支持,即 ME(X|Z=zmin)>0 和 βXZ<0,但不能因为有 2 个预测被满足,1 个没有被满足而简单计算对 HHX|Z 假设的支持力度是 0.667。

需要注意的是,与 (c) 不同,当 Z 增加到一定数值之后,X 的边际效应是显著为负的,这与 HHX|Z 假设所预测的 X 对 Y 的边际效应始终是正是相违背的。

图 3(e) 同样有两个预测得到了统计支持,但综合来看不能支持 HHX|Z 假设,虽然 X 对 Y 的边际效应始终是正向显著的,但 βXZ 虽然符号为负,却缺乏统计显著性,在图像上表现为边际效应线过于平坦。从量级上来看,这一交互效应是微不足道的,没有证据表明 X 和 Z 之间存在明显的交互作用。该实证证据严重挑战了所预测的交互作用的理论假设。

在图 3(f) 中,X 的边际效应曲线同样过于平坦。在 Z 的所有可能的取值范围内,X 对 Y 的边际效应都是在实质上不显著的 (即从量级来看微乎其微),但是其在 Z<z 的取值范围内是统计意义上显著的。X 对 Y 的边际效应随着 Z 取值的变化从显著变为不显著,似乎意味着存在 X 和 Z 的交互作用。

但这种看法是错误的,由于 X 的边际效应曲线接近平行与水平坐标轴,这代表当 Z 取值较小时,t 值刚刚超过统计显著性阈值。当 Z 取值较大时,t 值仅仅略低于统计显著性阈值,因此如果以此作为支持交互作用理论的证据,就会过分依赖与选择的统计显著性水平。这里我们更应该关注 βXZ 是统计上不显著的,且实质意义上量级过小,这表明 X 的边际效应随 Z 的变化微乎其微,因此应该拒绝 HHX|Z 假设。

4.论文范例

本文提供了两篇论文的复现,他们均提出了条件情形的理论,但在原文中仅提供了单一变量的边际效应图像来检验条件假设。其中一篇论文,在补充了交乘项中的另一个变量的边际效应图像之后,为原文中的理论提供额外支持的证据,而另一篇论文,第二个边际效应图像则违反了该文的理论假说。

4.1 与待检验理论假说一致的例子

Kastner (2007) 研究了利益冲突和与国际经济利益有关联的国内主体的实力对国家间贸易水平的影响。以往的研究表明,当国家之间存在政治利益冲突时,双边贸易会降低,但不同国家又有很大差异。

之所以如此,Kastner (2007) 认为尽管各国领导人都希望减少与利益冲突国家的贸易,但由于此举会影响到本国与国际经济利益有关联的主体的利益,因此会受到一定阻力。所以当具有国际经济利益的国内主体拥有强大政治影响力时,利益冲突对贸易影响会相对较小。由于无法直接衡量具有国际经济利益的国内主体的实力,采取贸易壁垒强度作为其反向的代理变量。

用 Conflict 代表两国之间的贸易冲突程度,Barriers 代表贸易壁垒强度,Trade 代表双边贸易水平,Kastner 的理论假说可以表示为:

  • HHConflict|Barriers:无论贸易壁垒强度取何值,贸易冲突对贸易水平的边际效应始终是负的,当贸易壁垒处于最低水平时,这种负面影响最弱,并且随着贸易壁垒强度的增加而增强。

该理论假说可以提供三个预测:

  1. PPC|Bmin:当 Barriers 取最小值时,Conflict 的边际效是负的。
  2. PPC|Bmax:当 Barriers 取最大值时,Conflict 的边际效是负的。
  3. PPCB:条件于控制变量,Conflict 的边际效应与 Barriers 负相关。

为了检验该条件理论,使用了含交互项的模型,模型设定为: