敏感性分析A-理论基础:控制变量内生时的系数敏感性分析-regsensitivity

发布时间:2022-07-05 阅读 1907

Stata连享会   主页 || 视频 || 推文 || 知乎 || Bilibili 站

温馨提示: 定期 清理浏览器缓存,可以获得最佳浏览体验。

New! lianxh 命令发布了:
随时搜索推文、Stata 资源。安装:
. ssc install lianxh
详情参见帮助文件 (有惊喜):
. help lianxh
连享会新命令:cnssc, ihelp, rdbalance, gitee, installpkg

课程详情 https://gitee.com/lianxh/Course

课程主页 https://gitee.com/lianxh/Course

⛳ Stata 系列推文:

PDF下载 - 推文合集

作者:陈卓然 (中山大学)
邮箱chenzhr25@mail2.sysu.edu.cn


目录


1. 基准模型

假定 Y 和 X 分别是可观测的一个标量,W1 是可观测的 d1 维控制向量,W2 是一个不可观测的控制标量。记 W=(W1,W2)(βlong,γ1,γ2) 为 Y 对 (1,X,W1,W2) 回归之后 (X,W1,W2) 的估计系数。为保证这些系数有定义,我们做出如下的假设:

假设 1(Y,X,W1,W2) 的方差矩阵有限且正定。从而我们可以写出如下等式:

其中,YX,W 代表回归的残差和常数项之和,因此它与 (X,W) 都不相关。在这里,我们感兴趣的参数为 βlong

现在考虑如下 X 对 (1,W1,W2) 的回归方程,记 (W1,W2) 的系数分别为 (π1,π2)

其中,XW 的定义与 YX,W 类似。注意在式 (2) 中 π1 表示依可测变量选择,π2 表示依不可测变量选择。

假设 2 (不存在依不可测变量选择):π2=0。令 βmed 表示 Y 对 (1,X,W1) 的回归中 X 的系数,由于不存在依不可测变量选择,因此有如下定理:

定理 1:假定 (Y,X1,X2)的联合分布已知,如果假设 1 和假设 2 成立,则如下结论成立:

  • βlong=βmed,因此 βlong 能够被点识别;
  • γ1 的可识别集合为 Rd1

这一结论允许内生控制变量,亦即在保证 βlong 能够被识别的基础上,可观测的控制变量 W1 与不可观测的控制变量 W2 任意相关,不过遗憾的是可观测控制变量的系数 γ1 完全不能被识别。

但是这里存在一个问题,即假设 2 是很难成立的。接下来,我们会用一种新的办法来评估这一假设的重要性。

2. 敏感性分析

2.1 敏感性参数

由于无法观测到式 (1) 的 W2,我们并不能估计 βlong。不过,我们能够估计式 (2) 中的 βmed。因此我们很关心 βlong 和 βmed 之差,也就是遗漏变量偏误:

其中,RW2W12 表示将不可观测的 W2 对可观测的 (1,W1) 回归之后的 R2。从式 (3) 不难看出遗漏变量偏误是 π2 的函数,因此 π2 是一个很自然的敏感性参数。但是仅仅将 π2 作为一个敏感性参数的话,研究者需要对这一系数的绝对大小做出正确判断,而这往往并不容易。

在这里,我们定义一个相对敏感性参数。令 Σobs 表示 Rd1 上加权的欧几里得范数,亦即 aΣobs=(aΣobsa)1/2,其中 Σobsvar(W1)。我们考虑如下假设:

假设 3|π2|r¯Xπ1Σobs对于一个已知的正数:r¯X0

假设 4Var(W2)=1

利用假设 4,假设 3 可以写为:

由于 π1W1 对于 W1 的任意线性变换都是保持不变的,因此 π1Σobs对于 W1 的任意线性变换都是保持不变,这一性质确保了 r¯X 是无单位的敏感性系数。

第一节的基准模型假设 π2=0,实际上对应的是 r¯X=0。我们通过假定 r¯X>0 来放松这一假设。此外从式 (3) 中,我们不难看出这一偏误同时也是 γ2 的函数,因此采用和前文相同的思路,我们考虑 γ2 和 γ1 之间的相对大小,也就是式 (1) 中 W1 和 W2 的系数的相对大小。

假设 5|γ2|r¯Yγ1Σobs 对于一个已知的正数:r¯Y0

同样在假设 4 成立的前提下,假设 5 和假设 3 有着相同的含义,同样由于 γ1Σobs 对于W1 的线性变换保持不变,因此 r¯Y 也是一个无单位的敏感性系数。

最后,同样注意到遗漏变量偏误式 (3) 也是 RW2W12 的函数,因此我们可以直接考虑对可观测变量和不可观测变量之间的关系做出限制。亦即如下的假设 6:

假设 6RW2W12c¯ 对于一个已知的正数:c¯[0,1]

假设 6 允许我们对控制变量内生性的程度做出限制,当控制变量完全外生时,RW2W12=0。此时 c¯=0c¯ 越大代表控制变量的内生性程度越强。同样在假设 4 成立的前提之下,RW2W12 对于 W1 的线性变换保持不变,最后注意到我们有时也将 RW2W12 写作 RW2W12=cov(W1,W2)Σobs12

2.2 识别

为简化起见,我们首先将处理变量和控制变量标准化,使得 var(X)=1var(W1)=I。在标准化之后,Σobs1=Σobs。同时记 Y 对于 (1,X,W1,W2) 的回归结果为长回归,而称 Y 对 (1,X,W1) 的回归结果为中回归

2.2.1 仅使用 r¯X 上的限制进行识别

令 BI(r¯x) 表示 βlong 在正定方差假设 1、正态化假设 4、假设 3 下的可识别集合。注意我们此处的集合并未考虑假设 5 和假设 6。令

代表 BI(r¯x) 的下确界和上确界。下面的定理 2 给出了这两个边界的解析解。当我们进一步考虑假设 6,并使用 BI(r¯x,c¯) 代表 βlong 的可识别集合,则令

代表 BI(r¯x,c¯) 的下确界和上确界。下面的定理 3 给出了这两个边界的显式解。为此我们还需要定义额外的几个符号。对于任意的随机向量 A 和 B,令 σA,B=cov(A,B)

敏感性系数 r¯X 会通过这一函数来影响边界,当然这一函数也依赖于 X 和 W1 之间的协方差。进一步定义

此处的不等号来源于 var(Y,X,W1) 的正定性。注意到 X中回归方程中的系数可以写作 βmed=k1/k0

假设 7σW1,YσX,YσW1,X 并且 σW1,X0

假设7并不是必须的,它只是为了简化证明过程。

定理 2:假设 (Y,X,W1) 的联合分布是已知的。同时假设 1、3、4、7 成立,并假设 var(X)=1var(W1)=I。如果 r¯X2<k0,那么

其中

否则,B_(r¯X)= 且 B¯(r¯X)=+

定理 2 刻画了当允许基于不可观测变量选择时,βlong 的最大值和最小值。我们允许可观测控制变量和不可观测的控制变量之间任意相关,并且我们没有在结果方程中对系数做出任何限制。定理 2 中有两点值得注意:一方面它只要求研究者推测一个敏感性系数,另一方面,它允许任意相关的内生控制变量。

由于定理 2 提供了边界的一些显式解,因此我们能够立即推导出一些有用的性质。具体来看:

  1. 当 r¯X=0 时,这一边界收敛到 βmed,也就是在不存在依不可观测变量选择的基准模型的点估计,因此我们可以将基准模型看作是我们模型的一个特例。
  2. 对于 r¯X>0,边界就不再是一个点了,上下边界之间的范围会随着 r¯X 的增大而增大,而且其增大的速率取决于如下的几个变量:
    • 处理变量和可观测协变量之间的相关性:cov(X,W1)
    • 结果变量在经控制变量调整以后的方差:var(YW1)
    • 处理变量在经控制变量调整之后的方差:var(XW1)
    • 将 YW1 对一个常数和 XW1 回归之后的 R2
  3. 边界关于βmed 对称。
  4. 边界只有当 r¯X<1 时才是有限的。

在实际研究过程中,研究者通常会做一些截断性分析,也就是说依不可观测变量选择必须相对依可观测变量选择有多强才能够推翻基准模型。

以定理 2 为例,假设在我们的基准模型中,βmed0。然而我们担心真实的 βlong0,而我们看到的大于 0 的 βlong 仅仅是由依不可观测变量选择所造成的。为此我们定义: