Stata:多元回归中控制其他因素不变的含义

发布时间:2022-07-27 阅读 1781

Stata连享会   主页 || 视频 || 推文 || 知乎 || Bilibili 站

温馨提示: 定期 清理浏览器缓存,可以获得最佳浏览体验。

New! lianxh 命令发布了:
随时搜索推文、Stata 资源。安装:
. ssc install lianxh
详情参见帮助文件 (有惊喜):
. help lianxh
连享会新命令:cnssc, ihelp, rdbalance, gitee, installpkg

课程详情 https://gitee.com/lianxh/Course

⛳ Stata 系列推文:

PDF下载 - 推文合集

作者:付一帆 (天津大学)
邮箱yifanfu_0912@tju.edu.cn


目录


在实证研究中,为讨论因变量和自变量之间的因果关系,常常需要加入控制变量来排除其他因素的干扰。例如,研究子女上学年限对工资的影响,线性回归模型为:

其中 y 是年工资 (元),核心解释变量 x 是子女上学年限 (年),控制变量 z 是母亲上学年限 (年)。控制母亲上学年限最直观的方式是联想早期回归分析实验中的控制变量法,保证所有样本的母亲上学年限均相同。这样,子女上学年限变化导致工资的波动可以归因为子女上学年限对工资因果效应。

然而,这种保持其他因素不变或者控制其他因素在相同水平的方法只适用于实验数据,在观测数据中却很难做到。在实验中,可以轻易控制某一变量在不同个体之间保持相同水平,而获取观测数据时,由于不能对获得的样本值进行限制,我们很少能奢侈地保持某些变量不变。

那么,在非实验条件下如何剔除控制变量的干扰呢?控制变量究竟是如何被 “控制” 的呢?

1. 控制的正确打开方式

在介绍原理之前,首先观摩一下控制的正确打开方式。所谓的控制,本质上是一种 Partial out (排除影响) 的思想。

这里必须要提到的定理是 Frisch–Waugh–Lovell theorem (弗里希-沃定理,简称 FWL 定理):多元回归中任何单一变量的系数,可以通过分步回归剔除回归模型中其他变量对因变量和自变量的影响后得到。具体而言,弗里希-沃定理分步回归的步骤如下:

首先,将 y 与 z 进行回归:y=β0+β1z+ε1,得到的残差 ε1 剔除了 z 对 y 的影响,只包含 z 不能解释的 y 部分,即图中 y 去除了 z 能解释的 D+C 部分后剩下的 A+B 部分。

其次,将 x 与 z 进行回归:x=α0+β2z+ε2,得到的残差 ε2 剔除了 z 对 x 的影响,只包含 z 不能解释的 x 部分,即图中 x 去除了 z 能解释的 E+C 部分后剩下的 B+F 部分。

最后,将 ε1 与 ε2 进行回归,因为 ε1 与 ε2 均值都为零,所以该回归模型不必带有截距项,回归方程:ε1=β3ε2+ε3,得到的 β3 被称为偏相关系数,指在控制变量 z 后 x 对 y 的净效应,即图中 A+B 部分与 B+F 部分重合的 B 部分。

2. 控制实现的理论基础

上述分步回归的过程虽然剔除了控制变量的影响,但是大家可能不免疑惑:

  • (1) 如何从理论上证明残差 ε1 与残差 ε2 回归得到的 β3 就是 y 对 x 的回归系数?
  • (2) 为何在实际操作中我们并未执行复杂的分步回归步骤,直接一条 reg Y X Z 命令就认为已经控制变量了呢?

为了回答上述两个问题,我们将:

  • (1) 证明 FWL 定理对残差 ε1 与残差 ε2 回归系数为 y 对 x 的回归系数;
  • (2) 证明 OLS 回归与利用 FWL 定理的分步回归得到的偏回归系数估计值具有等价性。

2.1 前序知识矩阵投影

2.1.1 一维空间的矩阵投影

在证明前,首先了解矩阵投影的前序知识,矩阵投影的部分结论将在证明中得到应用。一维空间的矩阵投影如图所示:

其中,p 是 y 在 x1 上的投影。p 和 x1 是同向的,故可以表示为 p=x1aa 是标量。根据 p 和 m 正交的条件,可以推导出 a=x1Tyx1Tx1,则:

记 P 为投影矩阵,说明在一维空间中,向量 y 在 x1 上的投影 p 是由投影矩阵 P 作用在 y 上得到的。m 是误差向量,表示为:

记 M 为残差生成矩阵,说明在一维空间中,误差向量 m 是由残差生成矩阵 M 作用在 y 上得到的。

2.1.2 多维空间的矩阵投影

将一维空间的矩阵投影推广到多维空间,向量 x1 变成矩阵 X。记 X 的列空间包含两个向量 x1x2,向量 y 在 X 空间上的投影为 p,则:

误差向量 m=yp 垂直于列空间的平面,故:

此时投影向量 p 的形式为:

记 P 为投影矩阵,说明在多维空间中,向量 y 在矩阵 X 上的投影 p 是由投影矩阵 P 作用在 y 上得到的。同样,误差向量 m 是由残差生成矩阵 M 作用在 y 上得到的。

2.1.3 投影矩阵的性质

一维空间:

  • P=PT (对称性)
  • PP=P (幂等性)
  • M=IP
  • M=MT (对称性)
  • MM=M (幂等性)
  • MX=0

多维空间:

  • PXPx1=Px1PX=Px1
  • MxMx1=Mx1Mx=Mx
  • MxX1=0

2.2 证明 FWL 定理

具体而言,假设线性回归方程为:

OLS 的估计量 b 是使得残差平方和最小的 b ,符合以下条件:

将核心解释变量表示为 x1,控制变量表示为 X2,其中 X2=[x2,,xk]XX 表示为:

Xy 表示为:

根据 XXb=Xy 得到:

根据矩阵乘法得到:

进一步得到:

将 b2 带入 x1x1b1+x1X2b2=x1y 得到:

根据矩阵投影 P=X(XTX)1XT 的性质:

根据矩阵投影 M2=IP2 的性质,得到:

根据残差生成矩阵 M2 的对称性及幂等性:

因此 b1 可以重新写为:

其中,ex1=M2x1ey=M2yey 是 y 对 X2 做回归后得到残差向量,ex1 是 x1 对 X2 做回归后得到残差向量。b1 公式即为 FWL 定理。

对比 OLS 估计量 b=(XX)1Xy 的含义是 y 对 X 做回归的回归系数,b1=(ex1ex1)1ex1ey 可以理解为被解释变量对控制变量做回归后的残差向量 ey 与核心解释变量对控制变量做回归后的残差向量 ex1 再做回归得到的系数,此系数就是 y 对 x 的回归系数,(1) 证毕。

2.3 证明 OLS 与分步回归具有等价性

上面利用 FWL 定理进行分步回归估计的核心解释变量系数是:

假设用 OLS 回归估计线性回归方程:

在上式两边同时乘以 x1M2,得到: