Stata:系数为何不显著?GIF-演示-OLS-的性质.md

发布时间:2020-10-09 阅读 3208

Stata 连享会   主页 || 视频 || 推文

温馨提示: 定期 清理浏览器缓存,可以获得最佳浏览体验。

课程详情 https://gitee.com/arlionn/Course   |   lianxh.cn

课程主页 https://gitee.com/arlionn/Course


作者:连玉君 | 许梦洁


目录


最小二乘估计( OLS )是经管类学生学术道路上的第一个拦路虎,也是最重要的垫脚石。复杂的估计参数、模型设定以及各种统计量总是让初学者们望而却步,同时如何清楚明白地向同学们讲清楚复杂的 OLS 系统对于老师们来说也是一个不小的挑战。因此一个能够直观反映 OLS 系统抽象性质的工具想必不仅能帮助同学们对抽象的 OLS 系统有一个直观地体验,而且也能极大地方便老师们的教学工作。在这篇推文中,我们就将为大家介绍这样一个福利 APP:A Shiny App for Playing with OLS

1. OLS 回顾

采用矩阵形式将线性回归模型表示如下:

若假设解释变量外生 (同时满足其它基本假设条件),即 E(xu)=0,则 OLS 估计式如下:

进一步假设 uN(0,σ2),则 β^ 为:

显然,若想提高 β^ 估计的准确程度,我们希望 Var(β^) 尽可能小一点。从公式 (3) 中可以看出,这取决于两个因素:

  • 要点 1: 干扰项的变异程度。显然,σ2 越小越好:这意味着原始模型 (1) 中干扰项的方差 (Var(u)=σu2) 越小越好。实证分析中,若模型设定中遗漏了重要的变量,或是某些不可观测的个体或时间特征没有得到很好的控制,它们都会跑到干扰项中,从而导致 σ2 过大。一个比较常用的处理方式就是在模型中加入反应个体或时间固定效应的虚拟变量。
  • 要点 2: 解释变量的变异程度。若把 (xx) 视为 Var(x)=σx2,则 (xx)1 可以视为 1/Var(x)。换言之,解释变量的离散程度越高,则越容易更为准确地识别 β 的参数估计值。实证分析中,在收集数据环节,就要尽可能保证样本的来源多样化,能够较好的反应母体的特征。

2. OLS 性质的可视化模拟

2.1 概览

为了让大家对参数和模型的设定如何影响 OLS 回归结果有一个直观地感受,本文与大家分享一个在线的可视化 APP —— A Shiny App for Playing with OLS

这个 APP 使我们可以直接修改 DGP (数据生成过程,Data Generation Process) 中各项参数,以便了解 OLS 的估计性质受那些因素影响,从而为实证分析中合理设定模型提供依据。

具体而言,在进行基本参数设定时,该 APP 对解释变量和扰动项的假设与经典 OLS 假设一致 ,并给定 x 的期望为 2, u 的期望为 0。用户可以调整解释变量 x 和干扰项 u 的标准差、随机模拟的种子值、样本数、DGP 以及 OLS 回归模型,并可以在调整参数的同时看到样本点、拟合情况和对应的回归统计量的实时变化,如下图:

OLS_app-01-Stata连享会.gif
OLS_app-01-Stata连享会.gif

2.2 样本规模的影响

首先,我们来看样本规模对 OLS 回归的影响。其他条件不变,在回归模型设定正确的前提下,样本量越大模型的拟合优度越高。这个预判可以从下图的操作中得到验证,这里真实数据生成过程 (DGP) 为 y=2+3x+u ,回归模型与真实模型一致,为 y=α+xβ+u。随着样本量由 10 逐渐扩大到 496,拟合优度由 0.26 增加到 0.31。

OLS_app-02-sample-size-Stata连享会.gif
OLS_app-02-sample-size-Stata连享会.gif

2.3 解释变量标准差的影响

模型设定正确的前提下,其他条件不变,解释变量标准差越大,拟合效果越好。如下图,当解释变量 x 的标准差由 0.25 逐渐增加到 3.5 时,拟合优度也呈现了大幅度地增加,由 0.29 增加到了 0.99。

OLS_app-03-varX.gif
OLS_app-03-varX.gif

2.4 解释变量标准差和误差项标准差的交互影响

当同时考虑解释变量和误差项的标准差变化时,我们将能更清楚地看到解释变量和误差项标准差对拟合效果不同方向的影响以及影响程度的相对大小。

模拟显示,保持 x 的标准差为 0.25,u 的标准差由 1 增加到 7 时,模型的拟合优度将由 0.28 骤降到 0。保持 u 的标准差为 5,x 的标准差由 0.25 增加到 4.25 时,模型的拟合优度将由 0.01 增加到 0.83。

OLS_app-04-varU-Stata连享会.gif
OLS_app-04-varU-Stata连享会.gif

2.5 回归模型设定的影响

在上述模拟中,我们都直接设定回归模型与真实模型一致。然而,实际分析中,我们并不知道真实的 DGP,也就无从知道真实的模型形式。那么,当回归模型设定不符合真实模型会发生什么呢?

这里,我们设定真实模型为 y=2+3x5x2+u,当回归模型只包含一次项时,拟合优度为 0.30;只包含二次项 x2 时,由于抛物线的开口方向相反,拟合优度仅为 0.16;而同时包含一次项和二次项 (与真实模型一致) 时,拟合优度增加到了 0.49;但当我们在模型中进一步添加高次项时,拟合优度并没有改善。

上述模拟结果表明:当回归模型与真实模型一致时,OLS 的拟合效果最好。

这意味着,在实证分析中,我们可以使用 R2 (更多的时候是使用 残差平方和 RSS),来作为判别模型优劣的指标。(需要说明的是,这只是一个必要条件,而不是充分条件。因为,当存在严重共线性或伪回归问题时,也会表现出 R2 很高的特征。参见 「Stata: 协整还是伪回归?」

OLS_app-05-NLS-Stata连享会.gif
OLS_app-05-NLS-Stata连享会.gif

3. 自己动手:用 Stata 模拟 OLS 的性质

以上模拟过程同样也可以用 Stata 操作,事实上仅需几行代码即可完成:

cd "D:\stata15\ado\personal\Jianshu\OLS_simu_APP"
clear
set obs 151
set seed 1
gen x = rnormal(2, 0.25)
gen u = rnormal(0,1)
gen y = 2 + 3*x + u
*-图示
twoway (scatter y x) (lfit y x), ///
       scheme(tufte) legend(off)
*-更为简洁的做法
aaplot y x
graph export OLS_APP_01.png, replace
reg y x

我们可以在上述 dofile 中修改相应的参数来对比 OLS 性质的变化。

如果想让模拟分析过程更有效,可以把上述代码改写为一个可以反复执行的 ado 文件,并以此为基础定义一个 Stata 命令,通过选项来设定模拟过程中各个参数的数值。具体实现过程参见:「Stata:编写 ado 文件自动化执行常见任务」

Stata连享会-OLS蒙特卡洛模拟-使用 aaplot 命令制图
Stata连享会-OLS蒙特卡洛模拟-使用 aaplot 命令制图

4. 结语

在这篇推文中,我们为大家介绍了一个根据用户自己设置的参数生成样本点并进行 OLS 回归的 APP,并通过对这个 APP 的简单操作对 OLS 回归中样本规模、解释变量标准差、误差项标准差以及各个参数之间的交互作用对回归结果的影响给出了一个直观的体验,希望对大家有所帮助。需要注意的是,在试图使用 Stata 等其他统计软件对这个 APP 计算的统计量进行对比和验证时需要牢记这个 APP 默认 x 的期望为 2,u 的期望为 0 ,否则可能会出现与预期不一致的结果。这里我们也给出了使用 Stata 实现同样回归效果的代码,作为对这个 APP 的一个补充和对照。

相关课程

连享会-直播课 上线了!
http://lianxh.duanshu.com

免费公开课:


课程一览

支持回看,所有课程可以随时购买观看。

专题 嘉宾 直播/回看视频
最新专题 DSGE, 因果推断, 空间计量等
Stata 数据清洗 游万海 直播, 2 小时,已上线
研究设计 连玉君 我的特斯拉-实证研究设计-幻灯片-
面板模型 连玉君 动态面板模型-幻灯片-
面板模型 连玉君 直击面板数据模型 [免费公开课,2 小时]

Note: 部分课程的资料,PPT 等可以前往 连享会-直播课 主页查看,下载。


关于我们

  • Stata 连享会 由中山大学连玉君老师团队创办,定期分享实证分析经验。直播间 有很多视频课程,可以随时观看。
  • 连享会-主页知乎专栏,300+ 推文,实证分析不再抓狂。
  • 公众号推文分类: 计量专题 | 分类推文 | 资源工具。推文分成 内生性 | 空间计量 | 时序面板 | 结果输出 | 交乘调节 五类,主流方法介绍一目了然:DID, RDD, IV, GMM, FE, Probit 等。
  • 公众号关键词搜索/回复 功能已经上线。大家可以在公众号左下角点击键盘图标,输入简要关键词,以便快速呈现历史推文,获取工具软件和数据下载。常见关键词:课程, 直播, 视频, 客服, 模型设定, 研究设计, stata, plus, 绘图, 编程, 面板, 论文重现, 可视化, RDD, DID, PSM, 合成控制法

连享会主页  lianxh.cn
连享会主页 lianxh.cn

连享会小程序:扫一扫,看推文,看视频……

扫码加入连享会微信群,提问交流更方便

✏ 连享会学习群-常见问题解答汇总:
https://gitee.com/arlionn/WD