温馨提示: 定期 清理浏览器缓存,可以获得最佳浏览体验。
作者:连玉君 | 许梦洁
目录
最小二乘估计( OLS )是经管类学生学术道路上的第一个拦路虎,也是最重要的垫脚石。复杂的估计参数、模型设定以及各种统计量总是让初学者们望而却步,同时如何清楚明白地向同学们讲清楚复杂的 OLS 系统对于老师们来说也是一个不小的挑战。因此一个能够直观反映 OLS 系统抽象性质的工具想必不仅能帮助同学们对抽象的 OLS 系统有一个直观地体验,而且也能极大地方便老师们的教学工作。在这篇推文中,我们就将为大家介绍这样一个福利 APP:A Shiny App for Playing with OLS。
采用矩阵形式将线性回归模型表示如下:
若假设解释变量外生 (同时满足其它基本假设条件),即
进一步假设
显然,若想提高
为了让大家对参数和模型的设定如何影响 OLS 回归结果有一个直观地感受,本文与大家分享一个在线的可视化 APP —— A Shiny App for Playing with OLS。
这个 APP 使我们可以直接修改 DGP (数据生成过程,Data Generation Process) 中各项参数,以便了解 OLS 的估计性质受那些因素影响,从而为实证分析中合理设定模型提供依据。
具体而言,在进行基本参数设定时,该 APP 对解释变量和扰动项的假设与经典 OLS 假设一致 ,并给定
首先,我们来看样本规模对 OLS 回归的影响。其他条件不变,在回归模型设定正确的前提下,样本量越大模型的拟合优度越高。这个预判可以从下图的操作中得到验证,这里真实数据生成过程 (DGP) 为
模型设定正确的前提下,其他条件不变,解释变量标准差越大,拟合效果越好。如下图,当解释变量
当同时考虑解释变量和误差项的标准差变化时,我们将能更清楚地看到解释变量和误差项标准差对拟合效果不同方向的影响以及影响程度的相对大小。
模拟显示,保持
在上述模拟中,我们都直接设定回归模型与真实模型一致。然而,实际分析中,我们并不知道真实的 DGP,也就无从知道真实的模型形式。那么,当回归模型设定不符合真实模型会发生什么呢?
这里,我们设定真实模型为
上述模拟结果表明:当回归模型与真实模型一致时,OLS 的拟合效果最好。
这意味着,在实证分析中,我们可以使用 R2 (更多的时候是使用 残差平方和 RSS),来作为判别模型优劣的指标。(需要说明的是,这只是一个必要条件,而不是充分条件。因为,当存在严重共线性或伪回归问题时,也会表现出 R2 很高的特征。参见 「Stata: 协整还是伪回归?」)
以上模拟过程同样也可以用 Stata 操作,事实上仅需几行代码即可完成:
cd "D:\stata15\ado\personal\Jianshu\OLS_simu_APP"
clear
set obs 151
set seed 1
gen x = rnormal(2, 0.25)
gen u = rnormal(0,1)
gen y = 2 + 3*x + u
*-图示
twoway (scatter y x) (lfit y x), ///
scheme(tufte) legend(off)
*-更为简洁的做法
aaplot y x
graph export OLS_APP_01.png, replace
reg y x
我们可以在上述 dofile 中修改相应的参数来对比 OLS 性质的变化。
如果想让模拟分析过程更有效,可以把上述代码改写为一个可以反复执行的 ado 文件,并以此为基础定义一个 Stata 命令,通过选项来设定模拟过程中各个参数的数值。具体实现过程参见:「Stata:编写 ado 文件自动化执行常见任务」。
在这篇推文中,我们为大家介绍了一个根据用户自己设置的参数生成样本点并进行 OLS 回归的 APP,并通过对这个 APP 的简单操作对 OLS 回归中样本规模、解释变量标准差、误差项标准差以及各个参数之间的交互作用对回归结果的影响给出了一个直观的体验,希望对大家有所帮助。需要注意的是,在试图使用 Stata
等其他统计软件对这个 APP 计算的统计量进行对比和验证时需要牢记这个 APP 默认 Stata
实现同样回归效果的代码,作为对这个 APP 的一个补充和对照。
连享会-直播课 上线了!
http://lianxh.duanshu.com
免费公开课:
直击面板数据模型 - 连玉君,时长:1 小时 40 分钟 Stata 33 讲 - 连玉君, 每讲 15 分钟. 部分直播课 课程资料下载 (PPT,dofiles 等)
支持回看,所有课程可以随时购买观看。
专题 | 嘉宾 | 直播/回看视频 |
---|---|---|
⭐ 最新专题 ⭐ | DSGE, 因果推断, 空间计量等 | |
⭕ Stata 数据清洗 | 游万海 | 直播, 2 小时,已上线 |
研究设计 | 连玉君 | 我的特斯拉-实证研究设计,-幻灯片- |
面板模型 | 连玉君 | 动态面板模型,-幻灯片- |
面板模型 | 连玉君 | 直击面板数据模型 [免费公开课,2 小时] |
Note: 部分课程的资料,PPT 等可以前往 连享会-直播课 主页查看,下载。
关于我们
课程, 直播, 视频, 客服, 模型设定, 研究设计, stata, plus, 绘图, 编程, 面板, 论文重现, 可视化, RDD, DID, PSM, 合成控制法
等
连享会小程序:扫一扫,看推文,看视频……
扫码加入连享会微信群,提问交流更方便
✏ 连享会学习群-常见问题解答汇总:
✨ https://gitee.com/arlionn/WD