Stata连享会 主页 || 视频 || 推文 || 知乎 || Bilibili 站
温馨提示: 定期 清理浏览器缓存,可以获得最佳浏览体验。
New!
lianxh
命令发布了:
随时搜索推文、Stata 资源。安装:
. ssc install lianxh
详情参见帮助文件 (有惊喜):
. help lianxh
连享会新命令:cnssc
,ihelp
,rdbalance
,gitee
,installpkg
⛳ Stata 系列推文:
Note:本文为连享会 B 站视频课 连玉君公开课 Stata 33 讲中 「XT2:FE 和 RE 模型」的文字版。课程 dofile 和复现文档可以前往 https://gitee.com/arlionn/stata101 下载。
文字整理:冯超楠 (北京航空航天大学)
E-mail: fengcnhpy@126.com
内容提要:
本节学习最为常用的两个面板数据模型:固定效应模型 (Fixed Effects model,简称:FE) 和随机效应模型 (Random Effects model,简称:RE)
目录
首先回顾混合 OLS 模型,对于截面数据而言有以下线性表达式,其中 i 代表个体维度 (例如公司),公式如下:
对于 Panel Data 而言有以下表达式,其中 i 代表个体维度,t 代表时间维度
若直接用 OLS 方法应用于 Panel Data,则被称为混合 OLS 估计 (POLS)。在 Stata 中直接输入 reg
y x 就可以实现对该模型的混合 OLS 估计。其缺陷在于忽视了实际中个体效应对被解释变量的影响,如面试官的特征会对面试结果产生影响,公司不可观测的公司文化、CEO 的特征等会影响公司的业绩表现及财务决策,因此,将不变的截距项
接下来就转入考虑个体特征的模型。
首先看一下固定效应模型,模型右边所有的解释变量为
再来看一下随机效应模型,与固定效应表达式相同,不同的是此时
固定效应模型和随机效应模型的表达式完全相同,但背后的含义完全不同。固定效应模型假定“个体效应”
在估计方法上,固定效应模型只需要在OLS基础上加入一系列 firm dummies,用来反映不同公司间截距项的差别,即“个体效应“;随机效应模型的干扰项相对复杂,由
xtreg y x, fe
reg y x i.id
areg y x, absorb(id)
xtreg y x, re
(5) 式为固定效应模型的表述
(6) 式为每家公司内部进行了“压缩“处理,对每家公司时序上的作了平均处理 (计算组内平均值):
(7) 式为整个样本的“压缩“处理,得到:
(5) - (6) 去除了不可观测的 “个体效应”, (8) 式通过 (5) - (6) + (7) 得到,该变换称为组内去心,据此得到的估计量称为 Within-group Estimator (组内估计量) 或 De-meaned Estimator (去心估计量)
先用数据处理方式计算 (5) - (6) + (7),随后采取 OLS 方式:reg
如下散点图,若直接进行 OLS 估计,得到红色的拟合线,反映 y 与 x 之间的负相关关系。
若了解数据背后的特征:每个红圈内样本点对应三家公司,假设三家公司有相同的斜率,对应截距不同三条拟合平行线 (更好反映数据拟合的结果) 为我们通过固定效应模型估计得到的结果。
同样的数据,POLS 和 FE 估计结果可能完全不同 (Case I 中 POLS 估计结果显著为负,而 FE 估计结果显著为正)。
散点图:三家公司在不同年份的样本点 (Panel Data),整体拟合,可得到一条紫色的拟合线,即 x 和 y 存在正相关关系。
考虑到个体特征,使用固定效应模型估计,得到三条平行蓝色拟合线 (斜率相同),每家公司有其特定的截距项
该种情形下,两种估计方法得到的估计值 (斜率) 都为正,但在数值上有所差异。
我们使用 invest2.dta 作为研究数据,invest2.dta 包含 100 个观察值:5 家公司,每家公司有 20 年资料,涉及公司 id、时间 t、投资支出 invest、市场价值 market、资本存量 stock 五个变量。有多种方法估计投资支出 invest、市场价值 market、资本存量 stock 三个变量之间的关系,假设我们想研究投资支出、资本存量对市场价值的影响,则在回归模型中被解释变量为市场价值 market,解释变量为投资支出 invest、资本存量 stock,不同模型和估计方法 Stata 命令如下:
webuse "invest2.dta", clear
xtset company time
global y "market"
global x "invest stock"
regress $y $x //POLS
est store POLS
tab company, gen(dum)
regress $y $x dum2-dum5 //OLS+Dummies(id)
est store OLSdum1
regress $y $x dum1-dum5, nocons //OLS+Dummies(id)
est store OLSdum2
xtreg $y $x, fe //FE
est store FE
xtreg $y $x, re //RE
est store RE
local m "POLS OLSdum1 OLSdum2 FE RE"
esttab `m', mtitle(`m') nogap compress ///
scalar(N r2 r2_w r2_b r2_o) ///
star(* 0.1 ** 0.05 *** 0.01)
---------------------------------------------------------------
(1) (2) (3) (4) (5)
POLS OLSdum1 OLSdum2 FE RE
---------------------------------------------------------------
invest 4.453*** 3.053*** 3.053*** 3.053*** 3.847***
(9.24) (6.67) (6.67) (6.67) (7.96)
stock -0.115 -0.676*** -0.676*** -0.676*** -0.798***
(-0.33) (-3.05) (-3.05) (-3.05) (-3.11)
dum2 -2404.0*** 512.3***
(-12.40) (5.96)
dum3 -1016.6*** 1899.7***
(-4.59) (19.03)
dum4 -2318.4*** 597.9***
(-11.30) (7.15)
dum5 -1979.4*** 936.9***
(-15.50) (5.92)
dum1 2916.3***
(14.99)
_cons 849.6*** 2916.3*** 1372.6*** 1212.8***
(7.42) (14.99) (17.83) (7.84)
---------------------------------------------------------------
N 100 100 100 100 100
r2 0.667 0.936 0.978 0.417
r2_w 0.417 0.416
r2_b 0.696 0.705
r2_o 0.632 0.638
---------------------------------------------------------------
t statistics in parentheses
* p<0.1, ** p<0.05, *** p<0.01
结果解读如下:
OLS+Dummies(id)
还是 reg,fe
进行固定效应的估计,估计系数及标准误完全相同。reg,fe
组内去心方式在计算 R 平方的时候已经去除了 “个体效应” 的贡献,及列 (2) R 平方 (0.936) 与列 (4) R 平方 (0.417) 的差异在于 Dummies(id) 对 R 平方的贡献。
免费公开课
最新课程-直播课
专题 | 嘉宾 | 直播/回看视频 |
---|---|---|
⭐ 最新专题 | 文本分析、机器学习、效率专题、生存分析等 | |
研究设计 | 连玉君 | 我的特斯拉-实证研究设计,-幻灯片- |
面板模型 | 连玉君 | 动态面板模型,-幻灯片- |
面板模型 | 连玉君 | 直击面板数据模型 [免费公开课,2小时] |
⛳ 课程主页
⛳ 课程主页
关于我们
课程, 直播, 视频, 客服, 模型设定, 研究设计, stata, plus, 绘图, 编程, 面板, 论文重现, 可视化, RDD, DID, PSM, 合成控制法
等
连享会小程序:扫一扫,看推文,看视频……
扫码加入连享会微信群,提问交流更方便
✏ 连享会-常见问题解答:
✨ https://gitee.com/lianxh/Course/wikis
New!
lianxh
命令发布了:
随时搜索连享会推文、Stata 资源,安装命令如下:
. ssc install lianxh
使用详情参见帮助文件 (有惊喜):
. help lianxh