作者: 徐婷 (厦门大学)
在不同的实证研究中,有些回归模型为每个年份设置了时间虚拟变量,另一些模型加入了时间趋势项。那么,在模型中加入时间虚拟变量和时间趋势项的区别是什么呢?在什么情况下,应该加入那种表示时间变化的变量呢?
当观察值所在年份等于指定年份,时间虚拟变量等于 1,否认为 0。通过设置时间虚拟变量,能够控制年份层面的固定效应,例如:特定时间内发生的外部冲击,无法被其他解释变量控制。一般而言,当数据集中包含 T 期时,应该加入 T-1 个时间虚拟变量。
如以上公式所示,
如以上公式所示,大小为 τj 的特定年份的效应,能影响所有的第 j 年的样本。如果认为某一年有特殊效应,并且希望衡量其大小,那么设置时间虚拟变量是最合适的方法。
指定年份的时间趋势变量等于数据集中时间变量的顺序,例如:如果数据集中包含了 2000 年到 2010 年的样本,那么 2000 年的样本的时间趋势项为 1,2001 年的样本为 2,以此类推。通过设置时间趋势变量,可以控制由其他变量无法解释的因变量的外生变动。
以上公式中的 λ 是时间趋势项t的回归系数,t 是等步递增的。为了获得可以解释的表达方式,我们可以进行求导如下:
所以,随着时间从某一年变化到另一年,如:时间趋势项 t 变动一个单位,会对因变量产生一个大小为 λ 的影响。由此生成一个线性的趋势项,它可以被解释为因变量随时间变动的总体方向。事前假设时间趋势项的效应并非对应于某一特定年份,但是产生变化的过程是跨年份的。
时间趋势项通常用于表示技术进步,而时间虚拟变量用于控制某一特定年份的效应,例如发生严重的洪水等自然灾害的年份。如何选择时间虚拟变量或时间趋势项,这取决于模型希望解决的问题是某个特定年份的变化还是时间趋势。
只要有可靠的理论依据,可以同时包含时间虚拟变量和时间趋势项。但加入这两种变量都无法解决时间序列的非平稳问题,因此要利用面板数据的单位根检验来检查数据是否平稳。
下面本文基于数据集 gss.dta 来简要说明在模型中加入时间虚拟变量和时间趋势项的区别和联系。degree为因变量,表示被调查者的受教育程度;coh为时间趋势项,用被调查者出生的年份减 1900 后除以10来衡量;year为时间虚拟变量,用被调查者出生的年份减 1900 后设置的虚拟变量来衡量。
.use http://fmwww.bc.edu/repec/bocode/g/gss.dta, clear
.gen year = coh*10
在这里,我们在模型一中同时加入时间虚拟变量i.year
、时间趋势项c.coh
,在模型二中仅加入时间虚拟变量。回归后分别求取拟合值yhat1和yhat2,通过比较两种拟合值的差异来分析两个模型的异同。
.reg degree i.year c.coh
.predict yhat1
.reg degree i.year
.predict yhat2
.twoway scatter yhat1 yhat2, aspect(1) || ///
function identity = x, range(.5 2.1) ///
ytitle(trend + dummies) ///
xtitle(only dummies)
如下图所示,在包含时间虚拟变量的模型中加入时间趋势项后,并没有改变模型,只是将相同的信息以不同的系数进行区分。在本例中,两种模型得出的拟合结果是完全相同的。所以,如果在模型中同时加入时间虚拟变量和趋势项难以解释,在没有损失信息的情况下,可以去掉时间趋势项。
在这里,我们将时间虚拟变量以每 10 年为单位进行划分,在模型三中同时加入以每 10 年为单位的时间虚拟变量i.decade
、时间趋势项c.coh
,在模型四中仅加入时间趋势项。回归后分别求取拟合值yhat3和yhat4,再加上模型二的拟合值yhat2,通过比较三个拟合值的差异来分析模型的异同。
.gen decade = floor(coh)
.reg degree i.decade coh
.predict yhat3
.reg degree coh
.predict yhat4
.sort coh
.by coh : gen byte mark = _n == 1
.twoway line yhat3 coh if mark || ///
line yhat4 coh if mark || ///
scatter yhat2 coh if mark, ///
legend(order( 1 "trend + decade" ///
2 "just trend" ///
3 "annual estimate" ))
如果划分时间虚拟变量的时间跨度更长,例如,时间趋势项按年度划分,而时间虚拟变量按 10 年划分,那么这两个模型实质上是不同的。
连享会-直播课 上线了!
http://lianxh.duanshu.com
免费公开课:
直击面板数据模型 - 连玉君,时长:1小时40分钟 Stata 33 讲 - 连玉君, 每讲 15 分钟. 部分直播课 课程资料下载 (PPT,dofiles等)
支持回看,所有课程可以随时购买观看。
专题 | 嘉宾 | 直播/回看视频 |
---|---|---|
⭐ 最新专题 ⭐ | DSGE, 因果推断, 空间计量等 | |
⭕ Stata数据清洗 | 游万海 | 直播, 2 小时,已上线 |
研究设计 | 连玉君 | 我的特斯拉-实证研究设计,-幻灯片- |
面板模型 | 连玉君 | 动态面板模型,-幻灯片- |
面板模型 | 连玉君 | 直击面板数据模型 [免费公开课,2小时] |
Note: 部分课程的资料,PPT 等可以前往 连享会-直播课 主页查看,下载。
关于我们
课程, 直播, 视频, 客服, 模型设定, 研究设计, stata, plus, 绘图, 编程, 面板, 论文重现, 可视化, RDD, DID, PSM, 合成控制法
等
连享会小程序:扫一扫,看推文,看视频……
扫码加入连享会微信群,提问交流更方便
✏ 连享会学习群-常见问题解答汇总:
✨ https://gitee.com/arlionn/WD