温馨提示: 定期 清理浏览器缓存,可以获得最佳浏览体验。
编者: 展一帆 (复旦大学)
E-Mail: simonzhanyf@163.com
编者注: 本文翻译改编自 Paul Allison 教授发表的论文以及博客文章,特此致谢。 Source: Allison P D . Asymmetric Fixed-effects Models for Panel Data[J]. Socius: Sociological Research for a Dynamic World, 2019
目录
标准的面板数据分析方法依赖于方向对称性假设(directional symmetry)。具体而言,即如果变量
但是这种对称性的假设在很多情形下往往不适用。例如,一个人结婚时幸福水平的增加与离婚时幸福水平的减少正好相等么?亦或者收入增加 1 万美元对储蓄的提振与减少 1 万美元的影响正好对称么?
本文将利用一个仅包含双时点的简单情形,展示如何放松这一假设。关于多时期的情形,可以参阅 Allison (2019)。
首先可以下载作者 Paul Allison 提供的范例数据 nlsy.dta (右击另存)。该数据集横截面上有 581 名儿童,分别在 1990 年和 1992 年参与了国家青年纵向调查,测量了如下三个指标:
anti
:反社会行为,测度指标为一有序分类变量,取值从 0 至 6。self
:自尊心,测度指标为一有序分类变量,取值从 6 至 24。pov
:家庭贫困状况, 测度指标为一虚拟变量,取 1 代表家庭贫困,取 0 则反之。实证分析的目标是估计 self
和 pov
对 anti
的因果效应。估计模型采用传统的固定效应模型 (Allison 2005, 2009) ,其是研究随时间增加或减少的效应的理想选择,并且可以很好地控制非时变不可观测因素。
对于两个时期的数据,有几种等价的方法可以估计固定效应模型。其中差分法是允许方向不对称的最直接方法。其原理是从时间 2 的值中减去时间 1 的值以构造差分变量,然后只需对差异后的变量执行 OLS 估计即可。
如下是「传统 对称模型」的 Stata 代码:
*-下载数据,保存到当前工作路径下
. copy "https://statisticalhorizons.com/wp-content/uploads/nlsy.dta" nlsy.dta, replace
. use "nlsy.dta", clear
*-数据概况
. des
Contains data from nlsy.dta
obs: 581
vars: 16
size: 12,782
----------------------------------------------------
variable name variable label
----------------------------------------------------
momage mother age at birth of child years
anti90 child antisocial behavior in 1990
anti92 child antisocial behavior in 1992
anti94 child antisocial behavior in 1994
gender child's gender
childage child age in 1990 years
hispanic child race hispanic
black child race black
momwork mother employment status in 1990
married mother married in 1990
self90 child self-esteem in 1990
self92 child self-esteem in 1992
self94 child self-esteem in 1994
pov90 family poverty status in 1990
pov92 family poverty status in 1992
pov94
----------------------------------------------------
*-变量的基本统计量
. sum // 下面的结果是用 fsum 命令得到的
Variable | N Mean SD Min Max
----------+---------------------------------------------
momage | 581 20.66 2.19 16.00 25.00
anti90 | 581 1.57 1.47 0.00 6.00
anti92 | 581 1.60 1.56 0.00 6.00
anti94 | 581 1.75 1.69 0.00 6.00
gender | 581 0.50 0.50 0.00 1.00
childage | 581 8.94 0.60 8.00 10.00
hispanic | 581 0.24 0.43 0.00 1.00
black | 581 0.36 0.48 0.00 1.00
momwork | 581 0.34 0.47 0.00 1.00
married | 581 0.24 0.42 0.00 1.00
self90 | 581 20.07 3.19 9.00 24.00
self92 | 581 20.36 3.53 6.00 24.00
self94 | 581 20.62 3.27 9.00 24.00
pov90 | 581 0.34 0.47 0.00 1.00
pov92 | 581 0.33 0.47 0.00 1.00
pov94 | 581 0.32 0.47 0.00 1.00
*-回归分析 I:对称固定效应模型
generate antidiff = anti92 - anti90
generate selfdiff = self92 - self90
generate povdiff = pov92 - pov90
regress antidiff selfdiff povdiff
结果如下 (这里省略了置信区间):
----------------------------------------------------
antidiff | Coef. Std. Err. t P>|t|
----------+-----------------------------------------
selfdiff | -.0391292 .0136396 -2.87 0.004
povdiff | .1969039 .1326352 1.48 0.138
_cons | .0403031 .0533833 0.75 0.451
----------------------------------------------------
从结果来看,自尊对反社会行为具有显著的负面影响。具体而言,自尊每增加 1 个单位,反社会行为就会下降 0.039 个单位。但这也意味着自尊每降低 1 个单位,反社会行为就会增加 0.039 个单位。贫困对自尊产生正向(但不显著)的影响。陷入贫困的儿童的反社会行为增加了 0.196 个单位,而摆脱贫困的儿童的反社会行为则降低了 0.196。
那么进一步,如何放松方向对称性假设(directional symmetry)的约束?参考 York and Light(2017),需要将每个差分后的变量进一步分解为其 正分量 和 负分量 两个部分。设
以下是在 Stata 中创建这些变量的方法,其中括号中的不等式是逻辑表达式,如果不等式为 true,则值为 1;如果不等式为 false,则值为 0。
generate selfpos = selfdiff*(selfdiff>0)
generate selfneg = -selfdiff*(selfdiff<0)
generate povpos = povdiff*(povdiff>0)
generate povneg = -povdiff*(povdiff<0)
现在只需用 antidiff 对这个四个变量执行 OLS 回归即可:
regress antidiff selfpos selfneg povpos povneg
---------------------------------------------------
antidiff | Coef. Std. Err. t P>|t|
---------+-----------------------------------------
selfpos | -.0048386 .0251504 -0.19 0.848
selfneg | .0743077 .025658 2.90 0.004
povpos | .2502064 .2003789 1.25 0.212
povneg | -.126328 .1923669 -0.66 0.512
_cons | -.0749517 .086383 -0.87 0.386
---------------------------------------------------
在放松对称性假设后的回归中,结果发生了显著变化:
self
每增加 1 个单位,反社会行为就会降低 0.005 个单位(不显着);但自尊心下降 1 个单位会使反社会行为增加 0.074 个单位(非常显着)。因此,自尊心对反社会行为的影响是非对称的,其下降会产生很大影响,而自尊心的增长却几乎没有影响。请注意,原始估计值 -0.039 大约介于这两个估计值之间 (可以视为平均效果吗?)。那么,上述对称效果是否显着不同?我们可以使用以下命令进行检验:
. test selfpos = -selfneg
( 1) selfpos + selfneg = 0
F( 1, 576) = 2.63
Prob > F = 0.1057
. test povpos = -povneg
( 1) povpos + povneg = 0
F( 1, 576) = 0.18
Prob > F = 0.6688
得出的 p 值为 0.10,在统计上不显着。这意味着,本例中,「自尊心效应」并不存在统计上显著的非对称特征。
家庭贫困状态 pov
变量的两个分量的系数虽然都在预期的方向上,但统计上均不显著。陷入贫困会增加反社会行为,而摆脱贫困则会减少反社会行为,但幅度只有一半左右。这两种效果统计上差异也不显著。
以上便是非对称固定效应模型用于分析两期面板数据的实操方法。
当数据包含三个或更多时期时,则需要对相邻时期都进行一阶差分,每个横截面单位都将有多个时期的差分变量,例如
有关估计和分析细节,可以进一步参考 Allison (2019)。
*-下载数据,保存到当前工作路径下
. copy "https://statisticalhorizons.com/wp-content/uploads/nlsy.dta" nlsy.dta, replace
. use "nlsy.dta", clear
*-数据概况
. des
*-变量的基本统计量
. sum // 下面的结果是用 fsum 命令得到的
. fsum
*-回归分析 I:对称固定效应模型
generate antidiff = anti92 - anti90
generate selfdiff = self92 - self90
generate povdiff = pov92 - pov90
regress antidiff selfdiff povdiff
*-回归分析 II:非对称 FE
generate selfpos = selfdiff*(selfdiff>0)
generate selfneg = -selfdiff*(selfdiff<0)
generate povpos = povdiff*(povdiff>0)
generate povneg = -povdiff*(povdiff<0)
regress antidiff selfpos selfneg povpos povneg
*-假设检验
test selfpos = -selfneg
test povpos = -povneg
连享会-直播课 上线了!
http://lianxh.duanshu.com
免费公开课:
直击面板数据模型 - 连玉君,时长:1小时40分钟 Stata 33 讲 - 连玉君, 每讲 15 分钟. 部分直播课 课程资料下载 (PPT,dofiles等)
支持回看,所有课程可以随时购买观看。
专题 | 嘉宾 | 直播/回看视频 |
---|---|---|
⭐ 最新专题 ⭐ | DSGE, 因果推断, 空间计量等 | |
⭕ Stata数据清洗 | 游万海 | 直播, 2 小时,已上线 |
研究设计 | 连玉君 | 我的特斯拉-实证研究设计,-幻灯片- |
面板模型 | 连玉君 | 动态面板模型,-幻灯片- |
面板模型 | 连玉君 | 直击面板数据模型 [免费公开课,2小时] |
Note: 部分课程的资料,PPT 等可以前往 连享会-直播课 主页查看,下载。
关于我们
课程, 直播, 视频, 客服, 模型设定, 研究设计, stata, plus, 绘图, 编程, 面板, 论文重现, 可视化, RDD, DID, PSM, 合成控制法
等
连享会小程序:扫一扫,看推文,看视频……
扫码加入连享会微信群,提问交流更方便
✏ 连享会学习群-常见问题解答汇总:
✨ https://gitee.com/arlionn/WD