温馨提示: 定期 清理浏览器缓存,可以获得最佳浏览体验。
作者:李森林 (中南财经政法大学)
邮箱:Senlin6835@163.com
目录
在实证分析中,我们通常假设解释变量和被解释变量为「线性关系」。然而,在很多情况下,解释变量和被解释变量可能存在「非线性关系」。为解决该问题,研究者往往会在模型中加入平方项,甚至是高阶项 (断点回归分析 RDD 中常用的处理方法)。
在「平方项 = 倒 U 型 ?」推文中,我们介绍了模型中加入平方项后应如何解释系数的含义及注意事项。但是,通过浏览现有的期刊论文,我们发现不少文章作者只要平方项的系数
在 Statalist 的一个帖子 Testing whether to include a squared term 中,大家也对此问题进行了深入的讨论。
平方项显著就一定意味着存在 U 形关系吗?
在大多数试图识别 U 形关系的实证中,研究人员会在一个标准的线性回归模型中包括一个非线性 (通常是二次型) 项。如果这一项是显著的,并且估计的极值点在数据范围内,则认为存在 U 形关系。然而,Lind and Mehlum (2010)1 认为,这一标准过于薄弱。当真正的关系是凸而单调时,模型估计将错误地产生一个极值点和 U 形关系。
对 U 形的测试比较复杂,因为原假设要求在区间的左边是递增的 (或递减的),而在右边是递减的 (或递增的)。对于这个复合的原假设,标准的测试方法不再适用。Lind and Mehlum (2010) 借鉴 Sasabuschi (1980) 开发的通用框架,来测试两变量间是否存在 U 形和倒 U 形关系,并且利用这个检验原理编写了 utest
检验命令。utest
提供了一个 U 形 (或倒 U 形) 关系在一个区间上存在与否的「精确测试」。
本文的目的在于介绍 utest
命令的具体使用方法,并结合案例加以说明。
在正式介绍之前,我们需使用 ssc install utest, replace
安装该命令,并使用 help utest
查看该命令的帮助文件。
utest
的基本语法:utest x f(x) [, options]
其中,utest
为命令主体;
估计必须包括解释变量 x 和非线性项 f(x) ;
options
为在基础命令上添加的选项,「详见 2.2 小节」。
下面将对 utest
命令的选项进行说明。
选项 | 用途 |
---|---|
min(#) |
# 为数据范围的左端点 |
max(#) |
# 为数据范围的右端点 |
quadratic |
设定检验 f(x) =x^2 |
inverse |
设定检验 f(x) =1/x |
fieller |
包括极值点的费勒区间 |
level(#) |
设置菲勒区间的置信水平 |
prefix(因变量) |
模型估计的因变量 |
注意:utest
是在回归之后使用的。
prefix(因变量)
选项适用于普通 regress
之外的其它模型,例如 logit
等;
默认情况下,测试区间为完整的数据范围,但是可以通过设置选项 min(#)
和 max(#)
来控制;
选项 Fieller
也提供了极值点的「Fieller 区间」,即使对于有限样本,这个区间也是正确的;
菲勒区间的置信水平默认是 95%。
以「nlsw88」数据为例,检验妇女工资 wage 与工作经验 ttl_exp 间是否存在倒 U 形关系。
代码如下:
*-调用数据
sysuse "nlsw88.dta", clear
*-生成二次项
gen ttl_exp2 = ttl_exp * ttl_exp
*-ols 回归
reg wage ttl_exp ttl_exp2
*-检验 U 形关系
utest ttl_exp ttl_exp2, fieller
*-ttl_exp 取值范围
sum ttl_exp
检验结果如下:
. *-检验 U 形关系
. utest ttl_exp ttl_exp2, fieller
Specification: f(x)=x^2
Extreme point: 29.60629
Test:
H1: Inverse U shape
vs. H0: Monotone or U shape
-------------------------------------------------
| Lower bound Upper bound
-----------------+-------------------------------
Interval | .1153846 28.88461
Slope | .5548667 .0135783
-------------------------------------------------
Extremum outside interval - trivial failure to reject H0
95% Fieller interval for extreme point: [20.930938; 244.46717]
. sum ttl_exp
Variable | Obs Mean Std. Dev. Min Max
-------------+---------------------------------------------------------
ttl_exp | 2,246 12.53498 4.610208 .1153846 28.88461
可以看出,计算出的极值点为 29.61,ttl_exp 的最大值为 28.88。可知,检验出的 “极值点” 并不在数据范围内,无法拒绝原假设。因此,我们可以认为不存在 U 形或倒 U 形关系。同时,fieller
选项还汇报了极值点的置信区间。
以「nlswork」数据为例,考察女性年龄与对数工资之间是否存在倒 U 形关系。
代码如下:
*-调用数据
/*
copy http://www.stata-press.com/data/r9/nlswork.dta nlswork.dta, replace
use nlswork.dta, clear
*/
webuse "nlswork.dta", clear
*-生成二次项
generate age2 = age^2
*-ols 回归
xtset idcode
xtreg ln_w age age2
*-检验 U 形关系
utest age age2, fieller level(99) //设置99%的置信度
*-age 取值范围
sum age
检验结果如下:
. *-检验 U 形关系
. utest age age2, fieller level(99) //设置99%的置信度
(24 missing values generated)
(24 missing values generated)
Specification: f(x)=x^2
Extreme point: 43.67398
Test:
H1: Inverse U shape
vs. H0: Monotone or U shape
-------------------------------------------------
| Lower bound Upper bound
-----------------+-------------------------------
Interval | 14 46
Slope | .0401102 -.0031441
t-value | 27.22722 -2.117613
P>|t| | 1.8e-161 .0171082
-------------------------------------------------
Overall test of presence of a Inverse U shape:
t-value = 2.12
P>|t| = .0171
99% Fieller interval for extreme point: [41.577944; 46.604849]
. *-age 取值范围
. sum age
Variable | Obs Mean Std. Dev. Min Max
-------------+---------------------------------------------------------
age | 28,510 29.04511 6.700584 14 46
可以看出,计算出的极值点为 43.67398,age 取值范围为 [14, 46]。可知,极值点在数据范围内,并能够在 5% 的统计水平上拒绝原假设。同时,结果中的 slope 在区间里是存在负号,因而我们可以认为是倒 U 形关系。
值得说明的是,utest
程序并未设置单独的方法检验是不是倒 U 形关系。但是,我们可以通过 slope
区间里的负号特征进行判断。
连享会-直播课 上线了!
http://lianxh.duanshu.com
免费公开课:
直击面板数据模型 - 连玉君,时长:1小时40分钟 Stata 33 讲 - 连玉君, 每讲 15 分钟. 部分直播课 课程资料下载 (PPT,dofiles等)
支持回看,所有课程可以随时购买观看。
专题 | 嘉宾 | 直播/回看视频 |
---|---|---|
⭐ 最新专题 ⭐ | DSGE, 因果推断, 空间计量等 | |
⭕ Stata数据清洗 | 游万海 | 直播, 2 小时,已上线 |
研究设计 | 连玉君 | 我的特斯拉-实证研究设计,-幻灯片- |
面板模型 | 连玉君 | 动态面板模型,-幻灯片- |
面板模型 | 连玉君 | 直击面板数据模型 [免费公开课,2小时] |
Note: 部分课程的资料,PPT 等可以前往 连享会-直播课 主页查看,下载。
关于我们
课程, 直播, 视频, 客服, 模型设定, 研究设计, stata, plus, 绘图, 编程, 面板, 论文重现, 可视化, RDD, DID, PSM, 合成控制法
等
连享会小程序:扫一扫,看推文,看视频……
扫码加入连享会微信群,提问交流更方便
✏ 连享会学习群-常见问题解答汇总:
✨ https://gitee.com/arlionn/WD