utest:检验U型和倒U形关系

发布时间:2020-06-22 阅读 16435

Stata 连享会   主页 || 视频 || 推文

温馨提示: 定期 清理浏览器缓存,可以获得最佳浏览体验。

课程详情 https://gitee.com/arlionn/Course   |   lianxh.cn

课程主页 https://gitee.com/arlionn/Course

作者:李森林 (中南财经政法大学)
邮箱Senlin6835@163.com


目录


1 应用背景

在实证分析中,我们通常假设解释变量和被解释变量为「线性关系」。然而,在很多情况下,解释变量和被解释变量可能存在「非线性关系」。为解决该问题,研究者往往会在模型中加入平方项,甚至是高阶项 (断点回归分析 RDD 中常用的处理方法)。

「平方项 = 倒 U 型 ?」推文中,我们介绍了模型中加入平方项后应如何解释系数的含义及注意事项。但是,通过浏览现有的期刊论文,我们发现不少文章作者只要平方项的系数 c 在统计上显著,便声称 y 和 x 之间存在「U 形关系」 或「倒 U 形关系」。实际上,这并不严谨,有时甚至是错误的。

在 Statalist 的一个帖子 Testing whether to include a squared term 中,大家也对此问题进行了深入的讨论。

平方项显著就一定意味着存在 U 形关系吗?

在大多数试图识别 U 形关系的实证中,研究人员会在一个标准的线性回归模型中包括一个非线性 (通常是二次型) 项。如果这一项是显著的,并且估计的极值点在数据范围内,则认为存在 U 形关系。然而,Lind and Mehlum (2010)1 认为,这一标准过于薄弱。当真正的关系是凸而单调时,模型估计将错误地产生一个极值点和 U 形关系。

对 U 形的测试比较复杂,因为原假设要求在区间的左边是递增的 (或递减的),而在右边是递减的 (或递增的)。对于这个复合的原假设,标准的测试方法不再适用。Lind and Mehlum (2010) 借鉴 Sasabuschi (1980) 开发的通用框架,来测试两变量间是否存在 U 形和倒 U 形关系,并且利用这个检验原理编写了 utest 检验命令。utest 提供了一个 U 形 (或倒 U 形) 关系在一个区间上存在与否的「精确测试」。

本文的目的在于介绍 utest 命令的具体使用方法,并结合案例加以说明。

2 用法介绍

在正式介绍之前,我们需使用 ssc install utest, replace 安装该命令,并使用 help utest 查看该命令的帮助文件。

2.1 基本语法

utest 的基本语法:utest x f(x) [, options]

  • 其中,utest 为命令主体;

  • 估计必须包括解释变量 x 和非线性项 f(x)

  • options 为在基础命令上添加的选项,「详见 2.2 小节」。

2.2 选项介绍

下面将对 utest 命令的选项进行说明。

选项 用途
min(#) #为数据范围的左端点
max(#) #为数据范围的右端点
quadratic 设定检验 f(x) =x^2
inverse 设定检验 f(x) =1/x
fieller 包括极值点的费勒区间
level(#) 设置菲勒区间的置信水平
prefix(因变量) 模型估计的因变量

注意utest 是在回归之后使用的。

  • prefix(因变量) 选项适用于普通 regress 之外的其它模型,例如 logit 等;

  • 默认情况下,测试区间为完整的数据范围,但是可以通过设置选项 min(#)max(#) 来控制;

  • 选项 Fieller 也提供了极值点的「Fieller 区间」,即使对于有限样本,这个区间也是正确的;

  • 菲勒区间的置信水平默认是 95%。

3 应用案例

3.1 案例一

以「nlsw88」数据为例,检验妇女工资 wage 与工作经验 ttl_exp 间是否存在倒 U 形关系。

代码如下:

*-调用数据
  sysuse "nlsw88.dta", clear
*-生成二次项
  gen ttl_exp2 = ttl_exp * ttl_exp
*-ols 回归
  reg wage ttl_exp ttl_exp2
*-检验 U 形关系
  utest ttl_exp ttl_exp2, fieller
*-ttl_exp 取值范围
  sum ttl_exp

检验结果如下:

. *-检验 U 形关系
.   utest ttl_exp ttl_exp2, fieller

Specification: f(x)=x^2
Extreme point:  29.60629

Test:
     H1: Inverse U shape
 vs. H0: Monotone or U shape 

-------------------------------------------------
                 |   Lower bound      Upper bound
-----------------+-------------------------------
Interval         |    .1153846         28.88461
Slope            |    .5548667         .0135783
-------------------------------------------------

Extremum outside interval - trivial failure to reject H0

95% Fieller interval for extreme point: [20.930938; 244.46717]
. sum ttl_exp

    Variable |        Obs        Mean    Std. Dev.       Min        Max
-------------+---------------------------------------------------------
     ttl_exp |      2,246    12.53498    4.610208   .1153846   28.88461

可以看出,计算出的极值点为 29.61,ttl_exp 的最大值为 28.88。可知,检验出的 “极值点” 并不在数据范围内,无法拒绝原假设。因此,我们可以认为不存在 U 形或倒 U 形关系。同时,fieller 选项还汇报了极值点的置信区间。

3.2 案例二

以「nlswork」数据为例,考察女性年龄与对数工资之间是否存在倒 U 形关系。

代码如下:

*-调用数据
/*
  copy http://www.stata-press.com/data/r9/nlswork.dta nlswork.dta, replace
  use nlswork.dta, clear
*/  
  webuse "nlswork.dta", clear 
*-生成二次项
  generate age2 = age^2
*-ols 回归
  xtset idcode
  xtreg ln_w age age2
*-检验 U 形关系
  utest age age2, fieller level(99) //设置99%的置信度
*-age 取值范围
  sum age

检验结果如下:


. *-检验 U 形关系
.   utest age age2, fieller level(99) //设置99%的置信度
(24 missing values generated)
(24 missing values generated)

Specification: f(x)=x^2
Extreme point:  43.67398

Test:
     H1: Inverse U shape
 vs. H0: Monotone or U shape 

-------------------------------------------------
                 |   Lower bound      Upper bound
-----------------+-------------------------------
Interval         |          14               46
Slope            |    .0401102        -.0031441
t-value          |    27.22722        -2.117613
P>|t|            |    1.8e-161         .0171082
-------------------------------------------------

Overall test of presence of a Inverse U shape:
     t-value =      2.12
     P>|t|   =     .0171

99% Fieller interval for extreme point: [41.577944; 46.604849]

. *-age 取值范围
.   sum age

    Variable |        Obs        Mean    Std. Dev.       Min        Max
-------------+---------------------------------------------------------
         age |     28,510    29.04511    6.700584         14         46

可以看出,计算出的极值点为 43.67398,age 取值范围为 [14, 46]。可知,极值点在数据范围内,并能够在 5% 的统计水平上拒绝原假设。同时,结果中的 slope 在区间里是存在负号,因而我们可以认为是倒 U 形关系。

值得说明的是,utest 程序并未设置单独的方法检验是不是倒 U 形关系。但是,我们可以通过 slope 区间里的负号特征进行判断。

参考文献

  • Lind J T, Mehlum H. With or without U? The appropriate test for a U‐shaped relationship[J]. Oxford bulletin of economics and statistics, 2010, 72(1): 109-118. PDF
  • Sasabuchi S. A test of a multivariate normal mean with composite hypotheses determined by linear inequalities[J]. Biometrika, 1980, 67(2): 429-439. PDF
  • Haans, Richard F. J., Constant Pieters, and Zi‐Lin He. 2016. “Thinking about U: Theorizing and Testing U‐ and Inverted U‐shaped Relationships in Strategy Research.” Southern Medical Journal 37 (7): 1177–95.

相关课程

连享会-直播课 上线了!
http://lianxh.duanshu.com

免费公开课:


课程一览

支持回看,所有课程可以随时购买观看。

专题 嘉宾 直播/回看视频
最新专题 DSGE, 因果推断, 空间计量等
Stata数据清洗 游万海 直播, 2 小时,已上线
研究设计 连玉君 我的特斯拉-实证研究设计-幻灯片-
面板模型 连玉君 动态面板模型-幻灯片-
面板模型 连玉君 直击面板数据模型 [免费公开课,2小时]

Note: 部分课程的资料,PPT 等可以前往 连享会-直播课 主页查看,下载。


关于我们

  • Stata连享会 由中山大学连玉君老师团队创办,定期分享实证分析经验。直播间 有很多视频课程,可以随时观看。
  • 连享会-主页知乎专栏,300+ 推文,实证分析不再抓狂。
  • 公众号推文分类: 计量专题 | 分类推文 | 资源工具。推文分成 内生性 | 空间计量 | 时序面板 | 结果输出 | 交乘调节 五类,主流方法介绍一目了然:DID, RDD, IV, GMM, FE, Probit 等。
  • 公众号关键词搜索/回复 功能已经上线。大家可以在公众号左下角点击键盘图标,输入简要关键词,以便快速呈现历史推文,获取工具软件和数据下载。常见关键词:课程, 直播, 视频, 客服, 模型设定, 研究设计, stata, plus, 绘图, 编程, 面板, 论文重现, 可视化, RDD, DID, PSM, 合成控制法

连享会主页  lianxh.cn
连享会主页 lianxh.cn

连享会小程序:扫一扫,看推文,看视频……

扫码加入连享会微信群,提问交流更方便

✏ 连享会学习群-常见问题解答汇总:
https://gitee.com/arlionn/WD