Logit-Probit:非线性模型中交互项的边际效应解读

发布时间:2021-04-30 阅读 2159

Stata连享会   主页 || 视频 || 推文 || 知乎

温馨提示: 定期 清理浏览器缓存,可以获得最佳浏览体验。

New! lianxh 命令发布了:
随时搜索推文、Stata 资源。安装命令如下:
. ssc install lianxh
详情参见帮助文件 (有惊喜):
. help lianxh

课程详情 https://gitee.com/lianxh/Course

课程主页 https://gitee.com/lianxh/Course

⛳ Stata 系列推文:

作者:展一帆 (复旦大学) ,周依仿(复旦大学) 邮箱simonzhanyf@163.com

Source:

  • Maarten L. Buis. Stata Tip 87: Interpretation of Interactions in Nonlinear Models[J]. The Stata Journal, 2010, 10(2) : 305-308. -Link-
  • Dow W H, Norton E C, Donahoe J T. Stata tip 134: Multiplicative and marginal interaction effects in nonlinear models[J]. The Stata Journal, 2019, 19(4): 1015-1020. -Link-


目录


1. 问题背景

在非线性计量模型(例如 logit,probit 等),如何解释交互项的效应,很多学者在应用上仍存在混淆之处。本文通过介绍 Buis (2010 和 Dow et al. (2019) 来说明这一问题。

2. 四种解释方法

我们使用一个 logit 模型作为例子:y=f(β1x+β2z+β12x×z)。 定义四种解释交互效应的方法如下: (1) 概率度量下的乘积交互效应(multiplicative interaction effects) 记 p 为给定 x 和 z 之后的估计值,则概率度量下的乘积交互效应可定义为

在 stata 中可用 marginsnlcom 命令获得:

. logit y i.x##i.z
. margins x#z, post
. nlcom (_b[1.x#1.z] / _b[1.x#0.z]) / (_b[0.x#1.z] / _b[0.x#0.z])

(2) 概率度量下的边际交互效应(marginal interaction effects) 概率度量下的边际交互效应定义则为:

stata 中可以使用如下命令获得:

. margins, dydx(z) at(x=(0 1)) contrast(atcontrast(r._at)) post

(3) 优比度量下的乘积交互效应(multiplicative interaction effects) 如果将被解释变量转化为优比(odds ratio),则乘积交互效应(multiplicative interaction effects)可定义为

这种解释方式是文献中最为常见的,在 stata 中的实现方式也非常简单,仅需增加 or 选项

. logit y i.x##i.z, or

(4) 优比度量下的边际交互效应(marginal interaction effects)

. margins x#z, expression(exp(xb())) post
. lincom (_b[1.x#1.z] - _b[1.x#0.z]) - (_b[0.x#1.z] - _b[0.x#0.z])

3. 一个警示性例子

在很多文献中,对于非线性模型交互项的解释只汇报了上述解释方法中的一种。本小节中通过一个简单例子说明上文四种方法可能得到不一样的结论,需要针对研究问题谨慎选择。

这个简单例子只有四个数据点(见图 1 的面板 A)。不妨考虑这个例子的背景为一个自然实验,变量 x 代表处理前后,0 代表处理前,1 代表处理后。变量 z 标记组,z=0 为控制组,z=1 为处理组。样本在处理前并不平衡,控制组的 p 为 0.05,处理组的 p 为 0.1。

在处理前(x = 0)时,随着 z 从 0 增加到 1,被解释变量取 1 的概率 p 从 0.05 上升到 0.10。当 x = 1 时,随着 z 从 0 增加到 1,被解释变量取 1 的概率从 0.10 增加到 0.19。图 1 的面板 B 则为转换成优比后的相同的四个数据点。

图1
图1

一方面,概率度量上的乘积交互效应为 0.95(表 1 最后一列,面板 A),因为在处理前(x=0)时,处理组(z=1)的 p 为控制组的两倍(0.1/0.05),而在处理后则仅为 1.9 倍(0.19/0.1),这意味着随着 x 增加,z 对 y 的效应在减小。相比之下,优比度量上的乘积交互效应是 1.0(表 1 的最后一列,面板 B),这意味着随着 x 的增加,z 的效应是不变的。

另一方面,概率度量上的边际交互效应为 0.04(表 1 中列,面板 A),因为在处理前(x=0)时,处理组(z=1)的 p 比控制组大 0.05(0.1-0.05),而在处理后则升至为 0.09(0.19-0.1)。这意味着随着 x 增大,z 的效应增大。优比度量上的边际交互效应为 0.06,也显示了类似的递增效应(尽管在其他例子中,它可能与概率度量上的边际交互效应有显著不同)。

由此可见,在该简单例子中,交互项的解释根据解释方法不同,即可能为正,为零也可能为负。即随着 x 增大,z 的效应可能:

  • 根据概率度量上的乘积交互效应而减小
  • 根据概率度量上的边际交互效应而增大
  • 根据优比度量上的乘积交互效应而为零
  • 根据优比度量上的边际相互效应而增大
表1
表1

4. 实操案例分析

进一步,我们可以通过 Buis(2010)中的一个例子加深对上文的理解。比如我们要研究对于黑人和白人来说,是否拥有大学学位 collgrad 对于是否能获得高级别工作(high_occ)优比的效应差异。

4.1 优比度量下的乘积交互效应解释方法

. sysuse nlsw88   // 采用系统自带的美国妇女工资数据集

// 生成“高级别”工作变量
. generate byte high_occ = occupation < 3 if occupation < .  

. generate byte black = race == 2 if race < .
. drop if race == 3

. generate byte baseline = 1

// 添加or选项,汇报odds ratio
. logit high_occ black##collgrad baseline, or noconstant nolog  

结果如下:

. logit high_occ black##collgrad baseline, or noconstant nolog 

Logistic regression                             Number of obs     =      2,211
                                                Wald chi2(4)      =     504.62
Log likelihood = -1199.4399                     Prob > chi2       =     0.0000

------------------------------------------------------------------------------
       high_occ | Odds Ratio   Std. Err.     z    P>|z|   [95% Conf. Interval]
----------------+-------------------------------------------------------------
        1.black |   .4194072   .0655069   -5.56   0.000   .3088072    .5696188
                |
       collgrad |
  college grad  |   2.465411    .293568    7.58   0.000   1.952238    3.113478
                |
 black#collgrad |
1#college grad  |   1.479715   .4132536    1.40   0.161   .8559637    2.558003
                |
       baseline |   .3220524   .0215596  -16.93   0.000   .2824512    .3672059
------------------------------------------------------------------------------

针对上表的解读,首先看基准组(没有大学学历的白人),表格中可得其优比为 0.322。由于优比的定义是 p/(1-p),所以我们可以解读为,对于每一个非高级别工作的人,样本中可以找到对应 0.322 个有高级别工作的人。

collgrad 的优比为 2.47,也即是说,拥有大学文凭的白人相对于没有大学文凭的白人,优比提升 2.47 倍(注意这里是乘法运算,即上文提到的 multiplicative effects)。所以对于有大学文凭的白人,总优比是 0.79 (0.32×2.47)。也即是说此时对于每一个非高级别工作的人,样本中可以找到对应 0.79 个有高级别工作的人。显然拥有大学文凭大幅度提升了获取高级别工作的可能性。

black的优比为 0.42,所以没有大学文凭的黑人的优比为 0.14 (0.32×0.42)。交乘项的优比为 1.48 (注意,这里对应上文中的“优比度量下的乘积交互效应”解释方法),也即黑人有大学文凭相比白人有大学文凭,对于找到高级别工作的优比的边际提升为 1.48 倍。换言之,对于有大学文凭的黑人来说,总优比是 0.49 (0.32×0.42×2.47×1.48)。

4.2 优比度量下的边际交互效应解释方法

继续该例子,但我们换做优比度量下的边际交互效应解释。用 margins 命令得到 blackcollgrad 不同组合下的优比。可以看到四种组合下的优比分别为 0.32,0.79,0.14 和 0.49(上一小节中已经通过乘法运算得到了这四个数字)。

用边际交互效应解释,则大学文凭对于白人的边际效应为 0.47 (0.79-0.32), 而对于黑人的边际效应则仅有 0.36 (0.49-0.14)。

由此可以看出, collgrad 的边际交互效应对于白人来说大于黑人,但其乘积交互效应则是黑人大于白人。产生差异的原因就在于计算乘积交互效应时,不同组的基准是不一样的,白人为 0.32,但黑人仅 0.14,所以虽然从乘积角度, collgrad 提升黑人的优比的比例更高,从 0.14 提升至 0.49,约 3.6 倍,但从边际上看优比只增加了 0.36。而白人的优比从 0.32 提升至 0.79,增加的倍数不如黑人,但边际上的增加量却达 0.47,大于黑人的 0.36。这就是两种解释方法差异的来源。

margins, over(black collgrad) expression(exp(xb())) post
*结果如下:
Predictive margins                              Number of obs     =      2,211
Model VCE    : OIM

Expression   : exp(xb())
over         : black collgrad

--------------------------------------------------------------------------------
                    |          Delta-method                                 
                    |   Margin   Std. Err.      z    P>|z|  [95% Conf. Interval]
--------------------+-----------------------------------------------------------
     black#collgrad |                                                           
0#not college grad  | .3220524   .0215596    14.94   0.000  .2797964    .3643084
    0#college grad  | .7939914    .078188    10.15   0.000  .6407457    .9472371
1#not college grad  | .1350711   .0190606     7.09   0.000   .097713    .1724292
    1#college grad  | .4927536   .1032487     4.77   0.000    .29039    .6951173
--------------------------------------------------------------------------------
. lincom 0.black#1.collgrad - 0.black#0.collgrad
( 1)  - 0bn.black#0bn.collgrad + 0bn.black#1.collgrad = 0

----------------------------------------------------------------
     |    Coef.   Std. Err.    z    P>|z|   [95% Conf. Interval]
-----+----------------------------------------------------------
 (1) |  .471939    .081106   5.82   0.000   .3129742    .6309038
----------------------------------------------------------------
. lincom 1.black#1.collgrad - 1.black#0.collgrad
 ( 1)  - 1.black#0bn.collgrad + 1.black#1.collgrad = 0

-----------------------------------------------------------------
     |     Coef.   Std. Err.    z    P>|z|   [95% Conf. Interval]
-----+-----------------------------------------------------------
 (1) |  .3576825   .1049933   3.41   0.001   .1518994    .5634656
-----------------------------------------------------------------

总结一下,乘积交互效应(multiplicative interaction effects)和边际交互效应(marginal interaction effects)并不一样,回答的是不同的问题,在特定情况下可能给出完全相反的结论。故而学者在解释非线性模型的交乘项时,应当注意其中微妙的差别,谨慎的对交互项做出经济学解释。

5. 参考资料

  • Maarten L. Buis. Stata Tip 87: Interpretation of Interactions in Nonlinear Models[J]. The Stata Journal, 2010, 10(2) : 305-308. -Link-
  • Dow W H, Norton E C, Donahoe J T. Stata tip 134: Multiplicative and marginal interaction effects in nonlinear models[J]. The Stata Journal, 2019, 19(4): 1015-1020. -Link-, -PDF-

6. 相关推文

Note:产生如下推文列表的 Stata 命令为:
lianxh 调节 u型 交乘 交叉
安装最新版 lianxh 命令:
ssc install lianxh, replace

相关课程

免费公开课

最新课程-直播课

专题 嘉宾 直播/回看视频
最新专题 文本分析、机器学习、效率专题、生存分析等
研究设计 连玉君 我的特斯拉-实证研究设计-幻灯片-
面板模型 连玉君 动态面板模型-幻灯片-
面板模型 连玉君 直击面板数据模型 [免费公开课,2小时]
  • Note: 部分课程的资料,PPT 等可以前往 连享会-直播课 主页查看,下载。

课程主页

课程主页

关于我们

  • Stata连享会 由中山大学连玉君老师团队创办,定期分享实证分析经验。
  • 连享会-主页知乎专栏,400+ 推文,实证分析不再抓狂。直播间 有很多视频课程,可以随时观看。
  • 公众号关键词搜索/回复 功能已经上线。大家可以在公众号左下角点击键盘图标,输入简要关键词,以便快速呈现历史推文,获取工具软件和数据下载。常见关键词:课程, 直播, 视频, 客服, 模型设定, 研究设计, stata, plus, 绘图, 编程, 面板, 论文重现, 可视化, RDD, DID, PSM, 合成控制法

连享会小程序:扫一扫,看推文,看视频……

扫码加入连享会微信群,提问交流更方便

✏ 连享会-常见问题解答:
https://gitee.com/lianxh/Course/wikis

New! lianxh 命令发布了:
随时搜索连享会推文、Stata 资源,安装命令如下:
. ssc install lianxh
使用详情参见帮助文件 (有惊喜):
. help lianxh