温馨提示: 定期 清理浏览器缓存,可以获得最佳浏览体验。
吴思锐 (湖南大学, wusirui@hnu.edu.cn)
连玉君 (中山大学, arlionn@163.com)
目录
本次推文主要介绍 biprobit
命令,以及其在 Stata 中的应用实例。
Bivariate Probit 模型是两个二元变量结果的联合模型。如果这两个二元变量的结果是不相关的,我们可以估计两个独立的 probit 模型,否则则需要使用 Bivariate Probit 模型。
Bivariate Probit 模型边际效应和预测值的估计和二元 probit 模型类似,但其是两种不同结果的联合概率。以公司违规为例,公司违规数据由公司自身违规行为和证券监管机构违规稽查共同决定。由于未被稽查出的公司违规行为是不可观测数据,公司的违规行为属于部分可观测数据。也就是说,我们只能观测到发生了违规并且被稽查出的公司样本。因此,若直接采用Probit 模型进行估计,则会低估违规影响因素(如舞弊的动机、压力、机会)对公司违规的影响程度。在 Bivariate Probit 模型中,不可观测到的潜变量可以表述为:
Bivariate Probit 模型将结果指定为:
由于无法直接观测到
其中,
biprobit
命令
biprobit depvar1 depvar2 [indepvars] [if] [in] [weight] [, options]
其中, depvar
是被解释变量; indepvars
是解释变量。
_options
的选项: partial 是拟合部分观测模型,offset1(varname) 是抵消第一个方程中的变量,offset2(varname) 是抵消第二个方程中的变量; vce(vcetype) 是指稳健型标准误估计的类别选项,可以是异方差稳健型标准误 robust,聚类调整的稳健型标准误 cluster,自体抽样法稳健型标准误 bootstrap 或刀切法稳健型标准误 jackknife。
本次推文以 Pindyck and Rubinfeld (1998) school 数据集为例,对可观测的Bivariate Probit 模型的使用进行简要介绍。Pindyck and Rubinfeld (1998) school 数据集的变量包括:
我们希望根据其他协变量对子女是否上私立学校和家庭业主是否对增加财产税投赞成票的双变量结果进行建模。
webuse school
biprobit private vote logptax loginc years
------------------
Fitting comparison equation 1:
Iteration 0: log likelihood = -31.967097
Iteration 1: log likelihood = -31.452424
Iteration 2: log likelihood = -31.448958
Iteration 3: log likelihood = -31.448958
Fitting comparison equation 2:
Iteration 0: log likelihood = -63.036914
Iteration 1: log likelihood = -58.534843
Iteration 2: log likelihood = -58.497292
Iteration 3: log likelihood = -58.497288
Comparison: log likelihood = -89.946246
Fitting full model:
Iteration 0: log likelihood = -89.946246
Iteration 1: log likelihood = -89.258897
Iteration 2: log likelihood = -89.254028
Iteration 3: log likelihood = -89.254028
Bivariate probit regression Number of obs = 95
Wald chi2(6) = 9.59
Log likelihood = -89.254028 Prob > chi2 = 0.1431
------------------------------------------------------------------------------
| Coef. Std. Err. z P>|z| [95% Conf. Interval]
-------------+----------------------------------------------------------------
private |
logptax | -.1066962 .6669782 -0.16 0.873 -1.413949 1.200557
loginc | .3762037 .5306484 0.71 0.478 -.663848 1.416255
years | -.0118884 .0256778 -0.46 0.643 -.0622159 .0384391
_cons | -4.184694 4.837817 -0.86 0.387 -13.66664 5.297253
-------------+----------------------------------------------------------------
vote |
logptax | -1.288707 .5752266 -2.24 0.025 -2.416131 -.1612839
loginc | .998286 .4403565 2.27 0.023 .1352031 1.861369
years | -.0168561 .0147834 -1.14 0.254 -.0458309 .0121188
_cons | -.5360573 4.068509 -0.13 0.895 -8.510188 7.438073
-------------+----------------------------------------------------------------
/athrho | -.2764525 .2412099 -1.15 0.252 -.7492153 .1963102
-------------+----------------------------------------------------------------
rho | -.2696186 .2236753 -.6346806 .1938267
------------------------------------------------------------------------------
LR test of rho=0: chi2(1) = 1.38444 Prob > chi2 = 0.2393
上图展示了多个迭代日志的结果,第一个迭代日志展示了运行第一个方程的单变量 probit 模型结果,第二个迭代日志展示了运行第二个方程的单变量 probit 模型结果。如果vce(robust)
选项,则该测试将作为Wald测试而非似然比检验。
如果是似不相关 Bivariate Probit 回归,Stata 命令和结果如下所示:
biprobit (private = logptax loginc years) (vote = logptax years)
------------------
Fitting comparison equation 1:
Iteration 0: log likelihood = -31.967097
Iteration 1: log likelihood = -31.452424
Iteration 2: log likelihood = -31.448958
Iteration 3: log likelihood = -31.448958
Fitting comparison equation 2:
Iteration 0: log likelihood = -63.036914
Iteration 1: log likelihood = -61.455896
Iteration 2: log likelihood = -61.452436
Iteration 3: log likelihood = -61.452436
Comparison: log likelihood = -92.901393
Fitting full model:
Iteration 0: log likelihood = -92.901393
Iteration 1: log likelihood = -92.220515
Iteration 2: log likelihood = -92.215279
Iteration 3: log likelihood = -92.215278
Seemingly unrelated bivariate probit Number of obs = 95
Wald chi2(5) = 4.77
Log likelihood = -92.215278 Prob > chi2 = 0.4440
------------------------------------------------------------------------------
| Coef. Std. Err. z P>|z| [95% Conf. Interval]
-------------+----------------------------------------------------------------
private |
logptax | -.194247 .6677031 -0.29 0.771 -1.502921 1.114427
loginc | .5289522 .5339413 0.99 0.322 -.5175536 1.575458
years | -.0107319 .0255361 -0.42 0.674 -.0607818 .039318
_cons | -5.108515 4.83203 -1.06 0.290 -14.57912 4.362089
-------------+----------------------------------------------------------------
vote |
logptax | -.6138309 .4585021 -1.34 0.181 -1.512478 .2848167
years | -.0230864 .0143602 -1.61 0.108 -.0512319 .0050591
_cons | 4.773266 3.235681 1.48 0.140 -1.568552 11.11508
-------------+----------------------------------------------------------------
/athrho | -.2801136 .2453392 -1.14 0.254 -.7609696 .2007424
-------------+----------------------------------------------------------------
rho | -.2730102 .2270529 -.6416477 .1980887
------------------------------------------------------------------------------
LR test of rho=0: chi2(1) = 1.37223 Prob > chi2 = 0.2414
连享会-直播课 上线了!
http://lianxh.duanshu.com
免费公开课:
直击面板数据模型 - 连玉君,时长:1小时40分钟 Stata 33 讲 - 连玉君, 每讲 15 分钟. 部分直播课 课程资料下载 (PPT,dofiles等)
支持回看,所有课程可以随时购买观看。
专题 | 嘉宾 | 直播/回看视频 |
---|---|---|
⭐ Stata暑期班 | 连玉君 江艇 |
线上直播 9 天 2020.7.28-8.7 |
效率分析-专题 | 连玉君 鲁晓东 张 宁 |
视频-TFP-SFA-DEA 已上线,3天 |
文本分析/爬虫 | 游万海 司继春 |
视频-文本分析与爬虫 已上线,4天 |
空间计量系列 | 范巧 | 空间全局模型, 空间权重矩阵 空间动态面板, 空间DID |
研究设计 | 连玉君 | 我的特斯拉-实证研究设计,-幻灯片- |
面板模型 | 连玉君 | 动态面板模型,-幻灯片- |
直击面板数据模型 [免费公开课,2小时] |
Note: 部分课程的资料,PPT 等可以前往 连享会-直播课 主页查看,下载。
关于我们
课程, 直播, 视频, 客服, 模型设定, 研究设计, 暑期班
stata, plus,Profile, 手册, SJ, 外部命令, profile, mata, 绘图, 编程, 数据, 可视化
DID,RDD, PSM,IV,DID, DDD, 合成控制法,内生性, 事件研究
, 交乘, 平方项, 缺失值, 离群值, 缩尾, R2, 乱码, 结果
Probit, Logit, tobit, MLE, GMM, DEA, Bootstrap, bs, MC, TFP
, 面板, 直击面板数据, 动态面板, VAR, 生存分析, 分位数
空间, 空间计量, 连老师, 直播, 爬虫, 文本, 正则, python
Markdown, Markdown幻灯片, marp, 工具, 软件, Sai2, gInk, Annotator, 手写批注
, 盈余管理, 特斯拉, 甲壳虫, 论文重现
, 易懂教程, 码云, 教程, 知乎
连享会小程序:扫一扫,看推文,看视频……
扫码加入连享会微信群,提问交流更方便
✏ 连享会学习群-常见问题解答汇总:
✨ https://gitee.com/arlionn/WD