Stata连享会 主页 || 视频 || 推文 || 知乎 || Bilibili 站
温馨提示: 定期 清理浏览器缓存,可以获得最佳浏览体验。
New!
lianxh
命令发布了:
随时搜索推文、Stata 资源。安装:
. ssc install lianxh
详情参见帮助文件 (有惊喜):
. help lianxh
连享会新命令:cnssc
,ihelp
,rdbalance
,gitee
,installpkg
⛳ Stata 系列推文:
作者:伍慧铭 (中山大学)
邮箱:wuhm28@mail2.sysu.edu.cn
编者按:本文部分摘译自下文,特此致谢!
Source: Karakaplan M U. Panel stochastic frontier models with endogeneity[J]. The Stata Journal, 2022, 22(3): 643-663. -Link-
目录
自 Aigner 等 (1977)、Meeusen 和 van den Broeck (1977) 引入随机前沿模型以来,已有 40 多年的历史。模型由确定前沿目标的确定性部分、确定双边误差项的随机部分和确定与随机前沿距离的单边无效误差项组成。该模型可以用来研究不同行业的生产、成本、收入、利润与其他目标,在教育、金融市场、房地产、交通领域等领域得到广泛运用。
Stata 提供了 frontier
命令估计随机前沿模型的参数,但各种命令都没有提供控制模型内生性的方法。如果边界或无效率项的决定因素与模型的双边误差项相关,则估计量的结果将受到内生性的污染。Karakaplan 和 Kutlu (2017) 设计了一个随机前沿估计器,可以解决面板中的内生性问题。Stata 的 xtfrontier
命令和 Belotti 等 (2013) 的 sfpanel
命令适合面板随机前沿模型,但忽略了内质性问题。
在本文中,引入一个新的命令 xtsfkk
,用于拟合 Stata 中具有内生性的面板随机前沿模型。
Karakaplan 和 Kutlu (2017) 提出了以下面板随机前沿模型,其中前沿和无效率项中含有内生解释变量。
此外,为了预测效率
最后 Karakaplan 和 Kutlu (2017) 基于标准 Durbin-Wu-Hausman 检验的推理提供了内质性检验。这个检验是通过观察
* 命令安装
ssc install xtsfkk, replace
* 命令语法
xtsfkk depvar [indepvars] [if] [in] [weight] [, options]
其中,depvar
为被解释变量,indepvars
为解释变量。weight
用于设定进行不等概率抽样时的权重,此处使用 pweights
、aweights
、fweights
、与 iweights
都可以。options
包括:
noconstant
:不控制常数项。production
:指定模型为生产前沿模型。cost
:指定模型为成本前沿模型。endogenous(endovarlist)
:一般情况下,xtsfkk
假定模型是外生的。instruments(ivarlist)
:ivarlist
中的变量为处理内生性的工具变量。exogenous(exovarlist)
:exogenous()
与 leaveout()
不能同时使用。leaveout(lovarlist)
:指定将 lovarlist
中的变量从包含外生变量的默认列表中取出。uhet(uvarlist[, noconstant])
:指定无效成分是异方差的,方差函数依赖于 uvarlist
的线性组合。whet(wvarlist)
:指定异质误差分量是异方差的。initial(matname)
:指定初始值的矩阵。delve
:寻找更好的初始值。difficult
:在非凹区域使用不同的步进算法。technique(algorithm_spec)
:指定最大化的方法。iterate(#)
:执行#次迭代。save(filename)
:将当前迭代的结果储存在硬盘。load(filename)
:从先前保存的文件中加载估计值,并从估算值所在的位置继续。level(#)
:设定置信度。header
:在回归的开头显示模型的约束,该命令提供了一种在估计时快速检查模型规格的方法,指导区分不同的回归结果保存在单一日志文件。timer
:显示命令完成所需时间。beep[(#)]
:该命令对于多任务处理很有用,在报告结果时产生哔哔声。当 #
为正数时,报告结果时,它会生成 #beeps
。若 #
为负数,则哔哔声就像警报一样,产生连续的哔哔声,直到用户停止。使用 beep
选项,用户将不需要不断监视 Stata Results 窗口的结果。如果模型很复杂、面板数据集很大,beep
将是不错的选择。compare
:在显示内生性模型回归结果后显示回归结果。efficiency(effvar[, replace])
:当估计完成后,生成生产或成本效率变量 effvar_EN,并显示其统计信息。该选项自动扩展任何变量名 effuar_En,如果使用了 compare
选项,还会生成 effuar_Ex (外生模型的生产或成本效率变量),并显示其汇总统计信息。test
:检验模型内生性,检验 nicely
:在单个表格中显示回归结果。如果同时指定了compare
选项,那么表格将并排显示外生和内生模型及其对应的统计信息,以便进行比较。即使没有指定efficiency()
或test
选项,也能准确地估计生产或成本效率并测试内生性,并在表格中报告。mldisplay(display_options)
:控制 ml display
选项。
在本例中,纵向数据包括 2011 年至 2015 年的 85 个个体,300 个观察结果。
. use "https://www.mukarakaplan.com/files/xtsfkkcost", clear
. xtset id t
成本 (y) 为两个前沿变量 (x 和 z) 的函数,而成本效率低下为变量 (z2) 的函数。使用两个工具变量 (iv1 和 iv2)来处理模型中两个变量 (z1 和 z2) 的潜在内生性。
. xtsfkk y x1 z1, cost uhet(z2) endogenous(z1 z2) instruments(iv1 iv2) ///
> compare nicely beep
Table: Estimation Results
----------------------------------------------------------------
Model EX Model EN
----------------------------------------------------------------
Dep.var: y
Constant 0.391** (0.129) 0.295* (0.136)
x1 0.136* (0.068) 0.494*** (0.092)
z1 0.963*** (0.047) 0.746*** (0.097)
----------------------------------------------------------------
Dep.var: ln(σ²_u)
Constant -0.544* (0.251) -0.944*** (0.215)
z2 1.190*** (0.068) 1.131*** (0.063)
----------------------------------------------------------------
Dep.var: ln(σ²_v)
Constant -1.503*** (0.097)
----------------------------------------------------------------
Dep.var: ln(σ²_w)
Constant -1.918*** (0.094)
----------------------------------------------------------------
eta1 (z1) 0.421*** (0.109)
eta2 (z2) 0.568*** (0.055)
----------------------------------------------------------------
eta Endogeneity Test X2=138.67 p=0.000
----------------------------------------------------------------
Observations 300 300
Log Likelihood -302.44 -782.62
Mean Cost Efficiency 0.3625 0.4838
Median Cost Efficiency 0.3341 0.4976
----------------------------------------------------------------
Notes: Standard errors are in parentheses. Symbols indicate
significance at the 0.1% (***), 1% (**), 5% (*), and 10% (†)
levels.
这里使用了 compare
和 nicely
选项,表格列示有两列结果:模型 EX 是忽略内生性的模型,而模型 EN 是处理内生性的模型。z1 和 z2 的系数在 0.1% 水平上均具有统计学显著性,
模型 EX 和模型 EN 的系数大小与统计显著性不同。模型 EX 中 z1 和 z2 的系数为正,具有统计学意义。在模型 EN 中,这些系数显著且为正,但较小。此外,模型 EX 的平均成本效率为 0.3625,而模型 EN 的平均成本效率为 0.4838。这告诉我们,在具有内生性的模型中的个体比在忽略内生性的模型中的个体更具成本效益。
本例分析了生产环境中随机生成的数据集。数据包含了 1991 年至 2015 年间 140 家公司的 2000 个观察结果。
. use "https://www.mukarakaplan.com/files/xtsfkkprod", clear
. xtset firm year
生产 (y) 是前沿变量 (x1,x2,x3 和 z1) 的函数,效率低下是变量 (z2) 的函数。z1 和 z2 是内生的,并使用两个工具变量 (iv1 和 iv2) 来处理内生性。为了完全显示模型,将 header
选项添加到命令行中。
. xtsfkk y x1 x2 x3 z1, production uhet(z2) endogenous(z1 z2) ///
> instruments(iv1 iv2) header efficiency(efv) test timer
Model EN log likelihood = 5614.6133 Number of obs = 2,000
------------------------------------------------------------------------------
| Coefficient Std. err. z P>|z| [95% conf. interval]
-------------+----------------------------------------------------------------
frontier_y |
x1 | 0.042 0.016 2.72 0.006 0.012 0.073
x2 | -0.275 0.117 -2.36 0.018 -0.504 -0.047
x3 | -0.100 0.050 -2.00 0.045 -0.199 -0.002
z1 | 0.462 0.175 2.64 0.008 0.119 0.804
_cons | 0.704 0.034 20.50 0.000 0.636 0.771
-------------+----------------------------------------------------------------
lnsig2u |
z2 | 2.469 0.265 9.31 0.000 1.949 2.988
_cons | -7.598 0.226 -33.66 0.000 -8.041 -7.156
-------------+----------------------------------------------------------------
lnsig2w |
_cons | -9.052 0.034 -265.12 0.000 -9.119 -8.985
-------------+----------------------------------------------------------------
ivr1_z1 |
iv1 | -0.231 0.083 -2.78 0.006 -0.394 -0.068
iv2 | 0.036 0.020 1.82 0.069 -0.003 0.074
x1 | -0.086 0.010 -8.66 0.000 -0.105 -0.066
x2 | 0.653 0.017 38.36 0.000 0.620 0.686
x3 | 0.293 0.015 19.15 0.000 0.263 0.323
_cons | 0.369 0.069 5.34 0.000 0.234 0.505
-------------+----------------------------------------------------------------
ivr2_z2 |
iv1 | 0.545 0.057 9.61 0.000 0.434 0.656
iv2 | 0.937 0.040 23.30 0.000 0.859 1.016
x1 | -0.013 0.007 -1.96 0.050 -0.027 -0.000
x2 | -0.027 0.012 -2.32 0.021 -0.050 -0.004
x3 | -0.020 0.011 -1.89 0.059 -0.041 0.001
_cons | -0.132 0.047 -2.81 0.005 -0.224 -0.040
-------------+----------------------------------------------------------------
/eta1_z1 | -0.457 0.175 -2.62 0.009 -0.799 -0.115
/eta2_z2 | 0.023 0.007 3.48 0.000 0.010 0.036
/le1 | 0.320 0.005 63.24 0.000 0.310 0.330
/le2 | -0.010 0.005 -2.09 0.037 -0.020 -0.001
/le3 | 0.219 0.003 63.25 0.000 0.212 0.226
------------------------------------------------------------------------------
eta Endogeneity Test
----------------------------------------------------------------
Ho: Correction for endogeneity is not necessary.
Ha: There is endogeneity in the model and correction is needed.
( 1) [/]eta1_z1 = 0
( 2) [/]eta2_z2 = 0
chi2( 2) = 19.00
Prob > chi2 = 0.0001
Result: Reject Ho at 0.1% level.
Summary of Model EN Tech Efficiency
--------------------------------------------------
Mean Efficiency .97187903
Median Efficiency .97215876
Minimum Efficiency .79961787
Maximum Efficiency .99961413
Standard Deviation .01449745
表中 z1 和 z2 的 test
选项,因此给出了
从内生变量的系数来看,z1 和 z2 的系数都是正的,具有统计学意义。如果指定了 compare
选项,则外生模型的结果将显示 z1 和 z2 的系数远远小于所显示的内生性校正模型中的系数。
efficiency
选项是在命令行中指定的,所以技术效率分数被保存为一个变量,并且显示该变量的汇总统计信息。在该模型中,平均技术效率为 0.9719,中位数技术效率为 0.9722。如果已经指定了 compare
选项,那么 efficiency
选项还将保存忽略内生性的模型的效率分数。比较这两种模型的技术效率,可以发现一些生产者的生产效率并不像忽略内生性的标准前沿模型那样高。
Note:产生如下推文列表的 Stata 命令为:
lianxh 效率, m
安装最新版lianxh
命令:
ssc install lianxh, replace
免费公开课
最新课程-直播课
专题 | 嘉宾 | 直播/回看视频 |
---|---|---|
⭐ 最新专题 | 文本分析、机器学习、效率专题、生存分析等 | |
研究设计 | 连玉君 | 我的特斯拉-实证研究设计,-幻灯片- |
面板模型 | 连玉君 | 动态面板模型,-幻灯片- |
面板模型 | 连玉君 | 直击面板数据模型 [免费公开课,2小时] |
⛳ 课程主页
⛳ 课程主页
关于我们
课程, 直播, 视频, 客服, 模型设定, 研究设计, stata, plus, 绘图, 编程, 面板, 论文重现, 可视化, RDD, DID, PSM, 合成控制法
等
连享会小程序:扫一扫,看推文,看视频……
扫码加入连享会微信群,提问交流更方便
✏ 连享会-常见问题解答:
✨ https://gitee.com/lianxh/Course/wikis
New!
lianxh
和songbl
命令发布了:
随时搜索连享会推文、Stata 资源,安装命令如下:
. ssc install lianxh
使用详情参见帮助文件 (有惊喜):
. help lianxh