Stata:内生性随机边界模型-xtsfkk

发布时间:2023-04-01 阅读 674

Stata连享会   主页 || 视频 || 推文 || 知乎 || Bilibili 站

温馨提示: 定期 清理浏览器缓存,可以获得最佳浏览体验。

New! lianxh 命令发布了:
随时搜索推文、Stata 资源。安装:
. ssc install lianxh
详情参见帮助文件 (有惊喜):
. help lianxh
连享会新命令:cnssc, ihelp, rdbalance, gitee, installpkg

课程详情 https://gitee.com/lianxh/Course

课程主页 https://gitee.com/lianxh/Course

⛳ Stata 系列推文:

PDF下载 - 推文合集

作者:伍慧铭 (中山大学)
邮箱wuhm28@mail2.sysu.edu.cn

编者按:本文部分摘译自下文,特此致谢!
Source: Karakaplan M U. Panel stochastic frontier models with endogeneity[J]. The Stata Journal, 2022, 22(3): 643-663. -Link-


目录


1. 背景介绍

自 Aigner 等 (1977)、Meeusen 和 van den Broeck (1977) 引入随机前沿模型以来,已有 40 多年的历史。模型由确定前沿目标的确定性部分、确定双边误差项的随机部分和确定与随机前沿距离的单边无效误差项组成。该模型可以用来研究不同行业的生产、成本、收入、利润与其他目标,在教育、金融市场、房地产、交通领域等领域得到广泛运用。

Stata 提供了 frontier 命令估计随机前沿模型的参数,但各种命令都没有提供控制模型内生性的方法。如果边界或无效率项的决定因素与模型的双边误差项相关,则估计量的结果将受到内生性的污染。Karakaplan 和 Kutlu (2017) 设计了一个随机前沿估计器,可以解决面板中的内生性问题。Stata 的 xtfrontier 命令和 Belotti 等 (2013) 的 sfpanel 命令适合面板随机前沿模型,但忽略了内质性问题。

在本文中,引入一个新的命令 xtsfkk,用于拟合 Stata 中具有内生性的面板随机前沿模型。

2. 模型简介

Karakaplan 和 Kutlu (2017) 提出了以下面板随机前沿模型,其中前沿和无效率项中含有内生解释变量。

此外,为了预测效率 Effit=exp(uit),Karakaplan 和 Kutlu (2017) 给出了以下公式:

最后 Karakaplan 和 Kutlu (2017) 基于标准 Durbin-Wu-Hausman 检验的推理提供了内质性检验。这个检验是通过观察 η 项组成部分的联合显著性来实现的。如果 η 项的组成部分是共同显著的,那么这将告诉我们模型中存在内生性,则需要通过式 (1) 进行修正。相反,如果不考虑各成分的联合显著性,则不需要对内生性进行修正,可以用传统前沿模型进行拟合。

3. 命令介绍

* 命令安装
ssc install xtsfkk, replace
* 命令语法
xtsfkk depvar [indepvars] [if] [in] [weight] [, options]

其中,depvar 为被解释变量,indepvars 为解释变量。weight 用于设定进行不等概率抽样时的权重,此处使用 pweightsaweightsfweights、与 iweights 都可以。options 包括:

  • noconstant:不控制常数项。
  • production:指定模型为生产前沿模型。
  • cost:指定模型为成本前沿模型。
  • endogenous(endovarlist):一般情况下,xtsfkk 假定模型是外生的。
  • instruments(ivarlist)ivarlist 中的变量为处理内生性的工具变量。
  • exogenous(exovarlist)exogenous()leaveout() 不能同时使用。
  • leaveout(lovarlist):指定将 lovarlist 中的变量从包含外生变量的默认列表中取出。
  • uhet(uvarlist[, noconstant]):指定无效成分是异方差的,方差函数依赖于 uvarlist 的线性组合。
  • whet(wvarlist):指定异质误差分量是异方差的。
  • initial(matname):指定初始值的矩阵。
  • delve:寻找更好的初始值。
  • difficult:在非凹区域使用不同的步进算法。
  • technique(algorithm_spec):指定最大化的方法。
  • iterate(#):执行#次迭代。
  • save(filename):将当前迭代的结果储存在硬盘。
  • load(filename):从先前保存的文件中加载估计值,并从估算值所在的位置继续。
  • level(#):设定置信度。
  • header:在回归的开头显示模型的约束,该命令提供了一种在估计时快速检查模型规格的方法,指导区分不同的回归结果保存在单一日志文件。
  • timer:显示命令完成所需时间。
  • beep[(#)]:该命令对于多任务处理很有用,在报告结果时产生哔哔声。当 # 为正数时,报告结果时,它会生成 #beeps。若 # 为负数,则哔哔声就像警报一样,产生连续的哔哔声,直到用户停止。使用 beep 选项,用户将不需要不断监视 Stata Results 窗口的结果。如果模型很复杂、面板数据集很大,beep 将是不错的选择。
  • compare:在显示内生性模型回归结果后显示回归结果。
  • efficiency(effvar[, replace]):当估计完成后,生成生产或成本效率变量 effvar_EN,并显示其统计信息。该选项自动扩展任何变量名 effuar_En,如果使用了 compare 选项,还会生成 effuar_Ex (外生模型的生产或成本效率变量),并显示其汇总统计信息。
  • test:检验模型内生性,检验 η 项的联合显著性,并在显示回归结果后报告结果。
  • nicely:在单个表格中显示回归结果。如果同时指定了compare选项,那么表格将并排显示外生和内生模型及其对应的统计信息,以便进行比较。即使没有指定efficiency()test选项,也能准确地估计生产或成本效率并测试内生性,并在表格中报告。
  • mldisplay(display_options):控制 ml display 选项。

4. Stata 实操

4.1 面板随机成本前沿模型

在本例中,纵向数据包括 2011 年至 2015 年的 85 个个体,300 个观察结果。

. use "https://www.mukarakaplan.com/files/xtsfkkcost", clear
. xtset id t

成本 (y) 为两个前沿变量 (xz) 的函数,而成本效率低下为变量 (z2) 的函数。使用两个工具变量 (iv1iv2)来处理模型中两个变量 (z1z2) 的潜在内生性。

. xtsfkk y x1 z1, cost uhet(z2) endogenous(z1 z2) instruments(iv1 iv2) ///
>     compare nicely beep

Table: Estimation Results
----------------------------------------------------------------
                              Model EX             Model EN     
----------------------------------------------------------------
Dep.var: y                                                      
Constant                  0.391**   (0.129)    0.295*    (0.136)
x1                        0.136*    (0.068)    0.494***  (0.092)
z1                        0.963***  (0.047)    0.746***  (0.097)
----------------------------------------------------------------
Dep.var: ln(σ²_u)                                               
Constant                 -0.544*    (0.251)   -0.944***  (0.215)
z2                        1.190***  (0.068)    1.131***  (0.063)
----------------------------------------------------------------
Dep.var: ln(σ²_v)                                               
Constant                 -1.503***  (0.097)                     
----------------------------------------------------------------
Dep.var: ln(σ²_w)                                               
Constant                                      -1.918***  (0.094)
----------------------------------------------------------------
eta1 (z1)                                      0.421***  (0.109)
eta2 (z2)                                      0.568***  (0.055)
----------------------------------------------------------------
eta Endogeneity Test                          X2=138.67  p=0.000
----------------------------------------------------------------
Observations                    300                  300         
Log Likelihood                -302.44              -782.62       
Mean Cost Efficiency           0.3625               0.4838       
Median Cost Efficiency         0.3341               0.4976       
----------------------------------------------------------------
Notes: Standard errors are in parentheses. Symbols indicate
significance at the 0.1% (***), 1% (**), 5% (*), and 10% (†)
levels.

这里使用了 comparenicely 选项,表格列示有两列结果:模型 EX 是忽略内生性的模型,而模型 EN 是处理内生性的模型。z1z2 的系数在 0.1% 水平上均具有统计学显著性,η 内生性检验结果在 0.1% 水平上拒绝原假设,这表明对模型内生性的修正是必要的。

模型 EX 和模型 EN 的系数大小与统计显著性不同。模型 EX 中 z1z2 的系数为正,具有统计学意义。在模型 EN 中,这些系数显著且为正,但较小。此外,模型 EX 的平均成本效率为 0.3625,而模型 EN 的平均成本效率为 0.4838。这告诉我们,在具有内生性的模型中的个体比在忽略内生性的模型中的个体更具成本效益。

4.2 面板随机生产前沿模型

本例分析了生产环境中随机生成的数据集。数据包含了 1991 年至 2015 年间 140 家公司的 2000 个观察结果。

. use "https://www.mukarakaplan.com/files/xtsfkkprod", clear
. xtset firm year

生产 (y) 是前沿变量 (x1x2x3z1) 的函数,效率低下是变量 (z2) 的函数。z1z2 是内生的,并使用两个工具变量 (iv1iv2) 来处理内生性。为了完全显示模型,将 header 选项添加到命令行中。

. xtsfkk y x1 x2 x3 z1, production uhet(z2) endogenous(z1 z2)  ///
>     instruments(iv1 iv2) header efficiency(efv) test timer  

Model EN log likelihood = 5614.6133                      Number of obs = 2,000
------------------------------------------------------------------------------
             | Coefficient  Std. err.      z    P>|z|     [95% conf. interval]
-------------+----------------------------------------------------------------
frontier_y   |
          x1 |      0.042      0.016     2.72   0.006        0.012       0.073
          x2 |     -0.275      0.117    -2.36   0.018       -0.504      -0.047
          x3 |     -0.100      0.050    -2.00   0.045       -0.199      -0.002
          z1 |      0.462      0.175     2.64   0.008        0.119       0.804
       _cons |      0.704      0.034    20.50   0.000        0.636       0.771
-------------+----------------------------------------------------------------
lnsig2u      |
          z2 |      2.469      0.265     9.31   0.000        1.949       2.988
       _cons |     -7.598      0.226   -33.66   0.000       -8.041      -7.156
-------------+----------------------------------------------------------------
lnsig2w      |
       _cons |     -9.052      0.034  -265.12   0.000       -9.119      -8.985
-------------+----------------------------------------------------------------
ivr1_z1      |
         iv1 |     -0.231      0.083    -2.78   0.006       -0.394      -0.068
         iv2 |      0.036      0.020     1.82   0.069       -0.003       0.074
          x1 |     -0.086      0.010    -8.66   0.000       -0.105      -0.066
          x2 |      0.653      0.017    38.36   0.000        0.620       0.686
          x3 |      0.293      0.015    19.15   0.000        0.263       0.323
       _cons |      0.369      0.069     5.34   0.000        0.234       0.505
-------------+----------------------------------------------------------------
ivr2_z2      |
         iv1 |      0.545      0.057     9.61   0.000        0.434       0.656
         iv2 |      0.937      0.040    23.30   0.000        0.859       1.016
          x1 |     -0.013      0.007    -1.96   0.050       -0.027      -0.000
          x2 |     -0.027      0.012    -2.32   0.021       -0.050      -0.004
          x3 |     -0.020      0.011    -1.89   0.059       -0.041       0.001
       _cons |     -0.132      0.047    -2.81   0.005       -0.224      -0.040
-------------+----------------------------------------------------------------
    /eta1_z1 |     -0.457      0.175    -2.62   0.009       -0.799      -0.115
    /eta2_z2 |      0.023      0.007     3.48   0.000        0.010       0.036
        /le1 |      0.320      0.005    63.24   0.000        0.310       0.330
        /le2 |     -0.010      0.005    -2.09   0.037       -0.020      -0.001
        /le3 |      0.219      0.003    63.25   0.000        0.212       0.226
------------------------------------------------------------------------------
                      eta Endogeneity Test                      
----------------------------------------------------------------
Ho: Correction for endogeneity is not necessary.
Ha: There is endogeneity in the model and correction is needed.
 ( 1)  [/]eta1_z1 = 0
 ( 2)  [/]eta2_z2 = 0
           chi2(  2) =   19.00
         Prob > chi2 =    0.0001
Result: Reject Ho at 0.1% level.
       Summary of Model EN Tech Efficiency        
--------------------------------------------------
Mean Efficiency         .97187903
Median Efficiency       .97215876
Minimum Efficiency      .79961787
Maximum Efficiency      .99961413
Standard Deviation      .01449745

表中 z1z2 的 η 项都有统计学意义。此外,由于指定了 test 选项,因此给出了 η 内生性检验结果,表明原假设在 0.1% 水平上被拒绝,需要对内生性进行修正。

从内生变量的系数来看,z1z2 的系数都是正的,具有统计学意义。如果指定了 compare 选项,则外生模型的结果将显示 z1z2 的系数远远小于所显示的内生性校正模型中的系数。

efficiency 选项是在命令行中指定的,所以技术效率分数被保存为一个变量,并且显示该变量的汇总统计信息。在该模型中,平均技术效率为 0.9719,中位数技术效率为 0.9722。如果已经指定了 compare 选项,那么 efficiency 选项还将保存忽略内生性的模型的效率分数。比较这两种模型的技术效率,可以发现一些生产者的生产效率并不像忽略内生性的标准前沿模型那样高。

5. 相关推文

Note:产生如下推文列表的 Stata 命令为:
lianxh 效率, m
安装最新版 lianxh 命令:
ssc install lianxh, replace

相关课程

免费公开课

最新课程-直播课

专题 嘉宾 直播/回看视频
最新专题 文本分析、机器学习、效率专题、生存分析等
研究设计 连玉君 我的特斯拉-实证研究设计-幻灯片-
面板模型 连玉君 动态面板模型-幻灯片-
面板模型 连玉君 直击面板数据模型 [免费公开课,2小时]
  • Note: 部分课程的资料,PPT 等可以前往 连享会-直播课 主页查看,下载。

课程主页

课程主页

关于我们

  • Stata连享会 由中山大学连玉君老师团队创办,定期分享实证分析经验。
  • 连享会-主页知乎专栏,700+ 推文,实证分析不再抓狂。直播间 有很多视频课程,可以随时观看。
  • 公众号关键词搜索/回复 功能已经上线。大家可以在公众号左下角点击键盘图标,输入简要关键词,以便快速呈现历史推文,获取工具软件和数据下载。常见关键词:课程, 直播, 视频, 客服, 模型设定, 研究设计, stata, plus, 绘图, 编程, 面板, 论文重现, 可视化, RDD, DID, PSM, 合成控制法

连享会小程序:扫一扫,看推文,看视频……

扫码加入连享会微信群,提问交流更方便

✏ 连享会-常见问题解答:
https://gitee.com/lianxh/Course/wikis

New! lianxhsongbl 命令发布了:
随时搜索连享会推文、Stata 资源,安装命令如下:
. ssc install lianxh
使用详情参见帮助文件 (有惊喜):
. help lianxh