xtheckmanfe:面板Heckman模型的固定效应估计

发布时间:2021-07-20 阅读 8835

Stata连享会   主页 || 视频 || 推文 || 知乎 || Bilibili 站

温馨提示: 定期 清理浏览器缓存,可以获得最佳浏览体验。

New! lianxh 命令发布了:
随时搜索推文、Stata 资源。安装:
. ssc install lianxh
详情参见帮助文件 (有惊喜):
. help lianxh
连享会新命令:cnssc, ihelp, rdbalance, gitee, installpkg

课程详情 https://gitee.com/lianxh/Course

课程主页 https://gitee.com/lianxh/Course

⛳ Stata 系列推文:

PDF下载 - 推文合集

作者: 牛坤在 (天津大学)
邮箱: kunzainiu002@163.com


目录


1. 背景介绍

当前,面板数据模型已被广泛应用于经济学的研究中。当横截面单位是个人、家庭或公司时,面板数据集通常可能是非平衡的。虽然固定效应和随机效应等方法能够用于非平衡面板数据的估计,但是如果缺失数据是由自我选择造成的,这将带来估计偏差。例如,在收入模型中,只有那些工作的人可以被观测到收入情况,数据的丢失并不是随机性的。当面板数据方程包含内生解释变量以及未观测到的异质性时,可以使用样本选择模型估计该面板数据方程。

2. Heckman 模型的基本原理

样本选择问题可能是因为样本收集过程存在问题或研究对象存在自我选择问题。Heckman 模型可用于纠正样本选择偏差问题。其在横截面数据中的适用情形和基本原理详见推文 Heckman 模型:你用对了吗?

当样本选择问题发生在面板数据情形中,Heckman 模型的基本原理如下:

首先,考虑一个具有无法观测效果的面板数据模型:

yit 为被解释变量,xit 为 1*K 向量的解释变量,ci1 为潜在内生或未观测变量。定义工具 zit 对 ci1 是严格外生的,并且包含 xit 中所有的外生变量。定义一个潜变量 sit

同时定义:

其中,sit 是一个选择指标,如果 yit 能被观测到,则取值为1;反之,取值为0。

uit1 和 uit2 服从均值为0,方差为0的二元正态分布,协方差矩阵为:

当两个随机误差项 uit1 和 uit2 相关时,E(uit1|sit)0,式 (1) 中的估计量 β 有偏。

3. 纠正样本选择模型的估计方法

3.1 理论部分

Heckman 模型的固定效应方法和 Heckman 方法本质相同,就是通过式 (3) 构造逆米尔斯比率,用来识别和纠正偏差。但是,固定效应方法采用了 FE-2SLS 估计最终统计方程。其具体推算过程如下:

基于以下假设:

  • uit2|zi,ci2N(0,1),t=1,,T

  • z¯iT1t=1Tzit

  • ci2=z¯iξ+ai2

  • ai2|ziN(0,σa)2,t=1,,T

得到:

此时有:

  • υit2|ziN(0,1+σa2),t=1,,T

当 E(uit1|υit2) 为线性时,得到:

将 (6) 代入 (1) 最终得到:

上式中,E(υit2|zi,sit=1) 等于我们在之前推文中提到的逆米尔斯比率 (IMR),即

所以,我们只需要使用 probit 命令估计 E(υit2|zi,sit=1),检验假设 H0:ρ=0,即可识别选择偏差。

总之,识别和纠正面板模型样本选择偏差的程序如下:

  • 对于每个 t,使用 probit 估计 P(sit=1|zi)=Φ(zitδta+υziξta),使用估计结果得到 λ^itλ(zitδ^ta+υziξ^ta);
  • 对于 sit=1,使用 FE-2SLS 估计方程 yit=xitβ+ci1+ρλ^it+eit1;
  • 使用 T 统计量检验 H0:ρ=0,或者使用 Wald 检验H0:ρ1==ρT=0

但是, FE-2SLS 估计量只有在选择是严格的外生条件下的未观测到的效应时才一致,但这通常是不可能的。当 E(ci1+uit1|zit,sit)=0 时, pooled 2SLS 估计是一致的,这允许 uit1 和 sit 是任意相关的。此时,也可以选择 pooled 2SLS 纠正样本选择偏差。

3.2 语法结构

基于参数校正和应用 Mundlak (1978) 的模型设置建模, xtheckmanfe 实现了存在选择和内生变量的面板数据的估计。其用法如下:


xtheckmanfe depvar indepvars [if] [in] 
    [, 
     selection(selection Equation) 
     [endogenous(endogenous equation/s) 
      id(id variable) 
      time(time variable) 
      reps(#repetitions) 
      seed(#)
    ]

其中:

  • 选择方程设定为:Selection equation=instruments1
  • 内生方程设定为:endogenous variables = instruments2
  • depvar :被解释变量。
  • indepvars :解释变量。
  • selection (sel Eq) :指定选择方程。如果观测变量 i 在时间 t 被观测到,则选择变量为 1,否则为 0。如果没有指定选择变量,选择是对主因变量是否被观测而定义。
  • endogenous (endog Eq(s)) :指定模型中的内生变量。模型能够有一个或多个内生变量。
  • id (varname) :指定面板标识符变量。
  • time (varname) :指定面板时间符变量。
  • reps (#) :指定将用于估计标准误差的 bootstrap 样本的数量。默认值为50。
  • seed (#) :指定生成 bootstrap 随机样本的种子。

4. Stata 实例

假设我们希望研究成年人的工资、工作任期和年龄之间的关系。我们调用一份 Stata 自带的面板数据集。该数据集是一份观察了 600 名成年人的虚构数据,时间从 2013年至2016 年。

* 导入数据 
. webuse wagework.dta, clear

. des

/* 变量说明
   age:年龄
   personid:个人识别代码
   year:年份
   market:劳动力市场情况
   working:就业状况
   tenure:工作任期
   wage:小时工资
*/

假设小时工资是年龄和工作任期的函数,而工资能否被观测到取决于在调查年份个体是否处于就业状态。影响个人工资未被观测到的因素与影响就业状况未被观测到的因素有关,可能包括个体水平、家庭状况等因素。因而考虑方程存在的选择偏差问题,将年龄和有关劳动力市场情况变量加入到选择方程。

在进行回归分析之前,我们需要指定数据的面板结构。面板变量是 personid ,即个人识别代码,时间变量是年份 (year),从2013年至2016年。

. xtset personid year
       panel variable:  personid (strongly balanced)
        time variable:  year, 2013 to 2016
                delta:  1 unit

下面进行回归分析。首先,使用官方 xtheckman 命令进行回归,采用的是随机效应方法,得到以下结果:


. xtheckman wage age tenure, select(working = age market)

(setting technique to bhhh)
Iteration 0:   log likelihood = -5470.6968  
Iteration 1:   log likelihood =   -5465.61  
Iteration 2:   log likelihood = -5464.2762  
Iteration 3:   log likelihood = -5464.2387  
Iteration 4:   log likelihood = -5464.2375  
Iteration 5:   log likelihood = -5464.2374  
Iteration 6:   log likelihood = -5464.2373  

Random-effects regression with selection        Number of obs     =      2,400
                                                      Selected    =      1,928
                                                      Nonselected =        472

Group variable: personid                        Number of groups  =        600

                                                Obs. per group:
                                                              min =          4
                                                              avg =        4.0
                                                              max =          4

Integration method: mvaghermite                 Integration pts.  =          7

                                                Wald chi2(2)      =    2376.13
Log likelihood = -5464.2373                     Prob > chi2       =     0.0000

--------------------------------------------------------------------------------
                       |  Coef.  Std. Err.     z    P>|z|   [95% Conf. Interval]
-----------------------+--------------------------------------------------------
   wage                |                                                        
                   age |  0.185     0.007   26.35   0.000      0.172       0.199
                tenure |  0.599     0.017   35.09   0.000      0.565       0.632
                 _cons | 13.642     0.293   46.50   0.000     13.067      14.217
-----------------------+--------------------------------------------------------
working                |                                                        
                   age | -0.019     0.003   -5.60   0.000     -0.026      -0.013
                market |  0.190     0.019    9.80   0.000      0.152       0.228
                 _cons |  2.036     0.169   12.03   0.000      1.704       2.368
-----------------------+--------------------------------------------------------
            var(e.wage)|  4.439     0.216                      4.034       4.883
-----------------------+--------------------------------------------------------
 corr(e.working,e.wage)|  0.362     0.152    2.38   0.017      0.036       0.618
-----------------------+--------------------------------------------------------
    var(wage[personid])|  2.967     0.326                      2.392       3.681
 var(working[personid])|  0.729     0.120                      0.528       1.006
-----------------------+--------------------------------------------------------
                rho    |  0.691     0.065    10.71  0.000      0.543       0.798
--------------------------------------------------------------------------------
Note: rho = corr(working[personid],wage[personid])

回归结果的前两部分分别提供了工资方程和选择方程的估计系数。可以看出,工资方程中,年龄越高,工作任期越长,个体每小时工资越高,并且二者均在 1% 的水平上显著。具体而言,年龄每增长 1 岁,小时工资将增加 0.185 美元;工作任期每增加 1 年,小时工资将增加 0.599 美元。选择方程中,年龄和劳动力市场情况均在1%的水平上显著影响个体就业状况。

后半部分 var(e.wage)、corr(e.working,e.wage) 分别是工资的观测水平误差的方差,以及其与选择模型的观测水平误差相关性的估计;var(wage[persoid])var(working[personid]) 是随机效应的方差估计,corr(working[personid],wage[personid]) 是随机效应的相关估计。如果上述至少有一个相关性与零显著不同,可以认为存在内生样本选择问题。在我们的例子中,观测误差之间的相关性为 0.362,随机效应之间的相关性为 0.691。二者均为正值,并且与零显著不同。因而,我们得出结论,此案例存在内生选择,而且那些能够增加被雇佣机会的未观测变量倾向于增加小时工资。

其次,将上述结果和用 xtheckmanfe 命令得到的回归结果进行比较:


. xtheckmanfe wage age tenure, select(working = age market)
(running _xthck on estimation sample)

Bootstrap replications (50)
----+--- 1 ---+--- 2 ---+--- 3 ---+--- 4 ---+--- 5 
..................................................    50

Bootstrap results                               Number of obs     =      2,400
                                                Replications      =         50

                                   (Replications based on 600 clusters in personid)
-----------------------------------------------------------------------------------
                  |Observed   Bootstrap                         Normal-based
                  |    Coef.   Std. Err.     z    P>|z|     [95% Conf. Interval]
------------------+-------------------------------------------------------------
wage              |
              age |   0.394      0.119     3.30   0.001        0.160       0.628
           tenure |   0.562      0.032    17.30   0.000        0.498       0.625
          _mn_age |  -0.199      0.118    -1.69   0.091       -0.431       0.032
       _mn_tenure |   0.054      0.046     1.17   0.240       -0.036       0.144
       _mn_market |   0.115      0.081     1.41   0.159       -0.045       0.274
                  |                                                             
             year |                                                             
            2014  |  -0.416      0.446    -0.93   0.351       -1.290       0.459
            2015  |   0.302      0.273     1.10   0.270       -0.234       0.837
            2016  |   0.000  (omitted)
                  |                                                             
  year#c._sel_imr |                                                             
            2013  |   1.567      0.744     2.11   0.035        0.110       3.025
            2014  |   2.390      1.068     2.24   0.025        0.298       4.482
            2015  |  -0.288      0.482    -0.60   0.550       -1.233       0.657
            2016  |  -0.347      0.705    -0.49   0.623       -1.728       1.034
                  |
            _cons |  13.378      0.358    37.39   0.000       12.677      14.080
------------------+-------------------------------------------------------------
select            |                                                             
       year#c.age |                                                             
            2013  |  -0.018      0.008    -2.14   0.032       -0.034      -0.001
            2014  |  -0.007      0.005    -1.30   0.194       -0.017       0.004
            2015  |  -0.030      0.005    -6.46   0.000       -0.039      -0.021
            2016  |  -0.018      0.005    -3.46   0.001       -0.028      -0.008
                  |                                                             
    year#c.tenure |                                                             
            2013  |   0.029      0.060     0.49   0.627       -0.089       0.148
            2014  |  -0.079      0.028    -2.84   0.005       -0.134      -0.025
            2015  |  -0.303      0.049    -6.16   0.000       -0.399      -0.206
            2016  |   0.125      0.045     2.77   0.006        0.037       0.214
                  |
    year#c.market |
            2013  |   0.116      0.069     1.67   0.095       -0.020       0.251
            2014  |   0.119      0.040     2.98   0.003        0.041       0.197
            2015  |   0.181      0.037     4.88   0.000        0.108       0.253
            2016  |   0.151      0.039     3.84   0.000        0.074       0.228
                  |                                                             
   year#c._mn_age |                                                             
            2014  |   0.000  (omitted)                                          
            2015  |   0.000  (omitted)                                          
            2016  |   0.000  (omitted)                                          
                  |                                                             
year#c._mn_tenure |                                                             
            2013  |   0.029      0.022     1.33   0.184       -0.014       0.073
            2014  |   0.036      0.034     1.04   0.298       -0.032       0.103
            2015  |   0.362      0.073     4.92   0.000        0.218       0.506
            2016  |  -0.169      0.065    -2.60   0.009       -0.297      -0.042
                  |
year#c._mn_market |
            2013  |   0.007      0.076     0.10   0.923       -0.141       0.156
            2014  |   0.006      0.066     0.09   0.930       -0.123       0.135
            2015  |  -0.046      0.078    -0.59   0.557       -0.199       0.107
            2016  |   0.041      0.072     0.56   0.573       -0.101       0.182
                  |                                                             
             year |                                                             
            2014  |   0.213      0.344     0.62   0.536       -0.461       0.887
            2015  |   0.467      0.364     1.28   0.199       -0.246       1.180
            2016  |   0.650      0.341     1.91   0.057       -0.018       1.319
                  |
            _cons |   1.294      0.239     5.41   0.000        0.825       1.763
--------------------------------------------------------------------------------

从上述结果可以看到,与不考虑固定效应的面板 Heckman 模型结果不同。工资方程中,年龄每增加 1 岁,小时工资将增加 0.394 美元,即未固定时间效应,将低估结果;工作任期每增加 1 年,小时工资将增加 0.562 美元。此外,该模型创建了 “_ mn _” 辅助变量,存储所有外生变量的个别特定平均值,以及变量 “_sel_imr”,包含了逆米尔斯比。

第三,如果模型只考虑选择问题,则可以采用伪两步法进行回归,该方法通过 “ml” 选项估计:


. xtheckmanfe wage age tenure, select(working = age market) ml 
Estimating Probit model

note: 2013.year#c._mn_age omitted because of collinearity
note: 2014.year#c._mn_age omitted because of collinearity
note: 2015.year#c._mn_age omitted because of collinearity
note: 2016.year#c._mn_age omitted because of collinearity
note: 2016.year omitted because of collinearity
Iteration 0:   log likelihood = -1189.7918  
Iteration 1:   log likelihood = -1084.4275  
Iteration 2:   log likelihood = -1082.4963  
Iteration 3:   log likelihood = -1082.4834  
Iteration 4:   log likelihood = -1082.4834  
Estimating Second model
note: 2016.year omitted because of collinearity
note: 2013.year#c._mn_age omitted because of collinearity
note: 2014.year#c._mn_age omitted because of collinearity
note: 2015.year#c._mn_age omitted because of collinearity
note: 2016.year#c._mn_age omitted because of collinearity

initial:       log pseudolikelihood = -5743.9185
rescale:       log pseudolikelihood = -5743.9185
rescale eq:    log pseudolikelihood = -5730.1921
(setting technique to nr)
Iteration 0:   log pseudolikelihood = -5730.1921  (not concave)
Iteration 1:   log pseudolikelihood = -5664.5257  
Iteration 2:   log pseudolikelihood = -5650.3725  
Iteration 3:   log pseudolikelihood = -5649.7247  
Iteration 4:   log pseudolikelihood = -5649.7192  
(switching technique to bhhh)
Iteration 5:   log pseudolikelihood = -5649.7192  

                                                Number of obs     =      2,400
                                                Wald chi2(7)      =    2038.43
Log pseudolikelihood = -5649.7192               Prob > chi2       =     0.0000

                                  (Std. Err. adjusted for 600 clusters in personid)
-----------------------------------------------------------------------------------
                  |               Robust
                  |      Coef.   Std. Err.      z    P>|z|     [95% Conf. Interval]
------------------+----------------------------------------------------------------
wage              |
              age |      0.412      0.136     3.03   0.002        0.146       0.678
           tenure |      0.560      0.029    19.16   0.000        0.503       0.618
          _mn_age |     -0.218      0.136    -1.60   0.110       -0.485       0.049
       _mn_tenure |      0.059      0.045     1.30   0.193       -0.030       0.147
       _mn_market |      0.120      0.087     1.39   0.165       -0.049       0.290
                  |
             year |
            2014  |     -0.580      0.487    -1.19   0.234       -1.535       0.375
            2015  |      0.307      0.314     0.98   0.329       -0.309       0.924
            2016  |      0.000  (omitted)
                  |
            _cons |     13.376      0.334    39.99   0.000       12.720      14.031
------------------+----------------------------------------------------------------
select            |
       year#c.age |
            2013  |     -0.016      0.008    -2.11   0.035       -0.032      -0.001
            2014  |     -0.008      0.004    -1.77   0.076       -0.016       0.001
            2015  |     -0.030      0.005    -5.68   0.000       -0.040      -0.020
            2016  |     -0.019      0.006    -3.18   0.001       -0.030      -0.007
                  |
    year#c.tenure |
            2013  |      0.012      0.055     0.22   0.826       -0.096       0.120
            2014  |     -0.051      0.030    -1.69   0.091       -0.111       0.008
            2015  |     -0.305      0.052    -5.86   0.000       -0.407      -0.203
            2016  |      0.120      0.047     2.54   0.011        0.028       0.213
                  |
    year#c.market |
            2013  |      0.127      0.055     2.32   0.020        0.020       0.235
            2014  |      0.145      0.030     4.91   0.000        0.087       0.203
            2015  |      0.180      0.041     4.38   0.000        0.099       0.260
            2016  |      0.152      0.037     4.16   0.000        0.080       0.223
                  |
   year#c._mn_age |
            2013  |      0.000  (omitted)
            2014  |      0.000  (omitted)
            2015  |      0.000  (omitted)
            2016  |      0.000  (omitted)
                  |
year#c._mn_tenure |
            2013  |      0.038      0.025     1.50   0.133       -0.012       0.088
            2014  |      0.028      0.033     0.84   0.399       -0.037       0.093
            2015  |      0.365      0.076     4.80   0.000        0.216       0.514
            2016  |     -0.161      0.070    -2.31   0.021       -0.297      -0.024
                  |
year#c._mn_market |
            2013  |     -0.004      0.071    -0.06   0.950       -0.143       0.134
            2014  |     -0.036      0.065    -0.56   0.578       -0.162       0.091
            2015  |     -0.045      0.079    -0.57   0.568       -0.199       0.109
            2016  |      0.033      0.077     0.43   0.671       -0.119       0.184
                  |
             year |
            2014  |      0.125      0.267     0.47   0.638       -0.398       0.648
            2015  |      0.463      0.298     1.55   0.121       -0.122       1.047
            2016  |      0.661      0.308     2.15   0.032        0.058       1.264
                  |
            _cons |      1.300      0.210     6.20   0.000        0.889       1.711
------------------+----------------------------------------------------------------
mills             |
             year |
            2014  |      1.311      1.618     0.81   0.418       -1.861       4.483
            2015  |     -1.986      0.996    -1.99   0.046       -3.939      -0.033
            2016  |     -2.081      1.167    -1.78   0.074       -4.368       0.205
                  |
            _cons |      1.719      0.901     1.91   0.056       -0.047       3.485
------------------+----------------------------------------------------------------
lnsigma           |
            _cons |      0.949      0.019    49.84   0.000        0.912       0.987
-----------------------------------------------------------------------------------

伪两步法的标准误已经被两步法修正。然而,因为选择和结果是联合估计的,点估计将与 bootstrap 方法不同。详细内容可参考 Rios-Avila and Canavire-Bacarreza (2018)

第四,如果不设定 xtset,命令的选项中应提供 idtime 变量:


. xtheckmanfe wage age tenure, select(working = age market) id(personid) time(year)
(running _xthck on estimation sample)

Bootstrap replications (50)
----+--- 1 ---+--- 2 ---+--- 3 ---+--- 4 ---+--- 5 
..................................................    50

Bootstrap results                               Number of obs     =      2,400
                                                Replications      =         50

                                   (Replications based on 600 clusters in personid)
-----------------------------------------------------------------------------------
                  |   Observed   Bootstrap                         Normal-based
                  |      Coef.   Std. Err.      z    P>|z|     [95% Conf. Interval]
------------------+----------------------------------------------------------------
wage              |
              age |      0.394      0.141     2.78   0.005        0.116       0.671
           tenure |      0.562      0.026    21.91   0.000        0.511       0.612
          _mn_age |     -0.199      0.141    -1.41   0.159       -0.476       0.078
       _mn_tenure |      0.054      0.041     1.33   0.185       -0.026       0.134
       _mn_market |      0.115      0.082     1.40   0.163       -0.046       0.275
                  |
             year |
            2014  |     -0.416      0.352    -1.18   0.238       -1.105       0.274
            2015  |      0.302      0.312     0.97   0.334       -0.310       0.914
            2016  |      0.000  (omitted)
                  |
  year#c._sel_imr |
            2013  |      1.567      0.788     1.99   0.047        0.023       3.111
            2014  |      2.390      1.083     2.21   0.027        0.266       4.514
            2015  |     -0.288      0.582    -0.49   0.621       -1.428       0.852
            2016  |     -0.347      0.788    -0.44   0.660       -1.891       1.197
                  |
            _cons |     13.378      0.320    41.75   0.000       12.750      14.006
------------------+----------------------------------------------------------------
select            |
       year#c.age |
            2013  |     -0.018      0.009    -2.01   0.044       -0.035      -0.000
            2014  |     -0.007      0.004    -1.63   0.103       -0.015       0.001
            2015  |     -0.030      0.006    -4.77   0.000       -0.042      -0.018
            2016  |     -0.018      0.005    -3.49   0.000       -0.028      -0.008
                  |
    year#c.tenure |
            2013  |      0.029      0.060     0.49   0.626       -0.088       0.147
            2014  |     -0.079      0.030    -2.63   0.008       -0.139      -0.020
            2015  |     -0.303      0.058    -5.19   0.000       -0.417      -0.188
            2016  |      0.125      0.040     3.15   0.002        0.047       0.203
                  |
    year#c.market |
            2013  |      0.116      0.070     1.64   0.100       -0.022       0.254
            2014  |      0.119      0.033     3.65   0.000        0.055       0.183
            2015  |      0.181      0.036     4.98   0.000        0.110       0.252
            2016  |      0.151      0.033     4.59   0.000        0.086       0.215
                  |
   year#c._mn_age |
            2014  |      0.000  (omitted)
            2015  |      0.000  (omitted)
            2016  |      0.000  (omitted)
                  |
year#c._mn_tenure |
            2013  |      0.029      0.025     1.16   0.246       -0.020       0.079
            2014  |      0.036      0.034     1.04   0.300       -0.032       0.103
            2015  |      0.362      0.080     4.52   0.000        0.205       0.519
            2016  |     -0.169      0.061    -2.78   0.005       -0.289      -0.050
                  |
year#c._mn_market |
            2013  |      0.007      0.060     0.12   0.903       -0.110       0.124
            2014  |      0.006      0.076     0.08   0.939       -0.143       0.154
            2015  |     -0.046      0.067    -0.68   0.496       -0.178       0.086
            2016  |      0.041      0.070     0.58   0.562       -0.097       0.178
                  |
             year |
            2014  |      0.213      0.267     0.80   0.426       -0.311       0.737
            2015  |      0.467      0.368     1.27   0.204       -0.254       1.188
            2016  |      0.650      0.277     2.34   0.019        0.106       1.194
                  |
            _cons |      1.294      0.229     5.65   0.000        0.845       1.743
-----------------------------------------------------------------------------------

最后,因为 age 变量已经被包含在工资方程中,所以可将其从选择方程中剔除。得到与上述一致的结果:

. xtheckmanfe wage age tenure,  ///
     select(working = market) id(personid) time(year)

Bootstrap replications (50)
----+--- 1 ---+--- 2 ---+--- 3 ---+--- 4 ---+--- 5 
..................................................    50

Bootstrap results                               Number of obs     =      2,400
                                                Replications      =         50

                                   (Replications based on 600 clusters in personid)
-----------------------------------------------------------------------------------
                  |   Observed   Bootstrap                         Normal-based
                  |      Coef.   Std. Err.      z    P>|z|     [95% Conf. Interval]
------------------+----------------------------------------------------------------
wage              |
              age |      0.394      0.129     3.05   0.002        0.140       0.647
           tenure |      0.562      0.027    20.81   0.000        0.509       0.615
          _mn_age |     -0.199      0.130    -1.54   0.125       -0.453       0.055
       _mn_tenure |      0.054      0.039     1.38   0.167       -0.023       0.131
       _mn_market |      0.115      0.082     1.39   0.164       -0.047       0.276
                  |
             year |
            2014  |     -0.416      0.323    -1.29   0.199       -1.049       0.218
            2015  |      0.302      0.292     1.03   0.301       -0.270       0.874
            2016  |      0.000  (omitted)
                  |
  year#c._sel_imr |
            2013  |      1.567      0.875     1.79   0.073       -0.148       3.282
            2014  |      2.390      0.953     2.51   0.012        0.522       4.258
            2015  |     -0.288      0.553    -0.52   0.603       -1.372       0.796
            2016  |     -0.347      0.666    -0.52   0.603       -1.653       0.960
                  |
            _cons |     13.378      0.278    48.16   0.000       12.834      13.923
------------------+----------------------------------------------------------------
select            |
       year#c.age |
            2013  |     -0.018      0.007    -2.55   0.011       -0.031      -0.004
            2014  |     -0.007      0.005    -1.26   0.207       -0.018       0.004
            2015  |     -0.030      0.005    -5.96   0.000       -0.040      -0.020
            2016  |     -0.018      0.005    -3.45   0.001       -0.028      -0.008
                  |
    year#c.tenure |
            2013  |      0.029      0.053     0.55   0.580       -0.075       0.133
            2014  |     -0.079      0.027    -2.98   0.003       -0.132      -0.027
            2015  |     -0.303      0.052    -5.79   0.000       -0.405      -0.200
            2016  |      0.125      0.050     2.49   0.013        0.027       0.224
                  |
    year#c.market |
            2013  |      0.116      0.063     1.85   0.065       -0.007       0.239
            2014  |      0.119      0.039     3.06   0.002        0.043       0.195
            2015  |      0.181      0.033     5.46   0.000        0.116       0.246
            2016  |      0.151      0.037     4.08   0.000        0.078       0.223
                  |
   year#c._mn_age |
            2014  |      0.000  (omitted)
            2015  |      0.000  (omitted)
            2016  |      0.000  (omitted)
                  |
year#c._mn_tenure |
            2013  |      0.029      0.024     1.22   0.222       -0.018       0.077
            2014  |      0.036      0.037     0.96   0.336       -0.037       0.108
            2015  |      0.362      0.074     4.91   0.000        0.217       0.506
            2016  |     -0.169      0.071    -2.38   0.018       -0.309      -0.030
                  |
year#c._mn_market |
            2013  |      0.007      0.065     0.11   0.911       -0.121       0.135
            2014  |      0.006      0.069     0.08   0.933       -0.129       0.140
            2015  |     -0.046      0.081    -0.57   0.571       -0.204       0.113
            2016  |      0.041      0.069     0.59   0.556       -0.095       0.176
                  |
             year |
            2014  |      0.213      0.304     0.70   0.483       -0.382       0.808
            2015  |      0.467      0.313     1.49   0.136       -0.147       1.081
            2016  |      0.650      0.312     2.09   0.037        0.039       1.261
                  |
            _cons |      1.294      0.215     6.01   0.000        0.872       1.716
-----------------------------------------------------------------------------------

5. 结语

本文介绍的 xtheckmanfe 命令的基本结构是基于 Anastasia Semykina 为两步参数方法编写的 dofile,该文件可在作者网站 http://myweb.fsu.edu/asemykina/ 获得。Heckman 模型的固定效应估计适用于存在异质性或内生变量的情况下修正样本选择偏误。当动态面板数据存在选择偏差时,Anastasia Semykina 也提出了相应的解决办法。

6. 参考文献

  • Semykina, Anastasia, and Jeffrey M. Wooldridge. Estimating panel data models in the presence of endogeneity and selection [J]. Journal of Econometrics , 2012 , 157 (2):375-380. -PDF-
  • XTHECKMANFE: Stata module to fit panel data models in the presence of endogeneity and selection命令主页,-Link

7. 相关推文

Note:产生如下推文列表的 Stata 命令为:
lianxh heckman 自选择
安装最新版 lianxh 命令:
ssc install lianxh, replace

相关课程

免费公开课

最新课程-直播课

专题 嘉宾 直播/回看视频
最新专题 文本分析、机器学习、效率专题、生存分析等
研究设计 连玉君 我的特斯拉-实证研究设计-幻灯片-
面板模型 连玉君 动态面板模型-幻灯片-
面板模型 连玉君 直击面板数据模型 [免费公开课,2小时]
  • Note: 部分课程的资料,PPT 等可以前往 连享会-直播课 主页查看,下载。

课程主页

课程主页

关于我们

  • Stata连享会 由中山大学连玉君老师团队创办,定期分享实证分析经验。
  • 连享会-主页知乎专栏,400+ 推文,实证分析不再抓狂。直播间 有很多视频课程,可以随时观看。
  • 公众号关键词搜索/回复 功能已经上线。大家可以在公众号左下角点击键盘图标,输入简要关键词,以便快速呈现历史推文,获取工具软件和数据下载。常见关键词:课程, 直播, 视频, 客服, 模型设定, 研究设计, stata, plus, 绘图, 编程, 面板, 论文重现, 可视化, RDD, DID, PSM, 合成控制法

连享会小程序:扫一扫,看推文,看视频……

扫码加入连享会微信群,提问交流更方便

✏ 连享会-常见问题解答:
https://gitee.com/lianxh/Course/wikis

New! lianxh 命令发布了:
随时搜索连享会推文、Stata 资源,安装命令如下:
. ssc install lianxh
使用详情参见帮助文件 (有惊喜):
. help lianxh