温馨提示: 定期 清理浏览器缓存,可以获得最佳浏览体验。
作者: 谢雁翔 (南开大学)
邮箱: xyxmask1995@163.com
目录
编者按: 「测量误差」 (Measurement Error,亦称「衡量偏误」) 是内生性的主要来源之一。相对于另外两种文献中经常提及的内生性来源——「遗漏变量」、「互为因果」,大家对「测量误差」的关注非常有限。在实证研究过程中,若解释变量存在测量误差,往往会使得研究者无法一致地估计解释变量的系数。
在此前的推文 第三种内生性:衡量偏误(测量误差)如何检验-dgmtest? 中,我们介绍了如何检验是否存在衡量偏误。今天这篇推文,将为大家分享如何应对衡量偏误问题,即「模型中核心变量存在衡量偏误时的估计方法」。
在连玉君老师此前的一份幻灯片中,也提及了本文的方法,参见 内生性:来源及处理方法-幻灯片下载。
本文部分内容参考如下内容,特此致谢!
Timothy Erickson, Robert Parham, Toni M. Whited, 2017, Fitting the Errors-in-variables Model Using High-order Cumulants and Moments, Stata Journal, 17(1): 116–129. -PDF-, -PDF2-
第三届“Stata 中国用户大会”-Stata 在公司投融资研究中的应用-覃家琦. -Link-
托宾 (Tobin) 于 1969 年提出了著名的投资(托宾) q 理论,他指出新增资产预期利润的净现值与重置成本的比率将是决定投资的重要因素,这便是著名的托宾 q 值,由此便引出了企业资产的边际 q 值。随后,Summers (1981)和 Hayashi (1982) 进一步发展了托宾 q 理论并推导出托宾 q 理论的具体投资函数,即投资与资本存量的比率是 q 的增函数。自此,托宾 q 理论逐步成为投资理论的一个重要分支。为检验托宾 q 理论 , 对于边际 q 值的计算至关重要, 边际 q 值的高低在一定程度将决定公司所拥有的投资机会的多寡,但其本身却具有不可观测性。
为解决这一问题, Furstenberg (1977) 、Lindenberg 和 Ross (1981) 、 Lang 和 Litzenberger (1989) 、Chung 和 Pruitt (1994) 等学者分别提供了使用平均 q 值来代替边际 q 值的详细计算方法,即公司市场价值对其资产重置成本的比率。但 Hayashi (1982) 指出上述替代是有条件的,若企业拥有一定的市场势力而非完全的价格接受者, 平均 q 值就会高于边际 q 值。由此会产生内生性问题。
内生性问题的来源主要有 「遗漏变量」、「互为因果」 和 「测量误差」。然而,相对于另外两种问题,现有文献对于 「测量误差」 (Measurement Error,也称为「衡量偏误」) 的关注非常有限。在实证研究分析中,Erickson 和 Whited (2000) 指出证券市场有效性的缺乏会使托宾 q 值不可避免地存在严重的衡量偏误,连玉君等 (2007, 2008) 也指出在中国股市仅接近甚至尚未达到弱势有效的背景下,平均 q 值的衡量偏误,将导致统计推断失效。
假设存在以下一元线性回归模型为真实模型:
通常,由于无法直接观测到真实值
因为潜在的
鉴于托宾 q 理论在投资理论与实证中的重要地位,JFE 的联合主编 Toni Whited 教授从 1992 年就对平均 q 值的度量误差问题进行了持续的关注,并发表了一系列论文对此问题进行缓解。最后,在 2002 年提出了高阶矩(high-order moments)方法,并相继推出了 Stata 命令 ewreg
和 xtewreg
,专门用来处理托宾 q 在投资理论中的度量误差问题。然而 Almeida et al. (2010) 对 EW 提出高阶矩(high-order moments) 方法进行了否定,认为与简单 IV 法和 AB 动态面板估计相比,EW 方法估计效果最差。对此,EW (2012) 基于 Almeida 的数据和程序,对比了 Higher Order Moments GMM (HGMM), Dynamic Panel Data, IV 三种方法,并认为在正确的设定下,三种方法都表现良好,但高阶矩估计最容易检测出测量偏误。 Stata 官方在 2017 年对 xtewreg
进行了更新。
借鉴 Erickson 和 Whited (2002) 和 Erickson、Jiang 和 Whited (2004) 提出的 EIV 模型以及高阶矩和累积量估计。
假设存在一组可观测的向量序列
(1)式中包含
在进行估计之前,将完全测量的变量进行了部分划分,并根据总体残差重写了模型。
之所以出现
从(2)式的两边减去
与此类似,
式(1)中
因此,从式(1)的两边都减去
累积量和矩估计量都是基于两步估计法,第一步是用最小二乘估计值替代:
在(3)式和(5)式,第二步是使用样本累积量或矩
关于此步骤的实际操作,应将所有可能误测的变量归为向量
高阶矩估计基于(3)式和(5)式得出的矩条件,通过将这两个方程的乘方取幂,将结果相乘,然后取双方的期望。 所得方程将数据的可观测高阶矩和交叉矩表示为
其中,
然后,可以使用上述矩条件的子集构造一个广义矩估计(GMM),其中权重矩阵只是(6)式左侧可观测矩的协方差矩阵,并对其进行调整以考虑样本中 xtewreg
命令考虑了基于阶数为 3、4、5 等高阶矩的方程组。
描述(6)式的一个简单示例,可用于构造一个估计量。考虑单个回归度量存在偏误的情况,因此
类似地,如果将(3)式平方并将结果乘以(5)式,然后取期望值,则可以得出:
如果
通过用样本矩代替总体矩,可以从(9)式推导出一个估计量。
正如 Erickson,Jiang 和 Whited(2014)所示,累积量估计为矩估计的渐近估计,它们具有方便的闭合形式。 以下估算方法的形式来自 Erickson,Jiang 和 Whited(2014)。 令
无穷多个方程式由(10)式给出,对于每个课允许的向量
表示(10)式的系统 M 方程组)。 如果
考虑到