Stata连享会 主页 || 视频 || 推文 || 知乎 || Bilibili 站
温馨提示: 定期 清理浏览器缓存,可以获得最佳浏览体验。
New!
lianxh
命令发布了:
随时搜索推文、Stata 资源。安装:
. ssc install lianxh
详情参见帮助文件 (有惊喜):
. help lianxh
连享会新命令:cnssc
,ihelp
,rdbalance
,gitee
,installpkg
⛳ Stata 系列推文:
作者:张雪娇 (中山大学)
邮箱:zhangxj78@mail2.sysu.edu.com
编者按:本文主要摘译自下文,特此致谢!
Source:Whited R L, Swanquist Q T, Shipman J E, et al. Out of control: The (over) use of controls in accounting research[J]. The Accounting Review, 2022, 97(3): 395-413. -PDF- -Link-
目录
在没有随机分配的情况下,选择适当的控制变量对于设计一个具有明确因果效应的实证检验至关重要。然而,与其他方法学问题相比,控制变量在会计研究中的重要性似乎未得到充分重视。
我们评估了会计研究中控制变量使用的演变,并讨论了研究人员在选择控制变量时应考虑的一些问题。通过模拟,我们认为 “更多控制变量” 并不总是更好,一些控制变量可能会引入偏差。最后,我们为未来的会计研究提供了一些实践性的建议。
作者通过梳理 1980-2020 年发表在 The Accounting Review,Journal of Accounting and Economics,以及 Journal of Accounting Research 上的文章发现,虽然会计类文献也有使用 “准自然实验” 或 “外生冲击” 方法的趋势,但研究人员仍然更多依赖控制变量来识别因果关系。
与此同时,回归变量的个数从 1980-2000 的平均 6 个,上升至 2020 年的 16 个。总体来看,我们观察到研究人员越来越依赖基于回归的分析,并使用更多的控制变量,但关于回归结果对控制变量的敏感性研究并没有增加。
单变量的回归分析不太可能得出处理
为了构建明确的因果模型,研究人员可以借助因果图来帮助识别遗漏变量的来源、理解因果关系,从而制定合适的模型进行研究。我们用以下因果图来示例变量之间的因果关系:
在上图中,A 导致 B,B 导致 C,C 导致 D 和 E,D 也导致 E。如果我们感兴趣的是 D 对 E 的影响,则 C 作为混杂因素,必须要控制。如果感兴趣的是 C 对 E 的影响,则 D 不应该被控制,因为 D 是 C 和 E 之间关系的中介。实际上,回归不能告诉我们是 C 导致 E 还是 E 导致 C,回归只是在给定条件下对相关性的估计,只有理论才能为因果关系提供说明。
根据 Angrist 和 Pischke (2009) 提供的经验法则,“好” 的控制变量是指在确定处理变量
为了具体说明 “好” 控制和 “坏” 控制,我们提供了两个例子来证明控制变量对因果效应估计的影响。第一个例子采用包含注册会计师认证状态、会计师技能和收入的模拟数据集。第二个例子使用有关审计师类型、客户规模和审计费用的档案数据。
在第一个例子中,变量包括:内在的会计技能 Skill、注册会计师 CPA 和收益 Earnings。在第二个例子中,变量包括:是否四大审计机构 Big 4,审计费用自然对数 ln(Fee),总资产自然对数 ln(Asset)。
术语 “混杂” (Confounders) 是指影响
假如现在要探究的问题是:四大审计机构是否收取更高的审计费用?众所周知以下几个事实:
三者之间的关系可以由如下因果图来表示:
在此例子中,客户规模是影响审计费用和审计师选择的共同因素,所以客户规模在这里就代表混杂因素。对比模型中没有纳入混杂因素的结果 (详见下表),在控制客户规模 ln(Asset) 后,四大审计机构变量 Big4 的系数由 2.33 急剧下降至 0.55,说明了包括混杂结构控制的重要性,特别是当混杂变量对
虽然混合控制可以改善因果估计,但 “中介” 变量 (Mediators) 可以通过 “阻止”
假如现在要探究的问题是:大公司是否支付更高的审计费用?由下图可知,客户规模可以通过两条 “路径” 影响审计费用。一是客户规模增加了审计工作,从而增加了审计费用 (即直接影响)。二是大客户更有可能选择更昂贵的四大审计机构,从而增加了审计费用 (即间接路径)。
由下表可知,在考虑了公司规模通过选择审计机构影响审计费用的路径后,即加入中介变量 Big4,ln(Asset) 的系数变小了。事实上,列 (2) 对 ln(Asset) 的估计是有偏的,而 Big4 的估计是无偏的。因此,研究人员在借鉴现有文献或根据控制变量系数显著性来判断模型是否合适时应更加谨慎。
对撞变量 (Colliders),作为
由下表可知,在加入 ln(Fees) 之后,ln(Assets) 的系数估计值减半 (0.10 到 0.05),产生了严重偏误。与中介变量不同,如果对撞变量与
“同一结构” 的控制变量指的是与
如果
例如,在保持审计公司客户数量 ln(Auditor Client) 不变的情况下,研究四大审计机构 (Big4) 如何影响审计费用 ln(Fees)。由于 Big4 是审计机构规模的虚拟变量,ln(Auditor Client) 的变动很难不引起 Big4 的变化。
由下表可知,ln(Auditor Client) 变量的加入,使得 Big4 的系数由 0.55 降低至 0.17。通常具有多重共线性问题的方差膨胀因子 (VIFs) 都小于 5.0,但方差膨胀因子 (VIFs) 不一定可以诊断相同结构变量的问题,这突出了必须依赖理论来识别相同构造问题的重要性,而非依赖 VIFs。
对混杂因素的适当 “控制” 取决于对这些因素进行精确的观察和测量能力。测量误差的来源主要有:数据中的误差以及无法准确捕捉潜在理论结构的经验代理变量。
为了说明控制变量测量误差造成的影响,假设 3.1 部分中表列 (2) 捕捉了 Big4 对 ln(Fees) 的真实影响。在此基础上,通过对控制变量 ln(Assets) 人为增加随机噪音来模拟在控制变量存在测量误差的情况下,回归结果的不同。
由下图可知,在没有噪声 (测量误差) 的情况下,Big4 估计值为 “真实” 效应。然而,随着噪声的增加,ln(Assets) 的影响逐渐衰减为零。更令人担忧的是,随着 ln(Assets) 系数估计值趋近于 0,Big4 的效应被严重高估,逐渐向 3.1 部分中表列 (1) 收敛,即没有控制变量的情况。
随着控制变量噪声的增加,它实际上成为一个与
对于仅仅影响
控制变量也可能仅直接影响
这里以注册会计师的数据进行举例。假设注册会计师预备课程 (CPA Prep) 除了通过增加获得注册会计师资格 (CPA) 的可能性来影响会计师的收入 (Earnings) 以外,不会以任何其他方式影响会计师的收入。
假设只有 CPA 会对 Earnings 产生影响,因此下表的两列回归结果都是无偏估计。但是对比两列结果,虽然 CPA Prep 没有实质性的影响,但是它降低了变量 CPA 估计精度。这是因为 CPA Prep 对 CPA 有强烈预测作用,但相对于仅包括 CPA 的回归模型来说,加入 CPA Prep 没有增量模型的解释力,但却增加了标准误。
第二种情况,控制变量
固定效应是一系列 “虚拟” 控制变量,因此 “固定效应” 也属于控制变量的讨论范围。固定效应将组内 (例如,公司、行业、年份) 处理变量 X 和结果变量 Y 的变化分离开,因此在某些情况下它可以改善因果解释。然而,它们也可以分离出不可概括的变异或内生的变异。
假设我们想要探究审计委员会会计专家 (以下简称 ACAE) 对欺诈事件 (Fraud) 的影响。如果不随时间变化且不可观察的公司因素 (如文化) 与 ACAE 和 Fraud 相关,那么就需要在回归中加入公司固定效应。
由下表可知,与不包含固定效应的结果相比,加入固定效应之后,ACAE 对 Fraud 的抑制作用由 -4.32 下降至 -1.71。这是因为固定效应分离了 ACAE 在公司组内的变化的影响。
在某些情况下,固定效应还可以分离组内的内源性变异。继续上面的 ACAE 的示例,假设公司倾向于在发生欺诈事件后增加 ACAE 来缓解公司治理问题。
由下表可知,当加入固定效应之后,ACAE 对 Fraud 的负向影响远远超过其真实效应。这是由于因欺诈而增加 ACAE 的公司,在事后欺诈很少发生。因此,列 (2) 中 ACAE 的负系数捕捉了触发增加 ACAE 的欺诈事件的反向因果关系,这说明固定效应可以放大变量之间的内生关系。
在会计研究中,经常使用
例如,我们可以通过以下模型来检验 Event 是否会调节 ROA 和 Outcomes 之间的关系。由于资产回报率 ROA 与资产ln(Assets) 和内部控制缺陷 Weak相关,即使 Event 与控制变量不相关,ROA × Event 也会与 ln(Assets)/Weak × Event 相关,如果模型不包括 ln(Assets)/Weak × Event 作为控制变量,那么模型就可能会遭受遗漏变量偏误问题。
虽然准自然实验得到越来越多地应用,但我们希望研究人员可以继续依赖统计控制和观察数据进行因果推断。因此本文根据以上内容总结了以下几点较为通用的建议,希望可以为后续相关研究提供帮助:
Note:产生如下推文列表的 Stata 命令为:
lianxh 控制变量, m
安装最新版lianxh
命令:
ssc install lianxh, replace
免费公开课
最新课程-直播课
专题 | 嘉宾 | 直播/回看视频 |
---|---|---|
⭐ 最新专题 | 文本分析、机器学习、效率专题、生存分析等 | |
研究设计 | 连玉君 | 我的特斯拉-实证研究设计,-幻灯片- |
面板模型 | 连玉君 | 动态面板模型,-幻灯片- |
面板模型 | 连玉君 | 直击面板数据模型 [免费公开课,2小时] |
⛳ 课程主页
⛳ 课程主页
关于我们
课程, 直播, 视频, 客服, 模型设定, 研究设计, stata, plus, 绘图, 编程, 面板, 论文重现, 可视化, RDD, DID, PSM, 合成控制法
等
连享会小程序:扫一扫,看推文,看视频……
扫码加入连享会微信群,提问交流更方便
✏ 连享会-常见问题解答:
✨ https://gitee.com/lianxh/Course/wikis
New!
lianxh
和songbl
命令发布了:
随时搜索连享会推文、Stata 资源,安装命令如下:
. ssc install lianxh
使用详情参见帮助文件 (有惊喜):
. help lianxh