温馨提示: 定期 清理浏览器缓存,可以获得最佳浏览体验。
New!
lianxh
命令发布了:
随时搜索推文、Stata 资源。安装命令如下:
. ssc install lianxh
详情参见帮助文件 (有惊喜):
. help lianxh
⛳ Stata 系列推文:
作者:曹琳君 (南开大学)
邮箱:linjuncao@yeah.net
编者按:本文主要摘译自下文,特此致谢!
Source:King G, Tomz M, Wittenberg J. Making the most of statistical analyses: Improving interpretation and presentation[J]. American journal of political science, 2000: 347-361. -PDF-
目录
在之前的推文中,我们介绍了在解释和展示实证结果时会遇到的不确定性问题,以及使用统计模拟的方法应对不确定性的步骤与技巧。在本推文中,我们主要分享 King 等 (2000) 所展示的常见统计模型示例,并具体演示 CLARIFY 命令在 Stata 中的运用。
为了说明 CLARIFY 命令的算法在实践中是如何工作的,King 等 (2000) 以 5 个模型为例进行了展示,具体如下:
根据 Tufte (1974),King 等 (2000) 估计了美国各州政府规模的对数回归模型。在该模型中,因变量
首先,King 等 (2000) 使用论文附录中所述的统计软件估计对数线性模型,并模拟一组效应系数
通过重复这个过程 1000 次,我们生成了 1000 个预测值,并按从最低到最高对这些预测值排序。第 25 位和第 976 位的数字代表 95% 置信区间的上限和下限。因此,我们以 95% 的信心预测州政府将雇用 73000 至 149000 人。我们最好的猜测是 106000 名全职员工,这是预测值的平均值。
我们还计算了一些预期值和最初的差异,发现将民主党控制权从众议院的一半增加到三分之二,往往会使州政府的就业人数平均增加 7000 人。围绕第一个差异的 95% 置信区间在 3000 到 12000 名全职员工之间。我们的研究结果可能值得跟进,因为据我们所知,研究人员在国家政治文献中没有提到这种关系。
我们的例子借鉴了 Rosenstone 和 Hansen (1993) 的工作,他们试图解释为什么一些人比其他人更有可能在美国总统选举中投票。继罗森斯通和汉森之后,我们收集了在总统选举年进行的每项全国选举研究的数据。如果受访者报告在总统选举中投票,我们的因变量
为了便于解释,我们将重点放在 Rosenstone 和 Hansen (1993) 强调的几个人口统计学变量上:年龄 (Ai) 和教育 (Ei) 以年计,收入 (Ii) 以 10 万美元计,种族 (白人编码 Ri=1,其他情况为 0)。我们还包括一个二次项来检验这样一个假设,即投票率随着年龄的增长而上升,直到被调查者接近退休时,这种趋势就会逆转。
因此解释变量集合是
结果如下图 1 所示:在 45 岁到 65 岁之间,投票的概率稳步上升到一个稳定的水平,然后在退休年龄逐渐下降。该图还显示,在年龄的两个极端情况下,与预期值相关的不确定性最大:代表 99% 置信区间的垂直条的受访者最年轻或最年长。
传统观点认为,市场全球化迫使政府削减公共支出,但 Garrett 的新书提供了相反的证据。Garrett 认为强大的左翼政党和包括工会在内的工会同时出现时,全球化会导致政府支出占 GDP 的比例增加,而在左翼和劳工力量薄弱的国家则会出现相反的情况。为了支持他的论点,Garrett 构建了一个由经济变量和政治变量组成的面板数据,对 1966 年至 1990 年期间的 14 个工业民主国家进行了年度测量。King 等 (2000) 复现了这一结果:因变量
模型计算结果如表 1 和图 2 所示:首先,无论市场整合水平如何,当左翼劳动力水平高时,政府支出总是大于其水平 (每个表格中第二行的条目都超过了第一行的值)。第二,在高贸易和资本流动性的案例中,低左劳动力和高左劳动力之间的差距比在低市场整合的案例中更大,这意味着党派政治对政府的影响更大。最后,在左翼劳动力较低的地方,如果一个人的市场整合水平从低水平上升到高水平,政府支出就会减少,但在左翼劳动力水平较高的地方,情况则相反。
借鉴 Domínguez 和 McCann (1996) 的研究,King 等 (2000) 三位学者探讨了公民意愿对 1988 年墨西哥总统选举的影响。在该研究中,Domínguez 和 McCann 使用多项 Logit 模型解释为什么一些选民更倾向于某个候选人。在该模型中,因变量
影响参数可以随着候选变人的不同而变化,因此
模拟的结果如图 3 所示:图中的坐标表示在不同的模拟选举结果下,每个候选人所获得的选票的预测比例。简单地说,一个点离其中一个顶点越近,其名字出现在该顶点上的候选人获得的选票比例就越大。接近中间的一个点表明模拟选举是平局。我们还在图中添加了 “获胜线”,将三元图划分为多个区域,表明哪个候选人获得了多数票,从而赢得了模拟选举
借鉴 Bueno de Mesquita 和 Siverson (1995) 的研究,King 等 (2000) 三位学者使用截尾回归模型探讨了战争对政治领袖生存的影响。在该模型中,因变量
其中
模拟的结果如图 4 所示,显示了以战前任期为条件的威权主义者和民主主义者生存时间的密度估计。虚线对应的是战前领导人的平均任期,而实线代表的是有额外十年战前经验的领导人的密度。图中的箭头表示每个场景下的中位数结果。左图 (a) 中的箭头比右图 (b) 中的箭头间距更大,这有力地支持了作者最初的主张,即战前任期对独裁主义者比民主主义者更重要。平均而言,经验丰富的威权主义者比经验不丰富的同行保住权力的时间要长 11.8 年;相比之下,民主党在战前的 10 年任期只延长了 2.8 年。
综上,作者建议到统计模型的数据解读不应该只是简单的数字堆砌,而应该用通俗易懂的语言精确描述数据背后的信息。
在本小结,本文将演示 King 等 (2000) 开发的用以展示数据结果的命令 CLARIFY。软件的详细信息可以从网站「GARY KING」处获得。
安装命令如下:
cnssc install clarify, replace
CLARIFY 由以下三个 Stata 命令组成:
*命令 1
estsimp logit Y X1 X2, sims(1000)
其中,Y
是因变量,X1
和 X2
是自变量,sims
括号中的数字表示重新的次数。
*命令 2
setx X1 mean X2 0
simqi, prval(1)
该命令表示将
*命令 3
simqi, prval(1) fd(prval(1))
changex(X2 0 1)
该命令表示为了估计模拟的预测概率的变化,以及它的标准差和 95% 置信区间,当
以上文中图 2 和 图 3 的数据获取为例,命令代码如下:
set seed 9999
noisily estsimp logit DVMAKE SIZE TENURE USFIRM JAPANFIRM ASIANFIRM ///
SMALLNO SMALLNOSQ ASSETSPEC DEMANDUNC ASSETxUNC FABEXPERIENCE ///
SOURCEXPERIENCE DIVERSIFI DIVERSSQ
oreach var of newlist X Y0 Y1 Y0lb Y1lb Y0ub Y1ub dY dYlb dYub {
gen `var' = .
}
forvalues obs = 1(1)18 {
replace X = .01*(òbs'+1) in òbs'
setx 0
setx DEMANDUNC .01*(òbs'+1)
foreach as_lev in 0 1 {
setx ASSETSPEC às_lev' ASSETxUNC às_lev'*.01*(òbs'+1)
simqi, genpr(Yàs_lev'_tmp) prval(1)
sum Yàs_lev'_tmp, meanonly
replace Yàs_lev' = r(mean) in òbs'
_pctile Yàs_lev'_tmp, p(2.5,97.5)
replace Yàs_lev'lb = r(r1) in òbs'
replace Yàs_lev'ub = r(r2) in òbs'
}
gen dY_tmp = Y1_tmp - Y0_tmp
sum dY_tmp, meanonly
replace dY = r(mean) in òbs'
_pctile dY_tmp, p(2.5,97.5)
replace dYlb = r(r1) in òbs'
replace dYub = r(r2) in òbs'
drop *_tmp
}
twoway rbar Y0ub Y0lb X, mw msize(1) lcolor(gs0) fcolor(gs16) || ///
line Y0 X, color(gs0) || rspike Y1ub Y1lb X, color(gs0) lp(dot) || ///
line Y1 X, color(gs0) ||, yscale (r(0 1)) ylabel(0(.2)1) legend(off) ///
xtitle("Demand uncertainty") ytitle("Pr(make)") graphregion(fcolor(gs16))
twoway rbar dYub dYlb X, mw msize(1) lcolor(gs0) fcolor(gs16) || ///
line dY X, color(gs0) || , yscale (r(0 1)) ylabel(-.2(.2)1) ///
legend(off) xtitle("Demand uncertainty") ytitle("dPr(make)") ///
graphregion(fcolor(gs16))
Note:产生如下推文列表的 Stata 命令为:
lianxh 模拟, m
安装最新版lianxh
命令:
ssc install lianxh, replace
免费公开课
最新课程-直播课
专题 | 嘉宾 | 直播/回看视频 |
---|---|---|
⭐ 最新专题 | 文本分析、机器学习、效率专题、生存分析等 | |
研究设计 | 连玉君 | 我的特斯拉-实证研究设计,-幻灯片- |
面板模型 | 连玉君 | 动态面板模型,-幻灯片- |
面板模型 | 连玉君 | 直击面板数据模型 [免费公开课,2小时] |
⛳ 课程主页
⛳ 课程主页
关于我们
课程, 直播, 视频, 客服, 模型设定, 研究设计, stata, plus, 绘图, 编程, 面板, 论文重现, 可视化, RDD, DID, PSM, 合成控制法
等
连享会小程序:扫一扫,看推文,看视频……
扫码加入连享会微信群,提问交流更方便
✏ 连享会-常见问题解答:
✨ https://gitee.com/lianxh/Course/wikis
New!
lianxh
命令发布了:
随时搜索连享会推文、Stata 资源,安装命令如下:
. ssc install lianxh
使用详情参见帮助文件 (有惊喜):
. help lianxh