Stata绘图:balanceplot-系数可视化之平衡性点图

发布时间:2023-07-17 阅读 2101

Stata连享会   主页 || 视频 || 推文 || 知乎 || Bilibili 站

温馨提示: 定期 清理浏览器缓存,可以获得最佳浏览体验。

New! lianxh 命令发布了:
随时搜索推文、Stata 资源。安装:
. ssc install lianxh
详情参见帮助文件 (有惊喜):
. help lianxh
连享会新命令:cnssc, ihelp, rdbalance, gitee, installpkg

课程详情 https://gitee.com/lianxh/Course

课程主页 https://gitee.com/lianxh/Course

⛳ Stata 系列推文:

PDF下载 - 推文合集

作者: 李胜胜
邮箱: lisheng2@foxmail.com

Source: balanceplot is written by Trenton D Mize, Department of Sociology, Purdue University. -点击查看详情-
Questions can be sent to tmize@purdue.edu


目录


1. 简介

balanceplot 可以产生分类自变量各组间标准化下不平衡统计的点阵图。标准化的不平衡统计量提供了一种有用的方法,该方法可以用来展示分类自变量(在选项group( )中指定)的各组协变量(在varlist中指定)之间的差异。

balanceplot 计算标准化的不平衡统计量,并使用 coefplot 将其绘制为点阵图。均值表、平衡的 t 检验和标准化的不平衡统计可以用选项 table 来显示。balanceplot 用于绘制不平衡曲线图,可以用选项 plotcommand 来显示。

该命令也可以使用因子变量的表示方法,使用因子变量表示时,将把该变量视为分类变量。

2. 语法格式

balanceplot [depvar] [varlist] [if] [in],  ///
    [
     group(var) ref(var) ref2(var) 
     graphop( ) nosort nodropdv 
     plotcommand leg1( ) leg2( ) 
     leftmargin( ) 
     table 
     width( ) 
     decimals( )
    ]
  • group(var): 必填,组变量是感兴趣的自变量,将对其进行不平衡统计计算。 组变量可以有 2 到 3 个级别。
  • base(var): 设置组变量的基本类别。如果没有指定选项 base( ),默认情况下被设置为 0。
  • ref(var): 设置组变量的参考类别。如果没有指定选项 ref( ),参考类别默认设置为 1。
  • ref2(var):设置分组变量的第二个参考类别。 只有当分组变量有3个或更多层次时才需要选项 ref2( )。
  • graphop( ):允许使用选项来控制图形的外观。 可以使用 Stata 图形库的大多数常用图形选项。例如,title( )、xtitle( )、xlabel( )和其他图形选项,可以在graphop( )选项中指定。
  • nosort: 指定根据 varlist 中指定的变量的顺序来排序(从上到下)的图。默认情况下,balanceplot 是根据不平衡统计量的大小来排列图表。
  • nodropdv: 不平衡统计图中删除不会剔除因变量。默认情况下,因变量不包括在图中。
  • plotcommand:返回用于生成不平衡统计点图。如果用户想创建一个比 balanceplot 产生的更复杂的图,允许用户从不平衡统计的原始矩阵中创建一个图。
  • leg1( ): 只有在指定了 3 个或更多级别的组别变量时才可用。leg1( ) 为曲线图中显示的第一个比较值(base vs ref)指定图例标签。balanceplot 在默认情况下会为图形提供一个逻辑标签。建议在指定一个选项之前先试试默认值。
  • leg2( ): 只有在指定了 3 个或更多级别的组别变量时才可用。
  • leftmargin( ): 指定在图表左侧提供额外空间。默认值为 0。指定一个额外的绘图空间的百分比,以增加左边缘。例如,leftmargin(10) 指定在图上向左扩展了 10% 的空间。
  • table: 返回组别变量各层次的均值表,不平衡性的 t检验,以及标准化的不平衡性统计("偏差")。
  • decimals( ): 指定在统计表中显示的小数位数(注意,必须指定 table 选项)。 默认的小数点位数是 3。
  • width( ): 指定统计表的列的宽度(注意,必须指定 table 选项),默认数字是 10。

3. Stata 实例

(1) 单一比较

net install balanceplot, from("https://tdmize.github.io/data/balanceplot")
sysuse nlsw88,clear
*set scheme cleanplots, perm
balanceplot wage age i.married i.collgrad ///
            i.south tenure ttl_exp, group(union)
graph export fig1.png,replace

           | mean_base  mean_ref  ttest_pval  std_diff 
-----------+-------------------------------------------
      wage |     7.227     8.685       0.000    35.213 
       age |    39.205    39.276       0.629     2.336 
 1.married |     0.665     0.607       0.025   -12.117 
1.collgrad |     0.224     0.322       0.000    22.126 
   1.south |     0.468     0.296       0.000   -36.030 
    tenure |     6.141     7.888       0.000    30.287 
   ttl_exp |    12.705    13.261       0.026    12.149 

分组变量是 union,是否为工会成员,图的含义为协变量的标准化下的差异。 以变量 South 问例,从图中可以得到工会成员更愿意住在南方地区, 注意图中为 Nonunion vs Union。Age 靠近 0 的虚线,表明是否工会成员,年龄差异不大。

(2)多组对比



balanceplot wage age i.married i.collgrad ///
    i.south tenure ttl_exp,               ///
    group(race) base(1) ref(2) ref2(3)    ///
    graphop(xlab(-75(25)75)) table

graph export fig2.png,replace

Difference in Means Across Groups of race: base(1_White) vs ref2(3_Other)

             |  mean_base    mean_ref  ttest_pval    std_diff 
-------------+------------------------------------------------
        wage |      8.106       8.551       0.705       7.946 
         age |     39.269      39.308       0.949       1.236 
   1.married |      0.702       0.692       0.916      -2.068 
  1.collgrad |      0.258       0.346       0.306      19.187 
     1.south |      0.346       0.115       0.014     -56.561 
      tenure |      5.808       4.949       0.426     -16.062 
     ttl_exp |     12.482      12.599       0.899       2.267 

上述结果解读为,分组变量为种族 group(race) ,白人为基准组,比较协变量标准化的差异。红色点表示白人对黑人,蓝色点表示白人对其他人种。靠近 0 的虚线表示没显著差异。例如,我们只看 age 这个变量,红色点表示,白人与黑人年龄标准化差异在 12.5% 左右。 蓝色点在 0 的竖线上,表示白人与其他人种,不存在差异。上表格中 t 检验 得到的 p 值为 0.949,也说明不存在差异。这个结果可以通过 表头 base(1_White) vs ref2(3_Other) 观察到。

4. 相关推文

Note:产生如下推文列表的命令为:lianxh 绘图, m
安装最新版 lianxh 命令:ssc install lianxh, replace

相关课程

免费公开课

最新课程-直播课

专题 嘉宾 直播/回看视频
最新专题 文本分析、机器学习、效率专题、生存分析等
研究设计 连玉君 我的特斯拉-实证研究设计-幻灯片-
面板模型 连玉君 动态面板模型-幻灯片-
面板模型 连玉君 直击面板数据模型 [免费公开课,2小时]
  • Note: 部分课程的资料,PPT 等可以前往 连享会-直播课 主页查看,下载。

课程主页

课程主页

关于我们

  • Stata连享会 由中山大学连玉君老师团队创办,定期分享实证分析经验。
  • 连享会-主页知乎专栏,700+ 推文,实证分析不再抓狂。直播间 有很多视频课程,可以随时观看。
  • 公众号关键词搜索/回复 功能已经上线。大家可以在公众号左下角点击键盘图标,输入简要关键词,以便快速呈现历史推文,获取工具软件和数据下载。常见关键词:课程, 直播, 视频, 客服, 模型设定, 研究设计, stata, plus, 绘图, 编程, 面板, 论文重现, 可视化, RDD, DID, PSM, 合成控制法

连享会小程序:扫一扫,看推文,看视频……

扫码加入连享会微信群,提问交流更方便

✏ 连享会-常见问题解答:
https://gitee.com/lianxh/Course/wikis

New! lianxh 命令发布了:
随时搜索连享会推文、Stata 资源,安装命令如下:
. ssc install lianxh
使用详情参见帮助文件 (有惊喜):
. help lianxh