Stata结果输出:绘制亮眼表格的十条建议

发布时间:2022-10-09 阅读 1328

Stata连享会   主页 || 视频 || 推文 || 知乎 || Bilibili 站

温馨提示: 定期 清理浏览器缓存,可以获得最佳浏览体验。

New! lianxh 命令发布了:
随时搜索推文、Stata 资源。安装:
. ssc install lianxh
详情参见帮助文件 (有惊喜):
. help lianxh
连享会新命令:cnssc, ihelp, rdbalance, gitee, installpkg

课程详情 https://gitee.com/lianxh/Course

课程主页 https://gitee.com/lianxh/Course

⛳ Stata 系列推文:

PDF下载 - 推文合集

作者:曹琳君 (南开大学)
邮箱linjuncao@yeah.net

编者按:本文在 Schwabish 2020 的基础上,结合连享会以往推文内容,使改进表格建议更具可操作性。
Source:Schwabish, J. A. (2020). Ten Guidelines for Better Tables. Journal of Benefit-Cost Analysis, 11(2), 151–178. -PDF-


目录


1. 引言

表格是可视化数据的一种独特形式。好的表格设计应该是视觉效果与目的的统一,能够帮助作者进一步阐明正在讲述的故事。本文将结合连享会以往关于「结果输出」的推文,介绍表格的正确结构、设计更好表格的建议,以及分析原文作者 Schwabish 如何重新设计表格。

2. 表格的正确结构

如下图所示,正确的表格结构主要由 10 个部分组成。

  • 标题:使用简洁、活跃的标题。相比于 “表 1. 回归结果”,用 “工作经验增加一年使年收入增加 2.8%” 之类的标题更能引导读者得出结论。此外,左对齐标题,并将副标题与表格的其余部分对齐能够创建一个更易于导航的网格。
  • 副标题:副标题位于标题下方,通常设置为较小的字体或不同的颜色。副标题应明确表中数据的单位 (如 “百分比” 或 “千元”) 或提出次要观点 (如 “经验效应男性大于女性”)。
  • 列标题:用粗体字将它们与其他表格单元格区分开来,或者用一条线将它们分开。
  • 分割线:分隔表格各部分的线条。在表格设计中至少需要将分割线放置在副标题下方,以及底行与任何来源或注释之间。
  • 边框:围绕表格的线条。是否在整个表格周围包含边框,取决于表格在文档其余部分中的排列方式。有时您需要添加视觉差异来将表格分开。但是,如果太多的线条和边框使文档变得混乱,请完全省略边框。
  • 列、行和单元格:列垂直运行,行水平运行。相交的区域称为单元格。
  • 跨列文本和行:对于跨越多列的文本和行,即使它的列标题是左对齐或右对齐,文本通常也位于列的中心。
  • 网格线:粗细网格线混合使用会使图表看起来混乱,增加读者清晰看见数字的困难。
  • 页脚:页脚位于表格的底部区域,可以在其中包含总计或平均值的一行。与副标题一样,我们应该将此行与表的其余部分区分开来。我们可以通过加粗数字、用线分隔它们或用颜色对单元格进行着色来做到这一点。
  • 来源和注释:来源和注释是位于表格下方的文本,包含表格的引文或其他详细信息或注释。例如,现代语言协会的风格建议将来源放在第一位,注释放在第二位。

3. 制作更好表格的十条规则

这些规则可以帮助我们将第一幅图中的表格转变成第二幅图中更易读的表格。

3.1 将列标题与表格主体分开

如下图所示,为了使您的列标题清晰,可以尝试使用粗体字或线条将它们与表格正文中的数字和文本分开。需要注意的是,头部不是数据值,而是类别或标签。在此示例中,我们展示了六个国家/地区的人均国内生产总值 (GDP) 增长率,列标签为粗体,并用单线与数据分开。

3.2 使用细分割线而不是粗重的网格线

如下图所示,您可以减少甚至删除表格中许多粗重的边框和分隔线。在表格设计中,很少需要每个单元格都有边框。此外,对于显示总数的系列,可以使用阴影、粗体或换行符来区分。

3.3 右对齐列标题和数字

如下图所示,我们可以沿小数位或逗号右对齐数字。同时,可能需要添加零来保持对齐,但这是值得的,这样数字更易于阅读。此外,为了保持网格布局,列标题也需要与数字右对齐。

另外需要注意的是数字并不总是相同的大小。例如在乔治亚州使用的数字,会将一些数字放在水平基线下方 (我在每个单元格中添加了一个下划线以使这一点更清楚)。

3.4 左对齐文本和标题

如下图所示,一旦我们右对齐了数字,我们应该左对齐文本。因为英语是从左到右阅读的,所以以这种方式排列条目会产生一个均匀的垂直边框,对读者来说更自然。

3.5 选择适当的精度水平

如下图所示,很少需要精确到小数点后五位。在表格设计时,需要考虑必要的精度和干净以及备用表格之间的平衡。例如,人均 GDP 增长率从不报告到小数点后五位——这是不必要的。但也不要使用太少的数字。例如,如果以整数形式报告人均 GDP 增长会掩盖各国之间的重要差异。

3.6 用行和列之间的空间引导读者

如下图所示,您对表格内部和周围空间的使用会影响有些人读取数据的顺序。例如,在左侧的表格中,列之间的空间比行之间的空间大,因此眼睛被吸引到从上到下而不是从左到右阅读表格。相比之下,右侧表格的行之间的空间比列之间的空间大,因此眼睛更有可能水平而不是垂直跟踪。策略性地使用间距来匹配您希望读者在表格中采取的顺序。

3.7 删除单元格中重复的内容

如下图所示,读者已经知道表中的单位值美元,因为我们在标题或副标题中告诉了他们。所以在整个表格中重复该符号是多余的,并且会增加混乱。在表格设计中,我们可以使用标题或列标题区域定义单位,或仅将它们放在第一行 (记住将数字沿小数点对齐)。如果表格中包含多个单元,请务必使标签清晰。

3.8 突出异常值

如下图所示,与上表中仅显示 6 个国家和 3 年的数据不同。如果我们需要显示 20 个国家和 10 年怎么办?在这种情况下,我们可能希望通过将文本设为粗体、用颜色着色或甚至对整个单元格进行着色来突出异常值。因为尽管有些读者会浏览表中的所有数字,但大多数读者可能只需要最重要的值。通过表格设计将他们引导到那些重要的数字可以让他们回答自己关于数据的问题或更好地理解你的论点。

3.9 对相似数据进行分组并增加空白

如下图所示,通过对相似的数据或标签进行分组来减少重复。与消除每个数值上的美元符号类似,我们可以通过对类似术语或标签进行分组来减少表格中的一些混乱。在此示例中,将国家/地区名称分组可减少第一列中重复的信息量。我们还可以使用分割线来组合单元格并减少不必要的重复。在此示例中,我还应用了到目前为止讨论的一些其他准则,例如左对齐文本、右对齐数字以及使用粗体页眉和页脚。

尽管对类似元素进行分组有助于减少页面上的混乱程度,但在线发布表格可能需要在这方面做出一些让步。如果您将表格作为图像发布到网站,用户将无法从表格中复制和粘贴数据,并且屏幕阅读器将无法识别数据值。相反,由于当前 Web 编程语言和格式的限制,您可能需要放弃一些特殊格式决定 (取决于您用于发布表格的工具)。

3.10 在适当的时候增加可视化

我们可以通过添加小的可视化来对我们的表格进行更大的更改。就像用颜色或粗体突出显示异常值一样,我们可以将许多不同的小数据可视化添加到我们的表格中,以便更轻松地导航并帮助您的读者找到您想要突出显示的模式和趋势。

下如图所示,演示此规则的一种方法是考虑如何将美国农业部食品和营养服务部的整合到此表中并且视觉化。它显示了参与印第安保留地食品分配计划的人数,提供了 2013 至 2016 财年 24 个州的参与估计以及 2017 财年的初步估计。如果我们放大,我们可以看到每个单元格中的数字都是顶部对齐的,这会将它们稍微隔开。

4. 重新设计表

在 JBCA 编辑的帮助下,原文作者与下图中展示的原始表格作者取得联系,并基于上述规则重新设计了表格。

4.1 示例:基本表的重新设计

第一幅图表是原始图表,第二幅图表是作者重新设计后的图表。在重新设计的过程中,作者做出如下调整:(1) 仅在第一行中包含美元符号;(2) 移除内部网络;(3) 将标题和副标题左对齐;(4) 列标题与表格中的数字一起右对齐。

在 Stata 软件中,我们主要通过 tabout 命令来进行基本表格的设计与输出,具体操作过程可以参考:

4.2 示例:回归表

第一幅图表是原始图表,第二幅图表是作者重新设计后的图表。在重新设计的过程中,作者做出如下调整:(1) 仅在第一行中包含美元符号;(2) 移除内部网络;(3) 将标题和副标题左对齐;(4)列标题与表格中的数字一起右对齐。

在 Stata 软件中,我们主要通过 addest 命令或 esttab 命令来进行回归表格的设计与输出,具体操作过程可以参考:

4.3 示例:热图

第一幅图表是原始图表,第二幅图表是作者重新设计后的图表。在重新设计的过程中,作者做出如下调整:(1) 通过颜色渐变表示从低到高的值;(2) 将估计分为正值和负值,并将中间值设置为零。

5. 相关推文

Note:产生如下推文列表的 Stata 命令为:
lianxh 结果输出, m
安装最新版 lianxh 命令:
ssc install lianxh, replace

相关课程

免费公开课

最新课程-直播课

专题 嘉宾 直播/回看视频
最新专题 文本分析、机器学习、效率专题、生存分析等
研究设计 连玉君 我的特斯拉-实证研究设计-幻灯片-
面板模型 连玉君 动态面板模型-幻灯片-
面板模型 连玉君 直击面板数据模型 [免费公开课,2小时]
  • Note: 部分课程的资料,PPT 等可以前往 连享会-直播课 主页查看,下载。

课程主页

课程主页

关于我们

  • Stata连享会 由中山大学连玉君老师团队创办,定期分享实证分析经验。
  • 连享会-主页知乎专栏,700+ 推文,实证分析不再抓狂。直播间 有很多视频课程,可以随时观看。
  • 公众号关键词搜索/回复 功能已经上线。大家可以在公众号左下角点击键盘图标,输入简要关键词,以便快速呈现历史推文,获取工具软件和数据下载。常见关键词:课程, 直播, 视频, 客服, 模型设定, 研究设计, stata, plus, 绘图, 编程, 面板, 论文重现, 可视化, RDD, DID, PSM, 合成控制法

连享会小程序:扫一扫,看推文,看视频……

扫码加入连享会微信群,提问交流更方便

✏ 连享会-常见问题解答:
https://gitee.com/lianxh/Course/wikis

New! lianxhsongbl 命令发布了:
随时搜索连享会推文、Stata 资源,安装命令如下:
. ssc install lianxh
使用详情参见帮助文件 (有惊喜):
. help lianxh