Stata新命令:readWind-快速读入并转换万德数据

发布时间:2020-10-08 阅读 4384

Stata 连享会   主页 || 视频 || 推文

温馨提示: 定期 清理浏览器缓存,可以获得最佳浏览体验。

课程详情 https://gitee.com/arlionn/Course   |   lianxh.cn

课程主页 https://gitee.com/arlionn/Course

作者:朱红兵 (南京大学)


目录


前言:WIND 数据库是大家在科研路上常用的数据下载利器,但遗憾的是从 WIND 上下载的 EXCEL 数据文件通常是横向排列的 (即 Stata 用户熟悉的 wide 格式),需要我们手工整理或采用 reshape 等命令进行转换后才能满足 Stata 的分析要求。出于这一需求,我们编写了一个新命令:readWind,用以将宽型 (wide) 的上市公司财务数据高效地转换为长型 (long) 的面板数据。

1. 下载安装 readWind 命令

第一步:在 Stata 中安装 github 命令

在 Stata 的 command 框口中输入如下命令自动下载外部命令 github。该命令用于搜索、安装 Github 上发布的 Stata 外部命令 (若已经安装 github 命令,可以忽略此步):

net install github, from("https://haghish.github.io/github/")

第二步:使用 github 命令安装 Github 上的命令

在 Stata 的 command 框中输入下面的代码,耐心等待安装完成:

 github install zhbsis/TwoSort

上述命名安装完成中你会发现你的 c 盘 ado 文件夹中的 a 文件夹里面多了readWind这个 ado 命令,这就是将 Wind 数据终端中下载的 excel 数据转换为能够直接进行实证分析的 long 型数据格式的命令啦!!!

第三步:readWind对 Wind 下载的 EXCEL 格式有什么要求呢?

只要你的 EXCEL 数据排版格式满足下面的要求,都是可以通过readWind读入到 Stata 中的:

股票代码 股票名称 时间1 时间2 ... 时间n
000016 深康佳A 1.051 .... .... .....
000017 深中华A 0.951 .... .... .....
...... ....... ..... .... .... .....

第四步:如何调用执行readWind命令呢?

调用readWind只需在 Stata 的 command 命令框输入下述命令行即可:

readWind, var(EXCEL名称) timeType(时间类型) t0(样本起始时间) [split splitN(样本分割数) erase]

其中,

  • EXCEL 名称就是从 Wind 下载下来的 EXCEL 名称,建议用英文命名,而且最好以变量名命名,比如你下载了ROE的数据,那这个 EXCEL 的文件名就命令为 ROE
  • 时间类型是指下载下来的样本是年度,季度还是月度数据,所以它的取值是 y/q/m ,暂时不支持日度
  • 样本起始时间,比如你选择从 1995 年 1 月开始下载,那么这个 t0 里面就写 1995m1,如果是 1995 年第 1 季度开始,那就写 1995q1,如果是年度数据以年为变化单位那就写 1995 ;
  • split splitN(n) erase这 3 个关键词是可选择的命令,当样本中的数据量太大时数据格式转换的速度相对较慢,所以我们采用了个折中的方法将样本分割成 n 个小样本,依次进行处理最后合并在一起。 n 取值越大分割的样本越小。建议 n 的取值是原始数据列数的 1/10 到 1/20 之间;
  • 另外需要注意的是,本命令是基于gather命令进行的转置,所以需要先安装tidy中的gather命令,即ssc install tidy

2. readWind 的使用案例

举个栗子:我从 Wind 上下载了 A 股上市企业 ROE 的数据(ROE.xlsx),格式如下:

ROE.png
ROE.png

那么只需要在 Stata 中输入下述命令:

cd "ROE所在的文件夹"             /// 改变工作路径到ROE文件夹下
readWind, var(ROE) timeType(q) t0(1995q1)      /// 调用readWind命令

或者输入:

readWind, var(ROE) timeType(q) t0(1995q1) split splitN(10) erase

等命令运行完就可以在 Stata 中看到漂亮规范的数据格式啦:

ROE.png
ROE.png

相关课程

连享会-直播课 上线了!
http://lianxh.duanshu.com

免费公开课:


课程一览

支持回看,所有课程可以随时购买观看。

专题 嘉宾 直播/回看视频
最新专题 DSGE, 因果推断, 空间计量等
Stata数据清洗 游万海 直播, 2 小时,已上线
研究设计 连玉君 我的特斯拉-实证研究设计-幻灯片-
面板模型 连玉君 动态面板模型-幻灯片-
面板模型 连玉君 直击面板数据模型 [免费公开课,2小时]

Note: 部分课程的资料,PPT 等可以前往 连享会-直播课 主页查看,下载。


关于我们

  • Stata连享会 由中山大学连玉君老师团队创办,定期分享实证分析经验。直播间 有很多视频课程,可以随时观看。
  • 连享会-主页知乎专栏,300+ 推文,实证分析不再抓狂。
  • 公众号推文分类: 计量专题 | 分类推文 | 资源工具。推文分成 内生性 | 空间计量 | 时序面板 | 结果输出 | 交乘调节 五类,主流方法介绍一目了然:DID, RDD, IV, GMM, FE, Probit 等。
  • 公众号关键词搜索/回复 功能已经上线。大家可以在公众号左下角点击键盘图标,输入简要关键词,以便快速呈现历史推文,获取工具软件和数据下载。常见关键词:课程, 直播, 视频, 客服, 模型设定, 研究设计, stata, plus, 绘图, 编程, 面板, 论文重现, 可视化, RDD, DID, PSM, 合成控制法

连享会主页  lianxh.cn
连享会主页 lianxh.cn

连享会小程序:扫一扫,看推文,看视频……

扫码加入连享会微信群,提问交流更方便

✏ 连享会学习群-常见问题解答汇总:
https://gitee.com/arlionn/WD