金融数据哪里找:Tushare数据平台

发布时间:2021-07-08 阅读 3114

Stata连享会   主页 || 视频 || 推文 || 知乎 || Bilibili 站

温馨提示: 定期 清理浏览器缓存,可以获得最佳浏览体验。

New! lianxh 命令发布了:
随时搜索推文、Stata 资源。安装:
. ssc install lianxh
详情参见帮助文件 (有惊喜):
. help lianxh
连享会新命令:cnssc, ihelp, rdbalance, gitee, installpkg

课程详情 https://gitee.com/lianxh/Course

课程主页 https://gitee.com/lianxh/Course

⛳ Stata 系列推文:

PDF下载 - 推文合集

作者: 申维冰 (新加坡国立大学)
邮箱: e0431418@u.nus.edu


目录


本文实操代码,视频讲解可以在 码云仓库 中获取:

1. Tushare 简介

Tushare 大数据开放社区是一个免费提供各类金融数据,助力智能投资与创新型投资的平台。Tushare 旧版本已经运行三年多,数据在广度和深度都得到了提升。最近推出的 Tushare Pro 版本则是在此基础上做了更大的改进。其涵盖的数据包括八大类,分别是:

  • 沪深股票
  • 期货数据
  • 公募基金和私募基金
  • 债券数据
  • 外汇数据
  • 行业经济数据
  • 区块链数据
  • 另类数据
图 1:Tushare 官网图片
图 1:Tushare 官网图片

2. Tushare 安装

  • 访问「Tushare 社区门户」,点击右上角 “注册”;
  • 登录成功后,点击右上角 “个人主页”  在 “用户中心” 中点击 “接口 TOKEN”  点击右侧复制按钮复制 TOKEN;
  • 由于接下来的教程均是基于 Python,建议下载 Anaconda。这是一个集成了多个科学计算包,可以同时进行包管理和环境管理的 Python 发行版本;
  • 在本地 cmd 终端中输入 pip install tushare,如果安装网络超时,可尝试国内 pip 源,如:
pip install tushare -i https://pypi.tuna.tsinghua.edu.cn/simple

3. 入门指南

3.1 初始化设置

import tushare as ts # 导入 Tushare
ts.set_token('your token here') # 只需要在第一次或者 token 失效后调用
pro = ts.pro_api() # 初始化 pro 接口

3.2 股票数据调取

为了方便大家理解,我们用一个具体实例来展示 Tushare 获取金融数据的方法。具体地,以获取沪深股票的基础信息为例,通过 pro 的接口调取股票代码、名称、上市日期、退市日期等信息。

  • 输入参数
名称 类型 必选 描述
is_hs str N 是否沪深港通标的,N否 H沪股通 S深股通
list_status str N 上市状态 L上市 D退市 P暂停上市,默认是L
exchange str N 交易所 SSE上交所 SZSE深交所
ts_code str N TS股票代码
market str N 市场类别
limit int N
offset int N
name str N 名称
  • 输出参数
名称 类型 默认显示 描述
ts_code str Y TS代码
symbol str Y 股票代码
name str Y 股票名称
area str Y 地域
industry str Y 所属行业
fullname str N 股票全称
enname str N 英文全称
cnspell str N 拼音缩写
market str Y 市场类型 (主板/创业板/科创板/CDR)
exchange str N 交易所代码
curr_type str N 交易货币
list_status str N 上市状态 L上市 D退市 P暂停上市
list_date str Y 上市日期
delist_date str N 退市日期
is_hs str N 是否沪深港通标的,N否 H沪股通 S深股通

上表中展示的是在获取沪深股票基本信息时,每个参数所代表的含义。类型列中,“str” 代表这是一个字符串类型,“int” 代表这是一个整数类型。必选列中若显示 “Y” 则表示这一参数为必选项,若为 “N” 则表示这一参数非必选。我们以具体代码为例进行解释:

# 查询当前所有正常上市交易的股票列表
data = pro.stock_basic(exchange = '', list_status = 'L', \
       fields = 'ts_code, symbol, name,area, industry, list_date')
  • exchange = '' 表示不指定交易所类别;
  • list_status = 'L' 表示上市状态为 “L”,即上市;
  • fields = 'ts_code, symbol, name, area, industry, list_date' 表示输出股票的 TS 代码 (ts_code),股票代码 (symbol),股票名称 (name),地域 (area),所属行业 (industry) 和上市日期 (list_date)。

上述代码采用的是 Tushare Pro 接口下的 pro.stock_basic 成员函数。当然,我们也可以使用 Tushare Pro 接口下的 pro.query 成员函数,并在第一个参数的位置指定为 stock_basic

#查询当前所有正常上市交易的股票列表
data = pro.query('stock_basic', exchange = '', list_status = 'L', \
       fields = 'ts_code, symbol,name, area, industry, list_date')

以上两种方式均可得到相同的结果,下图为结果样例:

图2:结果样例
图2:结果样例

4. 进阶功能

Tushare 不仅可以抓取股票数据,它还可以实现期货行情数据的抓取和清洗。接下来就为大家介绍一下 Tushare 如何获取期货数据,以及如何实现数据标准化。

4.1 期货交易所代码表

交易所名称 交易所代码 合约后缀
郑州商品交易所 CZCE .ZCE
上海期货交易所 SHFE .SHF
大连商品交易所 DCE .DCE
中国金融期货交易所 CFFEX .CFX
上海国际能源交易所 INE .INE

4.2 合约代码规则

合约类型 定义 Tushare 代码举例
交易合约 具有特定交易日期的、可以交易的期货合约 ZC1812.ZCE, IF1812.CFX
主力合约 持仓量、成交量最大的合约 ZC.ZCE, CU.SHF
连续合约 当前交割月的合约 ZCL.ZCE, CUL.SHF

在连续合约中,中金所的连续合约代码规则为:

合约代码 连续类型
IFL.CFX 当月连续
IFL1.CFX 次月连续
IFL2.CFX 当季连续
IFL3.CFX 下季连续

4.3 数据规则

在 Tushare 期货数据里,如果提取跟行情相关的数据,例如日线行情、每日结算参数等,都需要带交易所后缀的,比如 CU1811.SHF;如果是提取跟品种相关数据,例如持仓排名,仓单数据等,只需要输入品种代码,比如 CU: 沪深 300 期货。

4.4 数据列表

图3:Tushare 目前提供的期货数据列表
图3:Tushare 目前提供的期货数据列表

4.5 Python 抓取数据

  • 获取行情数据
df = pro.fut_daily(ts_code = 'IFL.CFX', \
     start_date = '20180101', end_date = '20210701')
  • 获取会员持仓排名
df = pro.fut_holding(trade_date = '20210701', \
     symbol = 'C', exchange = 'DCE')
  • 获取仓单日报数据
df = pro.fut_wsr(trade_date = '20210701', symbol = 'ZN')
  • 获取结算参数数据
df = pro.fut_settle(trade_date = '20210701', exchange = 'SHFE')

5. 积分权限

某些特定数据可能需要用户的积分达到一定数量才可以获取,这时我们就可以前往「Tushare 官网社区交流中心」,加入 Tushare 高校和机构用户群,通过以下步骤免费获取积分:

  • 机构客户和高校教师:
    • 添加积分管理员为好友,备注机构名称或高校名称;
    • 私聊积分管理员获取权限。
  • 在校学生:
    • 添加积分管理员为好友,备注学校专业;
    • 私聊积分管理员,说明使用 Tushare 的用途;
    • 完成每季度任务,获得学生赠送积分。

6. 更多资料

当然,我们只简单介绍了 Tushar 若干功能中的一小部分。这个免费的大数据平台还有更多公开的金融数据,有数据需求的小伙伴可以访问「Tushare 官网」 来获得详细信息。还在等什么,赶紧开启你的金融数据挖掘之旅吧!

7. 相关推文

Note:产生如下推文列表的 Stata 命令为:
lianxh API 公开 开放, m
安装最新版 lianxh 命令:
ssc install lianxh, replace

相关课程

免费公开课

最新课程-直播课

专题 嘉宾 直播/回看视频
最新专题 文本分析、机器学习、效率专题、生存分析等
研究设计 连玉君 我的特斯拉-实证研究设计-幻灯片-
面板模型 连玉君 动态面板模型-幻灯片-
面板模型 连玉君 直击面板数据模型 [免费公开课,2小时]
  • Note: 部分课程的资料,PPT 等可以前往 连享会-直播课 主页查看,下载。

课程主页

课程主页

关于我们

  • Stata连享会 由中山大学连玉君老师团队创办,定期分享实证分析经验。
  • 连享会-主页知乎专栏,400+ 推文,实证分析不再抓狂。直播间 有很多视频课程,可以随时观看。
  • 公众号关键词搜索/回复 功能已经上线。大家可以在公众号左下角点击键盘图标,输入简要关键词,以便快速呈现历史推文,获取工具软件和数据下载。常见关键词:课程, 直播, 视频, 客服, 模型设定, 研究设计, stata, plus, 绘图, 编程, 面板, 论文重现, 可视化, RDD, DID, PSM, 合成控制法

连享会小程序:扫一扫,看推文,看视频……

扫码加入连享会微信群,提问交流更方便

✏ 连享会-常见问题解答:
https://gitee.com/lianxh/Course/wikis

New! lianxh 命令发布了:
随时搜索连享会推文、Stata 资源,安装命令如下:
. ssc install lianxh
使用详情参见帮助文件 (有惊喜):
. help lianxh