python股票市场数据探索指北-低调大师

python股票市场数据探索指北

2019-07-27 688

前言

虽然同花顺之类的金融理财应用的数据足够好了，但还是有自己定制的冲动, 数据自然不会不会比前者好很多，但是按照自己的想法来定制还是不错的。

目标

通过免费的数据接口获取数据，每日增量更新标的历史交易数据, 然后通过Kibana做可视化及数据分析.

其实自己通过echarts之类的可视化框架做可视化也是个不错的选择，不过前期成本太大。还有就是pandas+matplotlib已经足以应付大部分需求了，可是交互感太弱，所以借助一个可视化应用是很有必要的，这里选择的是kibana, 它的竞品有Grafana.

这个目标应该会一直下去吧，大家可以通过以下链接获取代码

https://github.com/youerning/stock_playground

环境配置

Python3(推荐Anaconda安装)

安装相关依赖：

pip install -r requirement.txt

配置eleasticsearch, kibana环境(推荐使用docker)

Elasticsearch, Logstash, Kibana 7.2.0

数据源

获取数据的方式有很多种，收费或者免费，作为业余爱好者自然选择免费的，这里选择 tushare.pro, 但其实tushare会有一点限制, 如获取数据的频率有一定的限制，并且接口也有限制, 需要很多积分。如果大家对这个有兴趣注册，就通过我的推荐链接注册呗, 这样我可以跟大家分享更多关于数据可视化的内容,以及将我下载下来的数据分享出来。

https://tushare.pro/register?reg=277890

值得注意的是, tushare其实也是有几乎没限制的免费版本的. 但是pro版本数据更全，为了避免后期维护成本，所以选择pro版本。

其实还有其他的免费的数据获取方式的，大家可以自己尝试

获取数据

配置自己的token

import tushare as ts
ts.set_token("<your_token>")
pro = ts.pro_api("<your_token>")

关于Token的获取可以参考一下链接

https://tushare.pro/document/1?doc_id=39

尝试手动获取数据

通过日期取历史某一天的全部历史
df = pro.daily(trade_date='20190725')

df.head()
ts_code trade_date  open    high    low close   pre_close   change  pct_chg vol amount  value
0   000032.SZ   20190725    9.49    9.60    9.47    9.56    9.49    0.07    0.7376  12658.35    12075.625   8906.981000
1   000060.SZ   20190725    4.39    4.40    4.35    4.36    4.39    -0.03   -0.6834 129331.65   56462.292   -38586.330353
2   000078.SZ   20190725    3.37    3.38    3.35    3.38    3.37    0.01    0.2967  76681.00    25795.633   7653.564311
3   000090.SZ   20190725    5.66    5.66    5.56    5.61    5.64    -0.03   -0.5319 105582.72   59215.389   -31496.665409
4   000166.SZ   20190725    4.97    4.98    4.93    4.96    4.97    -0.01   -0.2012 268122.48   132793.120  -26717.975744

获取某一只股票的日线行情数据
data = ts.pro_bar(ts_code="601668.SH", adj='qfq', start_date="20120101")
data.head()
ts_code trade_date  open    high    low close   pre_close   change  pct_chg vol amount
0   601668.SH   20190726    6.01    6.06    5.98    6.03    6.04    -0.01   -0.17   696833.16   419634.547
1   601668.SH   20190725    6.05    6.07    6.02    6.04    6.04    0.00    0.00    543074.55   327829.380
2   601668.SH   20190724    6.09    6.11    6.02    6.04    6.05    -0.01   -0.17   788228.12   477542.609
3   601668.SH   20190723    5.93    6.07    5.92    6.05    5.94    0.11    1.85    1077243.46  650250.021
4   601668.SH   20190722    6.02    6.03    5.92    5.94    6.00    -0.06   -1.00   811369.73   485732.343

数据的获取自然是需要自动化的，但是由于接口的限制，所以需要考虑以下问题。

股票列表
判断是否超出接口限制，如果是，则暂停一段时间

关键代码部分

def save_data(code, start_date, fp):
    print("下载股票(%s)日线数据到 %s" % (code, fp))

    try:
        data = ts.pro_bar(ts_code=code, adj='qfq', start_date=start_date)
        # 当超过调用次数限制返回None
        if data is None:
            time.sleep(10)
            return
        pass_set.add(code)
    except Exception:
        time.sleep(10)
        print("股票: %s 下载失败" % code)
        return

    if len(data) == 0:
        pass_set.add(code)
        return

    try:
        data.trade_date = pd.to_datetime(data.trade_date)
        data = data.sort_values("trade_date")
        if path.exists(fp):
            data.to_csv(fp, mode="a", header=False, index=False)
        else:
            data.to_csv(fp, index=False)
    except Exception:
        print("股票:%s 保存失败" % code)

大家可以参考我GitHub仓库的save_data.py, 通过以下命令就可以自动下载数据了

python save_data.py

代码里面配置的起始时间是2012-01-01,有需要的课自行更改，值得注意的是需要在同级目录配置一个config.json, 内容如下

{
    "token": "<your_token>"
}

配上自己的token

配置elasticsearch, kibana

这里使用的是docker进行配置。

# 拉取镜像
docker pull sebp/elk:720

# 启动docker环境
docker run -p 5601:5601 -p 9200:9200 -p 5044:5044 -v /home/elasticsearch/:/var/lib/elasticsearch -itd  sebp/elk:720

转存数据

将数据上传到elasticsearch里面以便数据分析

配置settings.py

# 将ip:port改成自己elasticsearch地址，如192.168.56.102:9200
config["es_host"] = ["ip:port"]

运行代码

# 上传股票数据
python cmd.py dump

# 上传上证指数数据
python cmd.py dump_index

可视化

配置kibana是需要一定的时间的，好在kibana现在是大多数配置都支持导入导出，所以大家可以通过我仓库的export.ndjson文件直接导入

效果展示

由于现在接口受限，获取的股票因子有限，所以等我的积分更多了，我会加入更多的dashboard, 以及visualization.

后记

希望可以完成自己的从无到有搭建交易系统系列文章, 然后通向工作时间地点自由之路.

不求绝对财富自由, 但愿时间地点自由^_^

微信关注我们

原文链接：https://blog.51cto.com/youerning/2424082

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

Y服务-你真的懂 Yaml 吗？

在Java 的世界里，配置的事情都交给了 Properties，要追溯起来这个模块还是从古老的JDK1.0 就开始了的。 "天哪，这可是20年前的东西了，我居然还在用 Properties.." 然而，本文的主角并不是Properties，而是Yaml。这是新时代里微服务架构上的宠儿，和 Properties 相比起来，Yaml 显得有些弄潮儿。以往的大多数项目里，我们都可以发现 Properties配置文件的踪迹，这包括用作业务属性配置的、机机接×××互的、国际化的等等用途。而少量的一些情况下，也存在一些"混合式"的做法，比如：使用 Xml 来表示一些模板使用一个 Json 格式化的字符串裸奔的文本格式，应用自解析... 混杂的配置方式往往出现在一些充满"坏味道"的项目里头，因为代码陈旧、斯人已矣等原因，很难形成统一的方式。然而，除开 Properties 属性文件这种简单的配置方式之外，采用其他的方法不外乎都是为了适应配置复杂、多元化的诉求。那么，Yaml 就是应对这种场景而产生的，在 SpringBoot 的官方文档中，有不少篇幅是使用了 Yaml 语法的配置格式。下...

2019-07-26

789

1.SonarQube部署前的内核参数等配置以及java环境配置 1）修改内核参数配置，使满足环境要求 [root@sonarqube ~]# vim /etc/sysctl.conf vm.max_map_count=262144 fs.file-max=65536 [root@sonarqube ~]# sysctl -p #生效修改的内核参数 …… vm.max_map_count = 262144 fs.file-max = 65536 2）修改本机安全策略参数限制 [root@sonarqube ~]# vim /etc/security/limits.conf …… sonarqube - nofile 65536 sonarqube - nproc 2048 3）配置java环境（至少jdk-8或openjdk-8版本） [root@sonarqube ~]# ls /usr/local/src/ jdk-8u211-linux-x64.tar.gz [root@sonarqube src]# tar xvf jdk-8u211-linux-x64.tar.gz [roo...

2019-07-29

725

资源下载

更多资源

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称，一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集，帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Rocky Linux

Rocky Linux（中文名：洛基）是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版，作为CentOS稳定版停止维护后与RHEL（Red Hat Enterprise Linux）完全兼容的开源替代方案，由社区拥有并管理，支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性，采用模块化包装和SELinux安全架构，默认包含GNOME桌面环境及XFS文件系统，支持十年生命周期更新。

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能，例如代码缩略图，Python的插件，代码段等。还可自定义键绑定，菜单和工具栏。Sublime Text 的主要功能包括：拼写检查，书签，完整的 Python API ， Goto 功能，即时项目切换，多选择，多窗口等等。Sublime Text 是一个跨平台的编辑器，同时支持Windows、Linux、Mac OS X等操作系统。

WebStorm

WebStorm 是jetbrains公司旗下一款JavaScript 开发工具。目前已经被广大中国JS开发者誉为“Web前端开发神器”、“最强大的HTML5编辑器”、“最智能的JavaScript IDE”等。与IntelliJ IDEA同源，继承了IntelliJ IDEA强大的JS部分的功能。