您现在的位置是:首页 > 文章详情

用python抓取“3d”彩票数据,怎么分析你说了算!

日期:2018-07-04点击:348

快下班了,正好准备去买彩票,就顺手写了2个脚本,一个用来下载最近的彩票数据,一个用来统计彩票数字,分享给大家!

用python抓取3d彩票数据,怎么分析你说了算!

彩票数据获取并写入excel表格

数据来源自己看吧~用外链通不过。。。

所用库:xlwt,requests,lxml

有几点需要注意的:

1、构建列表。因为存入excel文件的时候用的是列表,所以新建一个函数,分别取网页5个数据:时间、期数、开奖数123,然后每一页嵌套写入列表类似结构为[[时间、期数、开奖数1,2,3],[时间、期数、开奖数1,2,3]……],在循环页数,获取所有的数据!注意构建列表的形式和列表结果,这个在你写入表格的时候很重要!

2、写入数据。xlwt写入文件的方法为ws.write(行,列,数据),按行写入文件,所以新建一个变量line(代码第36行),每写入一行自增1。

其他方面都很简单,没有反爬,就是为了获取数据,好做分析!

用python抓取3d彩票数据,怎么分析你说了算!

最后excel表中的数据,是这样的:

用python抓取3d彩票数据,怎么分析你说了算!

最后大概有4840行数据,足够我们分析的了!

数据处理

用xlrd库就可以~话说xlwt库和xlrd库好像就是一个写数据,一个读数据。。。

就写了一个抓热门数字的,也就是取频率最高的。如果您有更好的想法或者玩法,可以自行去实现哦!

先读取数据,然后取到每一行的2.3.4列,每一列写入一个列表(现在有些后悔,不该写那么多数据进来),然后3个列表合并一个总列表,这样我们就有了4个列表,取出每一个列表中出现次数最多的那个数字,代码如下:

用python抓取3d彩票数据,怎么分析你说了算!

第1个数字频率最高的是 [3]

第2个数字频率最高的是 [6]

第3个数字频率最高的是 [8]

单个数字频率最高的是 [3]

因为赶时间下班。。就全部用了列表推导式,也没有用pandas库或者可视化库做出很炫酷的图表,等我研究出完美的预测方案的时候在做【手动哭泣】,不过依现在的趋势,是没什么希望了。。。

最后要说的是,从开始研究分析各种数据到现在习惯性的买彩票,没中过大奖(超过200的都算大奖)!果然童话都是骗人的……还是学python比较好玩!

用python抓取3d彩票数据,怎么分析你说了算!

原文链接:https://yq.aliyun.com/articles/639535
关注公众号

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。

持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。

文章评论

共有0条评论来说两句吧...

文章二维码

扫描即可查看该文章

点击排行

推荐阅读

最新文章