Python爬虫入门教程 11-100 行行网电子书多线程爬取
行行网电子书多线程-写在前面
最近想找几本电子书看看,就翻啊翻,然后呢,找到了一个 叫做 周读
的网站 ,网站特别好,简单清爽,书籍很多,而且打开都是百度网盘可以直接下载,更新速度也还可以,于是乎,我给爬了。本篇文章学习即可,这么好的分享网站,尽量不要去爬,影响人家访问速度就不好了 http://www.ireadweek.com/
,想要数据的,可以在我博客下面评论,我发给你,QQ,邮箱,啥的都可以。
这个网站页面逻辑特别简单 ,我翻了翻 书籍详情页面 ,就是下面这个样子的,我们只需要循环生成这些页面的链接,然后去爬就可以了,为了速度,我采用的多线程,你试试就可以了,想要爬取之后的数据,就在本篇博客下面评论,不要搞坏别人服务器。
http://www.ireadweek.com/index.php/bookInfo/11393

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
JavaScript实现ZLOGO子集: 前进+转向
在前文《中文编程语言之Z语言初尝试: ZLOGO 4》与相关讨论后, 萌生了用JavaScript编写类似语言以便在线编程的想法. 于是使用 @TKT2016 (知乎账号)的ZLOGO语法设计, 在《编程语言试验之Antlr4+JavaScript实现"圈4"》基础上, 通过p5js的绘图功能, 实现了基本的两个ZLOGO功能. 如图(动态效果看起来更爽一点, 当然要耐心等它画完, 请自行尝试): 源码库: program-in-chinese/quan3, 导出代码到本地后, 在浏览器中打开"圈3.html"即可在本地实践编程. 在线演示: 【见原文】 由于还不支持循环, 实现这个五角星的代码很重影: 开始 前进200 左转144度 前进200 左转144度 前进200 左转144度 前进200 左转144度 前进200 结束 下面是编程语言试验之Antlr4+JavaScript实现"圈4"之后添加的主要部分:语法文件(圈3.g4): 声明 : 前进 | 转向; 前进 : '前进' T数 ; 转向 : T转向 '转' T数 '度' ; T转向 : '左' | '右' ; 主要修改在...
- 下一篇
JavaScript实现ZLOGO子集: 单层循环功能
前文《JavaScript实现ZLOGO子集: 前进+转向》的示例代码很累赘, 因此尝试实现基本的循环功能, 使得前面的11行代码缩减为7行: 开始 循环4次 前进200 左转144度 到此为止 前进200 结束 源码和在线演示地址同前文. 修改的语法描述(圈3.g4)不多, 应该已经支持多层循环: 声明 : 前进 | 转向 | 循环; 循环 : '循环' T数 '次' 声明+ '到此为止' ; 但实现上, 暂时先做了单层. 就是将循环体内的指令存放起来, 在循环结束时, 把它们按循环次数重复添加到最终的指令序列中: // TODO: 支持多层循环 var 循环次数 = 0; var 当前循环的指令序列 = []; ... 定制监听器.prototype.enter循环 = function(上下文) { 循环次数 = parseInt(上下文.getChild(1).getText()); } 定制监听器.prototype.exit循环 = function(上下文) { for (var i = 0; i < 循环次数; i++) { for (var j = 0; j &...
相关文章
文章评论
共有0条评论来说两句吧...