Windows下安装配置爬虫工具Scrapy及爬虫环境
爬虫工具Scrapy在Mac和Linux环境下都相对好装,但是在Windows上总会碰到各种莫名其妙的问题。本文记录下Scrapy在Window上的安装过程。
本文是基于Python2.7及Windows 10安装Scrapy及各种爬虫相关库。
下载安装Scrapy
-
按照官网建议下载安装Anaconda,使用这个安装比直接pip安装会少很多问题。
下载地址 -
安装完成后,python2.7也会自动安装好,然后执行以下命令安装Scrapy.
conda install -c conda-forge scrapy
安装mysql驱动
-
下载并安装mysql官方的驱动程序。下载地址
-
下载mysql的python驱动程序,可以把两个都装上,使用的时候再决定用哪个。
- MySQL官方的纯Python驱动
pip install mysql-connector-python
-
封装了MySQL C驱动的Python驱动
-
安装Python版C++编译程序。下载地址
-
拷贝mysql驱动(32位不需要这一步),将"C:\Program Files\MySQL" 拷贝到 “C:\Program Files (x86)\MySQL”。
目的是为了防止下一步的错误"Cannot open include file: ‘config-win.h’: No such file or directory" -
安装驱动
pip install MySQL-python
-
安装数据库连接池工具
pip install DBUtils
-
安装其它相关的依赖库
安装BeautifulSoup
Beautiful Soup提供一些简单的、python式的函数用来处理导航、搜索、修改分析树等功能。
pip install beautifulsoup4
安装PyQuery
PyQuery库也是一个非常强大又灵活的网页解析库。
pip install pyquery

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
-
上一篇
适配器在JavaScript中的体现
适配器设计模式在JavaScript中非常有用,在处理跨浏览器兼容问题、整合多个第三方SDK的调用,都可以看到它的身影。 其实在日常开发中,很多时候会不经意间写出符合某种设计模式的代码,毕竟设计模式就是老前辈们总结提炼出来的一些能够帮助提升开发效率的一些模版,源于日常的开发中。 而适配器其实在JavaScript中应该是比较常见的一种了。 在维基百科中,关于适配器模式的定义为: 在软件工程中,适配器模式是一种软件设计模式,允许从另一个接口使用现有类的接口。它通常用于使现有的类与其他类一起工作,而无需修改其源代码。 生活中的例子 在生活中最常见的就是电源插头的适配器了,世界各国的插座标准各不相同,如果需要根据各国的标准购买对应的电源插头那未免太过于浪费钱财,如果说自己带着插座,把人家墙敲碎,重新接线,也肯定是不现实的。 所以就会有插头的适配器,用来将某种插头转换成另一种插头,在插座和你的电源之间做中转的这个东西,就是适配器。 在代码中的体现 而转向到编程中,我个人是这样理解的: 将那些你不愿意看见的脏代码藏起来,你就可以说这是一个适配器 接入多个第三方SDK 举个日常开发中的例子,我们在...
-
下一篇
使用Python请求http/https时设置失败重试次数
使用Python的requests库时,默认是没有失败时重试请求的,通过下面的方式可以支持重试请求 设置请求时的重试规则 import requests from requests.adapters import HTTPAdapter s = requests.Session() a = HTTPAdapter(max_retries=3) b = HTTPAdapter(max_retries=3) #将重试规则挂载到http和https请求 s.mount('http://', a) s.mount('https://', b) 请求Url 上面设置完毕后,通过改Session的请求就可以支持失败重试 r = s.get('http://api.map.baidu.com/geocoder?location=39.90733345,116.391244079988&output=json') # 返回的状态码 r.status_code # 响应内容,中文为utf8编码 r.content # 响应的字符串形式,中文为unicode编码 r.text # 响应头中的编码 ...
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- Springboot2将连接池hikari替换为druid,体验最强大的数据库连接池
- SpringBoot2全家桶,快速入门学习开发网站教程
- SpringBoot2更换Tomcat为Jetty,小型站点的福音
- CentOS8安装MyCat,轻松搞定数据库的读写分离、垂直分库、水平分库
- SpringBoot2配置默认Tomcat设置,开启更多高级功能
- CentOS7,8上快速安装Gitea,搭建Git服务器
- Docker使用Oracle官方镜像安装(12C,18C,19C)
- MySQL数据库在高并发下的优化方案
- SpringBoot2整合MyBatis,连接MySql数据库做增删改查操作
- MySQL8.0.19开启GTID主从同步CentOS8