Scrapy框架快速创建项目命令、框架的结构
Scrapy在爬虫开发领域是非常不错的一款框架,如果要从事爬虫开发那么这款框架一定要非常熟悉,尽管在实际开发中可能用不上,但是其中的架构思想也能让自己写的爬虫质量有不一般的提升。 Scrapy框架应该掌握的几条命令: CMD命令行界面执行 scrapy shell [url] 该条命令常用于scrapy开发前的测试,如:scrapy shell 执行完该条命令后可运行,view(response)将用默认浏览器打开下载的URL页面。 Scrapy startproject [name] 该条命令用于创建一个Scrapy框架开发的项目文件,后接项目名 scrapy genspider [name] [domain] 创建项目后进入项目文件夹,执行该命令快速创建爬虫程序,后接爬虫名、爬去站点的域名,将在spiders文件夹下生成一个基本框架的爬虫程序。 scrapy crawl [name] -o [file] 该条命令是运行name名字的爬虫,并将数据保存为file,注意file是带格式的文件名,目前支持json、json lines、csv、xml、pickle、marshal。 上面...
