Python爬虫入门教程 31-100 36氪(36kr)数据抓取 scrapy-低调大师

Python爬虫入门教程 31-100 36氪(36kr)数据抓取 scrapy

2019-05-14 814

1. 36氪(36kr)数据----写在前面

今天抓取一个新闻媒体，36kr的文章内容，也是为后面的数据分析做相应的准备的，预计在12月底，爬虫大概写到50篇案例的时刻，将会迎来一个新的内容，系统的数据分析博文，记得关注哦~

36kr 让一部分人先看到未来，而你今天要做的事情确实要抓取它的过去。

网址 https://36kr.com/

2. 36氪(36kr)数据----数据分析

36kr的页面是一个瀑布流的效果，当你不断的下拉页面的时候，数据从后台追加过来，基于此，基本可以判断它是ajax异步的数据，只需要打开开发者工具，就能快速的定位到想要的数据，我们尝试一下！

捕获链接如下

https://36kr.com/api/search-column/mainsite?per_page=20&page=1&_=15438401

微信关注我们

原文链接：https://yq.aliyun.com/articles/702464

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

【直播预告】云栖社区特邀专家户庆凯：JVM的GC（垃圾回收器）机制

主讲人：户庆凯（云栖社区特邀专家）郑州大学学士，贵州大学硕士；高级研发工程师，数据分析师，小米公司研发工程师；专注于数据可视化，数据分析，增量计算技术，大数据管理与应用，热衷于Java、Spring Boot、TIDB、Mysql、Redis、Python；点击关注户庆凯的云栖社区个人主页内容概要：主要讲解JVM的内存结构，及GC原理，GC算法和JVM调优和监控。直播时间：2019年5月16日周四晚20:30 直播地点：【阿里Java技术进阶】钉钉群详情请看下方图片：想看免费直播的提前扫码入群，或点击link入群：http://byan.top/VjOiEk 以下为云栖社区的官方Java云栖号：Java技术进阶（点击关注）相关文章：Java StringUtils详解深入Java虚拟机:多态性实现机制--动态单分派和静态多分派【阿

2019-05-13

841

键盘上下左右控制 <html lang="en"> <head> <meta charset="UTF-8"> <title>Title</title> <style> .map { width: 400px; height: 400px; background-color: #ccc; position: relative; } </style> </head> <body> <div class="map"> </div> <scri

2019-05-14

794

资源下载

更多资源

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长，特征是大鼻子、头戴帽子、身穿背带裤，还留着胡子。与他的双胞胎兄弟路易基一起，长年担任任天堂的招牌角色。

Spring

Spring框架（Spring Framework）是由Rod Johnson于2002年提出的开源Java企业级应用框架，旨在通过使用JavaBean替代传统EJB实现方式降低企业级编程开发的复杂性。该框架基于简单性、可测试性和松耦合性设计理念，提供核心容器、应用上下文、数据访问集成等模块，支持整合Hibernate、Struts等第三方框架，其适用范围不仅限于服务器端开发，绝大多数Java应用均可从中受益。

Rocky Linux

Rocky Linux（中文名：洛基）是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版，作为CentOS稳定版停止维护后与RHEL（Red Hat Enterprise Linux）完全兼容的开源替代方案，由社区拥有并管理，支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性，采用模块化包装和SELinux安全架构，默认包含GNOME桌面环境及XFS文件系统，支持十年生命周期更新。

WebStorm

WebStorm 是jetbrains公司旗下一款JavaScript 开发工具。目前已经被广大中国JS开发者誉为“Web前端开发神器”、“最强大的HTML5编辑器”、“最智能的JavaScript IDE”等。与IntelliJ IDEA同源，继承了IntelliJ IDEA强大的JS部分的功能。

Python爬虫入门教程 31-100 36氪(36kr)数据抓取 scrapy

1. 36氪(36kr)数据----写在前面