Scrapy 2.13.4 发布,Python 爬虫框架
Scrapy 是一套基于 Twisted 的异步处理框架,纯 Python 实现的爬虫框架,用户只需要定制开发几个模块就可以轻松的实现一个爬虫,用来抓取网页内容以及各种图片。它也可以用于广泛的目的,从数据挖掘、监控到自动测试等。
Scrapy 2.13.4 现已发布,具体更新内容包括:
Security bug fixes
-
针对使用
br和deflate方法压缩的响应,HttpCompressionMiddleware增强了对解压 bombs 的防护机制:若单个压缩块解压后可能超过响应大小限制(参见DOWNLOAD_MAXSIZE),则不再执行解压操作。此机制对能实现超高压缩率的br(Brotli) 方法尤为关键。更多详情请参阅 CVE-2025-6176 和 GHSA-2qfp-q593-8484 安全公告。(issue 7134)
Modified requirements
- 可选
brotli包的最低支持版本现已为1.2.0.(issue 7134) brotlicffi和brotlipy软件包已不再用于解压缩 Brotli 压缩的响应。改用brotli软件包。(issue 7134)
Other changes
- 限制了支持的 Twisted 最高版本
25.5.0,因为 Scrapy 目前使用了一些在后续 Twisted 版本中已更改的私有 API。(issue 7142) - 停止在测试中设置
COVERAGE_CORE环境变量,该变量虽无实际效果却会导致coverage模块产生警告或错误。(issue 7137) - 移除了文档构建对已弃用
sphinx-hoverxref模块的依赖。(issue 6786,issue 6922)
详情可查看:https://docs.scrapy.org/en/latest/news.html#scrapy-2-13-4-2025-11-17