Google 开源 robots.txt 解析器
Google 称过去 25 年 Robots Exclusion Protocol (REP)协议一直是一种约定的标准,给网站管理员人员和爬虫工具开发者带来了很多不确定性。Google 现在宣布它将率先致力于让 REP 成为一个行业标准,作为这个努力的一部分,它开源了自己使用的 robots.txt 解析器,源代码托管在 GitHub 上,采用 Apache License 2.0 许可证。robots.txt 解析器是一个 C++ 库,用于解析和匹配 robots.txt 文件中的规则,它已经有约 20 年历史了,包含了 1990 年代写的代码。
稿源:Solidot
低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
MongoDB:有人敢像我一样说出开源的真实用意吗?
现在大大小小的公司都在搞开源,在被问到为什么开源某个项目时,负责人要么说是贡献社区与用户,要么以希望借广大开发者之力完善项目为挡箭牌,虽然这些想法都可以是真实也经得起考验的,但是在这背后更加真实的“目的”,公司都不愿意提及,比如营销品牌需要,比如先开源后“违规”收费,比如 KPI 担当,比如推动相应收费版本的销售…… 虽然开源有个人/公益组织的开源、以开源项目作为基础的商业化公司的开源,以及商业公司反过来去涉及开源领域的开源这些区别,但是除去人个与公益组织的开源初衷不表,剩下涉及到公司的开源,他们关于开源的真实想法确实往往不会明示,这其实也可以理解,开源本是一种黑客式的高尚行为,过多地掩盖这种特性,会带来反感,于公司不利。 然而事实是,上述“背后的真实目的”其实都经常被达成。 与这些公司的表里不一不同,最近在接受 Computer Business Review 采访时,MongoDB 公司 CEO Dev Ittycheria 明确表示了 MongoDB 的开源用意:“我们的开源并不是为了获得帮助,使产品更好,而是作为免费增值策略,以推动采用。” we didn’t open sou...
- 下一篇
SequoiaDB 虚拟机镜像正式上线
数据库云化架构需求 随着云架构的发展和流行,在业务和应用进行“云化”的过程中,云数据库因为在整体架构中的重要地位,在云化改造中的重要性不言而喻。云数据库需要满足这些技术要求,除了在功能上的具体提升,在整体架构上更需要进行升级和“进化”。 云数据库架构是其能否承载应用架构“云化”的关键点,随着技术和业务的发展,云数据库的架构出现了几个主要的发展方向: 在dbPaaS平台中,计算-存储层分离将会成为主流技术方向。通过将协议解析、计算等模块与底层存储解耦,数据库云平台将存储层进行分片以实现存储的弹性水平扩张,同时通过计算层的无状态设计允许计算层通过增加节点数量线性提升计算能力,已达到整个数据库云平台的弹性水平扩张。 多模架构成为主流趋势,Multi-model的架构在一个数据库平台就可以支持多种存储方式,大大减少运维和开发的成本。传统数据库中例如IBM、Oracle等早已经提供关系型、OO、甚至XML等存储引擎。而新一代数据库则更提供NewSQL、JSON、图、对象存储等多种类型数据存储引擎。 云数据库平台将会提供多种混合模式的数据服务 – 关系型与非关系型。该模式使用户能够在同一平台中结合...
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- SpringBoot2整合MyBatis,连接MySql数据库做增删改查操作
- CentOS8安装MyCat,轻松搞定数据库的读写分离、垂直分库、水平分库
- SpringBoot2整合Thymeleaf,官方推荐html解决方案
- Mario游戏-低调大师作品
- 2048小游戏-低调大师作品
- SpringBoot2初体验,简单认识spring boot2并且搭建基础工程
- 设置Eclipse缩进为4个空格,增强代码规范
- Windows10,CentOS7,CentOS8安装Nodejs环境
- MySQL8.0.19开启GTID主从同步CentOS8
- Docker快速安装Oracle11G,搭建oracle11g学习环境