Ferret — Go 语言实现的声明式 Web 爬虫系统
Ferret 是一个声明式的 Web 爬虫系统,旨在简化网络上的数据提取,以用于 UI 测试、机器学习和分析等等。
Ferret 拥有自己的声明式语言,通过抽象出技术细节和底层技术的复杂性,从而更专注于数据本身。
特性
-
声明式语言
-
支持静态和动态 web 页面
-
嵌入式
-
可扩展
示例
LET google = DOCUMENT("https://www.google.com/", true) INPUT(google, 'input[name="q"]', "ferret", 25) CLICK(google, 'input[name="btnK"]') WAIT_NAVIGATION(google) FOR result IN ELEMENTS(google, '.g') // filter out extra elements like videos and 'People also ask' FILTER TRIM(result.attributes.class) == 'g' RETURN { title: INNER_TEXT(result, 'h3'), description: INNER_TEXT(result, '.st'), url: INNER_TEXT(result, 'cite') }
本文来自云栖社区合作伙伴“开源中国”
本文作者:局长

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
前端高手的必经之路:前端布局
小伙伴可能已经学会了html、css、javascript等前端知识,还接触了vue、react、angular等各种框架。 在这个时候,我们自认为已经掌握了前端的知识后,信誓旦旦的找工作时,却被面试官的一个看似简单的切图问题给难倒了,即便是混过了面试,工作中也不得心应手。 这是因为我们忽视了一个重要知识:前端布局。 布局既是前端开发人员的核心技能,又在工作中占很大的比重。 什么是前端布局? 在盖一栋房子时,我们是打算将房子盖成两室一厅呢还是将它隔成三室一厅?如何合理的进行户型规划呢? 前端布局,做的就是这么一件事——对页面模块和内容进行科学合理的组织与呈现。 为什么我们要学习前端布局? 前端布局,既是前端开发人员的核心基础技能,也是在工作中占很大的比重。同时前端布局由于入门容易、深入困难的特点,历来被人们作为入门知识所轻视。 同时由于CSS3 Flex布局和grid布局等颠覆性布局方式的出现,也彻底改变了传统的div+css的单一布局方式,这让很多人显得无所适从。 然而良好的前端布局是进行javascript书写和交互的基础。 布局的好坏直接影响着后续的所有工作进展的顺利与否与效率的...
- 下一篇
2018诺贝尔经济学奖得主,一名62岁的Python教徒
北京时间10月8日,瑞典皇家科学院宣布,将2018年诺贝尔经济学奖授予美国学者威廉·诺德豪斯(William D. Nordhaus)和保罗·罗默(Paul M. Romer)。 此次诺奖共同获得者之一的保罗·罗默是美国著名经济学家,斯坦福大学教授。他是经济增长动力最重要的理论家之一,他还曾是前世界银行首席经济师,这是经济学领域中最有影响力岗位之一。他也是特许城市理论的主要传播者,主张在一个国家内建立小型的行政辖区,自治地运作政府,作为一种鼓励更好治理国家的方式。 但在他的种种身份中,也许最值得我们注意的是,这位62岁的经济学家是一位编程语言Python的用户。 经济学涉及大量数学和统计学,最常用的数字工具是电子表格软件Microsoft Excel和编程语言Stata以及Mathematica。这三项都是世界各地经济学教室中常用的工具
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- CentOS7,8上快速安装Gitea,搭建Git服务器
- CentOS8安装MyCat,轻松搞定数据库的读写分离、垂直分库、水平分库
- SpringBoot2整合Thymeleaf,官方推荐html解决方案
- CentOS7,CentOS8安装Elasticsearch6.8.6
- CentOS关闭SELinux安全模块
- SpringBoot2初体验,简单认识spring boot2并且搭建基础工程
- Docker快速安装Oracle11G,搭建oracle11g学习环境
- Eclipse初始化配置,告别卡顿、闪退、编译时间过长
- SpringBoot2整合Redis,开启缓存,提高访问速度
- CentOS7设置SWAP分区,小内存服务器的救世主