HugeGraph —— 图数据库系统
HugeGraph 是一款易用、高效、通用的开源图数据库系统(Graph Database), 实现了 Apache TinkerPop3 框架及完全兼容 Gremlin 查询语言, 具备完善的工具链组件,助力用户轻松构建基于图数据库之上的应用和产品。HugeGraph 支持百亿以上的顶点和边快速导入,并提供毫秒级的关联关系查询能力(OLTP), 并可与 Hadoop、Spark 等大数据平台集成以进行离线分析(OLAP)。
HugeGraph 典型应用场景包括深度关系探索、关联分析、路径搜索、特征抽取、数据聚类、社区检测、 知识图谱等,适用业务领域有如网络安全、电信诈骗、金融风控、广告推荐、社交网络和智能机器人等。
本系统的主要应用场景是解决百度安全事业部所面对的反欺诈、威胁情报、黑产打击等业务的图数据存储和建模分析需求,在此基础上逐步扩展及支持了更多的通用图应用。
主要特性
HugeGraph 支持在线及离线环境下的图操作,支持批量导入数据,支持高效的复杂关联关系分析,并且能够与大数据平台无缝集成。 HugeGraph 支持多用户并行操作,用户可输入 Gremlin 查询语句,并及时得到图查询结果,也可在用户程序中调用 HugeGraph API 进行图分析或查询。
本系统具备如下特点:
- 易用:HugeGraph 支持 Gremlin 图查询语言与 Restful API,同时提供图检索常用接口,具备功能齐全的周边工具,轻松实现基于图的各种查询分析运算。
- 高效:HugeGraph 在图存储和图计算方面做了深度优化,提供多种批量导入工具,轻松完成百亿级数据快速导入,通过优化过的查询达到图检索的毫秒级响应。支持数千用户并发的在线实时操作。
- 通用:HugeGraph 支持 Apache Gremlin 标准图查询语言和 Property Graph 标准图建模方法,支持基于图的 OLTP 和 OLAP 方案。集成 Apache Hadoop 及 Apache Spark 大数据平台。
- 可扩展:支持分布式存储、数据多副本及横向扩容,内置多种后端存储引擎,也可插件式轻松扩展后端存储引擎。
- 开放:HugeGraph 代码开源(Apache 2 License),客户可自主修改定制,选择性回馈开源社区。
本系统的功能包括但不限于:
- 支持从多数据源批量导入数据(包括本地文件、HDFS 文件、MySQL 数据库等数据源),支持多种文件格式导入(包括 TXT、CSV、JSON 等格式)
- 具备可视化操作界面,可用于操作、分析及展示图,降低用户使用门槛
- 优化的图接口:最短路径(Shortest Path)、K 步连通子图(K-neighbor)、K步到达邻接点(K-out)、个性化推荐算法 PersonalRank 等
- 基于 Apache TinkerPop3 框架实现,支持 Gremlin 图查询语言
- 支持属性图,顶点和边均可添加属性,支持丰富的属性类型
- 具备独立的 Schema 元数据信息,拥有强大的图建模能力,方便第三方系统集成
- 支持多顶点 ID 策略:支持主键 ID、支持自动生成 ID、支持用户自定义字符串 ID、支持用户自定义数字 ID
- 可以对边和顶点的属性建立索引,支持精确查询、范围查询、全文检索
- 存储系统采用插件方式,支持 RocksDB、Cassandra、ScyllaDB、HBase、MySQL、PostgreSQL、Palo 以及 InMemory 等
- 与 Hadoop、Spark GraphX 等大数据系统集成,支持 Bulk Load 操作
- 支持高可用 HA、数据多副本、备份恢复、监控等
组件
- HugeGraph-Server: HugeGraph-Server 是 HugeGraph 项目的核心部分,包含 Core、Backend、API 等子模块;
- Core:图引擎实现,向下连接 Backend 模块,向上支持 API 模块;
- Backend:实现将图数据存储到后端,支持的后端包括:Memory、Cassandra、ScyllaDB、RocksDB、HBase 及 MySQL,用户根据实际情况选择一种即可;
- API:内置 REST Server,向用户提供 RESTful API,同时完全兼容 Gremlin 查询。
- HugeGraph-Client:HugeGraph-Client 提供了 RESTful API 的客户端,用于连接 HugeGraph-Server,目前仅实现 Java 版,其他语言用户可自行实现;
- HugeGraph-Loader:HugeGraph-Loader 是基于 HugeGraph-Client 的数据导入工具,将普通文本数据转化为图形的顶点和边并插入图形数据库中;
- HugeGraph-Spark:HugeGraph-Spark 能在图上做并行计算,例如 PageRank 算法等;
- HugeGraph-Studio:HugeGraph-Studio 是 HugeGraph 的 Web 可视化工具,可用于执行 Gremlin 语句及展示图;
- HugeGraph-Tools:HugeGraph-Tools 是 HugeGraph 的部署和管理工具,包括管理图、备份/恢复、 Gremlin 执行等功能。
界面展示
低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
理查德·斯托曼:为了自由,我决定写一个 GNU 操作系统
开源人物志02|理查德·斯托曼:为了自由,我决定写一个 GNU 操作系统 作者:周荔人 本文获公众号「开源青年」授权转载 “打印机事件”以后,理查德斯托曼觉得:软件本该共享。 “如果我喜欢一个程序,我必须与其他喜欢它的人一起共享它。软件销售商想分割用户并统治他们,让每一个用户同意不与其他人共享软件。我拒绝以这样的方法破坏与其他用户的团结。” 他担心如果专有软件成为社会主流,会出现少数强力人物统治计算机工业的局面。 这种局面早在1949年奥威尔的小说《1984》里早有描写。 “BIG BROTHER IS WATCHING YOU” 《1984》是英国左翼作家乔治·奥威尔于1949年出版的长篇政治小说。 在这部作品中奥威尔刻画了一个令人感到窒息的恐怖世界,在假想的未来社会中,独裁者以追逐权力为最终目标,人性被强权彻底扼杀,自由被彻底剥夺,思想受到严酷钳制,人民的生活陷入了极度贫困,下层人民的人生变成了单调乏味的循环。 为了捍卫自由,我决定写一个操作系统 斯托曼可不想让这种事情发生。 但现实中的斯托曼却面临两种抉择:加入一家专有软件公司或者离开这个黑客圈子。 面包与理想。 或者,斯托曼想,...
- 下一篇
微软 Edge 将采用与 Chrome 相同的四周更新计划
从今年 9 月开始,微软 Edge 的更新速度将加快。跟随 Google Chrome 浏览器的脚步,微软 Edge 将采用新的更新时间表,即每四周推出一次更新。 在微软发布的一篇简短的文章中,微软确认将把 Edge 切换到本月早些时候宣布的 Chrome 的新更新时间表上。正如 Google 提到的那样,新的时间表可以更快地推出新功能,也可以更快地进行安全和错误修复。 微软表示,这一变化将随着 Edge 94 版本的发布而生效,根据公开的时间表,Edge 94 版本将在 9 月 1 日发布测试版,9 月 23 日发布稳定版。这与 Google 的目标时间表大致相同,Google Chrome 94 也将是首个以四周为周期更新的版本,而初步的时间表显示,Google 将于 9 月 21 日发布稳定版。微软也将和 Google 一样,以八周为周期向拥有托管环境的客户提供的"扩展稳定版"。 从 Edge 94 稳定版开始,微软 Edge 将转向以四周为周期的发布节奏。然而我们认识到,管理复杂环境的企业客户需要更多的时间来规划和测试 Edge 更新。为了帮助那些需要延长时间来管理更新的企业客...
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- Docker使用Oracle官方镜像安装(12C,18C,19C)
- SpringBoot2整合Redis,开启缓存,提高访问速度
- SpringBoot2全家桶,快速入门学习开发网站教程
- SpringBoot2配置默认Tomcat设置,开启更多高级功能
- Jdk安装(Linux,MacOS,Windows),包含三大操作系统的最全安装
- SpringBoot2初体验,简单认识spring boot2并且搭建基础工程
- CentOS7设置SWAP分区,小内存服务器的救世主
- CentOS8,CentOS7,CentOS6编译安装Redis5.0.7
- CentOS8安装Docker,最新的服务器搭配容器使用
- CentOS7编译安装Cmake3.16.3,解决mysql等软件编译问题