图数据库:释放互联数据的力量
【大咖・来了 第7期】10月24日晚8点观看《智能导购对话机器人实践》
【51CTO.com原创稿件】从Hadoop生态圈崛起开始,大数据已经热了十多年,大数据的存储、分析、处理等技术都已经比较成熟。发掘大数据之间的关联,以及关联后隐藏的商业价值,是大数据的真正意义所在,也是技术上的一大难点。
数据库做为组织、存储和管理数据的仓库,是大数据的基础和关键一环。数据库咨询公司 DB Engines 调研结果显⽰,图数据库正成为所有数据库管理系统中增长最快的⼀类。
图数据库更注重关系
图数据库,对于很多人来说还比较陌生。其实,图数据库是用图来存储数据,是最接近高性能的一种用于存储数据的数据结构方式之一。构成一张图的基本元素是节点(点)和关系(边)。节点和关系都可以设置自己的属性。节点经常被用于表示一些实体,但依赖关系也一样可以表示实体。节点之间的关系是图数据库很重要的一部分。通过关系可以找到很多关联的数据,比如节点集合、关系集合以及他们的属性集合。
举个例子,对于社会网络中人与人之间的关系来说,用关系型数据库存储这种数据的效果并不好,其查询复杂、缓慢、超出预期,而图数据库的独特设计恰恰弥补了这个缺陷。关系是图数据库特有的组成部分,相对于关系数据库中的各种关联表,图数据库可以通过关系包含属性这一功能来提供更为丰富的关系展现方式。
灵活性是推动图数据库流行度激增的关键因素。在过去10几年的时间里,对可用性和大规模的相同需求推动了各种NoSQL产品的开发和采用,从图数据库近期的趋势中看,这种走势将继续走强。
图数据库既然如此强大,但是过去并没有被广泛使用,主要是技术和条件上的限制:缺乏实时数据处理能力;支持的数据规模有限;计算的深度只有2-3层等。
TigerGraph公司,一个中西结合的名字,其创始人兼CEO许昱博士表示,TigerGraph的创始团队有中国背景,Tiger代表着TigerGraph强大的数据处理能力。经过在硅谷5年的开发,TigerGraph首创了业界***的原生、分布式、并行图数据库。日前,许昱接受了51CTO记者的采访,就图数据库进行了深入探讨。
TigerGraph创始人兼CEO许昱(博士)
强大的技术实力
原生,意味着不基于一个关系型数据库的表来存图,也不基于一些Key-Value系统,不把数据打乱存在别的存储系统里。TigerGraph围绕图做了存储、计算引擎、查询语言、可视化工具,所有这些都只是围绕图,而不基于关系型数据库,也不基于文档数据库。
说到并行,并不仅仅是多机分布式。其核心在于,图中的一个节点、一个边都存在属性,都是并行的存储单元。但并行最重要的核心是计算,多核、多CPU、多线程,是并行最核心的要素。
TigerGraph 进入中国市场不久,已经收获了金融、银行、电力等行业的大客户,这得益于TigerGraph强大的技术优势。
首先,在实时计算技术方面,一般的查询涉及到几千万到上亿个节点和边关联,点是实体,边是关系,TigerGraph的实时计算可以每秒每机遍历数亿个顶点/边,步数可达三步或更多,比传统⽅法快多个数量级。
第二,支持数据库的增、删、改、查,是业界正式商用的数据库。每台机器每⼩时可加载 100 到 200 GB 数据的能⼒,不再需要批量加载。
第三是超大规模,在只有20台商⽤计算机的集群上,能够将20亿以上的每日事件实时流式传输到具有超过1000亿个顶点和超过6000亿个边的⼤数据图谱。TigerGraph图数据库已经成功地在世界上多个行业***的公司生产线上运行了多年。
此外,TigerGraph的产品化程度很高,用户只需在TigerGraph网站上下载软件、技术文档,就可以自己去做图模型、数据录入、二次开发等,不需要TigerGraph的人员指导。
组建本地团队:推动市场、推动生态
目前,TigerGraph在中国组建了团队,据TigerGraph中国区总经理乌明捷介绍,中国团队的工作主要有以下三个方面:
1、提高大众对图的接受度和了解度。最初,TigerGraph认为金融行业会是使用图数据库最多的行业,但是经过一年的市场推广发现客户其实来自各个行业。比如物流调度IoT,需要用图来解决路径规划的问题。中国的大数据市场比较活跃,企业也愿意尝试新技术,所以TigerGraph希望推动这个市场。
2、推动合伙伙伴生态的建设。TigerGraph不卖数据,不做具体的应用,对合作伙伴持有开放的态度,中国团队的组建将有利于推动整个生态的发展。
3、快速响应客户需求。当中国客户有需求的时候,通过目前在国内的技术和咨询团队,可以进行快速响应。
简而言之,推动市场、推动生态,帮助行业标杆企业,在中国投入更多的资源去加强和客户的直接对话,是目前TigerGraph进入中国市场的主要工作。
从客户的痛点入手
当今,很多企业往往使用若干个不同的数据库,来解决不同部门的问题。TigerGraph进入客户是一个顺势而为的过程,先解决别的数据库工具不能解决的问题,和其他关系型数据库结合在一起,构成一个成熟的、有效的分析环境。
TigerGraph凭借强大的图数据库,为企业提供实时分析应用程序,在反欺诈和反洗钱、消费者智能、智能供应链、智能电网等应用中都有着出色的表现。
【51CTO原创稿件,合作站点转载请注明原文作者和出处为51CTO.com】
低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
【大数据分析】纷繁复杂的数据越多越好
【大咖・来了 第7期】10月24日晚8点观看《智能导购对话机器人实践》 传统的样本分析师们都很难容忍错误数据的存在,因为他们一生都在研究如何防止和避免错误的出现。 在收集样本的时候,统计学家会用一整套的策略来减少错误发生的概率。 在结果公布之前,他们也会测试样本是否存在潜在的系统性偏差。这些策略包括根据协议或通过受过专门训练的专家来采集样本。但是,即使只是少量的数据,这些规避错误的策略实施起来还是耗费巨大。 尤其是当我们收集所有数据的时候,这就行不通了。不仅是因为耗费巨大,还因为在大规模的基础上保持数据收集标准的一致性不太现实。就算是不让人们进行沟通争吵,也不能解决这个问题。 大数据时代要求我们重新审视精确性的优势。如果将传统的思维模式运用于数字化、网络化的21世纪,就会错过重要的信息。 执迷于精确性是信息缺乏时代和模拟时代的产物。在那个信息贫乏的时代,任意一个数据点的测量情况都对结果至关重要。所以,我们需要确保每个数据的精确性,才不会导致分析结果的偏差。 如今,我们已生活在信息时代,我们掌握的数据库越来越全面,它不再只包括我们手头现象的一点点可怜的数据,而是包括了与这些现象相关的大量...
- 下一篇
如何进阶成为一名数据科学家?
【大咖・来了 第7期】10月24日晚8点观看《智能导购对话机器人实践》 数据科学家-21世纪最性感的工作-可以说是每个数据分析师的最终目标,既然拿到的Stack Overflow调查问卷中含有数据分析师和数据科学家的数据,那本次报告的任务就是横向对比一下数据分析师与数据科学家,让大家对自己的未来的技能树选择能有多一点的数据支持。 假设问题 目前处在或者即将处在数据分析师职位的朋友应该打磨自己的哪项技能? 数据分析师为自己未来的数据科学家之路应该如何扩充自己的技能树? 问题解析 本次报告尝试横向对比数据分析师与数据科学家,将在两个职业的比较中回答假设问题,这样做的好处是使两种职业更饱满的展现在读者面前,因为问题的针对性比较强,对比的过程中也可以很清晰的解答问题,所以本次报告以这样的形式展现出来 数据分析师与数据科学家 人物画像 上图中的语言与学历均以占比从高到低排列 薪资 首先拿到这个数据,自然要从大家最关心的工资说起: 首先可以看出来,两个职业在接触编程人员中都有中等的工资水平,数据科学家更是挤进了前十,总的来说是相当不错的薪资水平了 更细致的来看数据分析师与数据科学家的工资情况,科学...
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- Springboot2将连接池hikari替换为druid,体验最强大的数据库连接池
- SpringBoot2配置默认Tomcat设置,开启更多高级功能
- Docker使用Oracle官方镜像安装(12C,18C,19C)
- CentOS7安装Docker,走上虚拟化容器引擎之路
- CentOS6,CentOS7官方镜像安装Oracle11G
- CentOS8编译安装MySQL8.0.19
- Windows10,CentOS7,CentOS8安装Nodejs环境
- CentOS7编译安装Cmake3.16.3,解决mysql等软件编译问题
- SpringBoot2整合MyBatis,连接MySql数据库做增删改查操作
- SpringBoot2整合Thymeleaf,官方推荐html解决方案