从2015硅谷Strata大会看：数据库的发展现状与前景-低调大师

从2015硅谷Strata大会看：数据库的发展现状与前景

2017-06-01 508

Strata+Hadoop World（SHW）大会是全世界最大的大数据大会之一。

SHW大会为各种技术提供了深度交流的机会，还会看到最领先的大数据技术、最广泛的应用场景、最有趣的用例教学以及最全面的大数据行业和趋势探讨。

https://yqfile.alicdn.com/ed52f5c03989d443cd07c419add8a2409f578ec6.png" >

SequoiaDB 作为现场的参展商之一，也是中国唯一一家参展的厂商，我们也在展会中着重了解了跟我们的产品息息相关的部分，也就是新型数据库。大会现场不仅有多家参加演讲和展示的数据库厂商，更有许多的数据库资深研发人员和架构师来到现场。为此，我们也总结了一些有关数据库的资讯和未来数据库领域发展的预测。

12b910c7b8d3ce7937d85ef68327e7a65affa96d

新型数据库的不断壮大

众所周知，关系型数据库已经出现了近40年，并且在很长一段时间里一直是数据库领域当之无愧的王者。如今，新型数据库，包括NoSQL以及NewSQL两种主要类型，这位后起之秀正在进入越来越多的应用领域。

新型数据库厂商的参加也是本届SHW大会亮点之一，其中有NoSQL界的佼佼者，如Couchbase、Aerospike、Marklogic和SequoiaDB等，也有NewSQL的许多厂商，如：MemSQL、VoltDB、ScaleDB和CitusDB等等。这些企业在现场和Cloudera、Hortonworks这些大数据领头羊一样，得到了广泛的关注。

随着“大数据时代”的到来，在高并发、大数据量、分布式以及实时性的要求之下，传统的关系型数据库，因为其数据模型以及预定义的操作模式，在很多情况下不能很好的满足以上的需求,所以新型数据库如今在大数据的场景下，取代了传统关系型数据库成为主导。相信未来随着大数据的发展，新型数据库将会颠覆数据库领域。

正如MemSQL的CTO Eric Frenkiel在主题演讲中说道：“We need a new kind of database to do things we have never done before!”

SQL与Hadoop的集成遇到了挑战

值得注意的是，除了NoSQL等新型数据库技术以外，传统的数据库厂商也在寻求能让关系型数据库完美对接Hadoop等大数据架构的方法，但是仍然没有找到能很好解决的方法。

展会上，IBM的工程师们分享了他们在SQL与Hadoop的结合上进行的尝试。其中提到，SQL和Hadoop的对接主要的难点之一是SQL语句如何在Hadoop上执行，因为Hadoop的文件系统HDFS的设计并不能有效的运行SQL。IBM则正在探究如何更好的解决这一个SQL和Hadoop对接的核心问题。大会上IBM分享的就是基于IBM的BigInsight的BigSQL实现的SQL与Hadoop对接。

同样作为传统RDBMS领头羊的Oracle也在大会上发布了最新版的Oracle BigDataSQL以及Oracle NoSQL等等大数据产品。

这些RDBMS先驱们的这些举动也从侧面说明了，新型的数据库的出现不仅很有必要，而且完全有能力替代很大一部分关系型数据库的应用场景。

大数据架构加强对NoSQL的支持

NoSQL在数据库领域的影响力日渐壮大，领头羊MongoDB，Cassandra和Redis已经在DB-Engine的数据库排名上进入了前十。所以许多的大数据架构、平台也都在越来越强化对于NoSQL数据库的支持。

Cloudera的CTO, Amr Awadallah 在他的演讲中介绍了未来Hadoop的发展规划，其中很重要的一点就是加强对NoSQL数据库的支持：“We will improve the integration with NoSQL database to make Hadoop more versatile.”

无独有偶，在另外一场主题演讲中，Databricks的CTO Matei Zaharia，也介绍了Spark 在2015年的新的发展方向，包括新增机器学习的流水线功能，R语言的集成，当然也包括了更好的支持NoSQL数据库。

可以看到，NoSQL数据库在大数据生态系统中的作用和地位正在不断的提升，相信在大数据渐渐普及的将来，NoSQL甚至有希望取代关系型成为数据库的先锋。

总结：

数据库作为底层的数据存储和管理工具，是大数据生态系统中不可或缺的一环。传统的关系型数据库已经存在了几十年，虽然有其适合的场景，但是对于大数据的应用下，存在较多的局限性。新型的数据库是本届SHW大会的焦点话题之一。高性能、高可用、灵活的数据结构等等主要特性，都让他成为大数据存储分析的不二之选。所以我也希望大家能更多的关注新型数据库的发展。

https://yqfile.alicdn.com/cc04e64694525175935cbe7f061bbb54ed6fa81c.png" >

文章转载自开源中国社区 [ http://www.oschina.net]

微信关注我们

原文链接：https://yq.aliyun.com/articles/110548

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

揭秘即将亮相 HadoopCon 2016 的大数据新星

根据IDC研究显示，大数据解决方案将在未来四年中，帮助全球企业分享大约1.6万亿美元新增收入的数据红利。在大数据产业发展中，以Hadoop为代表的开源大数据生态成为大数据和云计算的重要技术支撑，有效推动了开源社区的用户和贡献者，带动了技术进步与商业发展。开源大数据生态快速发展，Hadoop已经不是一个大数据软件，而成为大数据平台，Hadoop的生态圈日益壮大。其中，Apache Kylin是一个开源的分布式分析引擎，提供Hadoop之上的SQL查询接口及多维分析(OLAP)能力以支持超大规模数据。 Apache Kylin是首个完全由中国团队设计开发，并贡献到Apache软件基金会(ASF)的顶级项目，开源一年左右的时间，已经在国际国内多个公司被采用作为大数据分析平台的关键组成部分，包括eBay、Expedia、Exponential、百度、京东、美团、联想、网易、中国移动、唯品会等。而Kyligence是一家专注于大数据分析领域创新的数据科技公司，致力于为用户提供基于Apache Kylin的下一代企业级数据仓库及商务智能大数据分析平台和解决方案，使用户能够在超大规模数据集上获得...

2017-06-01

589

Spark简介整体认识 Apache Spark是一个围绕速度、易用性和复杂分析构建的大数据处理框架。最初在2009年由加州大学伯克利分校的AMPLab开发，并于2010年成为Apache的开源项目之一。 Spark在整个大数据系统中处于中间偏上层的地位，如下图，对hadoop起到了补充作用：基本概念 Fork/Join框架是Java7提供了的一个用于并行执行任务的框架，是一个把大任务分割成若干个小任务，最终汇总每个小任务结果后得到大任务结果的框架。第一步分割任务。首先我们需要有一个fork类来把大任务分割成子任务，有可能子任务还是很大，所以还需要不停的分割，直到分割出的子任务足够小。第二步执行任务并合并结果。分割的子任务分别放在双端队列里，然后几个启动线程分别从双端队列里获取任务执行。子任务执行完的结果都统一放在一个队列里，启动一个线程从队列里拿数据，然后合并这些数据。具体可参考Fork/Join 核心概念 RDD(Resilient Distributed Dataset) 弹性分布数据集介绍弹性分布式数据集（基于Matei的研究论文）或RDD是Spark框架中的核心...

2017-06-01

668

资源下载

更多资源

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长，特征是大鼻子、头戴帽子、身穿背带裤，还留着胡子。与他的双胞胎兄弟路易基一起，长年担任任天堂的招牌角色。

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题，腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构，目前腾讯云软件源站支持公网访问和内网访问。

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称，一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集，帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Spring

Spring框架（Spring Framework）是由Rod Johnson于2002年提出的开源Java企业级应用框架，旨在通过使用JavaBean替代传统EJB实现方式降低企业级编程开发的复杂性。该框架基于简单性、可测试性和松耦合性设计理念，提供核心容器、应用上下文、数据访问集成等模块，支持整合Hibernate、Struts等第三方框架，其适用范围不仅限于服务器端开发，绝大多数Java应用均可从中受益。