2015也过去一半了,Hadoop大事件盘点
2015也快过去一半了,Hadoop在过去一年的发展究竟如何,下面小象带你盘点一下2014Hadoop大事件!
2014年2月,Hadoop 2.3.0发布,新特性包括支持HDFS的混合存储分级,可以集中管理HDFS内存里的缓存数据,通过HDFS中的YARN分布式缓存简化MapReduce分配及一些Bug修正。
2014年4月,Hadoop 2.4.0发布。包括HDFS支持ACL权限控制机制、容易升级、支持支持https访问、支持ResourceManager因故障挂掉重启后,可以恢复之前正在运行的应用程序(用户不需重新提交)、增加了Yarn共享信息存储模块ATS等。
2014年8月,Hadoop 2.5.0发布。新特性包括扩展文件属性、改进 HDFS 的 Web UI,提升 Yarn共享信息存储模块ATS 安全性,更丰富的 YARN REST API 等。
2014年11月,Hadoop 2.6.0发布。增加了基于HadoopKeyProvider API编写的密钥管理服务器Hadoop Key Management Server(KMS)、HDFS实现了一个透明的,端到端的加密方式、长期存在的服务可以在YARN中运行、支持Docker容器中的本机应用程序等。
Hadoop 2 的逐步更新是不是意味着Hadoop已经走向成熟的企业级技术了呢?其实它还有很长的路要走。
SQL-on-Hadoop
如果不能使用SQL语言,Hadoop无疑是在构建下一个数据孤岛,因此SQL-on-Hadoop获得了越来越多的关注。
Apache Hive 0.13发布。Hive是最早的基于Hadoop的SQL引擎。
Apache 基金会宣布Apache Drill升级成为基金会的顶级项目。Drill包含SQL解析器,兼容SQL环境和Hive。
除此之外,还有很多SQL引擎可供选择。
数据库领域初创公司Splice Machine上周宣布,发布SQL-on-Hadoop数据库,官方宣称它可以在HDFS(Hadoop分布式文件系统)中运行SQL查询和ACID事务。
喧嚣与躁动
Hadoop市场从未像今年这样热闹过,商用版Hadoop供应商纷纷抱大腿,很多传统厂商也来分一杯羹。
Cloudera
因特尔放弃了自己研发的Hadoop发行版,转而支持Cloudera,以7.4亿美元收购Cloudera 18%的股份。
红帽和Cloudera联盟,一起开发包括数据集成和应用开发工具,以及数据平台在内的软件解决方案。
Cloudera成立中国分公司,取名“肯睿(上海)软件有限公司”,正式入华。
Hortonworks
惠普投资5000万美元与Hortonworks达成战略性合作关系,二者联手开发Hadoop技术,使其在惠普的Haven大数据平台上运行。
EMC分拆公司Pivotal和Hortonworks合作,联手打造Hadoop标准管理工具Apache Ambari。
Teradata
Teradata收购数据咨询公司Think Big Analytics,借此获得Hadoop业务能力
Teradata与MapR合作,获得MapR软件、专业服务及客户支持服务的经销权,并作为同时使用Teradata及MapR解决方案客户的单点联系方提供服务。
Oracle
Oracle最新推出的SQL扩展方案——Oracle大数据SQL(Big Data SQL)能实现一条SQL查询来从Cloudera Hadoop(CDH)和Oracle NoSQL数据库中调取数据,同时也支持Exadata上运行的Oracle关系型数据库。
应用案例
很多CIO非常关心Hadoop技术发展到什么程度了,还有没有成熟。其实CIO更应该关心的是自己的企业发展到什么程度了,适不适合使用Hadoop。没有完全成熟的技术,只有能否满足业务需求的产品。很多公司都应用了Hadoop技术,来看看今年曝光的应用案例吧!
美国电商eBay每天要处理100PB的数据,其中包括50TB的机器数据。它采用了三层平台战略,其中第三层平台就是Hadoop,eBay部署了两个2万节点的Hadoop集群,能处理80PB的数据。
数字媒体软件供应商Adobe公司运用SAP Data Service将Hadoop数据加载到SAP内存数据库HANA上。
思科首席数据架构师Bhargava带领他的团队从事开发Hadoop的工作,一些Hadoop用户案例已经投入市场,比如集成线下和线上客户信息。虽然现在Hadoop的规模还很小,但在接下来两年里,它会呈指数增长。
摘自:小象学院

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
大数据分析的八大趋势
Intuit数据工程副主管Loconzolo双脚都已经迈进数据湖里了。Smarter Remarketer首席数据科学家DeanAbbott也为云技术的发展指出了捷径。他们二人一致认为, 大数据与分析学前沿是个活动目标,这一领域包含了储存原始数据的数据湖和云计算。尽管这些技术并未成熟,但等待也并非上策。 Loconzolo表示:“现实的情况是,这些工具都刚刚兴起,他们构筑的平台还不足以让企业依赖。但是,大数据和分析学等学科发展十分迅速,因此企业必须努力跟上,否则就有被甩掉的危险。”他还说:“过去,新兴技术往往需要十年左右的时间才能够成熟,但是现在大大不同了,人们几个月甚至几周时间就能想出解决方案。”那么,有哪些新兴技术是我们应该关注,或者说科研人员正在重点研究的呢?《电脑世界》采访了一些IT精英、咨询师和行业分析专家,来看看他们列出的几大趋势吧。 1.云端大数据分析 Hadoop是一组有一定框架结构的工具,用来处理大型数据组。它原本用于机器群,但现在情况有所变化。Forrester Research一位分析师BrianHopkins表示,现在有越来越多的技术可以运用到云端数据处理上来了...
- 下一篇
Hadoop生态上几个技术的关系与区别:hive、pig、hbase 关系与区别
【本文转载自Hadoop生态上几个技术的关系与区别:hive、pig、hbase 关系与区别】 初接触Hadoop技术的朋友肯定会对它体系下寄生的个个开源项目糊涂了,我敢保证Hive,Pig,HBase这些开源技术会把你搞的有些糊涂,不要紧糊涂的不止你一个,如某个菜鸟的帖子的疑问,when to use Hbase and when to use Hive?....请教了^_^没关系这里我帮大家理清每个技术的原理和思路。 Pig 一种操作hadoop的轻量级脚本语言,最初又雅虎公司推出,不过现在正在走下坡路了。当初雅虎自己慢慢退出pig的维护之后将它开源贡献到开源社区由所有爱好者来维护。不过现在还是有些公司在用,不过我认为与其使用pig不如使用hive。:) Pig是一种数据流语言,用来快速轻松的处理巨大的数据。 Pig包含两个部分:Pig Interface,Pig Latin。 Pig可以非常方便的处理HDFS和HBase的数据,和Hive一样,Pig可以非常高效的处理其需要做的,通过直接操作Pig查询可以节省大量的劳动和时间。当你想在你的数据上做一些转换,并且不想编写MapRed...
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- SpringBoot2整合MyBatis,连接MySql数据库做增删改查操作
- Docker安装Oracle12C,快速搭建Oracle学习环境
- SpringBoot2配置默认Tomcat设置,开启更多高级功能
- Red5直播服务器,属于Java语言的直播服务器
- Windows10,CentOS7,CentOS8安装Nodejs环境
- CentOS7,8上快速安装Gitea,搭建Git服务器
- SpringBoot2初体验,简单认识spring boot2并且搭建基础工程
- SpringBoot2全家桶,快速入门学习开发网站教程
- Docker使用Oracle官方镜像安装(12C,18C,19C)
- SpringBoot2整合Redis,开启缓存,提高访问速度