发布Apache Hadoop 2.6.0——异构存储，长时间运行的服务与滚动升级支持

2014-12-07 836

发布Apache Hadoop 2.6.0
——异构存储，长时间运行的服务与滚动升级支持

我很高兴地宣布，在Apache的Hadoop社区已经发布的Apache Hadoop的2.6.0:http://markmail.org/message/gv75qf3orlimn6kt！

特别是，我们很高兴在此版本中相关的三个主要片：异构存储在HDFS使用SSD和内存层，支持长时间运行在YARN服务和滚动升级，将升级您的集群软件，然后重新启动升级的节点而无需关闭群集或丢失正在进行的工作。YARN作为其架构中心，Hadoop的不断吸引新的引擎在数据平台中运行，作为组织想要在一个单一的存储库高效地存储数据，并与它同时以不同的方式进行交互。

非常感谢所有的贡献者和提交这些人所合作过这个版本，共有近900个 JIRA问题在四个方面解决的：
•Hadoop通用：231个 JIRA问题解决
•Hadoop的HDFS：305个 JIRA问题解决
•Hadoop的YARN：290个 JIRA问题解决
•Hadoop的MapReduce的：70个 JIRA问题解决

Apache Hadoop2.6.0的亮点

以下是有关的最重要的特征的一些细节。对于功能，改进和bug修复的完整列表，请参阅发行说明：http://hadoop.apache.org/docs/r2.6.0/hadoop-project-dist/hadoop-common/releasenotes.html。

加强支持异构存储层的HDFS

管理员可以在一个限定的Datanode跨磁盘存储层，以及应用程序可利用的API将数据存储到这些不同的存储层。这意味着管理员可以优化他们的应用程序通过使用Hadoop运行：
•在SSD存储层以提高读/写延迟
•内存存储层进行快速读/写要么临时数据或故障的应用程序（如星火，TEZ等）
•归档存储层，以提高存储效率。

支持长时间运行的服务在YARN

Apache Hadoop2.6.0包括增强了核心Apache Hadoop YARN平台，使长期存在的服务（如Apache Storm，Apache Samza，Apache Kafka或Apache HBase），可以在YARN中运行，并充分利用其优势的容错，安全性和易维护性。

Apache Hadoop最初架构，支持批量处理数据。但有些应用“永远在线”，随时准备处理输入数据。例如，Apache Storm必须准备在一天中的任何时间实时处理数据流，在一年中的任何一天。

用Hadoop2.6.0，集群现在可以利用相同的基础设施安排，执行和管理所有期限的多个工作负载。长住服务，如 Storm和HBase可以和平共处的一起是在特定的时间点（如Apache Hive或Apache Pig），用于特设工作应用程序。

滚动升级在YARN工作，保留重新启动

新的工作，维护重启功能可以让应用程序保持其完成和正在进行的国家，在一个节点故障或重启的脸。 YARN现在可以提供滚动以最小的服务质量下降用于运行应用程序的升级支持。已完成或正在进行中的应用工作节点重启过程中保持不变，进度回升，而不必从头开始重新启动所有任务。

展望Apache Hadoop2.7版本

为ApacheHadoop的下一个版本的主要驱动力正在向JDK7+即我们现在要求使用JDK7（HADOOP-10530：https://issues.apache.org/jira/browse/HADOOP-10530）的ApacheHadoop的前进，也支持JDK8作为一个运行时（HADOOP-11090：https://issues.apache.org/jira/browse/HADOOP-11090）。

在ApacheHadoop社区开展的其他重要活动有：
•在HDFS进行纠删码支持 - HDFS-7285：https://issues.apache.org/jira/browse/HDFS-7285
•支持磁盘YARN调度和隔离的资源 - YARN-2139：https://issues.apache.org/jira/browse/YARN-2139
•容器资源委派延长YARN资源管理 - YARN-1488：https://issues.apache.org/jira/browse/YARN-1488

与往常一样，你可以沿着发展，通过跟踪路线图的Wiki：http://wiki.apache.org/hadoop/Roadmap 的Apache Hadoop跟随。

致谢

非常感谢大家谁促成了这一版本，和整个Apache Hadoop社区。

相关链接
•下载Apache Hadoop2.6.0版本：http://hadoop.apache.org/releases.html#18+November%2C+2014%3A+Release+2.6.0+available。
•阅读发行说明的Hadoop-2.6.0：http://hadoop.apache.org/docs/r2.6.0/hadoop-project-dist/hadoop-common/releasenotes.html。

本文翻译自：http://zh.hortonworks.com/blog/announcing-apache-hadoop-2-6-0/

微信关注我们

原文链接：https://yq.aliyun.com/articles/249703

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

Hbase万亿级存储性能优化总结

背景 hbase主集群在生产环境已稳定运行有1年半时间，最大的单表region数已达7200多个，每天新增入库量就有百亿条，对hbase的认识经历了懵懂到熟的过程。为了应对业务数据的压力，hbase入库也由最初的单机多线程升级为有容灾机制的分布式入库，为及早发现集群中的问题，还开发了一套对hbase集群服务和应用全面监控的报警系统。总结下hbase优化(针对0.94版本)方面的一些经验也算对这两年hbase工作的一个描述。服务端 1.hbase.regionserver.handler.count：rpc请求的线程数量，默认值是10，生产环境建议使用100，也不是越大越好，特别是当请求内容很大的时候，比如scan/put几M的数据，会占用过多的内存，有可能导致频繁的GC，甚至出现内存溢出。 2.hbase.master.distributed.log.splitting：默认值为true，建议设为false。关闭hbase的分布式日志切割，在log需要replay时，由master来负责重放 3.hbase.regionserver.hlog.splitlog.writer.t...

2014-12-06

688

Hadoop大象之旅009-通过Shell操作hdfs 老帅调用Hadoop分布式文件系统(HDFS)Shell命令应使用bin/hadoop fs <args>的形式。 1.查看hdfs都有哪些Shell命令参照前面章节中所述方法，使用SecureCRTPortable.exe登录CentOS; 使用命令“hadoopfs”查看hdfs的命令列表，如下图所示： hdfs的所有命令的格式，都为：hadoop fs –xx，具体使用方法，可参考官方文档： http://hadoop.apache.org/docs/r1.0.4/cn/hdfs_shell.html 全部命令清单如下 cat 使用方法：hadoop fs -cat URI [URI …] 将路径指定文件的内容输出到stdout。示例： · hadoop fs -cat hdfs://host1:port1/file1 hdfs://host2:port2/file2 · hadoop fs -cat file:///file3 /user/hadoop/file4 返回值：成功返回0，失败返回-1。 ...

2014-12-08

870

资源下载

更多资源

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长，特征是大鼻子、头戴帽子、身穿背带裤，还留着胡子。与他的双胞胎兄弟路易基一起，长年担任任天堂的招牌角色。

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题，腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构，目前腾讯云软件源站支持公网访问和内网访问。

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能，例如代码缩略图，Python的插件，代码段等。还可自定义键绑定，菜单和工具栏。Sublime Text 的主要功能包括：拼写检查，书签，完整的 Python API ， Goto 功能，即时项目切换，多选择，多窗口等等。Sublime Text 是一个跨平台的编辑器，同时支持Windows、Linux、Mac OS X等操作系统。

WebStorm

WebStorm 是jetbrains公司旗下一款JavaScript 开发工具。目前已经被广大中国JS开发者誉为“Web前端开发神器”、“最强大的HTML5编辑器”、“最智能的JavaScript IDE”等。与IntelliJ IDEA同源，继承了IntelliJ IDEA强大的JS部分的功能。