[白皮书翻译]Apache Hadoop的MapR发行版
说明: 本博文是人民邮电出版社《大数据分析:点“数”成金》的附录1部分,该书尚未刊发(计划于2013年6月末)。未经授权请勿直接使用,转载请注明出处,谢谢。 白皮书 业内最可靠的 Hadoop 平台 ApacheHadoop 的 MapR 发行版 ——简单、可靠、快速的 Hadoop 内容目录 概述 战略性的Hadoop 完整、先进、拥有强力支持的Hadoop发行版 易用的Hadoop 从批处理转向实时数据流 内建数据压缩机制 多集群支持 筹划、搭建和管理集群 MapR的卷 轻松的规模化管理 可靠的Hadoop 避免作业丢失 用于大规模并具有高可用性的分布式管理节点 Hadoop高可用性及直接挂载NFS 使用快照方便地恢复数据 镜像 更快的Hadoop 高性能架构 性能特色 性能测试 结论 概述 现在每天都有2百万人使用着互联网,每一次通话、每一条推特、每一封电子邮件、每一个下载或每一回购物都产生出有价值的信息。企业越来越依赖于使用Hadoop从迅猛增长的数据中发掘潜藏的价值,促进企业利润的增长。仅仅Orbitz这家旅游网站每月就有460万人次的访问量,社交网站Facebook的用户数...