《Wrox.Professional.Hadoop.Solutions》中文目录全稿
前言:最近有朋友给推荐一本书,英文原版《Wrox.Professional.Hadoop.Solutions》,感觉很好打算翻译成中文,共享给朋友,时间关系,不知能否成行,先干着吧。以下部分是本书的目录,算是一个开始,至于何时能够成稿,且干着吧,毕竟最近不是一般的忙。
关于中文名称,英文直译《专业的Hadoop解决方案》,个人更倾向于使用《Hadoop专业解决方案》至于选择哪个最终还没有确定,也想听一听大家的意见。敬请留言。
图书大纲:
中文部分:
chapter1:大数据和Hadoop生态圈
1.2 Hadoop生态圈
1.3 Hadoop核心组件
1.4 Hadoop版本分发
1.5 基于Hadoop开发企业级应用
chapter2:数据存储之Hadoop
2.1 HDFS
2.2 HBase
2.3 HDFS和HBase相结合,进行实际数据存储
2.4 使用Apache Avro
2.5 使用HCatalog管理元数据
2.6 Hadoop数据组织模式设计
chapter3:数据计算之MapReduce
3.1 认识MapReduce
3.2 第一个MapReduce应用
3.3 设计MapReduce实现
3.4 总结
chapter4:自定义MapReduce执行
4.1 通过InputFormat控制MapReduce执行
4.2 使用自定义RecordReaders读取你的数据
4.3 使用OutputFormats组织输出文件
4.4 使用Combiner优化MapReduce执行
4.5 使用Partitioners控制Reducer执行
4.6 使用非Java语言访问Hadoop
4.7 总结
chapter5:构建可重用的MapReduce应用
5.1 MapReduce程序单元测试
5.2 Eclipse本地应用程序测试
5.3 使用日志进行Hadoop测试
5.4 使用Job Counters计数
5.5 MapReduce防御式编程
5.6 总结
chapter6:自动数据处理之Oozie
chapter7:使用Oozie
chapter8:Oozie高级功能
chapter9:实时Hadoop
9.1 现实世界中的实时应用系统
9.2 使用HBase实现实时应用系统
9.3 使用特定的实时Hadoop查询系统
9.4 使用基于Hadoop的事件处理系统
9.5 总结
chapter10:Hadoop安全
10.1 历史回顾:理解Hadoop安全机制的挑战
10.2 身份认证
10.3 权限管理
10.4 Oozie身份认证和权限管理
10.5 网络加密
10.6 使用Rhino增强安全机制
10.7 Hadoop安全最佳实践
10.8 总结
chapter11:在AWS上运行Hadoop应用程序
chapter12:为Hadoop实现构建企业级安全解决方案
chapter13:Hadoop的发展趋势
英文部分:
关于翻译进度部分,敬请关注Hadoop高级培训交流群: 293503507,有最新的进展会第一时间更新群消息。
作者:张子良
出处:http://www.cnblogs.com/hadoopdev
本文版权归作者所有,欢迎转载,但未经作者同意必须保留此段声明,且在文章页面明显位置给出原文连接,否则保留追究法律责任的权利。

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
跟我一起云计算(1)——storm
概述 最近要做一个实时分析的项目,所以需要深入一下storm。 为什么storm 综合下来,有以下几点: 1. 生逢其时 MapReduce 计算模型打开了分布式计算的另一扇大门,极大的降低了实现分布式计算的门槛。有了MapReduce架构的支持,开发者只需要把注意力集中在如何使用 MapReduce的语义来解决具体的业务逻辑,而不用头疼诸如容错,可扩展性,可靠性等一系列硬骨头。一时间,人们拿着MapReduce这把榔头去敲 各种各样的钉子,自然而然的也试图用MapReduce计算模型来解决流处理想要解决的问题。各种失败的尝试之后,人们意识到,改良MapReduce并 不能使之适应于流处理的场景,必须发展出全新的架构来完成这一任务(MapReduce不适合做流处理的原因Yahoo!在其S4的介绍论文里面有比较详 细的阐述,而UCBerkeley的SparkStreaming项目现在正在尝试挑战这一结论,感兴趣的同志请自行查看)。另一方面,人们对传统的 CEP解决方案心存疑虑,认为其非分布式的架构可扩展性不够,无法scaleout来满足海量的数据处理要求。这时候,Yahoo!的S4以及 ...
- 下一篇
Hadoop专业解决方案之构建Hadoop企业级应用
一、大数据的挑战 大数据面对挑战是你必须重新思考构建数据分析应用的方式。传统方式的应用构建是基于数据存储在不支持大数据处理的基础之上。这主要是因为一下原因: 1.传统应用的基础设施是基于传统数据库访问模式设计的,它不支持Hadoop; 2.数据存储在Hadoop之上,实时访问集群中部分数据是可行的; 3.Hadoop大数据存储能力使得你可以存储数据集的多个版本,来挑战传统覆写数据方式。 二、大数据应用系统架构 三、架构说明 1.数据源层:DataSource数据的收集可以基于Flume或者Sqoop进行; 2.数据仓库层:需要区分结构化数据和非结构化数据存储,同时需要考虑过程数据的存储问题; 3.业务层:针对数据处理层OOzie可以做为工作流调度的工具,Map/Reduce任务可以作为任务执行的单元; 4.实时查询:必须加访问限制和条件过滤; 。。。未完待续。。。 《Hadoop专业解决方案》同步更新中,请关注Hadoop高级培训交流群:293503507 作者:张子良 出处:http://www.cnblogs.com/hadoopdev 本文版权归作者所有,欢迎转载,但未经作者同意...
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- Docker安装Oracle12C,快速搭建Oracle学习环境
- Docker使用Oracle官方镜像安装(12C,18C,19C)
- CentOS7安装Docker,走上虚拟化容器引擎之路
- Docker快速安装Oracle11G,搭建oracle11g学习环境
- CentOS7编译安装Cmake3.16.3,解决mysql等软件编译问题
- CentOS7编译安装Gcc9.2.0,解决mysql等软件编译问题
- CentOS8安装Docker,最新的服务器搭配容器使用
- Hadoop3单机部署,实现最简伪集群
- CentOS6,7,8上安装Nginx,支持https2.0的开启
- CentOS8编译安装MySQL8.0.19