Hadoop大数据挖掘从入门到进阶实战

2018-06-21 628

1.概述

　　大数据时代，数据的存储与挖掘至关重要。企业在追求高可用性、高扩展性及高容错性的大数据处理平台的同时还希望能够降低成本，而Hadoop为实现这些需求提供了解决方案。面对Hadoop的普及和学习热潮，笔者愿意分享自己多年的开发经验，带领读者比较轻松地掌握Hadoop数据挖掘的相关知识。这边是笔者编写本书的原因。本书使用通俗易懂的语言进行讲解，从基础部署到集群管理，再到底层设计等内容均由涉及。通过阅读本书，读者可以较为轻松地掌握Hadoop大数据挖掘与分析的相关技术。

　　本书目前已在网上商城上架，可以通过京东自营，当当自营，亚马逊自营等网上商城进行购买。书籍封面如下：

2.本书内容

　　本书采用“理论+实战”的形式编写，通过大量的实例，结合作者多年一线开发实战经验，全面的介绍了Hadoop的使用方法。全书设计秉承方便学习、易于理解、便于查询的理念，无论是刚入门的初学者系统的学习Hadoop的基础知识，还是拥有多年开发经验的开发者想学习Hadoop，都能通过本书迅速掌握Hadoop的各种基础语法和实战技巧。本书作者曾经与极客学院合作，拥有丰富的教学视频制作经验，为读者精心录制了详细的视频介绍。本书还免费提供所有案例的源码，为读者的学习和工作提供更多的便利。

本书分为13章，分别介绍Hadoop平台管理与维护、异常处理解决方案以及Hadoop的分布式文件系统等内容。最后一章对Hadoop进行了拓展，剖析了Kafka消息系统并介绍了笔者的开源监控系统Kafka Eagle。

本书结构清晰、案例丰富、通俗易懂、实用性强。特别适合初学者自学和进阶读者查询及参考。另外，本书也适合社会培训学校作为培训教材使用，还适合大中专院校的相关专业作为教学参考书。

3.本书特色

3.1 提供专业的配套教学视频，高效、直观

　　笔者曾接受过极客学院的专业视频制作指导，并在极客学院录制过多期Hadoop和Kafka实战教学视频课程，得到了众多学习者的青睐及好评。为了便于读者更加高效、直观地学习本书内容，笔者特意为本书实战部分的内容录制了配套教学视频，读者可以在教学视频的辅助下学习，从而更加轻松地掌握Hadoop。

3.2 来自一线的开发经验及实战例子

　　本书给出的代码讲解和实例大多数来自于笔者多年的教学积累和技术分享，几乎都是得到了学习者一致好评的干活。另外，笔者还是一名开源爱好者，编写了业内著名的Kafka Eagle监控系统。本书第13章介绍了该系统的使用，以帮助读者掌握如何监控大数据集群的相关知识。

3.3 浅显易懂的语言、触类旁通的对比、循序渐进的知识体系

　　本书在文字及目录编排上，尽量做到通俗易懂。在讲解一些常见的知识点时，将Hadoop命令与Linux命令做对比，掌握Linux命令的开发者能够迅速掌握Hadoop的操作命令。无论是初学者，还是久经沙场的老程序员都能快速通过本书学习Hadoop的精华之处。

3.4 内容全面，实用性强

　　本书精心挑选了多个实用性很强的例子，例如：Hadoop套件实战、Hive 编程、Hadoop平台管理与维护、ELK实战、Kafka实战等。读者既可以从例子中学习并理解Hadoop及其套件知识点，还可以将这些例子用于开发中。

4. 示例代码

　　本书的所有示例都封装在该项目中，读者可以下载该工程的源代码来对照书中的内容进行学习。由于本工程采用的是Maven来进行管理，所以在需要编译打包时，可以直接只用mvn命令，或者执行./build.sh脚本来实现打包。

5. 书籍目录部分预览

6. 读者对象

　　学习Hadoop没有想象中的那么困难，本书通过将一些Hadoop难懂的知识点，通过通俗易懂的语言进行概述，来减少读者的学习成本，让读者轻轻松松地掌握Hadoop的相关知识。适用范围但不仅仅包含以下：

Hadoop初学者
Hadoop进阶人员
后端程序初学者
前端转后端的开发人员
熟悉Linux操作系统以及有编程语言基础的
学习Hadoop的编程爱好者

7. 总结

　　最后，衷心希望笔者编写的这本书能够帮助到对Hadoop感兴趣、学习Hadoop的同学。希望阅读过本书的同学能够掌握Hadoop相关知识，希望笔者书中的经验和总结能够帮助读者少走弯路，在Hadoop学习之路上游刃有余。

8.结束语

　　感兴趣的同学可以购买本书，如果在学习本书的内容中遇到任何疑问，可以通过下面的联系方式进行邮件留言或者加入Hadoop学习讨论群，笔者会尽我所能，帮您解答，与君共勉！

联系方式：
邮箱：smartloli.org@gmail.com
Twitter： https://twitter.com/smartloli
QQ群（Hadoop - 交流社区1）： 424769183
温馨提示：请大家加群的时候写上加群理由（姓名＋公司/学校），方便管理员审核，谢谢！

热爱生活，享受编程，与君共勉！

作者：哥不是小萝莉［关于我］［犒赏］

出处：http://www.cnblogs.com/smartloli/

转载请注明出处，谢谢合作！

微信关注我们

原文链接：https://yq.aliyun.com/articles/644142

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

重磅！MaxCompute助力阿里开源自研语音识别模型DFSMN，准确率高达96.04%

阿里开源语音识别模型DFSMN 在近期举行的云栖大会武汉峰会上，装有DFSMN语音识别模型的“AI收银员”在与真人店员的PK中，在嘈杂环境下准确识别了用户的语音点单，在短短49秒内点了34杯咖啡。此外，装备这一语音识别技术的自动售票机也已在上海地铁“上岗”。著名语音识别专家，西北工业大学教授谢磊表示：“阿里此次开源的DFSMN模型，在语音识别准确率上的稳定提升是突破性的，是近年来深度学习在语音识别领域最具代表性的成果之一，对全球学术界和AI技术应用都有巨大影响。” 图：阿里在GitHub平台上开源了自主研发的DFSMN语音识别模型语音识别声学模型语音识别技术一直都是人机交互技术的重要组成部分。有了语音识别技术，机器就可以像人类一样听懂说话，进而能够思考、理解和反馈。近几年随着深度学习技术的使用，基于深度神经网络的语音识别系统性能获得了

2018-06-21

681

1 YARN 产生背景 2 YARN 架构 3 YARN 执行流程 1.client向yarn提交job，首先找ResourceManager分配资源， 2.ResourceManager开启一个Container,在Container中运行一个Application manager 3.Application manager找一台nodemanager启动Application master，计算任务所需的计算 4.Application master向Application manager（Yarn）申请运行任务所需的资源 5.Resource scheduler将资源封装发给Application master 6.Application master将获取到的资源分配给各个nodemanager 7.各个nodemanager得到任务和资源开始执行map task 8.map task执行结束后，开始执行reduce task 9.map task和 reduce task将执行结果反馈给Application master 10.Application master将任务执行...

2018-06-22

667

资源下载

更多资源

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长，特征是大鼻子、头戴帽子、身穿背带裤，还留着胡子。与他的双胞胎兄弟路易基一起，长年担任任天堂的招牌角色。

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称，一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集，帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Spring

Spring框架（Spring Framework）是由Rod Johnson于2002年提出的开源Java企业级应用框架，旨在通过使用JavaBean替代传统EJB实现方式降低企业级编程开发的复杂性。该框架基于简单性、可测试性和松耦合性设计理念，提供核心容器、应用上下文、数据访问集成等模块，支持整合Hibernate、Struts等第三方框架，其适用范围不仅限于服务器端开发，绝大多数Java应用均可从中受益。

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能，例如代码缩略图，Python的插件，代码段等。还可自定义键绑定，菜单和工具栏。Sublime Text 的主要功能包括：拼写检查，书签，完整的 Python API ， Goto 功能，即时项目切换，多选择，多窗口等等。Sublime Text 是一个跨平台的编辑器，同时支持Windows、Linux、Mac OS X等操作系统。

Hadoop大数据挖掘从入门到进阶实战

1.概述

2.本书内容