Hadoop大数据挖掘从入门到进阶实战
1.概述
大数据时代,数据的存储与挖掘至关重要。企业在追求高可用性、高扩展性及高容错性的大数据处理平台的同时还希望能够降低成本,而Hadoop为实现这些需求提供了解决方案。面对Hadoop的普及和学习热潮,笔者愿意分享自己多年的开发经验,带领读者比较轻松地掌握Hadoop数据挖掘的相关知识。这边是笔者编写本书的原因。本书使用通俗易懂的语言进行讲解,从基础部署到集群管理,再到底层设计等内容均由涉及。通过阅读本书,读者可以较为轻松地掌握Hadoop大数据挖掘与分析的相关技术。
本书目前已在网上商城上架,可以通过京东自营,当当自营,亚马逊自营等网上商城进行购买。书籍封面如下:
2.本书内容
本书采用“理论+实战”的形式编写,通过大量的实例,结合作者多年一线开发实战经验,全面的介绍了Hadoop的使用方法。全书设计秉承方便学习、易于理解、便于查询的理念,无论是刚入门的初学者系统的学习Hadoop的基础知识,还是拥有多年开发经验的开发者想学习Hadoop,都能通过本书迅速掌握Hadoop的各种基础语法和实战技巧。本书作者曾经与极客学院合作,拥有丰富的教学视频制作经验,为读者精心录制了详细的视频介绍。本书还免费提供所有案例的源码,为读者的学习和工作提供更多的便利。
本书分为13章,分别介绍Hadoop平台管理与维护、异常处理解决方案以及Hadoop的分布式文件系统等内容。最后一章对Hadoop进行了拓展,剖析了Kafka消息系统并介绍了笔者的开源监控系统Kafka Eagle。
本书结构清晰、案例丰富、通俗易懂、实用性强。特别适合初学者自学和进阶读者查询及参考。另外,本书也适合社会培训学校作为培训教材使用,还适合大中专院校的相关专业作为教学参考书。
3.本书特色
3.1 提供专业的配套教学视频,高效、直观
笔者曾接受过极客学院的专业视频制作指导,并在极客学院录制过多期Hadoop和Kafka实战教学视频课程,得到了众多学习者的青睐及好评。为了便于读者更加高效、直观地学习本书内容,笔者特意为本书实战部分的内容录制了配套教学视频,读者可以在教学视频的辅助下学习,从而更加轻松地掌握Hadoop。
3.2 来自一线的开发经验及实战例子
本书给出的代码讲解和实例大多数来自于笔者多年的教学积累和技术分享,几乎都是得到了学习者一致好评的干活。另外,笔者还是一名开源爱好者,编写了业内著名的Kafka Eagle监控系统。本书第13章介绍了该系统的使用,以帮助读者掌握如何监控大数据集群的相关知识。
3.3 浅显易懂的语言、触类旁通的对比、循序渐进的知识体系
本书在文字及目录编排上,尽量做到通俗易懂。在讲解一些常见的知识点时,将Hadoop命令与Linux命令做对比,掌握Linux命令的开发者能够迅速掌握Hadoop的操作命令。无论是初学者,还是久经沙场的老程序员都能快速通过本书学习Hadoop的精华之处。
3.4 内容全面,实用性强
本书精心挑选了多个实用性很强的例子,例如:Hadoop套件实战、Hive 编程、Hadoop平台管理与维护、ELK实战、Kafka实战等。读者既可以从例子中学习并理解Hadoop及其套件知识点,还可以将这些例子用于开发中。
4. 示例代码
本书的所有示例都封装在该项目中,读者可以下载该工程的源代码来对照书中的内容进行学习。由于本工程采用的是Maven来进行管理,所以在需要编译打包时,可以直接只用mvn命令,或者执行./build.sh脚本来实现打包。
5. 书籍目录部分预览
6. 读者对象
学习Hadoop没有想象中的那么困难,本书通过将一些Hadoop难懂的知识点,通过通俗易懂的语言进行概述,来减少读者的学习成本,让读者轻轻松松地掌握Hadoop的相关知识。适用范围但不仅仅包含以下:
- Hadoop初学者
- Hadoop进阶人员
- 后端程序初学者
- 前端转后端的开发人员
- 熟悉Linux操作系统以及有编程语言基础的
- 学习Hadoop的编程爱好者
7. 总结
最后,衷心希望笔者编写的这本书能够帮助到对Hadoop感兴趣、学习Hadoop的同学。希望阅读过本书的同学能够掌握Hadoop相关知识,希望笔者书中的经验和总结能够帮助读者少走弯路,在Hadoop学习之路上游刃有余。
8.结束语
感兴趣的同学可以购买本书,如果在学习本书的内容中遇到任何疑问,可以通过下面的联系方式进行邮件留言或者加入Hadoop学习讨论群,笔者会尽我所能,帮您解答,与君共勉!
邮箱:smartloli.org@gmail.com
Twitter: https://twitter.com/smartloli
QQ群(Hadoop - 交流社区1): 424769183
温馨提示:请大家加群的时候写上加群理由(姓名+公司/学校),方便管理员审核,谢谢!
热爱生活,享受编程,与君共勉!
低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
重磅!MaxCompute助力阿里开源自研语音识别模型DFSMN,准确率高达96.04%
阿里开源语音识别模型DFSMN 在近期举行的云栖大会武汉峰会上,装有DFSMN语音识别模型的“AI收银员”在与真人店员的PK中,在嘈杂环境下准确识别了用户的语音点单,在短短49秒内点了34杯咖啡。此外,装备这一语音识别技术的自动售票机也已在上海地铁“上岗”。 著名语音识别专家,西北工业大学教授谢磊表示:“阿里此次开源的DFSMN模型,在语音识别准确率上的稳定提升是突破性的,是近年来深度学习在语音识别领域最具代表性的成果之一,对全球学术界和AI技术应用都有巨大影响。” 图:阿里在GitHub平台上开源了自主研发的DFSMN语音识别模型 语音识别声学模型 语音识别技术一直都是人机交互技术的重要组成部分。有了语音识别技术,机器就可以像人类一样听懂说话,进而能够思考、理解和反馈。 近几年随着深度学习技术的使用,基于深度神经网络的语音识别系统性能获得了
- 下一篇
史上最快! 10小时大数据入门实战(四)-分布式资源调度YARN
1 YARN 产生背景 2 YARN 架构 3 YARN 执行流程 1.client向yarn提交job,首先找ResourceManager分配资源, 2.ResourceManager开启一个Container,在Container中运行一个Application manager 3.Application manager找一台nodemanager启动Application master,计算任务所需的计算 4.Application master向Application manager(Yarn)申请运行任务所需的资源 5.Resource scheduler将资源封装发给Application master 6.Application master将获取到的资源分配给各个nodemanager 7.各个nodemanager得到任务和资源开始执行map task 8.map task执行结束后,开始执行reduce task 9.map task和 reduce task将执行结果反馈给Application master 10.Application master将任务执行...
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- CentOS7,CentOS8安装Elasticsearch6.8.6
- Jdk安装(Linux,MacOS,Windows),包含三大操作系统的最全安装
- Linux系统CentOS6、CentOS7手动修改IP地址
- CentOS7安装Docker,走上虚拟化容器引擎之路
- CentOS7编译安装Cmake3.16.3,解决mysql等软件编译问题
- SpringBoot2全家桶,快速入门学习开发网站教程
- CentOS7设置SWAP分区,小内存服务器的救世主
- Docker快速安装Oracle11G,搭建oracle11g学习环境
- CentOS7编译安装Gcc9.2.0,解决mysql等软件编译问题
- Docker安装Oracle12C,快速搭建Oracle学习环境