Hadoop高级培训课程大纲-开发者版
一、课程概述
本次培训课程主要面向大数据系统管理人员和开发设计人员,基于开源社区大数据应用最活跃的Hadoop和HBase技术框架,围绕分布式文件存储(HDFS)、分布式并行计算(Map/Recue)和非关系型数据库(NoSql)三个大数据核心应用展开,旨在帮助培训对象建立起完整的大数据理论基础框架和实践操作能力。主要课程内容包括:
1.大数据应用发展史;
2.分布式文件系统HDFS原理与架构、HDFS系统管理、HDFS开发与设计;
3.分布式并行计算框架Map/Reduce工作原理与架构、Map/Reduce任务运行监控、Map/Reduce任务调度、Map/Redcue开发与设计;
4.非关系型数据库HBase逻辑架构、HBase物理存储、HBase关键流程和算法、HBase开发与设计;
5.大数据应用案例分析:金融、电信、互联网、电商平台
二、课程大纲
日程 | 课程模块 | 课程内容 |
第1天 | 大数据概述 | 什么是大数据? |
Hadoop概要 | ||
Hadoop生态系统介绍 | ||
Hadoop集群安装与部署 | Hadoop独立部署 | |
Hadoop伪分布式安装部署 | ||
Hadoop集群安装与部署 | ||
Hadoop配置参数管理 | ||
第2天 | HDFS架构与原理 | HDFS体系结构 |
HDFS读写过程-串行写与并行读 | ||
HDFS 管理接口-HDFS shell && HDFS Web Interface | ||
HDFS开发与设计 | HDFS API接口介绍 | |
HDFS Java接口实例 | ||
HDFS开发实例-基于HDFS实现云盘系统 | ||
第3天 | Map/Reduce架构与原理 | Map/Reduce体系结构 |
Map/Reduce管理接口-Map/Reduce shell && Map/Reduce Web Interface | ||
Map/Reduce开发与设计 | Map/Reduce API接口介绍 | |
Map/Reduce Java开发实例 | ||
第4天 | HBASE架构与原理 | HBASE体系结构 |
HBASE物理存储 | ||
HBASE关键流程算法 | ||
HBASE管理接口-HBase Shell&& HBase Web Interface | ||
HBASE与RDBMS的比较 | ||
HBASE开发与设计 | HBASE API接口介绍 | |
HBASE Java接口实例 | ||
HBASE优化专题-海量数据写入优化 | ||
第5天 | Hadoop辅助支持工具 | Hive-提供给SQL程序员最好的礼物 |
Pig-通过脚本实现Map/Reduce | ||
Sqoop-Hadoop时代的ETL |
三、服务支持
Hadoop培训交流群:293503507
培训邀请电话:13718542435
作者:张子良
出处:http://www.cnblogs.com/hadoopdev
本文版权归作者所有,欢迎转载,但未经作者同意必须保留此段声明,且在文章页面明显位置给出原文连接,否则保留追究法律责任的权利。

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
ElasticSearch查询 第一篇:搜索API
《ElasticSearch查询》目录导航: ElasticSearch查询 第一篇:搜索API ElasticSearch查询 第二篇:文档更新 ElasticSearch查询 第三篇:词条查询 ElasticSearch查询 第四篇:匹配查询(Match) ElasticSearch查询 第五篇:布尔查询 不同于SQL语言,对ElasticSearch引擎发送的查询请求,有两种方式:第一种方式是使用RESTful 风格的API请求对数据进行搜索或更新,这意味着,必须使用搜索API向ElasticSearch引擎发起搜索请求;第二种方式是使用Qeury DSL,将查询语言封装成JSON结构,在JSON结构中,封装查询请求的参数,作为请求主体(Request Body),发送给ElasticSearch引擎处理。 DSL是领域专用语言(Domain-SpecificLanguage)的首字母缩写,是一种通用的大数据查询语言,用于实现海量数据的检索分析。 本系列是ElasticSearch的入门文章,用于介绍搜索API的使用方法,只求快速入门,想要深入了解,最好的文档永远是官方手册。 ...
- 下一篇
Hadoop高级培训课程大纲-管理员版
一、课程概述 本次培训课程主要面向大数据系统管理人员和开发设计人员,基于开源社区大数据应用最活跃的Hadoop和HBase技术框架。围绕分布式文件存储(HDFS)、分布式并行计算(Map/Recue)和非关系型数据库(NoSql)三个大数据核心应用展开,旨在帮助培训对象建立起完整的大数据理论基础框架和实践操作能力。主要课程内容包括:1.大数据应用发展史;2.分布式文件系统HDFS原理与架构、HDFS系统管理、HDFS开发与设计;3.分布式并行计算框架Map/Reduce工作原理与架构、Map/Reduce任务运行监控、Map/Reduce任务调度、Map/Redcue开发与设计;4.非关系型数据库HBase逻辑架构、HBase物理存储、HBase关键流程和算法、HBase开发与设计;5.Hadoop操作实践:集群部署、文件管理、数据管理6.大数据应用案例分析:金融、电信、互联网、电商平台 二、课程大纲 日程 课程模块 课程内容 第1天 大数据概述 什么是大数据? Hadoop概要 Hadoop生态系统介绍 Hadoop集群安装与部署 Hadoop独立部署 Hadoop伪分布式安装部署 ...
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- CentOS7,8上快速安装Gitea,搭建Git服务器
- CentOS8安装MyCat,轻松搞定数据库的读写分离、垂直分库、水平分库
- SpringBoot2整合Thymeleaf,官方推荐html解决方案
- CentOS7,CentOS8安装Elasticsearch6.8.6
- CentOS关闭SELinux安全模块
- SpringBoot2初体验,简单认识spring boot2并且搭建基础工程
- Docker快速安装Oracle11G,搭建oracle11g学习环境
- Eclipse初始化配置,告别卡顿、闪退、编译时间过长
- SpringBoot2整合Redis,开启缓存,提高访问速度
- CentOS7设置SWAP分区,小内存服务器的救世主