大数据初学者必备神器学习路线图
大数据终将主宰经济社会,消除个体差异,成就一元化的经济体系。网络经济时代,人们在经济社会中的诸种活动通过网络账户体系来实现,这些活动也就是所谓的网络账户活动,其基本内容更多地体现为账户间的关系。这些账户活动及其账户关系是由数字网络程序所设定的、驱动的,且被实时地记录下来。这就形成了所谓的“大数据”。因此,大数据来源于大量的网络账户的活动及其有效的记录,简言之,大数据是网络账户数据。
具体学习路线图如下:
1.1 Java编程语言基本概述
1.2 Java基础语法
1.3 面向对象编程
1.4 面向对象高级编程
1.5 Java中的常用类库
1.6 枚举和异常类
1.7 Java数据结构和集合框架泛型
1.8 Java中的IO流
1.9 Java中的多线程
1.10 Java中网络编程和反射
1.11 Java8新特性
1.12 Java基础加强
第二阶段 Linux系统&Hadoop生态体系
01 Linux入门
02 常用基本命令
03 系统管理
04 Linux操作增强
05 Linux shell编程
06 Hadoop生态
07 分布式系统概述
08 Hadoop入门
09 Hadoop伪分布式
10 Hadoop全分布式
11 HDFS基本概念
12 HDFS的应用开发
13 HDFS的IO流操作
14 NameNode工作机制
15 DataNode工作机制
16 Zookeeper入门
17 Zookeeper详解
18 HA框架原理
19 Hadoop-HA集群配置
20 MapReduce框架原理
21 Shuffle机制
22 Mapreduce案例一
23 Mapreduce案例二
24 Hive入门
25 Hive DDL数据定义
26 Hive分区表
27 Hive分桶表
28 Hive查询
29 Hive的高级查询Join与排序
30 Hive的函数
31 Hive DML数据管理
32 Hive文件存储
33 Hive企业级调优
34 Hive企业级调优二
35 Hive企业级项目实战
36 Flume详解
37 Sqoop详解
38 Hbase概念
39 Hbase的操作
40 Hbase整合
41 Hbase的实战和优化
第三阶段 分布式计算框架
3.1 scala
3.2 Spark Core
3.3 Spark SQL
3.4 Spark Streaming
3.5 kafka
3.6 ElasticSearch
3.7 Logstash
3.8 Kibana
3.9 Kibana
第四阶段 大数据实战项目
4.1 互金领域-广告投放
项目介绍:构建广告投放平台,进行广告投放业务,吸引潜在客户,推广产品,包含投放微服务平台、竞价模块、客户群体画像、 千人千面推荐产品。
4.2 电商平台
项目介绍: 埋点业务,进行用户细分画像、建立信用体系、进行线上各类活动。
4.3 共享单车
项目介绍: 依据用户行为轨迹构成出行规律,根据用户群体出行规律、区域情况等动态调度用车情况。
4.4 工业大数据
项目介绍:国家电网_省级输/变电监控项目:监控线路的传感设备,确保设备安全、降低故障成本,动态监控线路、变电站二次设备工作情况、报警自动化。
4.5 交通
项目介绍:贵州交通厅,交通离线/实时监控项目:通过交通卡口采集实时数据,动态监控全省各道路通行和事故状况,避免拥堵、避免交通事故、 精准测速、防止套牌和提供便捷最佳出行方案、 预测拥堵系数,为各级提供最优道路规划方案。
4.6 旅游
项目介绍:安顺智慧旅游,整合各类旅游相关应用系统及信息资源,在公安、交通、工商等相关领域实现信息共享、协同合作,共同打造良性的旅游云生态系统。
4.7 医疗
项目介绍:某市人民医院,随着老年化的持续增加,患病率越来越高。增加大数据平台,采集医疗相关数据,提高诊断的准确性,预防一些疾病的发生,监控相关病情康复进展,真正实现解决看病难,降低发病率等。
第五阶段 大数据分析
5.1 Data Analyze数据分析基础
5.2 工作环境准备
5.3 数据可视化的概念与准则
5.4 Python机器学习
5.5 选择模型
5.6 构建树的过程
5.7 网格搜索
5.8 sklearn中有三类朴素贝叶斯算法
5.9 颜色特征
5.10 手写数字识别
5.11 文本的基本组成
5.12 文本的基本组成
大数据人才高度缺乏,人才需求量大。IT里面有很多职位可以选择,为什么要选择进入大数据圈子?原因正是大数据的光明前景,大数据风口在这里。学习大数据技术就在此刻!

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
一文了解 Apache Flink 核心技术
作者:伍翀 Apache Flink 介绍 Apache Flink (以下简称Flink)是近年来越来越流行的一款开源大数据计算引擎,它同时支持了批处理和流处理,也能用来做一些基于事件的应用。使用官网的语句来介绍 Flink 就是 "Stateful Computations Over Streams"。 首先 Flink 是一个纯流式的计算引擎,它的基本数据模型是数据流。流可以是无边界的无限流,即一般意义上的流处理。也可以是有边界的有限流,这样就是批处理。因此 Flink 用一套架构同时支持了流处理和批处理。其次,Flink 的一个优势是支持有状态的计算。如果处理一个事件(或一条数据)的结果只跟事件本身的内容有关,称为无状态处理;反之结果还和之前处理过的事件有关,称为有状态处理。稍微复杂一点的数据处理,比如说基本的聚合,数据流之间的
- 下一篇
【技术干货下载】从 Apache ORC 到 Apache Calcite | 2019大数据技术公开课第一季《技术人生专访》
2019年5月,大数据计算技术公开课又开播啦!!第一季《技术人生专访》,将带领开发者们从Apache ORC 到 Apache Calcite探讨大数据技术,从中美日看不同公司的工作经历和体验。 【直播详情】 吴刚专访 《大数据和 MaxCompute 技术和故事》5月14日 19:00-19:50 直播回看>>>阅读文字版>>>分享资料下载>>>雷春蔚专访 《MaxCompute 与 Calcite 的技术和故事》5月21日 19:00-19:50 直播回看>>>阅读文字版>>>分享资料下载>>>苑海胜专访 《MaxCompute 与大数据查询引擎的技术和故事》5月28日 20:00-20:50 直播回看>>&g
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- MySQL8.0.19开启GTID主从同步CentOS8
- CentOS8安装Docker,最新的服务器搭配容器使用
- Jdk安装(Linux,MacOS,Windows),包含三大操作系统的最全安装
- Hadoop3单机部署,实现最简伪集群
- SpringBoot2配置默认Tomcat设置,开启更多高级功能
- CentOS8,CentOS7,CentOS6编译安装Redis5.0.7
- CentOS6,7,8上安装Nginx,支持https2.0的开启
- CentOS关闭SELinux安全模块
- Linux系统CentOS6、CentOS7手动修改IP地址
- SpringBoot2整合MyBatis,连接MySql数据库做增删改查操作