如何正确学习大数据，才能少走弯路？-低调大师

如何正确学习大数据，才能少走弯路？

2019-04-17 641

https://img.mukewang.com/5cb7cc4f0001a4f206560411.jpg
在技术论坛中或知乎上，看到近几万的冤家都在疑惑，学习Java应该选择什麼展开方向，这个我们在之前的文章中有提到过，Java展开在范围上有三个选择方向：

这是全国最大的大数据学习交流的地方，2000人聚集，不管你是小白还是大牛，

小编我都挺欢迎，今天的已经资讯上传到群文件，不定期分享干货，

JavaEE，主要运用于企业级运用开发；安卓开发方向；嵌入式运用开发方向。在此建议大家选择JavaEE方向，由于运用非常普遍，岗位设置也比较多。

Java的职业展开规划之路我们也曾在（一文阐述Java从初级到初级的学习之路——

）详细罗列，这里就不逐一罗列了。

但我们历来没有讨论过学习Java，难道这辈子就只能做Java后端开发吗？只能在这条路上妥协终究吗？难道中途没有其他的选择吗？

偶然看法的一个冤家，最末尾是从事Java后端开发的，后来他在专业时间自学成功转入大数据行业，如今是一名大数据工程师，待遇也比之前好更多。前提是他是一名Java后端开发。

大数据是我们如今比较火的一个展开方向，但是很多培训机构有提到几个月速成的，小编觉得不是特别靠谱。

缘由有以下：

大数据是一个重生行业，还不太成熟。

Java展开了将近20年，也没有说几个月速成的，最多也就是带你入门，让你对Java的知识结构体系有一个明晰的认知，在后期的义务实际时期生长的速度更快。

大数据的起点要高，并不是所谓的零基础就可以入门的。

我们接上去讲述的有关大数据的学习是有条件限制的，首先你需求是一名普通的工程师，假设你是Java工程师的话更好，但假设你是小白的话，那就只能成爲一名工程师的后再来学习大数据吧。

一、看法大数据

大数据本质其实也是数据，不过也包括了些新的特征，

数据来源广；

数据格式多样化（结构化数据、非结构化数据、Excel文件等）；

数据量大（最少也是TB级别的、甚至可以是PB级别）；

数据增长速度快。

而针对以上新的特征需求思索很多成果：

例如，数据来源广，该如何采集汇总？采集汇总之后，又该存储呢？数据存储之后，该如何经过运算转化本钱人想要的结果呢？

关于这些成果，我们需求有相对应的知识处置。

二、大数据所需技艺要求

Python言语：编写一些脚本时会用到。

Scala言语：编写Spark顺序的最佳言语，当然也可以选择用Python。

Ozzie，azkaban：定时义务调度的工具。

Hue，Zepplin：图形化义务执行管理，结果反省工具。

Allluxio，Kylin等：经过对存储的数据中止预处置，加快运算速度的工具。

https://img.mukewang.com/5cb7cc960001afb207220480.jpg

必需掌握的技艺：

Java初级(虚拟机、并发)、Linux 基本操作、Hadoop（HDFS+MapReduce+Yarn ）、 HBase（JavaAPI操作+Phoenix ）、Hive(Hql基本操作和原理理解）、 Kafka、Storm/JStorm、Scala、Python、Spark (Core+sparksql+Spark streaming ）、辅佐小工具(Sqoop/Flume/Oozie/Hue等)

高阶技艺6条：

机器学习算法以及mahout库加MLlib、 R言语、Lambda 架构、Kappa架构、Kylin、Alluxio

三、学习规划

每天需求有3个小时的学习时间，周末的时分需求10小时，假设做不到的话，只能是

第一阶段（基础阶段）

Linux学习

Linux操作系统引见与安装、Linux常用命令、Linux常用软件安装、Linux网络、防火墙、Shell编程等。

Java 初级学习（《深化理解Java虚拟机》、《Java高并发实战》）

掌握多线程、掌握并发包下的队列、掌握JVM技术、掌握反射和静态代理、了解JMS。

Zookeeper学习

Zookeeper分布式协调效力引见、Zookeeper集群的安装部署、Zookeeper数据结构、命令。

第二阶段（攻坚阶段）

Hadoop、Hive、HBase、Scala、Spark、Python

第三阶段（辅佐工具工学习阶段）

Sqoop、Flume、Oozie、Hue这些工具的学习主要在CSDN，51CTO以及官网都可以学习。

https://img.mukewang.com/5cb7cc790001015003680269.jpg

总结

在技术行业里面，每天都会有新的东西出现，需求关注最新技术静态，不时学习。任何普通技术都是先学习实践，然后在实际中不时完善实践的进程。

假设你觉得自己看书效率太慢，你可以网上搜集一些课程。

快速学习的才干、处置成果的才干、沟通才干在这个行业是真的非常重要的目的。

要擅长运用StackOverFlow和Google来帮助你学习进程遇到的成果。

坚实的Java技术作为基础支持，之后学习：Hadoop，大数据存储，大数据架构设计，大数据实时计算，大数据数据采集，大数据商业实战等。

技术人员就业方向：大数据系统研发人才，大数据应用开发人才和大数据分析人才。

以上是我们对大数据学习的总结，当然我们也提到了，并不是说零基础的就可以直接学习，需求有编程的基础，要先掌握扎实的编程基础，在此建议学习Java，成爲一名工程师的时分，有一定编程阅历，自学起来也相对比末尾要复杂一点，然后对大数据有兴味或许想要进入这个行业的就可以去学习了以上内容是我个人见解，希望对你有帮助不

微信关注我们

原文链接：https://yq.aliyun.com/articles/698725

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

ELK日志分析方案

针对公司项目微服务化，随着项目及服务器的不断增多，决定采用ELK（Elasticsearch+Logstash+Kibana）日志分析平台进行微服务日志分析。 1.ELK整体方案 1.1 ELK架构图 1.2 ELK工作流程 1.在微服务服务器上部署Logstash，作为Shipper的角色，对微服务日志文件数据进行数据采集，将采集到的数据输出到Redis消息队列。 2.在另外一台服务器上部署Logstash，作为Indexer的角色，从Redis消息队列中读取数据（可以对数据进行处理），输出到Elasticsearch-Master主节点。 3.Elasticsearch-Master主节点内部与副节点同步数据。（Elasticsearch集群建议3个服务以上奇数） 4.Kibana部署一台服务器内，读取Elasticsearch集群数据，展

2019-04-17

798

阿里妹导读：MaxCompute 是阿里EB级计算平台，经过十年磨砺，它成为阿里巴巴集团数据中台的计算核心和阿里云大数据的基础服务。去年MaxCompute 做了哪些工作，这些工作背后的原因是什么？大数据市场进入普惠+红海的新阶段，如何与生态发展共赢？人工智能进入井喷阶段，如何支持与借力？本文从过去一年的总结，核心技术概览，以及每条技术线路未来展望等几个方面做一个概述。 BigData 概念在上世纪90年代被提出，随 Google 的3篇经典论文（GFS，BigTable，MapReduce）奠基，已经发展了超过10年。这10年中，诞生了包括Google 大数据体系，微软 Cosmos 体系，开源 Hadoop 体系等优秀的系统，这其中也包括阿里云的飞天系统。这些系统一步一步推动业界进入“数字化“和之后的“ AI 化”的时代。同时，

2019-04-17

729

资源下载

更多资源

Spring

Spring框架（Spring Framework）是由Rod Johnson于2002年提出的开源Java企业级应用框架，旨在通过使用JavaBean替代传统EJB实现方式降低企业级编程开发的复杂性。该框架基于简单性、可测试性和松耦合性设计理念，提供核心容器、应用上下文、数据访问集成等模块，支持整合Hibernate、Struts等第三方框架，其适用范围不仅限于服务器端开发，绝大多数Java应用均可从中受益。

Rocky Linux

Rocky Linux（中文名：洛基）是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版，作为CentOS稳定版停止维护后与RHEL（Red Hat Enterprise Linux）完全兼容的开源替代方案，由社区拥有并管理，支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性，采用模块化包装和SELinux安全架构，默认包含GNOME桌面环境及XFS文件系统，支持十年生命周期更新。

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能，例如代码缩略图，Python的插件，代码段等。还可自定义键绑定，菜单和工具栏。Sublime Text 的主要功能包括：拼写检查，书签，完整的 Python API ， Goto 功能，即时项目切换，多选择，多窗口等等。Sublime Text 是一个跨平台的编辑器，同时支持Windows、Linux、Mac OS X等操作系统。

WebStorm

WebStorm 是jetbrains公司旗下一款JavaScript 开发工具。目前已经被广大中国JS开发者誉为“Web前端开发神器”、“最强大的HTML5编辑器”、“最智能的JavaScript IDE”等。与IntelliJ IDEA同源，继承了IntelliJ IDEA强大的JS部分的功能。