大数据学习思路-低调大师

大数据学习思路

2019-03-22 732

学习大数据已经有一段时间了，抽空回顾一下自己学习的一些内容。下图主要为自己学习大数据的一个过程。

阶段一：Java基础
掌握JAVA基本语法、面向对象、集合、IO流、多线程、网络编程

阶段二：MySQL
CRUD

阶段三：Linux
常用的操作命令

阶段四：Hadoop生态系统

HDFS、YARN、MapReduce、Hive、HBase、Zookeeper、Flume、Kafka、Sqoop、Spark

阶段五：Spark生态系统

Spark Core、Spark SQL、Spark Streaming、MLlib、Graphx

阶段六：项目实战
用户推荐系统

阶段七：Python
学习python的基础语法。后面的数据爬去、算法的实现、机器学习、深度学习中会用到，学习numpy和panada。

阶段八：HTML
学习HTML的基础语法，了解网页的构成。

微信关注我们

原文链接：https://yq.aliyun.com/articles/694969

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

阿里云大数据平台MaxCompute用户指南官方电子版下载

习惯离线看文档的开发者，请点击附件下载https://yq.aliyun.com/attachment/download/?filename=MaxCompu...[%E9%9A%90%E6%9E%97].1555250826.zip 扫码加入“MaxCompute开发者社区”钉钉群

2019-03-22

721

大数据系列文章汇总链接 - 更新到15篇 HDFS：分布式存储系统（Hadoop Distributed File System）：提供了高可靠性、高扩展性和高吞吐率的数据存储服务 HDFS源自于Google的GFS论文 (发表于2003年10月)，是GFS克隆版YARN：资源管理系统（Yet Another Resource Negotiator）：负责集群资源的统一管理和调度，Hadoop 2.0新增系统，使得多种计算框架可以运行在一个集群中MapReduce：分布式计算框架：具有易于编程、高容错性和高扩展性等优点 MapReduce源自于Google的MapReduce论文（发表于2004年12月），是Google MapReduce克隆版 Hive：由facebook开源，基于MR的数据仓库，数据计算使用MR，数据存储使用HDFS，Hive 定义了一种类 SQL 查询语言——HQL：类似SQL，但不完全相同日志分析：统计网站一个时间段内的pv、uvPig：由yahoo！开源，构建在Hadoop之上的数据仓库 Mahout：数据挖掘库，基于Hadoo...

2019-03-22

702

资源下载

更多资源

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题，腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构，目前腾讯云软件源站支持公网访问和内网访问。

Spring

Spring框架（Spring Framework）是由Rod Johnson于2002年提出的开源Java企业级应用框架，旨在通过使用JavaBean替代传统EJB实现方式降低企业级编程开发的复杂性。该框架基于简单性、可测试性和松耦合性设计理念，提供核心容器、应用上下文、数据访问集成等模块，支持整合Hibernate、Struts等第三方框架，其适用范围不仅限于服务器端开发，绝大多数Java应用均可从中受益。

Rocky Linux

Rocky Linux（中文名：洛基）是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版，作为CentOS稳定版停止维护后与RHEL（Red Hat Enterprise Linux）完全兼容的开源替代方案，由社区拥有并管理，支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性，采用模块化包装和SELinux安全架构，默认包含GNOME桌面环境及XFS文件系统，支持十年生命周期更新。

WebStorm

WebStorm 是jetbrains公司旗下一款JavaScript 开发工具。目前已经被广大中国JS开发者誉为“Web前端开发神器”、“最强大的HTML5编辑器”、“最智能的JavaScript IDE”等。与IntelliJ IDEA同源，继承了IntelliJ IDEA强大的JS部分的功能。