《Hadoop海量数据处理：技术详解与项目实战》一第1章绪论-低调大师

《Hadoop海量数据处理：技术详解与项目实战》一第1章绪论

2017-05-01 716

本节书摘来异步社区《Hadoop海量数据处理：技术详解与项目实战》一书中的第1章，第1.1节，作者：范东来责编：杨海玲，更多章节内容可以访问云栖社区“异步社区”公众号查看。

第1章绪论

Hadoop海量数据处理：技术详解与项目实战
本章作为绪论，目的是在学习Hadoop之前，让读者理清相关概念以及这些概念之间的联系。

微信关注我们

原文链接：https://yq.aliyun.com/articles/97084

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

《Spark Cookbook 中文版》一1.5　在集群上以独立模式部署Spark

本节书摘来异步社区《Spark Cookbook 中文版》一书中的第1章，第1.5节，作者：【印度】Rishi Yadav（亚达夫）译者：顾星竹 , 刘见康责编：胡俊英，更多章节内容可以访问云栖社区“异步社区”公众号查看。 1.5　在集群上以独立模式部署Spark 在分布式环境中的计算资源需要管理，使得资源利用率高，每个作业都有公平运行的机会。Spark有一个便利的被称为独立模式的自带集群管理器。Spark也支持使用YARN或者Mesos做为集群管理器。选择集群处理器时，主要需要考虑延迟以及其他架构，例如MapReduce，是否共享同样的计算资源池。如果你的集群运行着旧有的MapReduce作业，并且这些作业不能转变为Spark作业，那么使用YARN作为集群管理器是个好主意。Mesos是一种新兴的、方便跨平台管理作业的、与Spark非常兼容的数据中心操作系统。如果Spark是你的集群的唯一框架，那么独立模式就足够好用了。随着Spark技术的发展，你会看到越来越多的Spark独立模式被用于处理所有的大数据计算需求。例如，目前有些作业可能在使用Apache Mahout，因为M...

2017-05-01

508

图为Hadoop创始人Doug Cutting Cloudera首席架构师就内存及云计算相关技术发表讨论，Hadoop将如何在大数据方面发挥更大价值。在Doug Cutting十年前创建Hadoop架构的时候，他从未想过这会为企业界带来如此超大规模的计算。“毫无疑问，我当初预想的情况比我们现在所看到的要稍微保守一些。“他在近期伦敦的Strata+Hadoop World大会上说。在今天，Hadoop被很多家喻户晓的名字使用，它帮助Facebook分析其每月超过16亿的用户流量，帮助VISA发现了数十亿美元的金融欺诈。 Hadoop的吸引力在于，它使大数据处理更便宜，从某些方面来说，更加简单。这个平台提供了一系列技术，允许大型数据集分布在商业服务器的大型集群中，对数据进行并行处理。然而该平台还有一定的局限性。如今，Hadoop集群能处理

2017-05-01

665

资源下载

更多资源

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题，腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构，目前腾讯云软件源站支持公网访问和内网访问。

Rocky Linux

Rocky Linux（中文名：洛基）是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版，作为CentOS稳定版停止维护后与RHEL（Red Hat Enterprise Linux）完全兼容的开源替代方案，由社区拥有并管理，支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性，采用模块化包装和SELinux安全架构，默认包含GNOME桌面环境及XFS文件系统，支持十年生命周期更新。

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能，例如代码缩略图，Python的插件，代码段等。还可自定义键绑定，菜单和工具栏。Sublime Text 的主要功能包括：拼写检查，书签，完整的 Python API ， Goto 功能，即时项目切换，多选择，多窗口等等。Sublime Text 是一个跨平台的编辑器，同时支持Windows、Linux、Mac OS X等操作系统。

WebStorm

WebStorm 是jetbrains公司旗下一款JavaScript 开发工具。目前已经被广大中国JS开发者誉为“Web前端开发神器”、“最强大的HTML5编辑器”、“最智能的JavaScript IDE”等。与IntelliJ IDEA同源，继承了IntelliJ IDEA强大的JS部分的功能。