云上Hadoop之挑战-低调大师

云上Hadoop之挑战

2018-11-04 798

引言

在云上云行Hadoop，很多人担心性能。因为一提到虚拟化就会有人想到有成本，往往得出有偏见的结论-在云上运行肯定比物理机器上运行性能差。如果单独把10台物理机虚拟化跑Hadoop，这肯定是有部分性能的开销的。但是如果在公共云上，情况就不是这样了。因为公共云虚拟化的开销最终是由平台方来承担的，其一是平台方采购机器有规模优势，其二平台方可以在保证虚拟机性能的情况超卖部分资源。
平台卖给用户8core32g的虚拟机就保证有这个规格的能力的。
结合云上的弹性优势，企业的总体成本是会下降的。

在云上运行Hadoop对平台方还是面临一些挑战的，下面主要讲述这些挑战及平台方怎么解决的。

云上Hadoop的挑战-Shuffle

Shuffle分为Push模式，Pull模式。Push模式就是直接通过网络发送到下一个节点，比如：storm、flink。

微信关注我们

原文链接：https://yq.aliyun.com/articles/664946

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

云上Hadoop之优势

云上Hadoop的优势如果对E-Mapreduce有兴趣，可以访问E-Mapreduce培训系列之基本介绍这里主要是围绕E-Mapreduce这款云产品展开的。易用主要体现在集群的创建、销毁、扩容、缩容等方面，目前一个集群基本4分钟内开启。支持作业的编排、作业执行错误后报警等。hadoop本身提供了基本的软件，目前hue、zeppelin、ooize等虽然提供了网页版本的交互式，任务的编排；但是毕竟不是企业的服务，也没有提供高可用的保证，对于报警，跟组内其它同事的账户也难以集成。emapreduce会提供这方面的服务，不过当前一些还在实现中。低成本主要体现在线下购买Hadoop、运维Hadoop集群的高成本。在云上有更好的组合方式，比如把数据放在OSS中，再启动emr集群按需运行。按照客户的业务情况，对于一直hold资源的场景，

2018-11-04

727

云上Hadoop的部署结构在云上部署Hadoop是比较灵活的，可以根据不同的业务目标部署Hadoop集群，笔者总结了在云上的大体部署结构。经典模式传统的部署模式如上，线下的机器比较固定，所以一般的节点上会部署Datanode、NodeManager节点。经典模式2 一般把节点分为：Master Node、Core Node、Task Node。这么部署结构相对灵活，也就是Task Node就部署NodeManager。如果需要添加计算能力，就添加Task Node。且因为Task Node无状态，在缩小集群时也相对简单。（这样就避免了在线下经常出现的，计算与存储不匹配的问题，导致资源浪费）存储计算分离在此模式下，数据放在OSS中，可以启动Hadoop集群分析数据。这种模式最大的好处就是Hadoop集群可以用完就释放掉，最大节约成本

2018-11-04

724

资源下载

更多资源

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称，一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集，帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Spring

Spring框架（Spring Framework）是由Rod Johnson于2002年提出的开源Java企业级应用框架，旨在通过使用JavaBean替代传统EJB实现方式降低企业级编程开发的复杂性。该框架基于简单性、可测试性和松耦合性设计理念，提供核心容器、应用上下文、数据访问集成等模块，支持整合Hibernate、Struts等第三方框架，其适用范围不仅限于服务器端开发，绝大多数Java应用均可从中受益。

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能，例如代码缩略图，Python的插件，代码段等。还可自定义键绑定，菜单和工具栏。Sublime Text 的主要功能包括：拼写检查，书签，完整的 Python API ， Goto 功能，即时项目切换，多选择，多窗口等等。Sublime Text 是一个跨平台的编辑器，同时支持Windows、Linux、Mac OS X等操作系统。

WebStorm

WebStorm 是jetbrains公司旗下一款JavaScript 开发工具。目前已经被广大中国JS开发者誉为“Web前端开发神器”、“最强大的HTML5编辑器”、“最智能的JavaScript IDE”等。与IntelliJ IDEA同源，继承了IntelliJ IDEA强大的JS部分的功能。