《Scala机器学习》一一3.2　理解Spark的架构-低调大师

《Scala机器学习》一一3.2　理解Spark的架构

2017-08-01 818

3.2　理解Spark的架构
并行化是将工作负载划分为在不同线程或不同节点上执行的子任务。下面介绍Spark实现并行化的原理，以及它如何管理子任务的执行和子任务之间的通信。
3.2.1　任务调度
Spark工作负载的划分由弹性分布式数据集（Resilient Distributed Dataset，RDD）的分区数决定，这是Spark的基本抽象和管道结构。RDD是一种可并行操作的、不可变元素的分区集合。具体细节可能取决于Spark的运行模式，图3-2为Spark任务/资源调度的示意图。

图3-2　通用的Spark任务调度示意图。尽管在图中没有明确标识，Spark Context通常会在端口4040上打开一个HTTP UI（并发情形将打开4041、4042等），在任务执行期间会一直这样。Spark Master UI的端口通常是8080（虽

微信关注我们

原文链接：https://yq.aliyun.com/articles/174390

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

浪潮发布GPU 深度学习一体机，大幅提升性能及生产力

美国当地时间11月16日，在盐湖城举行的全球超算大会SC16上，浪潮发布了深度学习一体机D1000，该产品部署了采用NVIDIA® Tesla™ GPU技术的浪潮高性能计算集群，运行多节点并行深度学习框架Caffe-MPI，可大幅提升在人脸识别、图片分类、物体识别等应用场景的深度学习计算性能，并有效提高用户在实际业务使用深度学习的生产力。强强联手产硕果 D1000产品整合了浪潮深度学习领域的最新技术成果，包括浪潮推动开发的并行版开源深度学习框架Caffe-MPI，英伟达专为深度学习定制的TeslaGPU及CuDNN库。浪潮展示了6节点的D1000产品方案，该方案的节点是浪潮专为深度学习开发的专用GPU服务器，每个节点配置2颗处理器及4块NVIDIA® Tesla™ M40 GPU。浪潮集团海外总部副总经理Jay Zhang现场讲解浪潮集团海外总部副总经理Jay Zhang表示，D1000在性能、扩展性等方面都大幅领先于以往的深度学习方案，可以满足大部分客户的应用需求。浪潮一直在加强深度学习前沿技术开发并致力于构建良好的生态系统，并联合NVIDIA等业界领先技术伙伴，将最新的技...

2017-08-01

834

OpenStack从2010年诞生至今，已经走过了6年的道路。在如今，企业云计算市场越来越普及的今天，OpenStack也开始逐渐收获成果——国内一家OpenStack公司在一天之内赢得五个私有云大单。但有媒体就此给出了“中国的私有云市场正在迎来拐点”的论断尚且为时过早。实际上，OpenStack最初是被当作公有云的操作系统来看的，但如今，一个基本的事实是，OpenStack的成功案例更多被运用于私有云的建设中，就如同本文开篇所例举的那家国内OpenStack创业企业所获得的订单一样。记得笔者曾经就此事与阿里云、青云等公共云服务提供商的技术人员进行过探讨，他们一致认为，OpenStack现有的架构，无法支撑大规模集群的Scale-out横向扩展。即便是基于OpenStack推出超融合一体机的书生云，也承认如果选择通用的OpenStack方案，不仅到处是坑，而且对自身的技术能力要求很高，隐形成本非常高，企业建设云平台面临重大挑战。书生云的说法是，通过软硬件整体优化集成，来填平OpenStack的各种坑，加上良好的监控管理运维界面和自动化的故障处理机制，才可以保证系统的相对成熟、可...

2017-08-01

705

资源下载

更多资源

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称，一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集，帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Rocky Linux

Rocky Linux（中文名：洛基）是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版，作为CentOS稳定版停止维护后与RHEL（Red Hat Enterprise Linux）完全兼容的开源替代方案，由社区拥有并管理，支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性，采用模块化包装和SELinux安全架构，默认包含GNOME桌面环境及XFS文件系统，支持十年生命周期更新。

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能，例如代码缩略图，Python的插件，代码段等。还可自定义键绑定，菜单和工具栏。Sublime Text 的主要功能包括：拼写检查，书签，完整的 Python API ， Goto 功能，即时项目切换，多选择，多窗口等等。Sublime Text 是一个跨平台的编辑器，同时支持Windows、Linux、Mac OS X等操作系统。

WebStorm

WebStorm 是jetbrains公司旗下一款JavaScript 开发工具。目前已经被广大中国JS开发者誉为“Web前端开发神器”、“最强大的HTML5编辑器”、“最智能的JavaScript IDE”等。与IntelliJ IDEA同源，继承了IntelliJ IDEA强大的JS部分的功能。