《Spark大数据分析：核心概念、技术及实践》一3.9　共享变量-低调大师

《Spark大数据分析：核心概念、技术及实践》一3.9　共享变量

2017-05-01 682

本节书摘来自华章出版社《Spark大数据分析：核心概念、技术及实践》一书中的第3章，第3.9节，作者[美]　穆罕默德·古勒（Mohammed Guller），更多章节内容可以访问云栖社区“华章计算机”公众号查看。

3.9　共享变量

Spark使用的架构是无共享的。数据分布在集群的各个节点上，每个节点都有自己的CPU、内存和存储资源。没有全局的内存空间用于任务间共享。驱动程序和任务之间通过消息共享数据。

举例来说，如果一个RDD操作的函数参数是驱动程序中变量的引用，Spark会将这个变量的副本以及任务一起发送给执行者。每个任务都有一份变量的副本并把它当成只读变量使用。任何对这个变量的更新都只存在任务的内部，改动并不会回传给驱动程序。而且Spark会把这个变量在每一个阶段的开始发送给worker节点。

对于一些应用而言，这种默认行为是低效的

微信关注我们

原文链接：https://yq.aliyun.com/articles/88842

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

深入理解Spark：核心思想与源码分析. 2.2　Spark基础知识

2.2　Spark基础知识 1.版本变迁经过4年多的发展，Spark目前的版本是1.4.1。我们简单看看它的版本发展过程。 1）Spark诞生于UCBerkeley的AMP实验室（2009）。 2）Spark正式对外开源（2010年）。 3）Spark 0.6.0版本发布（2012-10-15），进行了大范围的性能改进，增加了一些新特性，并对Standalone部署模式进行了简化。 4）Spark 0.6.2版本发布（2013-02-07），解决了一些bug，并增强了系统的可用性。 5）Spark 0.7.0版本发布（2013-02-27），增加了更多关键特性，例如，Python API、Spark Streaming的alpha版本等。 6）Spark 0.7.2版本发布（2013-06-02），性能改进并解决了一些bug，新增API使用的例

2017-05-01

625

本节书摘来自华章出版社《Spark大数据分析：核心概念、技术及实践》一书中的第3章，第3.10节，作者[美]　穆罕默德·古勒（MohammedGuller），更多章节内容可以访问云栖社区“华章计算机”公众号查看。 3.10　总结 Spark是一个快速、可扩展、可容错且基于内存的集群计算框架。一个Spark应用可以比Hadoop应用快上100倍。 Spark不但快速而且它能很方便地使用mapReduce。通过不同语言（包括Java、Python、Scala和R）的易读的API，它可以方便地开发分布式大数据应用。使用Spark开发者的生产力可以有5～10倍的提升。而且Spark为各种数据处理任务提供了统一的平台。它是一个通用的框架，可以被各种大数据应用使用。对于迭代式数据分析或者使用迭代算法的应用而言，它是一个理想的平台。 Spark的编

2017-05-01

662

资源下载

更多资源

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题，腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构，目前腾讯云软件源站支持公网访问和内网访问。

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称，一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集，帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Rocky Linux

Rocky Linux（中文名：洛基）是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版，作为CentOS稳定版停止维护后与RHEL（Red Hat Enterprise Linux）完全兼容的开源替代方案，由社区拥有并管理，支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性，采用模块化包装和SELinux安全架构，默认包含GNOME桌面环境及XFS文件系统，支持十年生命周期更新。

WebStorm

WebStorm 是jetbrains公司旗下一款JavaScript 开发工具。目前已经被广大中国JS开发者誉为“Web前端开发神器”、“最强大的HTML5编辑器”、“最智能的JavaScript IDE”等。与IntelliJ IDEA同源，继承了IntelliJ IDEA强大的JS部分的功能。