超大超详细图解，让你掌握Spark memeoryStore内存管理的精髓-低调大师

超大超详细图解，让你掌握Spark memeoryStore内存管理的精髓

2021-12-17 641

摘要：memoryStore主要是将没有序列化的java对象数组或者序列化的byteBuffer放到内存中。

本文分享自华为云社区《spark到底是怎么确认内存够不够用的？超大超详细图解！让你掌握Spark memeoryStore内存管理的精髓》，作者： breakDraw 。

首先回顾一下spark中的Block Manager和memory Store是做什么的。它主要是将没有序列化的java对象数组或者序列化的byte Buffer放到内存中。

但是这就涉及到一些内存管理的问题，如果放不下，是不是要放磁盘？什么时候认为放不下？这里会一一解读。

MemoryStore的putIterator

这个方法是把一堆values的数组内容放入内存中（本质上就是放到Map<blockId, blockEntry>中。如果发现内存足够，能够申请，则调用putArray把数据写入内存（就是放到map中），否则就去调用diskStore的接口写入磁盘中。

这里我先打住，不直接往下讲，而是给自己假设场景，如果是自己在开发计算引擎，写executor里的block缓存，肯定需要思考这个问题：

什么时候认为内存是足够的？

最简单的一个做法：

我给每个memoryStore设定一个阈值MaxMemory，
维护一个值currentMemory，这个值就是memoryStroe里那个Map<BlockId,memoryEntry>所占的大小。
然后遍历计算一下输入参数values所占的内存大小 needMemory
如果needMemory > maxMemory - currentMemory，则认为内存不足，写入到磁盘。

这个做法相当于直接把整个values大小都计算好之后，如果ok，马上进行写入内存操作。

如果是memoryStore是单线程的模块那ok，但如果这个putIterator是一个支持多线程写入的模块呢？当我觉得100M足够，我写入，可能得花10s，然后另外一个线程也觉得100M足够，也要写入，结果写到一半发现内存不够，就尴尬了。

因此问题变为：

多线程时，如果确保计算的内存量是有效的？

一种方式，就是每次确定要写入时，把要写入的这100M的量直接加到currentMemory中。后面的线程要判断时，直接拿最新的curentMemory判断。

但实际上这个数据并没有真正写入map中，有可能中间出现写入失败或者线程中断，那这时候已经被处理过的currentMemory就不好搞了。

所以引入一个概念，叫展开内存unrollMemory。

每个线程都有自己的unrollMemory，可以理解为该线程准备写入到内存中的大小。因此我们统计剩余可写入内存时，实际上是等于 MaxMemory - currentMemory - 所有线程unrollMemory总和。

但是我们又不能让线程展开的这个值正好把剩余内存占满，所以会设定一个展开内存总和maxUnrollMemory，替代MaxMemory。

因此此时我这个线程可用的剩余内存space，实际上为maxUnrollMemory - cyrrentUnrollMemory。

但问题又来了，如果我们假想的可分配内存比实际剩余内存小，怎么办？如下图:

一种方式，是发现假想剩余内存小于实际剩余内存时，认为内存不足，把数据写入磁盘。

但有个问题，假设我需要写入100M，实际剩余内存是98M，其实只差了2M，那为什么不能挤挤呢？只差2M了！

然而我肯定不能去动其他线程的unrollMemory，毕竟人家都认为自己是ok的准备写入了，你总不能插队吧？如果能动其他线程准备写入的数据，这管理就太复杂了。因此我们需要去已使用内存MemoryEntry里面找，找一下是不是有比较小的block块，比如有一个块只有5M，那我就把这个block块放入磁盘，那么我就可以塞进去了！

解答完上述问题后，再学习memoryStore的内存写入管理机制，就容易多了。

memoryStore完整安全展开流程

1. 计算需要写入的内存大小，是否需要申请新内存

这里的计算不同于上文中提到的直接遍历完之后判断总大小

因为当时传入的是一个迭代器，只能迭代一次，每次迭代时都需要放入vector这个临时存储的列表中，万一超级大，放入vector时超出范围就GG了，所以它实际时每隔一段就会检查一下是否超出阈值。

2. 计算剩余可用的展开空间

下图标注的地方就是上文最后算出的space：

如果小于实际内存，那么就需要去已分配的内存中找，看下能不能选一些小朋友去磁盘中。

spark不足时，检查能否抽一些已分配内存区磁盘

核心方法来自ensureFreeSpace

我们看下它的实现：

这个过程比较简单，也没做太多优化，不考虑最优情况，否则会有排序的性能问题。

如果发现抽内存也不够用，那就直接认为不行了。如果ok，那就认为可行，

内存足够分配，写入

最后会返回一个vector数据

这个vector会拿去做真正的写入操作。

完整高清大图过程：

点击关注，第一时间了解华为云新鲜技术~

微信关注我们

原文链接：https://my.oschina.net/u/4526289/blog/5373600

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

OpenFaaS - 以自己的方式运行容器化函数

译者注：本文篇幅较长，有助于了解 FaaS 和 OpenFaaS。作者分别从开发人员和运维人员的视角来了解 OpenFaaS，对了解新的技术是个很好的方式。本文翻译自 Ivan Velichko 的 OpenFaaS - Run Containerized Functions On Your Own Terms。长期以来，无服务器（serverless）对我来说无非就是 AWS Lambda 的代名词。Lambda 提供了一种方便的途径，可以将任意代码附加到平台事件（云实例的状态变更、DynamoDB 记录的更新或新的 SNS 消息）中。但是，我时不时会想到某个逻辑，但其又没大到足以有自己的服务，同时有不适合任何现有服务的范围。因此，我经常将其放入函数中，以便日后使用 CLI 命令或者 HTTP 调用来调用它。几年前，我来开了 AWS，自那以后，我一直怀念部署无服务器功能的便利性。因此，当我得知 OpenFaaS 项目时惊喜万分。它将在 Kubernetes 集群上部署函数变得简单，甚至仅需要 Containerd 就可以部署到虚拟机上。有兴趣？那么继续！无服务器与 Fa...

2021-12-17

576

MQTT X 是由全球领先的物联网数据基础设施软件供应商 EMQ 开源的一款跨平台 MQTT 5.0 桌面测试客户端，支持 macOS、Linux、Windows 系统。 MQTT X 的用户界面借助聊天软件的形式简化了页面的操作逻辑，用户可以快速创建多个同时在线的 MQTT 客户端，方便测试 MQTT/TCP、MQTT/TLS、MQTT/WebSocket 的连接/发布/订阅功能及其他 MQTT 协议特性。近日，EMQ 正式发布了 MQTT X v1.7.0。从这一版本起，MQTT X 将进一步支持 MQTT 5.0 的诸多新特性，这也是全球目前为止对 MQTT 5.0 支持最为完整的桌面测试客户端工具。 MQTT X 网站：https://mqttx.app/zh MQTT X v1.7.0 版本地址：https://github.com/emqx/MQTTX/releases/tag/v1.7.0 Mac 用户可在 App Store 中进行下载：https://apps.apple.com/cn/app/mqttx/id1514074565?mt=12 Linux 用户可在...

2021-12-17

699

资源下载

更多资源

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长，特征是大鼻子、头戴帽子、身穿背带裤，还留着胡子。与他的双胞胎兄弟路易基一起，长年担任任天堂的招牌角色。

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称，一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集，帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Rocky Linux

Rocky Linux（中文名：洛基）是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版，作为CentOS稳定版停止维护后与RHEL（Red Hat Enterprise Linux）完全兼容的开源替代方案，由社区拥有并管理，支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性，采用模块化包装和SELinux安全架构，默认包含GNOME桌面环境及XFS文件系统，支持十年生命周期更新。

WebStorm

WebStorm 是jetbrains公司旗下一款JavaScript 开发工具。目前已经被广大中国JS开发者誉为“Web前端开发神器”、“最强大的HTML5编辑器”、“最智能的JavaScript IDE”等。与IntelliJ IDEA同源，继承了IntelliJ IDEA强大的JS部分的功能。