presto是如何保证作业内存不会发生冲突和溢出-低调大师

presto是如何保证作业内存不会发生冲突和溢出

2022-03-22 654

摘要：presto计算引擎作为一个纯内存计算引擎，是如何保证计算过程不会发生作业内存溢出的？本篇文章会进行深入的学习和分析。

本文分享自华为云社区《presto是如何保证作业内存不会发生冲突和溢出？presto内存管理机制深入分析》，作者：breakDawn。

首先，presto分了如下3个内存池

System Pool

System Pool，指系统内存池，是用来保留给系统和缓冲区使用的，默认为40%的内存空间留给系统使用。

看来对于presto来说，作业之间的缓冲区是存在共用的，认为是系统、通用层面的部分。

General Pool

常规内存池，用来分配每个query运行时内存的。其中大部分的query使用general Pool。

Reserved Pool

保留内存池，用来为可能突然触发的超大作业进行内存保留分配。即最大的一个query，会使用Reserved Pool

Reserved Pool的空间等同于一个query在一个机器上运行使用的最大空间大小，默认是10%的空间。

在真正执行物理计划前，内存需求都来自于systemMemoryPool，包括临时数据结构，传输buffer等

执行物理计划时，不同的Operator类型都根据需要申请内存，比如aggregationOperator使用getEsctimatedSize()方法预估需要的内存。

这里获取的内存来自于reservatedMemoryPool或者generalMemoryPool，究竟使用哪个pool取决于当前查询是否耗用内存最大

问：为什么要引出一个Reserved内存池且只提供给1个作业使用？

如果没有Reserved Pool，那么当query非常多，并且把内存空间几乎快要占完的时候，某一个内存消耗比较大的query开始运行。

但是这时候已经没有内存空间可供这个query运行了，这个query一直处于挂起状态，一直在等待可用的内存。

但是其他的小内存query跑完后，可能只腾出一点点的空间，又有新的小内存query加进来。由于小内存query占用内存小，很容易找到可用内存。这种情况下，大内存query就一直挂起直到饿死。

所以为了防止出现这种饿死的情况，必须预留出来一块空间，共大内存query运行。预留的空间大小等于query允许使用的最大内存。Presto每秒钟，挑出来一个内存占用最大的query，允许它使用reserved pool，避免一直没有可用内存供该query运行。

保留池的选举机制（Reserved池是如何选出来的）

如下图所示：

Presto内存管理，分两部分：

1. query内存（作业内存）管理

query划分成很多task，每个task会有一个线程循环获取task的状态，包括task所用内存。汇总成query所用内存。

如果query的汇总内存超过一定大小，则强制终止该query。

2. 机器内存管理

coordinator有一个线程，定时的轮训每台机器，查看当前的机器内存状态。

当query内存和机器内存汇总之后，coordinator会挑选出一个内存使用最大的query，分配给Reserved Pool。
内存管理是由coordinator来管理的， coordinator每秒钟做一次判断，指定某个query在所有的机器上都能使用reserved 内存。

问：如果某台机器上，，没有运行该query，那岂不是该机器预留的内存浪费了？为什么不在单台机器上挑出来一个最大的task执行？

原因还是死锁，假如query，在其他机器上享有reserved内存，很快执行结束。但是在某一台机器上不是最大的task（即这个task在另一个节点可能只排第二名，被另一个大作业占了保留池，导致下一步卡住了，无法连续的执行），一直得不到运行，导致该query无法结束。

所以首要目的是保证此刻已感知到的最大作业尽快执行完毕。

如何在内存不足时杀掉不需要的query？

每次作业提交存在一个会话级别的配置 query_max_memory，即本次查询规定的最大内存，在轮询过程种如果发现内存超出本次查询上限内存，会杀掉这个query。

还有个会话配置resource_overcommit

如果设为true，后面即使内存暂时超出单作业规定内存，业不会被杀掉，但如果整个集群的内存出现不足，他仍然会被杀掉

集群内存不足的判定：
存在某个worker节点的内存池出现内存不足（即该节点阻塞了），则认为发生了内存溢出

点击关注，第一时间了解华为云新鲜技术~

微信关注我们

原文链接：https://my.oschina.net/u/4526289/blog/5495640

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

如何消除代码山中那一大坨参数列表？

摘要：有经验的程序员应该都见过，一个方法坐拥几十上百个参数。本文分享自华为云社区《如何消除代码屎山中的一大坨参数列表？》，作者： JavaEdge 。有经验的程序员应该都见过，一个方法坐拥几十上百个参数。 1 方法为何要有参数？因为不同方法之间需要共享信息。但方法间共享信息的方式除了参数列表，还有全局变量。但全局变量总能带来意外之喜，所以，取消全局变量也是各大语言趋势。于是参数列表就成了唯一选择，于是，只要你想到有什么信息要传给一个方法，就会直接将其加入参数列表，导致参数列表越来越长！ 2 长参数列表怎么了？参数列表一旦过长，你一个 crud boy就很难完全掌控这些逻辑了呀！所以症结是数量多，解决关键也就是降低参数数量。 3 解决方案 3.1 聚沙成塔一个简单的创建博客的方法： public void createActicle(final String title, final String introduction, final URL coverUrl, final ActicleType type, final ActicleColumn column,...

2022-03-22

525

摘要本文以MySQL数据库为研究对象，讨论与数据库索引相关的一些话题。特别需要说明的是，MySQL支持诸多存储引擎，而各种存储引擎对索引的支持也各不相同，因此MySQL数据库支持多种索引类型，如BTree索引，哈希索引，全文索引等等。为了避免混乱，本文将只关注于BTree索引，因为这是平常使用MySQL时主要打交道的索引，至于哈希索引和全文索引本文暂不讨论。第一部分主要从数据结构及算法理论层面讨论MySQL数据库索引的数理基础。第二部分结合MySQL数据库中MyISAM和InnoDB数据存储引擎中索引的架构实现讨论聚集索引、非聚集索引及覆盖索引等话题。第三部分讲解Explain命令的使用规范第四部分讨论MySQL中高性能使用索引的策略。数据结构与算法基础索引的本质 MySQL官方对索引的定义为：索引（Index）是帮助MySQL高效获取数据的数据结构。提取句子主干，就可以得到索引的本质：索引是数据结构。我们知道，数据库查询是数据库的最主要功能之一。我们都希望查询数据的速度能尽可能的快，因此数据库系统的设计者会从查询算法的角度进行优化。最基本的查询算法当然是顺序查找（li...

2022-03-22

548

资源下载

更多资源

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长，特征是大鼻子、头戴帽子、身穿背带裤，还留着胡子。与他的双胞胎兄弟路易基一起，长年担任任天堂的招牌角色。

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题，腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构，目前腾讯云软件源站支持公网访问和内网访问。

Spring

Spring框架（Spring Framework）是由Rod Johnson于2002年提出的开源Java企业级应用框架，旨在通过使用JavaBean替代传统EJB实现方式降低企业级编程开发的复杂性。该框架基于简单性、可测试性和松耦合性设计理念，提供核心容器、应用上下文、数据访问集成等模块，支持整合Hibernate、Struts等第三方框架，其适用范围不仅限于服务器端开发，绝大多数Java应用均可从中受益。

WebStorm

WebStorm 是jetbrains公司旗下一款JavaScript 开发工具。目前已经被广大中国JS开发者誉为“Web前端开发神器”、“最强大的HTML5编辑器”、“最智能的JavaScript IDE”等。与IntelliJ IDEA同源，继承了IntelliJ IDEA强大的JS部分的功能。