Ignite在集群内存空间不足时的处理方式-低调大师

Ignite在集群内存空间不足时的处理方式

2020-06-27 893

如果内存空间即将用完，Ignite可以水平扩展以存储应用和服务生成的更多数据，这是Ignite的基础功能之一，因此增加资源是最简单的处理方法。但是实际上多数情况都无法立即扩展集群，通常都是为应用配置了固定内存容量的Ignite集群，增加更多资源可能是一项艰巨而持续的工作。

下面会介绍几种功能，这样即使在内存成为稀缺资源的情况下也可以保持集群的稳定运行。

配置Ignite退出策略以避免内存不足问题

数据退出是防止内存过度使用的经典机制，它通过监控正在使用的内存空间并在内存占用超过阈值时删除多余的数据，从而避免内存不足的问题。

Ignite支持多种退出策略，这些策略最终会在达到最大数据区大小时从内存中清除最近最少使用的页面，下面的代码片段显示了如何为自定义数据区启用DataPageEvictionMode.RANDOM_2_LRU策略：

DataStorageConfiguration storageCfg = new DataStorageConfiguration();

DataRegionConfiguration regionCfg = new DataRegionConfiguration();

regionCfg.setName("20GB_Region");

// 500 MB initial region size (RAM).
regionCfg.setInitialSize(500L * 1024 * 1024);

// 20 GB maximum region size (RAM).
regionCfg.setMaxSize(20L * 1024 * 1024 * 1024);

// Enabling RANDOM_2_LRU eviction for this region.
regionCfg.setPageEvictionMode(DataPageEvictionMode.RANDOM_2_LRU);

可以为纯内存集群以及将数据保存在外部数据库（例如Oracle或MySQL）中的集群配置退出策略，开启Ignite原生持久化的集群会忽略退出策略的配置，而是使用页面替换算法来控制内存空间的使用。

如果将Ignite退出策略用作内存不足场景的预防措施，则只有在以下情况下，Ignite才会自动恢复退出的数据：a）通过CacheStore接口连接的外部数据库具有该数据的副本，b）应用使用Ignite的键-值API读取数据，其他情况开发者都需要自行进行数据的重新加载。

使用Ignite的原生持久化读取仅在磁盘上的数据

Ignite的多层存储可以将原生持久化配置为磁盘层。启用原生持久化后，它会将所有数据包括索引存储在磁盘上，然后开发者可以决定在内存中缓存多少数据。即使数据不在内存中，应用也可以访问仅仅保存在磁盘上的数据。

原生持久化的配置很简单，将DataRegionConfiguration.persistenceEnabled属性配置为true时，Ignite就会在磁盘上保存与该数据区有关的所有数据：

DataStorageConfiguration storageCfg = new DataStorageConfiguration();

DataRegionConfiguration regionCfg = new DataRegionConfiguration();

regionCfg.setName("20GB_Region");

// 500 MB initial region size (RAM).
regionCfg.setInitialSize(500L * 1024 * 1024);

// 20 GB maximum region size (RAM).
regionCfg.setMaxSize(20L * 1024 * 1024 * 1024);

// Enable Ignite Native Persistence for all the data from this data region.
regionCfg.setPersistenceEnabled(true);

因为持久化是在数据区上配置的，因此只需为可能会溢出的缓存和表设置持久化即可。通常来说，应为所有数据区打开持久化，然后决定是否为一个或多个数据子集关闭持久化。

凭借原生持久化，Ignite不会对集群进行API限制。相反，如果在内存中找不到记录，则所有Ignite API（包括SQL和ScanQueries）都可以从磁盘查找记录。此功能消除了应用由于退出而需要重新加载数据的负担，而且Ignite通过页面替换还可以避免内存空间过度消耗。尽管该算法会自动从内存中删除记录，但它不会触及磁盘上的副本，只要应用需要，就可以将其拉回到内存层。

使用更大的堆和无暂停的垃圾收集器来消除Java堆的问题

Ignite将所有数据包括索引都存储在堆外内存中，该内存通常称为页面内存（由于其组织和管理方式）。Ignite像现代操作系统一样，将空间分成固定大小的页面，并将数据保存在这些页面中。如前所述，如果有可能耗尽堆外内存，则可以使用退出策略和原生持久化。

同时，与任何Java中间件一样，Ignite使用Java堆作为应用请求的对象和数据的临时存储。例如，当通过键-值或SQL调用检索数据时，所请求的堆外数据的副本将在Java堆中维护，并在将基于堆的结果集传输到应用端后进行垃圾回收。

如果开始用完Java堆空间，那么JVM很可能不会生成导致集群节点故障的内存溢出异常，而是会在集群节点上观察到长时间的垃圾回收暂停。暂停会影响集群的性能，并可能导致未响应的节点故障。

解决此问题的常规方法是分配一个足够大的Java堆，以在生产负载下处理应用的所有请求。堆大小是场景相关的，每个集群节点可以小至3GB或大至30GB。

高吞吐量和低延迟的应用通常需要更大的Java堆。对于此类应用，也可以考虑使用不暂停的Java垃圾收集器，例如Azul Zing JVM的C4，无论堆大小如何，该垃圾收集器均显示可靠且一致的性能结果。

通过SQL的内存配额使Java堆使用情况可预测

SQL查询是Ignite中最消耗Java堆的操作之一。单个查询可以扫描成千上万个表记录，对内存中的数百个记录进行分组和排序，以及关联保存在多个表中的数据。下图显示了查询执行过程的所有步骤，计算阶段使用Java堆最多：

通常来说，在许多Ignite环境中，最终Java堆大小受基于SQL的操作的需求影响，上一节中关于更大的Java堆的建议适用于SQL。但是也可以配置内存配额以更好地管理Java堆空间的使用。

内存配额专为SQL设计，可在GridGain社区版和GridGain的其他版本中使用，以下配置示例显示了如何为每个集群节点设置配额：

// Creating Ignite configuration.
IgniteConfiguration cfg = new IgniteConfiguration();

// Defining SQL configuration.
SqlConfiguration sqlCfg = new SqlConfiguration();

// Setting the global quota per cluster node.
// All the running SQL queries combined cannot use more memory as set here.
sqlCfg.setSqlGlobalMemoryQuota("500M");

// Setting per query quota per cluster node.
// A single running SQL query cannot use more memory as set below.
sqlCfg.setSqlQueryMemoryQuota("40MB");

// If any of the quotas is exceeded, Ignite will start offloading result sets to disk.
sqlCfg.setSqlOffloadingEnabled(true);

cfg.setSqlConfiguration(sqlCfg);

使用此配置，单个Ignite集群节点可以使用不超过500MB的堆空间来满足正在运行的SQL查询的需求。另外，SqlConfiguration.setSqlQueryMemoryQuota指定Ignite不允许任何单独的SQL查询消耗超过40MB的堆。最后，如果超出了每个查询或全局配额，则Ignite开始将查询的结果集卸载到磁盘层（如启用SqlConfiguration.setSqlOffloadingEnabled参数，则和任何关系数据库一样），如果禁用了磁盘卸载功能，则超过配额的查询将终止，并抛出异常。

因此，建议使用磁盘卸载功能来启用配额，尤其是在应用要对数据执行排序（SORT BY）或分组（DISTINCT，GROUP BY）或使用子查询或者关联运行复杂查询时。

总结

本文讨论的所有技术点都可以解决内存过度消耗的问题，但是要注意，这些功能一旦触发，就会影响应用的性能。集群会更积极地使用磁盘（原生持久化进行页面替换，以及将SQL结果集卸载到磁盘上），或者通过从集群中删除记录来使记录不可用（退出策略）。

微信关注我们

原文链接：https://my.oschina.net/liyuj/blog/4326546

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

都在讲DevOps，但你知道它的发展趋势吗？

根据最近的一项集体研究，DevOps的市场在2017年创造了约29亿美元的产值，预计到2022年，这个数字将达到约66亿美元。人工智能的融入和安全性的融入，加上向自动化的巨大转变，可合理预测，在2020年，DevOps将成为软件工程的主流模式。 DevOps具有以下优势： ●对需求变更的迅速响应 ●超快的交付速度及灵活的安全部署 ●建立完善的协作沟通渠道 ●快速识别代码中的错误或漏洞 ●让团队将注意力集中在其他关键的事情上，而不是集中在安全特性上越来越多的企业正采用DevOps的产品交付模式：根据Statista的统计数据，全面采用DevOps的企业数量从2017年的约10%增长到了2018年的17%。而devops也将在2020年迎来新趋势。自动化成为焦点实施DevOps产品交付模式的组织已经见证了极高的效率和超快速的部署速度。在提到DevOps时，我们主要讨论的是DevOps自动化，零接触自动化是未来的发展方向。在DevOps生命周期的7C（持续发展、持续集成、持续测试、持续反馈、持续监测、持续部署、持续运维）中，应用自动化是未来的关键，因为预计这将是2020年的主要目...

2020-06-24

680

一、背景在微服务架构中 API网关非常重要，网关作为全局流量入口并不单单是一个反向路由，更多的是把各个边缘服务(Web层)的各种共性需求抽取出来放在一个公共的“服务”(网关)中实现，例如安全认证、权限控制、限流熔断、监控、跨域处理、聚合API文档等公共功能。在以 Dubbo 框架体系来构建的微服务架构下想要增加API网关，如果不想自研开发的情况下在目前的开源社区中几乎没有找到支持dubbo协议的主流网关，但是 Spring Cloud 体系下却有两个非常热门的开源API网关可以选择；本文主要介绍如何通过 Nacos 整合 Spring Cloud Gateway 与 Dubbo 服务。二、传统 dubbo 架构 dubbo属于rpc调用，所以必须提供一个web层的服务作为http入口给客户端调用，并在上面提供安全认证等基础功能，而web层前面对接Nginx等反向代理用于统一入口和负载均衡。 web层一般是根据业务模块来切分的，用于聚合某个业务模块所依赖的各个service服务 PS：我们能否把上图中的web层全部整合在一起成为一个API网关呢？(不建议这样做) 因为这样的w...

2020-06-28

773

资源下载

更多资源

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长，特征是大鼻子、头戴帽子、身穿背带裤，还留着胡子。与他的双胞胎兄弟路易基一起，长年担任任天堂的招牌角色。

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题，腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构，目前腾讯云软件源站支持公网访问和内网访问。

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称，一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集，帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Rocky Linux

Rocky Linux（中文名：洛基）是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版，作为CentOS稳定版停止维护后与RHEL（Red Hat Enterprise Linux）完全兼容的开源替代方案，由社区拥有并管理，支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性，采用模块化包装和SELinux安全架构，默认包含GNOME桌面环境及XFS文件系统，支持十年生命周期更新。