MaxCompute资源管理—— 包年包月资源组隔离

2020-08-30 709

概述

使用基于MaxCompute云数据仓库的企业，由于业务的差异，会创建多project进行数据隔离。同时也因为业务的差异，每个project需要跑的任务量、业务紧急程度等也有差异，因此不同project对计算资源的需求也不一致。本文我们一起探讨如何通过MaxCompute管家实现MaxCompute包年包月的资源隔离。

背景信息

默认预付费Quota：购买包年包月计算资源后，默认创建的配额组，该配额组不支持修改；升级或降配时，对应的CU量都在这个配额组中进行增减。
管家中支持创建配额组（自定义配额组），自定义的配额组里预留CU的最小值和非预留CU的值将从默认配额组对应的值里进行扣减。
所有配额组预留CU的最小值相加等于购买的预留CU量；所有配额组的非预留CU值相加等于购买的非预留CU量。
配额组中，预留CU的最小和最大值分别代表：
- 最小值：保障值。
- 最大值：可使用的最大值（最大可设置为购买的预留CU量）。当有多个配额组且配置了最小值<最大值是，一旦有配额组资源为空闲的时候，则可以占用。
```
>当有配额组最小值<最大值 时，说明配额组是有可能会抢占其他配额组空闲资源，因此会导致所有配额组都是共享（当前账号当前region范围）资源组。
```

使用案例

需求背景
公司使用到MaxComput进行大数据开发、分析、挖掘的业务大致为：数仓开发和生产、运营分析需求、算法挖掘。因而也创建了不同的project进行数据业务划分，project业务特点如下：

数仓project，分开发和生产，且按数仓模型分层划分project。
运营分析project，主要提供给业务部分进行日常数据分析取数，根据业务部分需求建不同部门专用project。
算法挖掘，分开发和生产，根据作业周期特点划分project。

根据前期业务评估当前购买的计算资源为预留CU量1000CU，非预留CU量600CU。现在需要将这些计算资源合理的进行隔离分配，以便能最大化提升资源使用率。

资源划分
资源划分可参考几个注意点：

高保障project主要配预留CU，非预留CU可作为加持资源。
预留CU最小值要根据实际配置避免滥用。
对于非高保障，优先级也不高但是会有可能请求大量资源的项目，对应配额组的最大值建议控制范围，影响以免其他资源组资源。
平均占用资源时间较长的考虑隔离独立配额组，同时最大值建议控制范围。
对时效性要求不高，资源占用频率高可以考虑非预留CU。
可根据实际情况结合资源分时功能。
因为默认配额组不可修改包括CU最大值，若不想让某些项目发起的任务可能会占用所有的CU量，那么可以考虑默认配额组不关联项目。由于默认配额组预留CU最小值不能为0，则可以留1CU，然后其他配额组里配置预留CU最小值<最大值，则其他配额组也依然能占用这1CU。

配额组设计如下：

综上所述，因为考虑到业务特点，配额组的预留CU最大值都进行了限制，避免严重影响其他配额组的最低保障值。在MaxCompute管家上进行配额组设计管理时，按上述表格，默认配额组不能关联项目，但预留CU最小值又必须大于0，可以选择保留1CU，可以选择上述数仓开发项目最小CU值减1。具体配置步骤如下：

先进行分时设置，把配额分为00:00:00-09:00:00、09:00:00-23:59:59 两个时段。
再分别新增配额组，设置数仓生产、数仓开发、运营、算法相关配额组。
最后分别将项目关联对应的配额组，默认配额组不关联项目。

总结

随着业务变化，配额组的划分也会可能需要随之变化，所以有必要随时监控配额组的使用情况，以便及时对配额组进行调整。关于配额组监控，您可以通过云监控的"MaxCompute-包年包月Quota组资源"指标进行监控，详情请参考文档j监控告警。
另外，您还可以结合MaxCompute更多的资源管理功能如包年包月项目任务使用按量付费资源、包年包月项目任务优先级进行更精细的资源管理。

微信关注我们

原文链接：https://yq.aliyun.com/articles/771251

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

8月27日 Spark 社区直播【OAP Spark 优化介绍: 通过索引和缓存优化交互式查询性能】

主题： OAP Spark 优化介绍: 通过索引和缓存优化交互式查询性能直播时间： 8月27日 19:00 观看方式：届时进入直播间（回看链接也是这个）：https://developer.aliyun.com/live/43848?spm=5176.8068049.0.0.27366d19Q1XzyT 或扫描下方钉钉群二维码进群观看讲师介绍：陈海锋，英特尔亚太研发有限公司大数据部门的高级软件架构师，开发经理，主要研究和关注基于Hadoop和Spark的大数据框架的分析和优化，Apache社区的长期贡献者。沈祥翔，英特尔亚太研发有限公司大数据部门的高级软件工程师，主要担任OAP项目的开发。直播介绍：简单介绍OAP的总体蓝图。同时详细介绍其中的一个具体优化，使用索引和缓存来解决交互式查询性能挑战。英特尔和社区合作，为Spark SQL实现了索引和数据源缓存，通过为关键查询列创建并存储完整的B +树索引，并使用智能的细粒度数据缓存策略，我们可以极大的提升基于Spark SQL的交互式查询的性能。

2020-08-24

737

作者 | 介龙平，英文名 leo，码农一枚【Arthas 官方社区正在举行征文活动，参加即有奖品拿~点击投稿】 1. 异常突起 HBase 集群的某一个 RegionServer 的 CPU 使用率突然飙升到百分之百，单独重启该 RegionServer 之后，CPU 的负载依旧会逐渐攀上顶峰。多次重启集群之后，CPU 满载的现象依然会复现，且会持续居高不下，慢慢地该 RegionServer 就会宕掉，慢慢地 HBase 集群就完犊子了。 2. 异常之上的现象 CDH 监控页面来看，除 CPU 之外的几乎所有核心指标都是正常的，磁盘和网络 IO 都很低，内存更是充足，压缩队列，刷新队列也是正常的。普罗米修斯的监控也是类似这样的，就不贴图了。监控指标里的数字，只能直观地告诉我们现象，不能告诉我们异常的起因。因此我们的第二反应是看日志。（企业微信截图）与此同时，日志中还有很多类似这样的干扰输出。后来发现这样的输出只是一些无关紧要的信息，对分析问题没有任何帮助，甚至会干扰我们对问题的定位。但是，日志中大量 scan responseTooSlow 的警告信息，似乎在告诉我们，...

2020-08-30

589

资源下载

更多资源

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题，腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构，目前腾讯云软件源站支持公网访问和内网访问。

Spring

Spring框架（Spring Framework）是由Rod Johnson于2002年提出的开源Java企业级应用框架，旨在通过使用JavaBean替代传统EJB实现方式降低企业级编程开发的复杂性。该框架基于简单性、可测试性和松耦合性设计理念，提供核心容器、应用上下文、数据访问集成等模块，支持整合Hibernate、Struts等第三方框架，其适用范围不仅限于服务器端开发，绝大多数Java应用均可从中受益。

Rocky Linux

Rocky Linux（中文名：洛基）是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版，作为CentOS稳定版停止维护后与RHEL（Red Hat Enterprise Linux）完全兼容的开源替代方案，由社区拥有并管理，支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性，采用模块化包装和SELinux安全架构，默认包含GNOME桌面环境及XFS文件系统，支持十年生命周期更新。

WebStorm

WebStorm 是jetbrains公司旗下一款JavaScript 开发工具。目前已经被广大中国JS开发者誉为“Web前端开发神器”、“最强大的HTML5编辑器”、“最智能的JavaScript IDE”等。与IntelliJ IDEA同源，继承了IntelliJ IDEA强大的JS部分的功能。

MaxCompute资源管理—— 包年包月资源组隔离

概述

背景信息

使用案例

总结

8月27日 Spark 社区直播【OAP Spark 优化介绍: 通过索引和缓存优化交互式查询性能】

用 Arthas 神器来诊断 HBase 异常进程

相关文章

发表评论

资源下载

腾讯云软件源

Spring

Rocky Linux

WebStorm

欢迎您来访！