🏆Java技术专题-JVM研究系列（36）性能调优之CMS垃圾回收器（上）

2021-06-18 592

前提概要

如果没有冬天，春天不会如此悦人；如果没有偶尔的不幸，幸运不会如此受人欢迎。

CMS垃圾回收的6个重要阶段

initial-mark 初始标记（CMS的第一个STW阶段），标记GC Root直接引用的对象，GC Root直接引用的对象不多，所以很快。
concurrent-mark并发标记阶段，由第一阶段标记过的对象出发，所有可达的对象都在本阶段标记。
concurrent-preclean 并发预清理阶段，也是一个并发执行的阶段。在本阶段，会查找前一阶段执行过程中，[从新生代晋升或新分配或被更新的对象]。通过并发地重新扫描这些对象，预清理阶段可以减少下一个stop-the-world 重新标记阶段的工作量。
concurrent-abortable-preclean，并发可中止的预清理阶段。这个阶段其实跟上一个阶段做的东西一样，也是为了减少下一个STW重新标记阶段的工作量。增加这一阶段是为了让我们可以控制这个阶段的结束时机，比如扫描多长时间（默认5秒）或者Eden区使用占比达到期望比例（默认50%）就结束本阶段。
remark重标记阶段（CMS的第二个STW阶段），暂停所有用户线程，从GC Root开始重新扫描整堆，标记存活的对象。需要注意的是，虽然CMS只回收老年代的垃圾对象，但是这个阶段依然需要扫描新生代，因为很多GC Root都在新生代，而这些GC Root指向的对象又在老年代，这称为“跨代引用”。
concurrent-sweep ，并发清理。

分析

分析其GC日志，发现GC发生在CMS的收集阶段。

箭头1 显示abortable-preclean阶段耗时4.04秒。
箭头2 显示的是remark阶段，耗时0.11秒。
虽然abortable-preclean阶段是concurrent的，不会暂停其他的用户线程。就算不优化，可能影响也不大。

调优之前先看下该应用的GC统计数据，包括GC次数，耗时：

统计期间内(18天)发生CMS GC 69次，其中abortable preclean阶段平均耗时2.45秒，final remark阶段平均112ms,最大耗时170ms。

优化目标

降低abortable preclean时间，而且不增加final remark的时间（因为remark是STW的）。

JVM参数调优

第一次调优

先尝试调低abortable preclean阶段的时间，看看效果。

有两个参数可以控制这个阶段何时结束：

-XX:CMSMaxAbortablePrecleanTime=5000

默认值5s，代表该阶段最大的持续时间

-XX:CMSScheduleRemarkEdenPenetration=50

默认值50%，代表Eden区使用比例超过50%就结束该阶段进入remark

调整为最大持续时间为1s，Eden区使用占比10%，如下：

-XX:CMSMaxAbortablePrecleanTime=1000

-XX:CMSScheduleRemarkEdenPenetration=10

为什么调整成这样两个值：首先每次CMS都发生在老年代使用占比达到80%时，因为这是由下面两个参数决定的：

-XX:CMSInitiatingOccupancyFraction=80
-XX:+UseCMSInitiatingOccupancyOnly

这两个设置一般配合使用,一般用于『降低CMS GC频率或者增加频率、减少GC时长』的需求

-XX:CMSInitiatingOccupancyFraction=80 是指设定CMS在对内存占用率达到80%的时候开始GC(因为CMS会有浮动垃圾,所以一般都较早启动GC);
-XX:+UseCMSInitiatingOccupancyOnly ：标志来命令JVM不基于运行时收集的数据来启动CMS垃圾收集周期。

当该标志被开启时，JVM通过CMSInitiatingOccupancyFraction的值进行每一次CMS收集，而不仅仅是第一次。(否则后续会动态控制回收阈值)

(慎用) 因此，只有当我们充足的理由(比如测试)并且对应用程序产生的对象的生命周期有深刻的认知时，才应该使用该标志。

老年代的增长是由于部分对象在Minor GC后仍然存活，被晋升到老年代，导致老年代使用占比增长的，也就是在每次CMS GC发生之前刚刚发生过一次Minor GC，所以在那一刻新生代的使用占比是很低的。

那么我们预计这个时候尽快结束abortable preclean阶段，在remark时就不需要扫描太多的Eden区对象，remark STW的时间也就不会太长。

第一次调整参数

在统计期间（17小时左右）内，发生过2次CMS GC。Abortable Preclean 平均耗时835ms，这是预期内的。但是Final Remark 平均耗时495ms（调整前是112ms），其中一次是80ms，另一次是910ms！将近1秒钟！Remark是STW的！对于要求低延时的应用来说这是无法接受的！

[YG occupancy: 181274 K (1887488 K)] - 年轻代当前占用情况和总容量

耗时80ms的这次remark发生时（早上9点，非高峰时段），新生代（YG）占用181.274M。

remark耗时910ms的那次GC日志

[YG occupancy: 773427 K (1887488 K)]

耗时910ms的这次remark发生时（晚上10点左右，高峰时段），新生代（YG）占用773.427M。因为这个时候高峰期，新生代的占用量上升的非常快，几乎同样的时间内，非高峰时段仅上升到181M，但是高峰时段就上升到773M。

如果abortale preclean阶段时间太短，随后在remark时，新生代占用越大，则remark持续的时间（STW）越长。
不缩短abortale preclean耗时会出现过程gc；缩短的话，remark阶段又会变长，而且是STW，更不能接受。

对于这种情况，CMS提供了CMSScavengeBeforeRemark参数，尝试在remark阶段之前进行一次Minor GC，以降低新生代的占用。

第二次调优

增加 -XX:+CMSScavengeBeforeRemark 不是没有代价的，因为这会增加一次Minor GC停顿。所以这个方案好或者不好的判断标准就是：增加CMSScavengeBeforeRemark参数之后的minor GC停顿时间 + remark 停顿时间如果比增加之前的remark GC停顿时间要小，这才是好的方案。

-XX:+CMSScavengeBeforeRemark：在CMS GC前启动一次ygc，目的在于减少old gen对ygc gen的引用，降低remark时的开销-----一般CMS的GC耗时 80%都在remark阶段

第二次调整的结果

在统计期间（20小时左右）内，发生3次CMS GC。Abortable preclean 平均耗时693ms。Final remark平均耗时50ms，最大耗时60ms。Final remark的时间比调优前的平均时间（112ms）更低。

3次CMS GC remark前的Minor GC日志分析

第1次是非高峰时段的表现，Minor GC 耗时 0.01s + remark耗时 0.06s = 0.07s = 70ms，如下第2次是高峰时段，Minor GC 耗时 0.01s + remark耗时 0.05s = 0.06s = 60ms，如下第3次是非高峰时段，Minor GC 耗时 0.00s + remark耗时 0.04s = 0.04s = 40ms，如下

所以，3次Minor GC + remark耗时的平均耗时 < 60ms,这比第一次调优时remark平均耗时495ms好得多了。

总结

解决abortable preclean 时间过长的方案可以归结为两步：

缩短abortable preclean 时长，通过调整这两个参数：

-XX:CMSMaxAbortablePrecleanTime=xxx

-XX:CMSScheduleRemarkEdenPenetration=xxx

调整为多少的一个判断标准是：abortable preclean阶段结束时，新生代的空间占用不能大于某个参考值。在前面第一次调优后，新生代（YG）占用181.274M，remark耗时80ms；新生代（YG）占用773.427M时，remark耗时910ms。所以这个参考值可以是300M。
而如果新生代增长过快，像这次调优应用2秒内就能用光2G新生代堆空间的，就只能通过CMSScavengeBeforeRemark做一次Minor GC了。

增加CMSScavengeBeforeRemark参数开启remark前进行Minor GC的尝试

虽然官方说明这个增加这个参数是尝试进行Minor GC，不一定会进行。但实际使用起来，几乎每次remark前都会Minor GC。

微信关注我们

原文链接：https://my.oschina.net/liboware/blog/5083162

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

MateCloud 3.7.8 正式版发布， Spring Cloud Alibaba 的微服务平台

一、升级说明 1.1、功能升级 #32 优化mate-starter-lock分布式锁的bug @aaronuu 新增自定义验证框架 @aaronuu #I3UFXE 修复消息消费多个的bug @madi 1.2、依赖升级升级至RocketMQ 4.9.0 升级至 Seata 1.4.2 升级至Mybatis Plus 3.4.3.1 升级至elasticsearch 7.13.2 二、平台说明 MateCloud 是一款基于Spring Cloud Alibaba的微服务架构。目前已经整合 Spring Cloud Gateway、Spring Security Oauth2、Feign、Dubbo、JetCache、RocketMQ 等服务套件，旨在为用户者提供技术框架的基础能力的封装，减少开发工作，可以专心于业务。 2.1 功能特点采用最新的 Spring Cloud Hoxton SR8, Spring Boot 2.3.7.RELEASE, Spring Cloud Alibaba 2.2.3.RELEASE 版本进行系统设计支持 nacos 作为注册中心，实现多配置、...

2021-06-19

734

如果你的简历上这么写，熟练掌握Spring，并对Spring源码有一定的见解（或者是读过Spring源码），那么无法避免的就是要问几个问题。 IOC的实现原理是什么？ AOP底层是如何实现的？因为这些基本上都是面试必然要准备的题目，所以如果你能粗略的说上一些来，就可能会问一些Spring中使用到的接口，就比如今天我们要说的BeanFactory和FactoryBean有什么不一样（区别）？如果你确实有些疑惑，那么接着看下去吧。什么是BeanFactory？其实Spring的源码中，当然很多知名技术的源码也一样，其中声明的类、接口，亦或者变量，都是能凭借英文看出大概的意思来的。这个BeanFactory就是这样，首先字面意思就是Bean工厂，再转换一下思路，也就是个Bean容器了。先看源代码，上图！可以看到BeanFactory是一个接口，它在Spring中是最基础的接口之一了，作用就是定义获取bean及bean的各种属性，在源代码中也可以看出来，里面有我们在编码过程中常用到的getBean()方法。如果你看过一些Spring源码，知道其中有一个XmlBeanFactor...

2021-06-19

727

资源下载

更多资源

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题，腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构，目前腾讯云软件源站支持公网访问和内网访问。

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称，一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集，帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能，例如代码缩略图，Python的插件，代码段等。还可自定义键绑定，菜单和工具栏。Sublime Text 的主要功能包括：拼写检查，书签，完整的 Python API ， Goto 功能，即时项目切换，多选择，多窗口等等。Sublime Text 是一个跨平台的编辑器，同时支持Windows、Linux、Mac OS X等操作系统。

WebStorm

WebStorm 是jetbrains公司旗下一款JavaScript 开发工具。目前已经被广大中国JS开发者誉为“Web前端开发神器”、“最强大的HTML5编辑器”、“最智能的JavaScript IDE”等。与IntelliJ IDEA同源，继承了IntelliJ IDEA强大的JS部分的功能。

🏆Java技术专题-JVM研究系列（36）性能调优之CMS垃圾回收器（上）

前提概要

CMS垃圾回收的6个重要阶段

分析

优化目标

JVM参数调优

第一次调优

第一次调整参数

第二次调优

第二次调整的结果

总结

MateCloud 3.7.8 正式版发布， Spring Cloud Alibaba 的微服务平台

高频面试题-请聊一下Spring中BeanFactory与FactoryBean的区别！

相关文章

发表评论

资源下载

腾讯云软件源

Nacos

Sublime Text

WebStorm

欢迎您来访！

🏆Java技术专题-JVM研究系列（36） 性能调优之CMS垃圾回收器（上）

前提概要

CMS垃圾回收的6个重要阶段

分析

优化目标

JVM参数调优

第一次调优

第一次调整参数

第二次调优

第二次调整的结果

总结

MateCloud 3.7.8 正式版发布， Spring Cloud Alibaba 的微服务平台

高频面试题-请聊一下Spring中BeanFactory与FactoryBean的区别！

相关文章

发表评论

资源下载

腾讯云软件源

Nacos

Sublime Text

WebStorm

欢迎您来访！

🏆Java技术专题-JVM研究系列（36）性能调优之CMS垃圾回收器（上）