JVM系列之:Contend注解和false-sharing

2020-07-23 676

简介

现代CPU为了提升性能都会有自己的缓存结构，而多核CPU为了同时正常工作，引入了MESI，作为CPU缓存之间同步的协议。MESI虽然很好，但是不当的时候用也可能导致性能的退化。

到底怎么回事呢？一起来看看吧。

false-sharing的由来

为了提升处理速度，CPU引入了缓存的概念，我们先看一张CPU缓存的示意图：

CPU缓存是位于CPU与内存之间的临时数据交换器，它的容量比内存小的多但是交换速度却比内存要快得多。

CPU的读实际上就是层层缓存的查找过程，如果所有的缓存都没有找到的情况下，就是主内存中读取。

为了简化和提升缓存和内存的处理效率，缓存的处理是以Cache Line（缓存行）为单位的。

一次读取一个Cache Line的大小到缓存。

在mac系统中，你可以使用sysctl machdep.cpu.cache.linesize来查看cache line的大小。在linux系统中，使用getconf LEVEL1_DCACHE_LINESIZE来获取cache line的大小。

本机中cache line的大小是64字节。

考虑下面一个对象：

public class CacheLine {
    public  long a;
    public  long b;
}

很简单的对象，通过之前的文章我们可以指定，这个CacheLine对象的大小应该是12字节的对象头+8字节的long+8字节的long+4字节的补全，总共应该是32字节。

因为32字节< 64字节，所以一个cache line就可以将其包括。

现在问题来了，如果是在多线程的环境中，thread1对a进行累加，而thread2对b进行累加。会发生什么情况呢？

第一步，新创建出来的对象被存储到CPU1和CPU2的缓存cache line中。
thread1使用CPU1对对象中的a进行累计。
根据CPU缓存之间的同步协议MESI（这个协议比较复杂，这里就先不展开讲解），因为CPU1对缓存中的cache line进行了修改，所以CPU2中的这个cache line的副本对象将会被标记为I（Invalid）无效状态。
thread2使用CPU2对对象中的b进行累加，这个时候因为CPU2中的cache line已经被标记为无效了，所以必须重新从主内存中同步数据。

大家注意，耗时点就在第4步。虽然a和b是两个不同的long，但是因为他们被包含在同一个cache line中，最终导致了虽然两个线程没有共享同一个数值对象，但是还是发送了锁的关联情况。

怎么解决？

那怎么解决这个问题呢？

在JDK7之前，我们需要使用一些空的字段来手动补全。

public class CacheLine { 
     public  long actualValue; 
     public  long p0, p1, p2, p3, p4, p5, p6, p7; 
     }

像上面那样，我们手动填充一些空白的long字段，从而让真正的actualValue可以独占一个cache line，就没有这些问题了。

但是在JDK8之后，java文件的编译期会将无用的变量自动忽略掉，那么上面的方法就无效了。

还好，JDK8中引入了sun.misc.Contended注解，使用这个注解会自动帮我们补全字段。

使用JOL分析

接下来，我们使用JOL工具来分析一下Contended注解的对象和不带Contended注解的对象有什么区别。

[@Test](https://my.oschina.net/azibug)
public void useJol() {
        log.info("{}", ClassLayout.parseClass(CacheLine.class).toPrintable());
        log.info("{}", ClassLayout.parseInstance(new CacheLine()).toPrintable());
        log.info("{}", ClassLayout.parseClass(CacheLinePadded.class).toPrintable());
        log.info("{}", ClassLayout.parseInstance(new CacheLinePadded()).toPrintable());
    }

注意，在使用JOL分析Contended注解的对象时候，需要加上 -XX:-RestrictContended参数。

同时可以设置-XX:ContendedPaddingWidth 来控制padding的大小。

INFO com.flydean.CacheLineJOL - com.flydean.CacheLine object internals:
 OFFSET  SIZE   TYPE DESCRIPTION                               VALUE
      0     4        (object header)                           05 00 00 00 (00000101 00000000 00000000 00000000) (5)
      4     4        (object header)                           00 00 00 00 (00000000 00000000 00000000 00000000) (0)
      8     4        (object header)                           d0 29 17 00 (11010000 00101001 00010111 00000000) (1518032)
     12     4        (alignment/padding gap)                  
     16     8   long CacheLine.valueA                          0
     24     8   long CacheLine.valueB                          0
Instance size: 32 bytes
Space losses: 4 bytes internal + 0 bytes external = 4 bytes total

INFO com.flydean.CacheLineJOL - com.flydean.CacheLinePadded object internals:
 OFFSET  SIZE   TYPE DESCRIPTION                               VALUE
      0     4        (object header)                           05 00 00 00 (00000101 00000000 00000000 00000000) (5)
      4     4        (object header)                           00 00 00 00 (00000000 00000000 00000000 00000000) (0)
      8     4        (object header)                           d2 5d 17 00 (11010010 01011101 00010111 00000000) (1531346)
     12     4        (alignment/padding gap)                  
     16     8   long CacheLinePadded.b                         0
     24   128        (alignment/padding gap)                  
    152     8   long CacheLinePadded.a                         0
Instance size: 160 bytes
Space losses: 132 bytes internal + 0 bytes external = 132 bytes total

我们看到使用了Contended的对象大小是160字节。直接填充了128字节。

Contended在JDK9中的问题

sun.misc.Contended是在JDK8中引入的，为了解决填充问题。

但是大家注意，Contended注解是在包sun.misc，这意味着一般来说是不建议我们直接使用的。

虽然不建议大家使用，但是还是可以用的。

但如果你使用的是JDK9-JDK14,你会发现sun.misc.Contended没有了！

因为JDK9引入了JPMS（Java Platform Module System），它的结构跟JDK8已经完全不一样了。

经过我的研究发现，sun.misc.Contended, sun.misc.Unsafe，sun.misc.Cleaner这样的类都被移到了jdk.internal.**中，并且是默认不对外使用的。

那么有人要问了，我们换个引用的包名是不是就行了？

import jdk.internal.vm.annotation.Contended；

抱歉还是不行。

error: package jdk.internal.vm.annotation is not visible
  @jdk.internal.vm.annotation.Contended
                  ^
  (package jdk.internal.vm.annotation is declared in module
    java.base, which does not export it to the unnamed module)

好，我们找到问题所在了，因为我们的代码并没有定义module，所以是一个默认的“unnamed” module,我们需要把java.base中的jdk.internal.vm.annotation使unnamed module可见。

要实现这个目标，我们可以在javac中添加下面的flag：

--add-exports java.base/jdk.internal.vm.annotation=ALL-UNNAMED

好了，现在我们可以正常通过编译了。

padded和unpadded性能对比

上面我们看到padded对象大小是160字节，而unpadded对象的大小是32字节。

对象大了，运行的速度会不慢呢？

实践出真知，我们使用JMH工具在多线程环境中来对其进行测试：

@State(Scope.Benchmark)
@BenchmarkMode(Mode.AverageTime)
@OutputTimeUnit(TimeUnit.NANOSECONDS)
@Fork(value = 1, jvmArgsPrepend = "-XX:-RestrictContended")
@Warmup(iterations = 10)
@Measurement(iterations = 25)
@Threads(2)
public class CacheLineBenchMark {

    private CacheLine cacheLine= new CacheLine();
    private CacheLinePadded cacheLinePadded = new CacheLinePadded();

    @Group("unpadded")
    @GroupThreads(1)
    @Benchmark
    public long updateUnpaddedA() {
        return cacheLine.a++;
    }

    @Group("unpadded")
    @GroupThreads(1)
    @Benchmark
    public long updateUnpaddedB() {
        return cacheLine.b++;
    }

    @Group("padded")
    @GroupThreads(1)
    @Benchmark
    public long updatePaddedA() {
        return cacheLinePadded.a++;
    }

    @Group("padded")
    @GroupThreads(1)
    @Benchmark
    public long updatePaddedB() {
        return cacheLinePadded.b++;
    }

    public static void main(String[] args) throws RunnerException {
        Options opt = new OptionsBuilder()
                .include(CacheLineBenchMark.class.getSimpleName())
                .build();
        new Runner(opt).run();
    }
}

上面的JMH代码中，我们使用两个线程分别对A和B进行累计操作，看下最后的运行结果：

从结果看来虽然padded生成的对象比较大，但是因为A和B在不同的cache line中，所以不会出现不同的线程去主内存取数据的情况，因此要执行的比较快。

Contended在JDK中的使用

其实Contended注解在JDK源码中也有使用，不算广泛，但是都很重要。

比如在Thread中的使用：

比如在ConcurrentHashMap中的使用：

其他使用的地方：Exchanger,ForkJoinPool,Striped64。

感兴趣的朋友可以仔细研究一下。

总结

Contented从最开始的sun.misc到现在的jdk.internal.vm.annotation，都是JDK内部使用的class，不建议大家在应用程序中使用。

这就意味着我们之前使用的方式是不正规的，虽然能够达到效果，但是不是官方推荐的。那么我们还有没有什么正规的办法来解决false-sharing的问题呢？

有知道的小伙伴欢迎留言给我讨论！

本文链接：http://www.flydean.com/jvm-contend-false-sharing/

本文来源：flydean的博客

欢迎关注我的公众号:程序那些事，更多精彩等着您！

微信关注我们

原文链接：https://my.oschina.net/flydean/blog/4422539

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

分布式架构设计篇(六)-刚性事务之3PC详解

引言：2PC必须注意的问题咱们上文介绍了分布式事务的常见方案、类型划分、2PC的起源和流程。但是不幸的是2PC还是存在几个问题： 1、全流程的同步阻塞：不管是第一阶段还是第二阶段，所有参与节点都是事务阻塞型。当参与者占有公共资源时，其他第三方访问公共资源可能不得不处于阻塞状态。 2、TM单点故障：由于全流程依赖TM的协调，一旦TM发生故障。参与者会一直阻塞下去。尤其在第二阶段，TM发生故障，那么所有的参与者还都处于锁定事务资源的状态中，而无法继续完成事务操作。所有参与者必须等待TM重新上线(TM重新选举)后才能继续工作。 3、TM脑裂引起数据不一致：在第二阶段中，当TM向参与者发送commit请求之后，发生了局部网络异常或者在发送commit请求过程中TM发生了故障，这会导致只有一部分参与者接受到了commit请求。而在这部分参与者接到commit请求之后就会执行commit操作。但是其他部分未接到commit请求的机器则无法执行事务提交。于是整个分布式系统便出现了数据不一致性的现象。 4、TM脑裂引起事务状态不确定：TM再发出commit消息之后宕机，而接收到这条消息的参与者同时也...

2020-07-21

676

摘要：这篇文章将介绍图数据库 Nebula Graph 的查询语言 nGQL 和 SQL 的区别。本文首发于 Nebula Graph 官方博客：https://nebula-graph.com.cn/posts/sql-vs-ngql-comparison/ 虽然本文主要介绍 nGQL 和 SQL 的区别，但是我们不会深入探讨这两种语言，而是将这两种语言做对比，以帮助你从 SQL 过渡到 nGQL。 SQL (Structured Query Language) 是具有数据操纵和数据定义等多种功能的数据库语言，这种语言是一种特定目的编程语言，用于管理关系数据库管理系统（RDBMS），或在关系流数据管理系统（RDSMS）中进行流处理。 nGQL 是一种类 SQL 的声明型的文本查询语言，相比于 SQL， nGQL 为可扩展、支持图遍历、模式匹配、分布式事务（开发中）的图数据库查询语言。概念对比对比项 SQL nGQL 点 \ 点边 \ 边点类型 \ tag 边类型 \ edge type 点 ID 主键 vid 边 ID 复合主键起点、终点、rank 列列点或边的属性 ...

2020-07-23

885

资源下载

更多资源

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长，特征是大鼻子、头戴帽子、身穿背带裤，还留着胡子。与他的双胞胎兄弟路易基一起，长年担任任天堂的招牌角色。

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题，腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构，目前腾讯云软件源站支持公网访问和内网访问。

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称，一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集，帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Rocky Linux

Rocky Linux（中文名：洛基）是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版，作为CentOS稳定版停止维护后与RHEL（Red Hat Enterprise Linux）完全兼容的开源替代方案，由社区拥有并管理，支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性，采用模块化包装和SELinux安全架构，默认包含GNOME桌面环境及XFS文件系统，支持十年生命周期更新。

JVM系列之:Contend注解和false-sharing

简介

false-sharing的由来

怎么解决？

使用JOL分析

Contended在JDK9中的问题

padded和unpadded性能对比

Contended在JDK中的使用

总结

分布式架构设计篇(六)-刚性事务之3PC详解

文档解读｜关系型数据库查询语言 SQL 和图数据库查询语言 nGQL 对比

相关文章

发表评论

资源下载

Mario

腾讯云软件源

Nacos

Rocky Linux

欢迎您来访！

JVM系列之:Contend注解和false-sharing

简介

false-sharing的由来

怎么解决？

使用JOL分析

Contended在JDK9中的问题

padded和unpadded性能对比

Contended在JDK中的使用

总结

分布式架构设计篇(六)-刚性事务之3PC详解

文档解读 ｜ 关系型数据库查询语言 SQL 和图数据库查询语言 nGQL 对比

相关文章

发表评论

资源下载

Mario

腾讯云软件源

Nacos

Rocky Linux

欢迎您来访！

文档解读｜关系型数据库查询语言 SQL 和图数据库查询语言 nGQL 对比