通俗易懂的CAS
前言
Java并发编程系列番外篇C A S(Compare and swap)
,文章风格依然是图文并茂,通俗易懂,让读者们也能与面试官疯狂对线。
C A S
作为并发编程必不可少的基础知识,面试时C A S
也是个高频考点,所以说C A S
是必知必会,本文将带读者们深入理解C A S
。
大纲
C A S基本概念
C A S(compareAndSwap)
也叫比较交换,是一种无锁原子算法,映射到操作系统就是一条cmpxchg
硬件汇编指令(保证原子性),其作用是让C P U
将内存值更新为新值,但是有个条件,内存值必须与期望值相同,并且C A S
操作无需用户态与内核态切换,直接在用户态对内存进行读写操作(意味着不会阻塞/线程上下文切换)。
它包含3
个参数C A S(V,E,N)
,V
表示待更新的内存值,E
表示预期值,N
表示新值,当 V
值等于E
值时,才会将V
值更新成N
值,如果V
值和E
值不等,不做更新,这就是一次C A S
的操作。
简单说,C A S
需要你额外给出一个期望值,也就是你认为这个变量现在应该是什么样子的,如果变量不是你想象的那样,说明它已经被别人修改过了,你只需要重新读取,设置新期望值,再次尝试修改就好了。
C A S如何保证原子性
原子性是指一个或者多个操作在C P U
执行的过程中不被中断的特性,要么执行,要不执行,不能执行到一半(不可被中断的一个或一系列操作)。
为了保证C A S
的原子性,C P U
提供了下面两种方式
- 总线锁定
- 缓存锁定
总线锁定
总线(B U S
)是计算机组件间的传输数据方式,也就是说C P U
与其他组件连接传输数据,就是靠总线完成的,比如C P U
对内存的读写。
总线锁定是指C P U
使用了总线锁,所谓总线锁就是使用C P U
提供的LOCK#
信号,当C P U
在总线上输出LOCK#
信号时,其他C P U
的总线请求将被阻塞。
缓存锁定
总线锁定方式虽然保证了原子性,但是在锁定期间,会导致大量阻塞,增加系统的性能开销,所以现代C P U
为了提升性能,通过锁定范围缩小的思想设计出了缓存行锁定(缓存行是C P U
高速缓存存储的最小单位)。
所谓缓存锁定是指C P U
对缓存行进行锁定,当缓存行中的共享变量回写到内存时,其他C P U
会通过总线嗅探机制感知该共享变量是否发生变化,如果发生变化,让自己对应的共享变量缓存行失效,重新从内存读取最新的数据,缓存锁定是基于缓存一致性机制来实现的,因为缓存一致性机制会阻止两个以上C P U
同时修改同一个共享变量(现代C P U
基本都支持和使用缓存锁定机制)。
C A S的问题
C A S
和锁都解决了原子性问题,和锁相比没有阻塞、线程上下文你切换、死锁,所以C A S
要比锁拥有更优越的性能,但是C A S
同样存在缺点。
C A S
的问题如下
- 只能保证一个共享变量的原子操作
- 自旋时间太长(建立在自旋锁的基础上)
ABA
问题
只能保证一个共享变量原子操作
C A S
只能针对一个共享变量使用,如果多个共享变量就只能使用锁了,当然如果你有办法把多个变量整成一个变量,利用C A S
也不错,例如读写锁中state
的高低位。
自旋时间太长
当一个线程获取锁时失败,不进行阻塞挂起,而是间隔一段时间再次尝试获取,直到成功为止,这种循环获取的机制被称为自旋锁(spinlock
)。
自旋锁好处是,持有锁的线程在短时间内释放锁,那些等待竞争锁的线程就不需进入阻塞状态(无需线程上下文切换/无需用户态与内核态切换),它们只需要等一等(自旋),等到持有锁的线程释放锁之后即可获取,这样就避免了用户态和内核态的切换消耗。
自旋锁坏处显而易见,线程在长时间内持有锁,等待竞争锁的线程一直自旋,即CPU一直空转,资源浪费在毫无意义的地方,所以一般会限制自旋次数。
最后来说自旋锁的实现,实现自旋锁可以基于C A S
实现,先定义lockValue
对象默认值1
,1
代表锁资源空闲,0
代表锁资源被占用,代码如下
public class SpinLock { //lockValue 默认值1 private AtomicInteger lockValue = new AtomicInteger(1); //自旋获取锁 public void lock(){ // 循环检测尝试获取锁 while (!tryLock()){ // 空转 } } //获取锁 public boolean tryLock(){ // 期望值1,更新值0,更新成功返回true,更新失败返回false return lockValue.compareAndSet(1,0); } //释放锁 public void unLock(){ if(!lockValue.compareAndSet(1,0)){ throw new RuntimeException("释放锁失败"); } } }
上面定义了AtomicInteger
类型的lockValue
变量,AtomicInteger
是Java
基于C A S
实现的Integer
原子操作类,还定义了3个函数lock、tryLock、unLock
tryLock函数-获取锁
- 期望值1,更新值0
C A S
更新- 如果期望值与
lockValue
值相等,则lockValue
值更新为0
,返回true
,否则执行下面逻辑 - 如果期望值与
lockValue
值不相等,不做任何更新,返回false
unLock函数-释放锁
- 期望值
0
,更新值1
C A S
更新- 如果期望值与
lockValue
值相等,则lockValue
值更新为1
,返回true
,否则执行下面逻辑 - 如果期望值与
lockValue
值不相等,不做任何更新,返回false
lock函数-自旋获取锁
- 执行
tryLock
函数,返回true
停止,否则一直循环
从上图可以看出,只有tryLock
成功的线程(把lockValue
更新为0
),才会执行代码块,其他线程个tryLock
自旋等待lockValue
被更新成1
,tryLock
成功的线程执行unLock
(把lockValue
更新为1
),自旋的线程才会tryLock
成功。
ABA问题
C A S
需要检查待更新的内存值有没有被修改,如果没有则更新,但是存在这样一种情况,如果一个值原来是A
,变成了B
,然后又变成了A
,在C A S
检查的时候会发现没有被修改。
假设有两个线程,线程1
读取到内存值A
,线程1
时间片用完,切换到线程2
,线程2
也读取到了内存值A
,并把它修改为B
值,然后再把B
值还原到A
值,简单说,修改次序是A->B->A
,接着线程1
恢复运行,它发现内存值还是A
,然后执行C A S
操作,这就是著名的ABA
问题,但是好像又看不出什么问题。
只是简单的数据结构,确实不会有什么问题,如果是复杂的数据结构可能就会有问题了(使用AtomicReference
可以把C A S
使用在对象上),以链表数据结构为例,两个线程通过C A S
去删除头节点,假设现在链表有A->B
节点
- 线程
1
删除A
节点,B
节点成为头节点,正要执行C A S(A,A,B)
时,时间片用完,切换到线程2
- 线程
2
删除A、B
节点 - 线程
2
加入C、A
节点,链表节点变成A->C
- 线程
1
重新获取时间片,执行C A S(A,A,B)
- 丢失
C
节点
要解决A B A
问题也非常简单,只要追加版本号即可,每次改变时加1
,即A —> B —> A
,变成1A —> 2B —> 3A
,在Java
中提供了AtomicStampedRdference
可以实现这个方案(面试只要问了C A S
,就一定会问ABA
,这块一定要搞明白)。
唠嗑唠嗑
C A S
到这里就结束啦,当然了,后续会有Atomic
系列的文章,有了C A S
铺垫,后面的Atomic
也是十分简单的,另外这里有个福利想告知下给各位读者,阿星公众号明天有个回馈读者,送酷炫显示器一台的抽奖活动,还没关注的朋友们,可以提前关注啦,欢迎大家参与,万一中了呢~
历史好文推荐
关于我
这里是阿星,一个热爱技术的Java程序猿,公众号 <span style="color: Blue;">「程序猿阿星」</span> 里将会定期分享操作系统、计算机网络、Java、分布式、数据库等精品原创文章,2021,与您在 Be Better 的路上共同成长!。
非常感谢各位小哥哥小姐姐们能看到这里,原创不易,文章有帮助可以关注、点个赞、分享与评论,都是支持(莫要白嫖)!
愿你我都能奔赴在各自想去的路上,我们下篇文章见

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
OCR性能优化:从认识BiLSTM网络结构开始
摘要:想要对OCR进行性能优化,首先要了解清楚待优化的OCR网络的结构,本文从动机的角度来推演下基于Seq2Seq结构的OCR网络是如何一步步搭建起来的。 本文分享自华为云社区《OCR性能优化系列(一):BiLSTM网络结构概览》,原文作者:HW007。 OCR是指对图片中的印刷体文字进行识别,最近在做OCR模型的性能优化,用Cuda C将基于TensorFlow编写的OCR网络重写了一遍,最终做到了5倍的性能提升。通过这次优化工作对OCR网络的通用网络结构和相关的优化方法有较深的认识,计划在此通过系列博文记录下来,也作为对自己最近工作的一个总结和学习笔记。 想要对OCR进行性能优化,首先要了解清楚待优化的OCR网络的结构,在本文中我将尝试着从动机的角度来推演下基于Seq2Seq结构的OCR网络是如何一步步搭建起来的。 读懂此文的前提只需要了解在矩阵乘法中矩阵的维度变化规律,即n*p的矩阵乘以p*m的矩阵等于n*m的矩阵。如果知道CNN和RNN网络的结构,对机器学习模型的构造套路有点了解的话更好。 首先给出从本文要剖析的OCR BILSTM网络总体结构如下图: 接下来我将从这张图的右上...
- 下一篇
三个数据分析里最难攻破的“悖论”,每一个都令人费解
跟数据打的交道越多,就越可能对数据产生绝对的信赖感,但其实在实际业务中,数据往往会“说谎”,今天给大家介绍三个数据分析中常见的悖论: 1、辛普森悖论 辛普森悖论是数据分析中最常见的悖论之一,举个最实际的例子来说: 鸭堡某学期期末考试,考数学、物理、化学三科,A的数学比B高2分,物理比B高15分,化学比C高3分,请问A的总分是否比B高? 很多人会说,这不是废话么,问题太简单了,当然是A的总分比B高了! 实际上很可能A的总成绩低于B,别急着惊讶,我们不妨再看一个例子: 很多人都爱看NBA比赛,最近几年的骑勇大战,使得詹姆斯和库里在球迷心目中的印象非常深,有一场骑勇大战,詹姆斯和库里的两分球与三分球命中率如下表所示: 其中: 两分球命中率 = 两分球命中数 / 两分球出手数 * 100% 三分球命中率 = 三分球命中数 / 三分球出手数 * 100% 那么请问本场比赛,詹姆斯的投篮命中率,是否低于库里? 投篮命中率 = (两分球命中数 + 三分球命中数) / (两分球出手数 + 三分球出手数) * 100% 很多人也会说,这不是跟上面期末考试那个题一样简单嘛,这还用说嘛,肯定是詹姆斯的投...
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- Springboot2将连接池hikari替换为druid,体验最强大的数据库连接池
- Docker快速安装Oracle11G,搭建oracle11g学习环境
- CentOS7设置SWAP分区,小内存服务器的救世主
- Mario游戏-低调大师作品
- Docker使用Oracle官方镜像安装(12C,18C,19C)
- 2048小游戏-低调大师作品
- Jdk安装(Linux,MacOS,Windows),包含三大操作系统的最全安装
- MySQL8.0.19开启GTID主从同步CentOS8
- CentOS8安装Docker,最新的服务器搭配容器使用
- CentOS8安装MyCat,轻松搞定数据库的读写分离、垂直分库、水平分库