通俗易懂的CAS

2021-05-21 695

前言

Java并发编程系列番外篇C A S（Compare and swap），文章风格依然是图文并茂，通俗易懂，让读者们也能与面试官疯狂对线。

C A S作为并发编程必不可少的基础知识，面试时C A S也是个高频考点，所以说C A S是必知必会，本文将带读者们深入理解C A S。

大纲

C A S基本概念

C A S（compareAndSwap）也叫比较交换，是一种无锁原子算法，映射到操作系统就是一条cmpxchg硬件汇编指令（保证原子性），其作用是让C P U将内存值更新为新值，但是有个条件，内存值必须与期望值相同，并且C A S操作无需用户态与内核态切换，直接在用户态对内存进行读写操作（意味着不会阻塞/线程上下文切换）。

它包含3个参数C A S（V，E，N），V表示待更新的内存值，E表示预期值，N表示新值，当 V值等于E值时，才会将V值更新成N值，如果V值和E值不等，不做更新，这就是一次C A S的操作。

简单说，C A S需要你额外给出一个期望值，也就是你认为这个变量现在应该是什么样子的，如果变量不是你想象的那样，说明它已经被别人修改过了，你只需要重新读取，设置新期望值，再次尝试修改就好了。

C A S如何保证原子性

原子性是指一个或者多个操作在C P U执行的过程中不被中断的特性，要么执行，要不执行，不能执行到一半（不可被中断的一个或一系列操作）。

为了保证C A S的原子性，C P U提供了下面两种方式

总线锁定
缓存锁定

总线锁定

总线（B U S）是计算机组件间的传输数据方式，也就是说C P U与其他组件连接传输数据，就是靠总线完成的，比如C P U对内存的读写。

总线锁定是指C P U使用了总线锁，所谓总线锁就是使用C P U提供的LOCK#信号，当C P U在总线上输出LOCK#信号时，其他C P U的总线请求将被阻塞。

缓存锁定

总线锁定方式虽然保证了原子性，但是在锁定期间，会导致大量阻塞，增加系统的性能开销，所以现代C P U为了提升性能，通过锁定范围缩小的思想设计出了缓存行锁定（缓存行是C P U高速缓存存储的最小单位）。

所谓缓存锁定是指C P U对缓存行进行锁定，当缓存行中的共享变量回写到内存时，其他C P U会通过总线嗅探机制感知该共享变量是否发生变化，如果发生变化，让自己对应的共享变量缓存行失效，重新从内存读取最新的数据，缓存锁定是基于缓存一致性机制来实现的，因为缓存一致性机制会阻止两个以上C P U同时修改同一个共享变量（现代C P U基本都支持和使用缓存锁定机制）。

C A S的问题

C A S和锁都解决了原子性问题，和锁相比没有阻塞、线程上下文你切换、死锁，所以C A S要比锁拥有更优越的性能，但是C A S同样存在缺点。

C A S的问题如下

只能保证一个共享变量的原子操作
自旋时间太长（建立在自旋锁的基础上）
ABA问题

只能保证一个共享变量原子操作

C A S只能针对一个共享变量使用，如果多个共享变量就只能使用锁了，当然如果你有办法把多个变量整成一个变量，利用C A S也不错，例如读写锁中state的高低位。

自旋时间太长

当一个线程获取锁时失败，不进行阻塞挂起，而是间隔一段时间再次尝试获取，直到成功为止，这种循环获取的机制被称为自旋锁(spinlock)。

自旋锁好处是，持有锁的线程在短时间内释放锁，那些等待竞争锁的线程就不需进入阻塞状态（无需线程上下文切换/无需用户态与内核态切换），它们只需要等一等（自旋），等到持有锁的线程释放锁之后即可获取，这样就避免了用户态和内核态的切换消耗。

自旋锁坏处显而易见，线程在长时间内持有锁，等待竞争锁的线程一直自旋，即CPU一直空转，资源浪费在毫无意义的地方，所以一般会限制自旋次数。

最后来说自旋锁的实现，实现自旋锁可以基于C A S实现，先定义lockValue对象默认值1，1代表锁资源空闲，0代表锁资源被占用，代码如下

public class SpinLock {
    
    //lockValue 默认值1
    private AtomicInteger lockValue = new AtomicInteger(1);
    
    //自旋获取锁
    public void lock(){

        // 循环检测尝试获取锁
        while (!tryLock()){
            // 空转
        }

    }
    
    //获取锁
    public boolean tryLock(){
        // 期望值1，更新值0，更新成功返回true，更新失败返回false
        return lockValue.compareAndSet(1,0);
    }
    
    //释放锁
    public void unLock(){
        if(!lockValue.compareAndSet(1,0)){
            throw new RuntimeException("释放锁失败");
        }
    }

}

上面定义了AtomicInteger类型的lockValue变量，AtomicInteger是Java基于C A S实现的Integer原子操作类，还定义了3个函数lock、tryLock、unLock

tryLock函数-获取锁

期望值1，更新值0
C A S更新
如果期望值与lockValue值相等，则lockValue值更新为0，返回true，否则执行下面逻辑
如果期望值与lockValue值不相等，不做任何更新，返回false

unLock函数-释放锁

期望值0，更新值1
C A S更新
如果期望值与lockValue值相等，则lockValue值更新为1，返回true，否则执行下面逻辑
如果期望值与lockValue值不相等，不做任何更新，返回false

lock函数-自旋获取锁

执行tryLock函数，返回true停止，否则一直循环

从上图可以看出，只有tryLock成功的线程（把lockValue更新为0），才会执行代码块，其他线程个tryLock自旋等待lockValue被更新成1，tryLock成功的线程执行unLock（把lockValue更新为1），自旋的线程才会tryLock成功。

ABA问题

C A S需要检查待更新的内存值有没有被修改，如果没有则更新，但是存在这样一种情况，如果一个值原来是A，变成了B，然后又变成了A，在C A S检查的时候会发现没有被修改。

假设有两个线程，线程1读取到内存值A，线程1时间片用完，切换到线程2，线程2也读取到了内存值A，并把它修改为B值，然后再把B值还原到A值，简单说，修改次序是A->B->A，接着线程1恢复运行，它发现内存值还是A，然后执行C A S操作，这就是著名的ABA问题，但是好像又看不出什么问题。

只是简单的数据结构，确实不会有什么问题，如果是复杂的数据结构可能就会有问题了（使用AtomicReference可以把C A S使用在对象上），以链表数据结构为例，两个线程通过C A S去删除头节点，假设现在链表有A->B节点

线程1删除A节点，B节点成为头节点，正要执行C A S(A,A,B)时，时间片用完，切换到线程2
线程2删除A、B节点
线程2加入C、A节点，链表节点变成A->C
线程1重新获取时间片，执行C A S(A,A,B)
丢失C节点

要解决A B A问题也非常简单，只要追加版本号即可，每次改变时加1，即A —> B —> A，变成1A —> 2B —> 3A，在Java中提供了AtomicStampedRdference可以实现这个方案（面试只要问了C A S，就一定会问ABA，这块一定要搞明白）。

唠嗑唠嗑

C A S到这里就结束啦，当然了，后续会有Atomic系列的文章，有了C A S铺垫，后面的Atomic也是十分简单的，另外这里有个福利想告知下给各位读者，阿星公众号明天有个回馈读者，送酷炫显示器一台的抽奖活动，还没关注的朋友们，可以提前关注啦，欢迎大家参与，万一中了呢~

历史好文推荐

关于我

这里是阿星，一个热爱技术的Java程序猿，公众号 <span style="color: Blue;">「程序猿阿星」</span> 里将会定期分享操作系统、计算机网络、Java、分布式、数据库等精品原创文章，2021，与您在 Be Better 的路上共同成长！。

非常感谢各位小哥哥小姐姐们能看到这里，原创不易，文章有帮助可以关注、点个赞、分享与评论，都是支持（莫要白嫖）！

愿你我都能奔赴在各自想去的路上，我们下篇文章见

微信关注我们

原文链接：https://my.oschina.net/u/4914267/blog/5055503

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

OCR性能优化：从认识BiLSTM网络结构开始

摘要：想要对OCR进行性能优化，首先要了解清楚待优化的OCR网络的结构，本文从动机的角度来推演下基于Seq2Seq结构的OCR网络是如何一步步搭建起来的。本文分享自华为云社区《OCR性能优化系列（一）：BiLSTM网络结构概览》，原文作者：HW007。 OCR是指对图片中的印刷体文字进行识别，最近在做OCR模型的性能优化，用Cuda C将基于TensorFlow编写的OCR网络重写了一遍，最终做到了5倍的性能提升。通过这次优化工作对OCR网络的通用网络结构和相关的优化方法有较深的认识，计划在此通过系列博文记录下来，也作为对自己最近工作的一个总结和学习笔记。想要对OCR进行性能优化，首先要了解清楚待优化的OCR网络的结构，在本文中我将尝试着从动机的角度来推演下基于Seq2Seq结构的OCR网络是如何一步步搭建起来的。读懂此文的前提只需要了解在矩阵乘法中矩阵的维度变化规律，即n*p的矩阵乘以p*m的矩阵等于n*m的矩阵。如果知道CNN和RNN网络的结构，对机器学习模型的构造套路有点了解的话更好。首先给出从本文要剖析的OCR BILSTM网络总体结构如下图：接下来我将从这张图的右上...

2021-05-20

639

跟数据打的交道越多，就越可能对数据产生绝对的信赖感，但其实在实际业务中，数据往往会“说谎”，今天给大家介绍三个数据分析中常见的悖论： 1、辛普森悖论辛普森悖论是数据分析中最常见的悖论之一，举个最实际的例子来说：鸭堡某学期期末考试，考数学、物理、化学三科，A的数学比B高2分，物理比B高15分，化学比C高3分，请问A的总分是否比B高？很多人会说，这不是废话么，问题太简单了，当然是A的总分比B高了！实际上很可能A的总成绩低于B，别急着惊讶，我们不妨再看一个例子：很多人都爱看NBA比赛，最近几年的骑勇大战，使得詹姆斯和库里在球迷心目中的印象非常深，有一场骑勇大战，詹姆斯和库里的两分球与三分球命中率如下表所示：其中：两分球命中率 = 两分球命中数 / 两分球出手数 * 100% 三分球命中率 = 三分球命中数 / 三分球出手数 * 100% 那么请问本场比赛，詹姆斯的投篮命中率，是否低于库里？投篮命中率 = (两分球命中数 + 三分球命中数) / (两分球出手数 + 三分球出手数) * 100% 很多人也会说，这不是跟上面期末考试那个题一样简单嘛，这还用说嘛，肯定是詹姆斯的投...

2021-05-21

738

资源下载

更多资源

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长，特征是大鼻子、头戴帽子、身穿背带裤，还留着胡子。与他的双胞胎兄弟路易基一起，长年担任任天堂的招牌角色。

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称，一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集，帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Rocky Linux

Rocky Linux（中文名：洛基）是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版，作为CentOS稳定版停止维护后与RHEL（Red Hat Enterprise Linux）完全兼容的开源替代方案，由社区拥有并管理，支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性，采用模块化包装和SELinux安全架构，默认包含GNOME桌面环境及XFS文件系统，支持十年生命周期更新。

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能，例如代码缩略图，Python的插件，代码段等。还可自定义键绑定，菜单和工具栏。Sublime Text 的主要功能包括：拼写检查，书签，完整的 Python API ， Goto 功能，即时项目切换，多选择，多窗口等等。Sublime Text 是一个跨平台的编辑器，同时支持Windows、Linux、Mac OS X等操作系统。