通俗易懂:说说 Python 里的线程安全、原子操作
云栖号资讯:【点击查看更多行业资讯】
在这里您可以找到不同行业的第一手的上云资讯,还在等什么,快来!
在并发编程时,如果多个线程访问同一资源,我们需要保证访问的时候不会产生冲突,数据修改不会发生错误,这就是我们常说的 线程安全 。
那什么情况下,访问数据时是安全的?什么情况下,访问数据是不安全的?如何知道你的代码是否线程安全?要如何访问数据才能保证数据的安全?
本篇文章会一一回答你的问题。
1. 线程不安全是怎样的?
要搞清楚什么是线程安全,就要先了解线程不安全是什么样的。
比如下面这段代码,开启两个线程,对全局变量 number 各自增 10万次,每次自增 1。
正常我们的预期输出结果,一个线程自增100万,两个线程就自增 200 万嘛,输出肯定为 2000000 。
可事实却并不是你想的那样,不管你运行多少次,每次输出的结果都会不一样,而这些输出结果都有一个特点是,都小于 200 万。
以下是执行三次的结果
这种现象就是线程不安全,究其根因,其实是我们的操作 number += 1 ,不是原子操作,才会导致的线程不安全。
2. 什么是原子操作?
原子操作(atomic operation),指不会被线程调度机制打断的操作,这种操作一旦开始,就一直运行到结束,中间不会切换到其他线程。
它有点类似数据库中的 事务。
在 Python 的官方文档上,列出了一些常见原子操作
而下面这些就不是原子操作
像上面的我使用自增操作 number += 1,其实等价于 number = number + 1,可以看到这种可以拆分成多个步骤(先读取相加再赋值),并不属于原子操作。
这样就导致多个线程同时读取时,有可能读取到同一个 number 值,读取两次,却只加了一次,最终导致自增的次数小于预期。
当我们还是无法确定我们的代码是否具有原子性的时候,可以尝试通过 dis 模块里的 dis 函数来查看
当我们执行这段代码时,可以看到 number += 1 这一行代码,由两条字节码实现。
- BINARY_ADD :将两个值相加
- STORE_GLOBAL: 将相加后的值重新赋值
每一条字节码指令都是一个整体,无法分割,他实现的效果也就是我们所说的原子操作。
当一行代码被分成多条字节码指令的时候,就代表在线程线程切换时,有可能只执行了一条字节码指令,此时若这行代码里有被多个线程共享的变量或资源时,并且拆分的多条指令里有对于这个共享变量的写操作,就会发生数据的冲突,导致数据的不准确。
为了对比,我们从上面列表的原子操作拿一个出来也来试试,是不是真如官网所说的原子操作。
这里我拿字典的 update 操作举例,代码和执行过程如下图
从截图里可以看到,info.update(new) 虽然也分为好几个操作
- LOAD_GLOBAL:加载全局变量
- LOAD_ATTR: 加载属性,获取 update 方法
- LOAD_FAST:加载 new 变量
- CALL_FUNCTION:调用函数
- POP_TOP:执行更新操作
但我们要知道真正会引导数据冲突的,其实不是读操作,而是写操作。
上面这么多字节码指令,写操作都只有一个(POP_TOP),因此字典的 update 方法是原子操作。
3. 实现人工原子操作
在多线程下,我们并不能保证我们的代码都具有原子性,因此如何让我们的代码变得具有 “原子性” ,就是一件很重要的事。
方法也很简单,就是当你在访问一个多线程间共享的资源时,加锁可以实现类似原子操作的效果,一个代码要嘛不执行,执行了的话就要执行完毕,才能接受线程的调度。
因此,我们使用加锁的方法,对例子一进行一些修改,使其具备原子性。
此时,不管你执行多少遍,输出都是 2000000.
4. 为什么 Queue 是线程安全的?
Python 的 threading 模块里的消息通信机制主要有如下三种:
- Event
- Condition
- Queue
使用最多的是 Queue,而我们都知道它是线程安全的。当我们对它进行写入和提取的操作不会被中断而导致错误,这也是我们在使用队列时,不需要额外加锁的原因。
他是如何做到的呢?
其根本原因就是 Queue 实现了锁原语,因此他能像第三节那样实现人工原子操作。
【云栖号在线课堂】每天都有产品技术专家分享!
课程地址:https://yqh.aliyun.com/live立即加入社群,与专家面对面,及时了解课程最新动态!
【云栖号在线课堂 社群】https://c.tb.cn/F3.Z8gvnK
原文发布时间:2020-05-14
本文作者:王一白
本文来自:“掘金”,了解相关信息可以关注“掘金”
低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
大数据面试宝典六
好程序员大数据培训分享大数据面试宝典六1、数据类型之间的转换:1)如何将数值型字符转换为数字?2)如何将数字转换为字符?3)如何取小数点前两位并四舍五入? 【基础】答:1)调用数值类型相应包装类中的方法parse*(String)或valueOf(String)即可返回相应基本类型或包装类型数值;2)将数字与空字符串相加即可获得其所对应的字符串;另外对于基本类型数字还可调用String 类中的valueOf(…)方法返回相应字符串,而对于包装类型数字则可调用其toString()方法获得相应字符串;3)可用该数字构造一java.math.BigDecimal 对象,再利用其round()方法进行四舍五入到保留小数点后两位,再将其转换为字符串截取最后两位。2、You need to insert an inner class declaration at line 3,Which two inner class declarations are valid?(Choose two.)public class OuterClass { private double d1 = 1.0; //...
- 下一篇
深入浅出开源监控系统Prometheus(上)
本文首发于 vivo互联网技术 微信公众号 链接: https://mp.weixin.qq.com/s/4NC4spF6cEvXuIBKVbIU7A 作者:ZhangShuo Prometheus是继Kubernetes(k8s)之后,CNCF毕业的第二个开源项目,其来源于Google的Borgmon。本文从“监控”这件事说起,深入浅出Prometheus的架构原理、目标发现、指标模型、聚合查询等设计核心点。 一、前言 接触过各式各样的监控,开源的CAT、Zipkin、Pinpoint等等,并深度二次开发过;也接触过收费的听云系APM,对各类监控的亮点与局限有足够的了解。 去年10月我们快速落地了一套易用、灵活、有亮点的业务监控平台,其中使用到了Prometheus。从技术选型阶段,Prometheus以及它的生态就让我们印象深刻,今天就聊聊监控设计与Prometheus。 通常一个监控系统主要包含 采集(信息源:log、metrics)、上报(协议:http、tcp)、聚合、存储、可视化以及告警等等。其中采集上报主要是客户端的核心功能,一般有定期外围探测的(早期的Nagios、Za...
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- CentOS6,7,8上安装Nginx,支持https2.0的开启
- SpringBoot2整合Thymeleaf,官方推荐html解决方案
- CentOS关闭SELinux安全模块
- CentOS7设置SWAP分区,小内存服务器的救世主
- Docker安装Oracle12C,快速搭建Oracle学习环境
- Docker快速安装Oracle11G,搭建oracle11g学习环境
- CentOS7编译安装Gcc9.2.0,解决mysql等软件编译问题
- CentOS8安装MyCat,轻松搞定数据库的读写分离、垂直分库、水平分库
- SpringBoot2整合MyBatis,连接MySql数据库做增删改查操作
- Mario游戏-低调大师作品