无锁缓存，每秒10万并发，究竟如何实现？-低调大师

无锁缓存，每秒10万并发，究竟如何实现？

2020-08-17 714

有一类业务场景：

（1）超高吞吐量，每秒要处理海量请求；

（2）写多读少，大部分请求是对数据进行修改，少部分请求对数据进行读取；

这类业务，有什么实现技巧么？

接下来，一起听我从案例入手，娓娓道来。

快狗打车，场景举例：

（1）司机地理位置信息会随时变化，可能每几秒钟地理位置要修改一次；

（2）用户打车的时候查看某个司机的地理位置，查询地理位置的频率相对较低；

这里要用到两个接口：

（1）大量修改司机信息：

void SetDriverInfo(long driver_id, DriverInfo info);

（2）相对少量查询司机信息：

DriverInfo GetDriverInfo(long driver_id);

这一类业务，一般怎么实现呢？

具体到底层的实现，往往是一个Map内存缓存：

（1）查询key定长，例如：司机ID；

（2）返回value也定长，例如：司机实体序列化后的二进制串；

即，类似这样的一个kv缓存结构：

Map<driver_id, DriverInfo>

这个kv内存缓存是一个临界资源，对它的并发访问，有什么注意事项么？

临界资源的访问，需要注意加读写锁，实施互斥。

以下，是加锁写入的伪代码：

void SetDriverInfo(long driver_id, DriverInfo info){

WriteLock (m_lock);

Map<driver_id>= info;

UnWriteLock(m_lock);

}

画外音：假设info已经序列化。

以下，是加锁读取的伪代码：

DriverInfo GetDriverInfo(long driver_id){

DriverInfo t;

ReadLock(m_lock);

t= Map<driver_id>;

UnReadLock(m_lock);

return t;

}

当吞吐量很高时，上述流程可能存在什么问题？

假设快狗打车有100w司机同时在线，每个司机每5秒更新一次经纬度状态，那么每秒就有20w次写并发操作。

假设快狗打车日订单1000w个，平均每秒大概也有300个下单，对应到查询并发量，大概每秒1000级别的并发读操作。

在这样的吞吐量下（每秒20w写，1k读）， 锁m_lock会成为潜在瓶颈 ，导致Map访问效率极低。

有什么潜在的优化方法么？

锁冲突之所以严重，是因为整个Map共用一把锁，锁的粒度太粗。

画外音：可以认为是一个数据库的“库级别锁”。

是否可能进行水平拆分，来降低锁冲突呢？

答案是肯定的。

画外音：类似于数据库里的分库，把一个库锁变成多个库锁，来提高并发，降低锁冲突。

我们可以把1个Map水平切分成N个Map：

void SetDriverInfo(long driver_id, DriverInfo info){

i = driver_id % N; // 水平拆分成N份，N个Map，N个锁

WriteLock (m_lock[i]); //锁第i把锁

Map[i]<driver_id>= info; // 操作第i个Map

UnWriteLock (m_lock[i]); // 解锁第i把锁

}

如此优化，能否提高性能？

（1）一个Map变成了N个Map，每个Map的并发量，变成了1/N ；

（2）同时，每个Map的数据量，变成了1/N ；

所以理论上，锁冲突会成平方指数降低，性能会提升。

有没有可能，进一步细化锁粒度，一个元素一把锁呢？

答案也是肯定的。

画外音：可以认为是一个数据库的“库级别锁”，优化为“行级别锁”。

不妨设driver_id是递增生成的，并且假设内存比较大，此时可以把Map优化成Array，并把锁的粒度细化到最细的，每个司机信息一个锁：

void SetDriverInfo(long driver_id, DriverInfo info){

index = driver_id;

WriteLock (m_lock[index]); //超级大内存，一条记录一个锁，锁行锁

Array[index]= info; //driver_id就是Array下标

UnWriteLock (m_lock[index]); // 解锁行锁

}

这个方案使得锁冲突降到了最低，但锁资源大增，在数据量非常大的情况下，内存往往是装不下的。

画外音：数据量比较小的时候，可以一个元素一把锁，典型的是连接池，每个连接用一把锁表示连接是否可用。

还没有方法进一步降低锁冲突，提升并发量呢？

写多读少的业务，有一种优化方案：无锁缓存，将锁冲突降低到。

无锁缓存，可能存在什么问题？

如果缓存不加锁，读写吞吐量可以达到极限，但是多线程对缓存中同一块定长数据进行写操作时，有可能出现不一致的脏数据。

这个方案为了提高性能，牺牲了一致性。

读取时，获取到了错误的数据，是不能接受的。

画外音：作为缓存，允许 cache miss ，却不允许读脏数据。

脏数据是如何产生的？

不加锁，在多线程并发写时，可能出现以下情况：

（1）线程1对缓存进行操作，对 key 想要写入 value1 ；

（2）线程2对缓存进行操作，对 key 想要写入 value2 ；

（3）不加锁，线程1和线程2对同一个定长区域进行一个并发的写操作，可能每个线程写成功一半，导致出现脏数据产生，最终的结果即不是 value1 也不是 value2 ，而是一个乱七八糟的不符合预期的值 value-unexpected ；

如何解决上述问题呢？

本质上，这是一个数据完整性问题。

并发写入的数据分别是 value1 和 value2 ，读出的数据是 value-unexpected ，数据被篡改，这本质上是一个数据完整性的问题。

通常如何保证数据的完整性呢？

例如：运维如何保证，从中控机分发到上线机上的二进制没有被篡改？

md5。

又例如：即时通讯系统中，如何保证接受方收到的消息，就是发送方发送的消息？

发送方除了发送消息本身，还要发送消息的签名，接收方收到消息后要校验签名，以确保消息是完整的，未被篡改。

“签名”是一种常见的保证数据完整性的方案。

加入“签名”保证数据的完整性之后，读写流程需要如何升级？

加上签名之后，不但缓存要写入定长value本身，还要写入定长签名（例如 16bitCRC 校验）：

（1）线程1对缓存进行操作，对 key 想要写入 value1 ，写入签名 v1-sign ；

（2）线程2对缓存进行操作，对 key 想要写入 value2 ，写入签名 v2-sign ；

（3）如果不加锁，线程1和线程2对同一个定长区域进行一个并发的写操作，可能每个线程写成功一半，导致出现脏数据产生，最终的结果即不是 value1 也不是 value2 ，而是一个乱七八糟的不符合预期的值 value-unexpected ，但签名，一定是v1-sign或者v2-sign中的任意一个；

画外音：16bit/32bit的写可以保证原子性。

（4）数据读取的时候，不但要取出 value ，还要像消息接收方收到消息一样，校验一下签名，如果发现签名不一致，缓存则返回 NULL ，即 cache miss ；

当然，对应到司机地理位置，除了内存缓存之前，肯定需要timer对缓存中的数据定期落盘，写入数据库，如果cache miss，可以从数据库中读取数据。

巧不巧秒？

总结

当业务满足：

（1）超高并发；

（2）写多读少；

（3）定长value；

时，可以用以下方法来提升吞吐量：

（1）水平拆分来降低锁冲突；

思路：单库变多库。

（2）Map转Array的方式来最小化锁冲突，一条记录一个锁；

思路：库锁变行锁。

（3）无锁，最大化并发；

思路：行锁变无锁，完整性与性能的折衷。

（4）通过签名的方式保证数据的完整性，实现无锁缓存；

思路：写时写签名，读时校验签名。

如果你喜欢本文，大概率会喜欢这个架构训练营，欢迎一起来玩。

扫码，一起玩架构，学别处没有的知识

思路比结论重要 ，希望大家有收获，谢转。

阅读原文 ，更多干货。

本文分享自微信公众号 - 架构师之路（road5858）。
如有侵权，请联系 support@oschina.cn 删除。
本文参与“OSC源创计划”，欢迎正在阅读的你也加入，一起分享。

微信关注我们

原文链接：https://my.oschina.net/u/4254706/blog/4504914

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

Android 11 强制用户使用内置系统相机应用

reddit 的一篇帖子介绍了 Android 11 调用相机 API 的重大变化，根据这篇帖子引用的博客文章的介绍，Android 11包含一些行为变更，这些变更可能会影响以 Android11 或更高版本为目标平台的应用，其中一项变更包括：从 Android11 开始，只有预装的系统相机应用可以响应以下 intent 操作： android.media.action.VIDEO_CAPTURE android.media.action.IMAGE_CAPTURE android.media.action.IMAGE_CAPTURE_SECURE 如果有多个预装的系统相机应用可用，系统会显示一个对话框，供用户选择应用。如果您希望自己的应用使用特定的第三方相机应用来代表其捕获图片或视频，可以通过为 intent 设置软件包名称或组件来使这些 intent 变得明确。可以看到，对于三个特定的需要调用摄像头的intent（VIDEO_CAPTURE、IMAGE_CAPTURE和IMAGE_CAPTURE_SECURE），Android 11 现在将自动提供预装的系统相机应用以执行这些操...

2020-08-20

866

一、前言目前当攻击者获取到某台内网机器的控制权限之后，进一步会考虑如何在内网进行横向移动，以及攻击域控服务器，今天丹丹就总结一下突破边界后进一步的攻击技巧。二、Windows域介绍将网络中多台计算机逻辑上组织到一起进行集中管理，这种区别于工作组的逻辑环境叫做域。域是由域控制器（Domain Controller）和成员计算机组成，域控制器就是安装了活动目录（Active Directory）的计算机。活动目录提供了存储网络上对象信息并使用网络使用该数据的方法，在域中，至少有一台域控制器，域控制器中保存着整个域的用户帐号和安全数据库。 2.1域的优势 1.集中管理，可以集中的管理企业中成千上万分布于异地的计算机和用户。 2.便捷的网络资源访问，能够容易的定位到域中的资源。 3.用户一次登录就可访问整个网络资源，集中的身份验证。 4.网络资源主要包含用户帐户、组、共享文件夹、打印机等 5.可扩展性，既可以适用于几十台计算机的小规模网络，也可以适用于跨国公司。 2.2域渗透常用命令查询与控制器主机名：net group “domain controllers” /domain 可...

2020-07-07

693

资源下载

更多资源

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题，腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构，目前腾讯云软件源站支持公网访问和内网访问。

Spring

Spring框架（Spring Framework）是由Rod Johnson于2002年提出的开源Java企业级应用框架，旨在通过使用JavaBean替代传统EJB实现方式降低企业级编程开发的复杂性。该框架基于简单性、可测试性和松耦合性设计理念，提供核心容器、应用上下文、数据访问集成等模块，支持整合Hibernate、Struts等第三方框架，其适用范围不仅限于服务器端开发，绝大多数Java应用均可从中受益。

Rocky Linux

Rocky Linux（中文名：洛基）是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版，作为CentOS稳定版停止维护后与RHEL（Red Hat Enterprise Linux）完全兼容的开源替代方案，由社区拥有并管理，支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性，采用模块化包装和SELinux安全架构，默认包含GNOME桌面环境及XFS文件系统，支持十年生命周期更新。

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能，例如代码缩略图，Python的插件，代码段等。还可自定义键绑定，菜单和工具栏。Sublime Text 的主要功能包括：拼写检查，书签，完整的 Python API ， Goto 功能，即时项目切换，多选择，多窗口等等。Sublime Text 是一个跨平台的编辑器，同时支持Windows、Linux、Mac OS X等操作系统。