一次性全讲透GaussDB（DWS）锁的问题-低调大师

一次性全讲透GaussDB（DWS）锁的问题

2023-09-13 533

本文分享自华为云社区《GaussDB（DWS）锁问题全解》，作者： yd_211043076。

一、gaussdb有哪些锁

1、常规锁：常规锁主要用于业务访问数据库对象的加锁，保护并发操作的对象，保持数据一致性；常见的常规锁有表锁（relation）和行锁（tuple）。

表锁：当对表进行DDL、DML操作时，会对操作的对象表加锁，在事务结束释放。

行锁：使用select for share语句时持有该模式锁，后台会对tuple加5级锁；使用select for update, delete, update等操作时，后台会对tuple加7级锁（ExclusiveLock）。

2、轻量级锁：轻量级锁主要用于数据库内部共享资源访问的保护，比如内存结构、共享内存分配控制等。

二、锁冲突矩阵

1、常规锁按照粒度可分为8个等级，各操作对应的锁等级及锁冲突情况参照下表：

锁编号	锁模式	对应操作	冲突的锁编号
1	ACCESS SHARE	SELECT	8
2	ROW SHARE	SELECT FOR UPDATE、SELECT FOR SHARE	7,8
3	ROW EXCLUSIVE	INSERT、DELETE、UPDATE	5,6,7,8
4	SHARE UPDATE EXCLUSIVE	VACUUM、ANALYZE	4,5,6,7,8
5	SHARE	CREATE INDEX	3,4,6,7,8
6	SHARE ROW EXCLUSIVE	-	3,4,5,6,7,8
7	EXCLUSIVE	-	2,3,4,5,6,7,8
8	ACCESS EXCLUSIVE	DROP TABLE、ALTER TABLE、REINDEX、CLUSTER、VACUUM FULL、TRUNCATE	1,2,3,4,5,6,7,8

2、几种锁冲突的场景：

ACCESS SHARE与ACCESS EXCLUSIVE锁冲突例子：session 1 在事务内对表进行truncate，且lockwait_timeout参数设置为10s；session 2 查询该表，此时会一直等到session 1 释放锁，直到等锁超时。

ROW SHARE（行锁冲突的例子）：并发insert/update/copy；session 1在事务内对有主键约束的行存表进行更新；session 2对同一主键的行进行更新，会一直等待session 1释放锁，直到行锁超时；

并发更新列存表出现等锁超时，该现象一般为并发更新同一CU造成的；

场景构造：session 1在事务内对列存表进行更新，不提交事务；session 2同样对列存表更新，会等锁超时；（只有更新的为同一CU时才会出现此场景）

列存表并发等锁原理：https://bbs.huaweicloud.com/blogs/255895 ；

三、锁相关视图

pg_locks视图存储各打开事务所持有的锁信息，需关注的字段：locktype(被锁定对象的类型)、relation(被锁定对象关系的OID)、pid(持锁或等锁的线程ID)、mode(持锁或等锁模式)、granted(t:持锁，f:等锁)。

pgxc_lock_conflicts视图提供集群中有冲突的锁的信息（适合锁冲突现场还在是使用），目前只收集locktype为relation、partition、page、tuple和transactionid的锁的信息，需要关注的字段nodename(被锁定对象节点的名字)、queryid(申请锁的查询ID)、query(申请锁的查询语句)、pid、mode、granted。

pgxc_deadlock视图获取导致分布式死锁产生的锁等待信息，只收集locktype为relation、partition、page、tuple和transactionid的锁等待信息。

四、锁相关参数介绍

lockwait_timeout：控制单个锁的最长等待时间。当申请的锁等待时间超过设定值时，系统会报错，即等锁超时，一般默认值为20min。

deadlock_timeout：死锁检测的超时时间，当申请的锁超过该设定值仍未获取到时，触发死锁检测，系统会检查是否产生死锁，一般默认值为1s。

update_lockwait_timeout：允许并发更新参数开启时，控制并发更新同一行单个锁的最长等待时间，超过该设定值，会报错，一般默认值为2min。

以上参数的单位均为毫秒，请保证deadlock_timeout的值大于lockwait_timeout，否则将不会触发死锁检测。

五、锁等待超时排查

https://bbs.huaweicloud.com/blogs/280354

六、为什么会死锁（单节点死锁）

1、死锁：两个及以上不同的进程实体在运行时因为竞争资源而陷入僵局，除非外力作用，否则双发都无法继续推进；而数据库事务可针对资源按照任意顺序加锁，就有一定几率因不同的加锁顺序而产生死锁。

2、死锁场景模拟：

锁表顺序不同，常见于存储过程中

session 1	session 2
begin；	begin；
truncate table lock_table2;	truncate table lock_table1;
select * from lock_table1;	select * from lock_table2;

第一时刻：session 1：先拿到lock_table2的8级锁，此时session 2拿到lock_table1的8级锁；第二时刻：session 1：再尝试申请lock_table1的1级锁; session 2 ：尝试申请lock_table2的1级锁；两个会话都持锁并等待对方手里的锁释放。

GaussDB（DWS）会自动处理单点死锁，当单节点死锁发生时，数据库会自动回滚其中一条事务，以消除死锁现象。

3、一些死锁场景

vacuum full 与delete select语句造成的死锁（等同一对象的不同锁）；部分业务场景下，存在查询时间窗在白天，而业务跑批删除只能在晚上执行，同样为了保证查询效率降低脏页率，对业务表的vacuum full操作也在晚上，时间窗重合，升锁过程便可能产生死锁；

上述场景下vacuum full语句申请1：ExclusiveLock并持有，后续delete from语句申请2：cessShareLock并持有；vacuum full升级锁3：AccessExclusiveLock失败；delete from升级锁4：RowExclusiveLock失败；两个语句形成死锁。

ater列存表与select max(a)的死锁，两条语句只涉及一张表，但仍旧会产生死锁，列存表有CUdesc表及delta表，语句在行时拿锁顺序不同，便可能产生死锁

列存表查询max(col)时，尽管并没有开启delta表，也会获取delta表的锁，alter table也一样，此时同一个操作对象变存在两个独立的资源（主表与delta表，其实还应该包含CUdesc表），不同拿锁顺序变产生这种两个语句操作同一张表死锁的现象。

upsert的死锁现象：行存带主键约束或列存表场景下并发upsert，并发更新重复的数据，且不同事务内部更新的相同数据的顺序不同；

该场景主要为分别从两个数据源做并发导数（upsert方式）时，时间窗未区分开，且数据也存在重复的可能性，此时便可能存在以不同的顺序分别更新相同数据（行）的现象，就会引发死锁现象，导致某一次导数任务失败，可选择业务侧将两个任务区分到不同时间窗去执行来规避该死锁现象。

七、分布式死锁

DWS的share nothing结构，使得一条语句可能在不同的节点上执行，在这些节点上都要对操作对象申请锁，且同样存在以不同顺序申请锁的可能，因此便存在分布式死锁的场景

1、如何排查分布式死锁：

先构造一个分布式死锁场景，如下图，session 1 在CN 1上开启事务并先查询lock_table1；此时session 2在CN 2上开启事务并查询lock_table1，然后两个会话分别执行truncate表：

session 1-CN 1	session 2-CN 2
begin；	begin；
select * from lock_table1;	select * from lock_table1;
truncate table lock_table1;	truncate table lock_table1;

通过查询分布式死锁视图：select * from pgxc_deadlock order by nodename,dbname,locktype,nspname,relname;

根据查询结果，可以看出在构造的该场景下：

CN_5001的truncate语句线程号为：139887210493696；在等待线程号为：139887432832768的truncate语句释放lock_table1的AccessShareLock（事务中select语句持有的锁），同时该线程：139887210493696，持有lock_table1的AccessExclusiveLock；

CN_5004的truncate语句线程号为：139887432832768；在等待线程号为：139887210493696的truncate语句释放lock_table1的AccessExclusiveLock；同时该线程：139887432832768持有lock_table1的AccessShareLock；这种场景下在不同实例上分布式的等待关系，便形成了分布式死锁。

2、消除分布式死锁：

对于分布式死锁的场景，一般在一个事务因为等锁超时后事务回滚，另一个未超时的事务便能继续进行下去；人为干预的情况，则需要调用select pg_terminate_backend(pid)，查杀掉一个持锁语句，破坏环形等待条件，便可让另一个事务继续执行下去。

号外！

华为将于2023年9月20-22日，在上海世博展览馆和上海世博中心举办第八届华为全联接大会（HUAWEICONNECT 2023）。本次大会以“加速行业智能化”为主题，邀请思想领袖、商业精英、技术专家、合作伙伴、开发者等业界同仁，从商业、产业、生态等方面探讨如何加速行业智能化。

我们诚邀您莅临现场，分享智能化的机遇和挑战，共商智能化的关键举措，体验智能化技术的创新和应用。您可以：

在100+场主题演讲、峰会、论坛中，碰撞加速行业智能化的观点
参观17000平米展区，近距离感受智能化技术在行业中的创新和应用
与技术专家面对面交流，了解最新的解决方案、开发工具并动手实践
与客户和伙伴共寻商机

感谢您一如既往的支持和信赖，我们热忱期待与您在上海见面。

大会官网：https://www.huawei.com/cn/events/huaweiconnect

欢迎关注“华为云开发者联盟”公众号，获取大会议程、精彩活动和前沿干货。

点击关注，第一时间了解华为云新鲜技术~

微信关注我们

原文链接：https://my.oschina.net/u/4526289/blog/10110125

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

如何实现一个数据库的 UDF？图数据库 NebulaGraph UDF 功能背后的设计与思考

大家好，我是来自 BOSS直聘的赵俊南，主要负责安全方面的图存储相关工作。作为一个从 v1.x 用到 v3.x 版本的忠实用户，在见证 NebulaGraph 发展的同时，也和它一起成长。 BOSS直聘和 NebulaGraph 关于 NebulaGraph 在 BOSS直聘的应用场景，大家可以看看之前文洲老师的文章（图数据库 NebulaGraph 在 BOSS直聘的应用），从那时候文洲老师构建的行为图发展到了安全场景的业务主图、算法推理图、职位相似度图谱等业务，现在更是支持了数仓同学的数据血缘及搜索同学的实时搜索召回场景，单图的规模达到了数千亿。在图计算方面，BOSS 直聘基于 LPA 和 Louvain 的单度团、多维团，以及基础的离线特征，在安全生产环境中广泛应用图技术。相信未来图在 BOSS直聘还会有更为宽广的舞台。 UDF 的萌生随着 NebulaGraph 在 BOSS直聘业务上的广泛应用，相对应的对内部技术人员的要求也越来越高。如果技术人员仅仅停留在使用层面，就无法满足从功能到性能很多需求。所以，学习源码成为了必然。而后迁移 Neo4j->NebulaGra...

2023-09-13

387

承接前文 OceanBase 安全审计的《传输加密》，本文主要实践数据透明加密，并验证加密是否有效。作者：张乾，外星人2号，兼任四位喵星人的铲屎官。爱可生开源社区出品，原创内容未经授权不得随意使用，转载请联系小编并注明来源。本文约 1200 字，预计阅读需要 4 分钟。环境版本：OceanBase 4.1.0.0 企业版加密配置详细的加密步骤略过，本次使用 MySQL 租户。开启透明加密并创建表空间管理员用户登录到集群的 MySQL 租户。 # 开启 internal 方式的透明加密 # tde_method 默认值为 none，表示关闭透明表空间加密 obclient [oceanbase]> ALTER SYSTEM SET tde_method='internal'; Query OK, 0 rows affected (0.022 sec) obclient [oceanbase]> SHOW PARAMETERS LIKE 'tde_method'; +-------+----------+-------------+----------+-...

2023-09-13

950

资源下载

更多资源

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长，特征是大鼻子、头戴帽子、身穿背带裤，还留着胡子。与他的双胞胎兄弟路易基一起，长年担任任天堂的招牌角色。

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称，一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集，帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Spring

Spring框架（Spring Framework）是由Rod Johnson于2002年提出的开源Java企业级应用框架，旨在通过使用JavaBean替代传统EJB实现方式降低企业级编程开发的复杂性。该框架基于简单性、可测试性和松耦合性设计理念，提供核心容器、应用上下文、数据访问集成等模块，支持整合Hibernate、Struts等第三方框架，其适用范围不仅限于服务器端开发，绝大多数Java应用均可从中受益。

Rocky Linux

Rocky Linux（中文名：洛基）是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版，作为CentOS稳定版停止维护后与RHEL（Red Hat Enterprise Linux）完全兼容的开源替代方案，由社区拥有并管理，支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性，采用模块化包装和SELinux安全架构，默认包含GNOME桌面环境及XFS文件系统，支持十年生命周期更新。