数仓现网案例丨超大结果集接收异常-低调大师

数仓现网案例丨超大结果集接收异常

2023-07-27 491

本文分享自华为云社区《GaussDB(DWS)现网案例之超大结果集接收异常》，作者：你是猴子请来的救兵吗。

问题背景

内核版本 GaussDB 8.1.3

问题描述 用户使用数据库客户端工具如navicat、dbeaver等执行查询语句异常中断，中断信息"Last read message sequence %d is not equal to the max written message sequence %d"

问题定位

客户端异常中断后有些错误信息时不感知的，此时topsql就派上了用场。历史topsql记录了查询作业运行结束时的资源使用情况(包括内存、下盘、CPU时间等)和运行状态信息(包括报错、终止、异常等)以及性能告警信息。而对于由于FATAL、PANIC错误导致查询异常结束时，状态信息列只显示aborted，无法记录详细异常信息。

1，此时我们通过历史topsql查询视图查询语句执行情况

--当前CN

select * from GS_WLM_SESSION_HISTORY;

--所有CN

select * from PGXC_WLM_SESSION_HISTORY;

根据topsql记录结果发现语句存在abort_info为

Last read message sequence %d is not equal to the max written message sequence %d

可知，查询执行遇到FATAL、PANIC错误导致查询异常结束

2，接着确认日志信息，通过线程ID查看当时语句执行情况，发现客户端存在异常中断

根因分析

前提：

cn_retry开启+查询语句+max_cn_temp_file_size临时文件开启

发送逻辑：

服务端执行查询之后，会通过发送缓冲区往客户端发送数据；当查询结果集过大，则发送缓冲区满了之后，会往临时文件写数据；当临时文件超出max_cn_temp_file_size指定的最大值时（此时会禁用cn_retry），需要分批发送，此时会先将已写入临时文件的数据发送至客户端；然后继续将剩余数据写入新的临时文件发送，以此循环，直到所有数据发送完成。

问题场景：

当临时文件超出最大值时，先将其发送至客户端，此时客户端断连（如产生oom），数据发送中断，此时已发送数据量与已写入临时文件的数据量不一致，因此产生报错

Last read message sequence %d is not equal to the max written message sequence %d

此报错代表已写入临时文件的数据与已发送到客户端的数据量不一致，实际场景为客户端异常导致的发送数据中断，因此报错内容符合预期。

此时客户端环境允许的数据量优先，超大结果集将分批发送的过程中，客户端触发OOM异常中断，服务端会记录客户端异常发送失败信息以及已发送数据不一致的错误信息。

改善办法

1，避免超大结果集的查询，如果无法避免，则通过分页或游标多次查询

2，增大客户端支持的运行内存，防止内存不足

知识小结

1，报错Last read message sequence %d is not equal to the max written message sequence %d为超大结果集返回异常中断时的报错，符合预期，需通过业务语句的改写或客户端环境的改善来解决。

2，TopSQL查询监控的原理和适用方法可参考：GaussDB for DWS 资源监控核心技术解密： TopSQL查询监控解密

点击关注，第一时间了解华为云新鲜技术~

微信关注我们

原文链接：https://my.oschina.net/u/4526289/blog/10091232

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

5分钟迁移关系型数据库到图数据库

本文分享自华为云社区《5分钟迁移关系型数据库到图数据库》，作者： RiverSide 。以往开发者会使用关系型数据库如MySQL对领域数据进行存储，这类关系型数据库诞生较早，但并不适合存储关联度较大的数据，如社交关系网络。随着高关联度数据的存储及分析的需求随数据量日益增长，将海量关联数据存入图数据库中进行深度挖掘分析是大势所趋。华为云图引擎服务（Graph Engine Service）是国内首个商用的、拥有自主知识产权的国产分布式原生图引擎。广泛应用于社交应用、企业关系分析、风控、推荐、反欺诈等具有丰富关系数据的场景。由于关系型数据库和如GES的图数据库天然存在的异构性，将已有的关系型数据库中的数据存储至图数据库中仍存在较多的难点。本文借助Apache Hop及GES插件，提供了多数据源通用、可视化、开箱即用的数据转换工程，可将多种关系型数据库迁移至GES图数据库中。转换工作流复用度高，可通过输入不同的元数据文件与数据源连接，使转换工作流完成多个数据源的迁移任务。支持的数据源借助Apache Hop的能力，支持MySQL，PostgreSQL，Oracle，MS SqlSer...

2023-07-26

903

本文分享自华为云社区《绘制一切》，作者：雨落无痕。绘制一切-Inpaint Anything 相关链接： Notebook案例地址：绘制一切 AI Gallery：https://developer.huaweicloud.com/develop/aigallery/home.html 也可通过AI Gallery，搜索【绘制一切】一键体验！ Inpaint Anything 通过一键点击标记选定对象，即可实现移除指定对象、填补指定对象、替换一切场景，涵盖了包括目标移除、目标填充、背景替换等在内的多种典型图像修补应用场景。它的整体框架如图所示： Inpaint Anything工作原理 Inpaint Anything结合了 SAM、图像修补模型（例如 LaMa）和 AIGC 模型（例如 Stable Diffusion）等视觉基础模型。 SAM（Segment Anything Model）可以通过点或框等输入提示生成高质量的对象分割区域，实现指定目标的分割。更多相关的介绍可以参考一键分割图像。图像修补模型LaMa，则能够在高分辨率图像的情况下，随意删除图像中的各种元素。模...

2023-07-27

1311

资源下载

更多资源

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长，特征是大鼻子、头戴帽子、身穿背带裤，还留着胡子。与他的双胞胎兄弟路易基一起，长年担任任天堂的招牌角色。

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题，腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构，目前腾讯云软件源站支持公网访问和内网访问。

Spring

Spring框架（Spring Framework）是由Rod Johnson于2002年提出的开源Java企业级应用框架，旨在通过使用JavaBean替代传统EJB实现方式降低企业级编程开发的复杂性。该框架基于简单性、可测试性和松耦合性设计理念，提供核心容器、应用上下文、数据访问集成等模块，支持整合Hibernate、Struts等第三方框架，其适用范围不仅限于服务器端开发，绝大多数Java应用均可从中受益。

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能，例如代码缩略图，Python的插件，代码段等。还可自定义键绑定，菜单和工具栏。Sublime Text 的主要功能包括：拼写检查，书签，完整的 Python API ， Goto 功能，即时项目切换，多选择，多窗口等等。Sublime Text 是一个跨平台的编辑器，同时支持Windows、Linux、Mac OS X等操作系统。