What？构造的查询语句会导致堆栈溢出-低调大师

What？构造的查询语句会导致堆栈溢出

2022-05-05 545

摘要：本文归纳了Neo4j和Nebula两个开源图数据库的两个pull request修复的堆栈溢出问题，并试着写写通过阅读pr中的问题而得到的一些启发

本文分享自华为云社区《巧妙构造的查询语句会导致堆栈溢出？从两个开源图数据库PR看查询执行时的编码设计问题》，作者：蜉蝣与海。

导读&简介

查询语言（Query Language）的出现方便了用户在计算引擎上执行各种操作，就图数据库而言，neo4j支持查询语言cypher，nebula有其独有的查询语言nGQL。由于查询语言规则依赖语言自身文法，用户使用查询语言自由度较大，输入灵活，一般测试手段难以覆盖到所有情况，所以在某种程度上复杂的查询语句是各类计算产品健壮性的试金石，本文归纳了两个开源产品pr（pull request）时修复的堆栈溢出问题，并试着写写通过阅读pr中的问题而得到的一些启发。

先上链接，如果你更喜欢读代码而不是听我叨叨：StackOverFlowError occurs when reducing a List（neo4j）：
issue：https://github.com/neo4j/neo4j/issues/12683
pr：https://github.com/neo4j/neo4j/commit/8336c2f75f4baa4283babe31293899020092d5d1
fix crash when the expression exceed the depth（nebula）：
https://github.com/vesoft-inc/nebula/pull/3606

代码分析

在这两个PR中都提到了StackOverFlow。我们先试着描述一下问题，Nebula的pr要稍微好懂一点：可以试着打开测试用例来看之前有问题的语句，是一堆 1+1+1+…+1+1

as result, 当+1+1这样的语法要素出现的次数太多时，会报栈溢出。通过阅读parser.yy可以看到，对于每个加法符号，都会生成一个表达式对象：

// parser.yy
expression_internal
：constant_expression {
       $$ = $1;
   } ...
   | expression_internal PLUS expression_internal {
       $$ = ArithmeticExpression::makeAdd(qctx->objPool(), $1, $3);
   }
 static ArithmeticExpression* makeAdd(ObjectPool* pool,
                                      Expression* lhs = nullptr,
                                      Expression* rhs = nullptr) {
   return pool->add(new ArithmeticExpression(pool, Expression::Kind::kAdd, lhs, rhs));
 }

对于像“1+1+1+1+1”这样的表达式，调用栈就会成这样：

当用户输入的+1的数目比较多时，头部expression下就会链式挂载若干个子expression，如果在语法解析层和语法执行层没有对表达式做特殊的处理，这些子链会被递归调用（即父expression会调用子expression），递归的深度取决于子链的数目。

neo4j的issue有些小众，其关注的是对这样自定义聚集操作的语句：

unwind range(0,15000) as xxx
with collect([xxx]) as set1
with reduce(c = [], x in set1| c + x) as fromNodes
unwind fromNodes as x return x

其中range(0,15000)会生成一个列表，共15000个元素，如[0,1,2,…,14998,14999]这样。unwind会对这个链表进行展开，通过collect([xxx])对每个元素生成一个独立的列表并打包成set1([0],[1],…[14998],[14999])，然后通过reduce操作对这些独立的元素进行拼接。问题就是出在拼接的时候：reduce看起来是不断在进行foreach（x in set1）{c = c + x}这样的操作，然而实际代码实现时，对15000个元素进行了展开，生成的是c=x0+x1+x2+…+x14999。并没有使用一个变量去缓存c的中间状态，而是试图通过不断的二元计算直接算出c的结果。代码如下：

// CypherMath.Add
if ( lhsIsListValue && rhs instanceof ListValue )
{
    return VirtualValues.concat( (ListValue) lhs, (ListValue) rhs );
}
// VirtualValues.concat
public static ListValue concat( ListValue... lists )
{
    return new ListValue.ConcatList( lists );
}

这样会有15000个ConcatList链式连接，实际计算时15000个ConcatList被递归调用，生成了一个深为15000的函数调用栈。

上述代码的问题和PR中的解决方案

可以看到，不管是C++的nebula，还是java写的neo4j，通过巧妙地构造查询语句，都可以使得内部执行时生成深度较深的函数调用栈。而函数调用栈的深度，在不同编程语言下都是有限制的（大部分查询语言栈空间是M级的，参见附录[1]和附录[2]）。超过这个限制，轻则直接导致语句崩溃，如果系统的异常处理机制不够完善，也可能导致更严重的问题。

nebula和neo4j对这个问题采用了两种不同的解决方案。在nebula中，通过在parser.yy中调用checkExprDepth方法，去检查最大递归调用深度，超出则报错；而在neo4j中，通过构建一个list来缓存concat的元素列表，进而消除了递归调用。

// neo4j更新list的代码，解析语句阶段，原始list调用add方法，会生成一个包含value元素的新的list，这个新list会替换调原始的list
public ListValue add( ListValue value )
{
    var newSize = lists.length + 1;
    var newArray = new ListValue[newSize];
    System.arraycopy( lists, 0, newArray, 0, lists.length );
    newArray[lists.length] = value;
    return new ConcatList( newArray);
}

容易发现nebula的解决方案更直接一点，过深的调用栈一律拒绝；而neo4j则是通过一些容器（如List，Stack）等消除了递归调用，对用户更加友好，但是如果其他地方也出现类似情况，可能需要做针对性修改。

PR带来的启示

在查询语言的解析和计划执行的编码设计阶段，为查询语句中的某个语法成分（如表达式、函数、子句）编写执行逻辑的代码往往是相对直观且易于理解的。比如加法操作可以直接构造一个ArithmeticExpression对象，List拼接可以直接构造一个ConcatList对象。然而由于用户输入的不确定性，需要考虑多个语法成分联动，或者某几个语法成分批量出现时带来的问题（例如深度过深的递归）。要么像nebula一样在量上做限制，量太大直接报错；要么像neo4j一样针对每个会因为批量联动带来问题的点给出不会出错的编码设计。通过这两种手段，可以减少极端语句对系统的影响，提高系统的健壮性。

附录

[1]C++函数调用栈溢出demo：https://blog.csdn.net/qq_44989173/article/details/115986871?spm=1001.2101.3001.6650.1&utm_medium=distribute.pc_relevant.none-task-blog-2~default~CTRLIST~Rate-1.pc_relevant_paycolumn_v3&depth_1-utm_source=distribute.pc_relevant.none-task-blog-2~default~CTRLIST~Rate-1.pc_relevant_paycolumn_v3&utm_relevant_index=2
[2]JVM StackOverFlow和OOM 场景模拟:https://blog.csdn.net/HUDCHSDI/article/details/113817579

点击关注，第一时间了解华为云新鲜技术~

微信关注我们

原文链接：https://my.oschina.net/u/4526289/blog/5522060

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

跟我学Python图像处理丨获取图像属性、兴趣ROI区域及通道处理

摘要：本篇文章主要讲解Python调用OpenCV获取图像属性，截取感兴趣ROI区域，处理图像通道。本文分享自华为云社区《[Python图像处理] 三.获取图像属性、兴趣ROI区域及通道处理 | 【生长吧！Python】》，作者： eastmount 。一.获取图像属性 1.形状-shape 通过shape关键字获取图像的形状，返回包含行数、列数、通道数的元祖。其中灰度图像返回行数和列数，彩色图像返回行数、列数和通道数。如下图所示： # -*- coding:utf-8 -*- import cv2 import numpy #读取图片 img = cv2.imread("test.jpg", cv2.IMREAD_UNCHANGED) #获取图像形状 print(img.shape) #显示图像 cv2.imshow("Demo", img) #等待显示 cv2.waitKey(0) cv2.destroyAllWindows() 输出结果如下图所示：(445L, 670L, 3L)，该图共445行、670列像素，3个通道。 2.像素数目-s...

2022-05-05

580

本文首发于 Nebula Graph Community 公众号在 #云原生# 主题分享中，来自 Nebula 云组的 Cloud 专家乔雷同大家分享云的相关知识，本文整理自该次主题直播。云原生是什么这里简单介绍下云原生是什么，包括 DBaaS 又是什么？它在云的整套体系内又处于一个什么样的层级？云原生从本质上来说，是一个不断演进的技术理念。一开始并不存在云原生这一概念，它从早期的虚拟化 VM 演进到容器化，再发展到到今天的 FaaS，逐步发展成一整套体系化的事物。换而言之，云原生便是将基础设施打包在一起构建成的整套技术，而这套技术在不断地向周边延伸。可以看下云原生金字塔这幅图，IaaS 层基于硬件虚拟化提供存储、计算、网络，安全防火墙等产品；再上层是 CaaS 层，基于 Kubernetes 编排系统提供容器化产品；最上层是基于云原生理念构建的应用服务，整套组合构成了云原生概念体系。某种技术产生一定是服务某项业务，所以我们要明白，云原生最终要服务于什么？云原生是希望更好地将业务同基础设施进行解耦，让大家更专注于业务层面的开发，无需去关心运维操作，比如：机器资源不够；流量爆发...

2022-05-05

681

资源下载

更多资源

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长，特征是大鼻子、头戴帽子、身穿背带裤，还留着胡子。与他的双胞胎兄弟路易基一起，长年担任任天堂的招牌角色。

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称，一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集，帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Spring

Spring框架（Spring Framework）是由Rod Johnson于2002年提出的开源Java企业级应用框架，旨在通过使用JavaBean替代传统EJB实现方式降低企业级编程开发的复杂性。该框架基于简单性、可测试性和松耦合性设计理念，提供核心容器、应用上下文、数据访问集成等模块，支持整合Hibernate、Struts等第三方框架，其适用范围不仅限于服务器端开发，绝大多数Java应用均可从中受益。

Rocky Linux

Rocky Linux（中文名：洛基）是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版，作为CentOS稳定版停止维护后与RHEL（Red Hat Enterprise Linux）完全兼容的开源替代方案，由社区拥有并管理，支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性，采用模块化包装和SELinux安全架构，默认包含GNOME桌面环境及XFS文件系统，支持十年生命周期更新。