GaussDB(DWS)函数不同写法引发的结果差异-低调大师

GaussDB(DWS)函数不同写法引发的结果差异

2023-08-11 403

本文分享自华为云社区《GaussDB(DWS)函数结果差异案例之greatest》，作者：你是猴子请来的救兵吗。

GaussDB(DWS)支持多种兼容模式，为了兼容目标数据库，各模式之间或多或少存在一些行为差异。这里分享一个mysql兼容模式下的表达式函数因不同写法引发的结果差异案例。

问题背景

问题版本 GaussDB 8.1.1

问题描述

用户反馈mysql兼容模式下，以下两条sql的执行结果存在差异：

select greatest(1,2,100,-1,0,nvl(null,0)) 出来的结果是 2

select greatest(1,2,100,-1,0) 出来结果是 100

场景再现

mysql=# select greatest(1,2,100,-1,nvl(null,0));

greatest

----------

2

(1 row)

mysql=# select greatest(1,2,100,-1,0,0);

greatest

----------

100

(1 row)

根因分析

1，不知道小伙伴们有没有注意到，这两个结果集的显示一个是靠左的一个是靠右的；ok，我们先来确认下这两个结果的数据类型：

mysql=# select pg_typeof(greatest(1,2,100,-1,nvl(null,0)));

pg_typeof

-----------

text

(1 row)

mysql=# select pg_typeof(greatest(1,2,100,-1,0));

pg_typeof

-----------

integer

(1 row)

2，依靠pg_typeof我们拿到了返回结果的数据类型；这就说明第一条语句是以text类型进行排序选择最大值的，依次为（‘0’,‘1’,’-1’,‘100’,‘2’），因此我们得到最大值是字符串类型的’2’。

3，依次类推，第二条语句是以int类型进行排序选择最大值的，依次为（-1,0,1,2,100），因此我们得到最大值是数值类型的100。

4，表达式函数greatest的返回类型是基于入参类型确定的，这里的差异是由于第五个入参类型导致的结果差异。

mysql=# select pg_typeof(nvl(null,0));

pg_typeof

-----------

text

(1 row)

mysql=# select pg_typeof(0);

pg_typeof

-----------

integer

(1 row)

5，而nvl/greatest之所以会出现不同的返回类型，是由mysql兼容模式下的类型匹配规则决定的。

具体规则可参考：UNION，CASE和相关构造。

修改建议

针对此差异场景，建议在不确定返回类型时显式指定其入参类型，将nvl(null,0)改为nvl(null,0)::int，这样结果就是已int排序的，与另一台语句预期相符。

mysql=# select greatest(1,2,100,-1,nvl(null,0)::int);

greatest

----------

100

(1 row)

知识剖析

SQL UNION构造把不相同的数据类型进行匹配输出为统一的数据类型结果集。因为SELECT UNION语句中的所有查询结果必须在一列里显示出来，所以每个SELECT子句中的元素类型必须相互匹配并转换成一个统一的数据类型。同样的要求广泛存在于 UNION、ARRAY 和 CASE、COALESCE、IF、IFNULL 和 GREATEST、LEAST 和 NVL 等表达式和函数中。

GaussDB(DWS)支持多种兼容模式，不同兼容模式下的类型匹配规则也不尽相同。为了便于理解，这里仅以mysql兼容模式下 IFNULL 的类型匹配规则进行举例说明，它与 GREATEST 在mysql兼容模式下的规则是一致的。

规则1： 如果所有输入都是相同的类型，不包括unknown类型，那么解析成所输入的相同数据类型。

mysql=# select pg_typeof(1),pg_typeof(2);

pg_typeof | pg_typeof

-----------+-----------

integer | integer

(1 row)

mysql=# select ifnull(1,2),pg_typeof(ifnull(1,2));

ifnull | pg_typeof

--------+-----------

1 | integer

(1 row)

规则2： 如果所有输入都是unknown类型则解析成text类型。（常量字符串就是unknow类型）

mysql=# select pg_typeof('1'),pg_typeof('2');

pg_typeof | pg_typeof

-----------+-----------

unknown | unknown

(1 row)

mysql=# select ifnull('1','2'),pg_typeof(ifnull('1','2'));

ifnull | pg_typeof

--------+-----------

1 | text

(1 row)

规则3： 如果输入是unknown类型和某一非unknown类型，则解析成该非unknown类型。

mysql=# select pg_typeof(current_date),pg_typeof('20230801');

pg_typeof | pg_typeof

-----------+-----------

date | unknown

(1 row)

mysql=# select ifnull(current_date,'20230801'),pg_typeof(ifnull(current_date,'20230801'));

ifnull | pg_typeof

------------+-----------

2023-08-10 | date

(1 row)

规则4： 如果存在多种非unknown类型，将enum类型当做text类型，再进行比较。

mysql=# create type gender as enum('boy','girl');

CREATE TYPE

mysql=# select pg_typeof('boy'::gender),pg_typeof('girl'::varchar);

pg_typeof | pg_typeof

-----------+-------------------

gender | character varying

(1 row)

mysql=# select ifnull('boy'::gender,'girl'::varchar),pg_typeof(ifnull('boy'::gender,'girl'::varchar));

ifnull | pg_typeof

--------+-----------

boy | text

(1 row)

规则5： 如果输入类型是同一个类型范畴，则选择该类型的优先级较高的类型。如果是不同的类型范畴，则解析成text类型。

--相同类型范畴

mysql=# select pg_typeof(1),pg_typeof(2.0);

pg_typeof | pg_typeof

-----------+-----------

integer | numeric

(1 row)

mysql=# select ifnull(1,2.0),pg_typeof(ifnull(1,2.0));

ifnull | pg_typeof

--------+-----------

1 | numeric

(1 row)

--不同类型范畴

mysql=# select pg_typeof(1),pg_typeof(current_date);

pg_typeof | pg_typeof

-----------+-----------

integer | date

(1 row)

mysql=# select ifnull(1,current_date),pg_typeof(ifnull(1,current_date));

ifnull | pg_typeof

--------+-----------

1 | text

(1 row)

规则6： 把所有输入转换为所选的类型。如果从给定的输入到所选的类型没有隐式转换则失败。

--json不存在到text的隐式转换

mysql=# select pg_typeof(1),pg_typeof('{"a":1}'::json);

pg_typeof | pg_typeof

-----------+-----------

integer | json

(1 row)

mysql=# select ifnull(1,'{"a":1}'::json),pg_typeof(ifnull(1,'{"a":1}'::json));

ERROR: IFNULL could not convert type json to text

LINE 1: select ifnull(1,'{"a":1}'::json),pg_typeof(ifnull(1,'{"a":1}...

^

CONTEXT: referenced column: ifnull

--可以尝试显式指定类型转换

mysql=# select ifnull(1,'{"a":1}'::json::text);

ifnull

--------

1

(1 row)

点击关注，第一时间了解华为云新鲜技术~

微信关注我们

原文链接：https://my.oschina.net/u/4526289/blog/10094699

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

Vim 项目的未来

Vim 作者 Bram Moolenaar 一周前去世，他被称为是 Vim 项目的终身仁慈独裁者，管理着 Vim 项目的各个方面。他的去世留下了巨大的空白。在 vim_dev 邮件列表上，Vim 核心开发者 Christian Brabandt 宣布了项目的未来计划，称从 Bram 家人获得了 Vim 在 Github 上的管理权，邀请了更多开发者加入了 Vim 组织，已经开始合并 commits，但目前主要是 bug 修正、安全补丁和文档更新等。其他的计划还包括：处理当前积压的工作后，发布 Vim 9.1 未来让 Vim 变得更现代（类似 Neovim 的做法）接管 Vim 所有邮件列表的管理和访问权限暂时无法访问 Vim FTP 主服务器，正在接触 Bram 的家人是否知道凭证迁移 Vim 项目主页讨论是否将 Vim 项目主页开源详情。

2023-08-11

829

2020 年初，随着网易互娱的海外业务增长与海外数据合规的需求，我们开始了网易互娱大数据离线计算平台迁移出海的工作。前期，我们采取了云主机裸机加上高性能 EBS 块存储的方案。但是，这个方案存储费用高昂，成本是国内自建机房的数十倍。于是，我们决定在公有云上构建一个平台，这个平台不仅需要更加适应当前业务场景、与历史业务更为兼容，还要比公有云的 EMR 托管方案更为经济。我们主要从存储、计算和数据分层生命周期管理三方面进行了成本优化，具体的优化方案将在下文为大家详细介绍。最终，这个项目给下游数据业务和分析部门提供了完整 Hadoop 的兼容性，避免了所有业务逻辑推倒重来；给游戏数据业务出海节省了大量成本，存储成本为优化前的 50%，算力总成本为优化前的 40%，冷数据成本为优化后线上存储成本的 33%。未来随着业务量的增加，成本节约按 10 倍比例节约相应的费用，为出海后的数据化运营等提供有力支持。 01. 大数据平台海外上云方案设计在 2020 年，我们开始了一项紧急的出海任务。在国内，我们的业务一直以自建集群的方式进行部署和运行。为了在海外能够快速上线，我们紧急上线了一个与国内集...

2023-08-11

966

资源下载

更多资源

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长，特征是大鼻子、头戴帽子、身穿背带裤，还留着胡子。与他的双胞胎兄弟路易基一起，长年担任任天堂的招牌角色。

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称，一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集，帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Spring

Spring框架（Spring Framework）是由Rod Johnson于2002年提出的开源Java企业级应用框架，旨在通过使用JavaBean替代传统EJB实现方式降低企业级编程开发的复杂性。该框架基于简单性、可测试性和松耦合性设计理念，提供核心容器、应用上下文、数据访问集成等模块，支持整合Hibernate、Struts等第三方框架，其适用范围不仅限于服务器端开发，绝大多数Java应用均可从中受益。

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能，例如代码缩略图，Python的插件，代码段等。还可自定义键绑定，菜单和工具栏。Sublime Text 的主要功能包括：拼写检查，书签，完整的 Python API ， Goto 功能，即时项目切换，多选择，多窗口等等。Sublime Text 是一个跨平台的编辑器，同时支持Windows、Linux、Mac OS X等操作系统。