Databend 产品月报（2025年2月）-低调大师

Databend 产品月报（2025年2月）

2025-03-05 142

很高兴为您带来 Databend 2025 年 2 月的最新更新、新功能和改进！我们希望这些增强功能对您有所帮助，并期待您的反馈。

从 MySQL 迁移到 Databend

Databend 推荐使用 db-archiver 进行 MySQL 批量迁移，使用 Flink CDC 进行实时变更数据捕获（CDC）迁移。教程已更新：

设置会话标签

现在，您可以为会话分配一个可选标签，从而更方便地在日志表中过滤具有指定标签的日志。例如，以下命令将当前会话的标签设置为 eric：

SET SESSION query_tag = 'eric';

随后，我们执行一个查询，并使用该标签从日志表中检索相应的日志记录：

SHOW USERS;

SELECT query_tag, query_text 
FROM system.query_log 
WHERE query_tag = 'eric' 
LIMIT 1;

返回结果中，您可以找到带有 eric 标签的查询记录：

-[ RECORD 1 ]-----------------------------------
               query_tag: eric
              query_text: SHOW USERS

溢出数据存储

自托管 Databend 支持在内存使用超出可用限制时，将中间查询结果溢出到磁盘。现在，您可以配置溢出数据的存储位置，可选择本地磁盘存储或远程 S3 兼容存储桶。

以下示例将 Databend 配置为最多使用 1 TB 本地磁盘空间进行溢出操作，同时保留 40% 磁盘空间供系统使用：

[spill]
spill_local_disk_path = "/data1/databend/databend_spill"
spill_local_disk_reserved_space_percentage = 40
spill_local_disk_max_bytes = 1099511627776

以下示例将 Databend 配置为使用 MinIO 作为 S3 兼容存储服务来进行溢出操作：

[spill]
[spill.storage]
type = "s3"
[spill.storage.s3]
bucket = "databend"
root = "admin"
endpoint_url = "http://127.0.0.1:9900"
access_key_id = "minioadmin"
secret_access_key = "minioadmin"
allow_insecure = true

使用 "FROM table" 获取所有列

Databend 扩展了 SQL 语法，允许查询直接以 FROM <table> 开头，而无需显式使用 SELECT *：

FROM my_table;

等同于：

SELECT * FROM my_table;

新增与优化的 SQL 命令

ATTACH TABLE：现在，您可以在附加表时指定选择的列。

ATTACH TABLE population_only (city, population) 's3://databend-doc/1/16/' CONNECTION = ( REGION='us-east-2', AWS_KEY_ID = '<your_aws_key_id>', AWS_SECRET_KEY = '<your_aws_secret_key>' );

新教程：使用 ATTACH TABLE 链接表

DESC PROCEDURE：显示特定存储过程的详细信息。

DESC PROCEDURE sum_even_numbers(Uint8, Uint8);

┌────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────┐ │ Property │ Value │ ├───────────┼────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────┤ │ signature │ (start_val,end_val) │ │ returns │ (UInt8) │ │ language │ SQL │ │ body │ BEGIN\n LET sum := 0;\n FOR i IN start_val TO end_val DO\n IF i % 2 = 0 THEN\n sum := sum + i;\n END IF;\n END FOR;\n \n RETURN sum;\nEND; │ └────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────┘

新增与优化的 SQL 函数

TIMESTAMP_DIFF：计算两个时间戳之间的差异，并将结果以 INTERVAL 格式返回。

SELECT TIMESTAMP_DIFF('2025-02-01'::TIMESTAMP, '2025-01-01'::TIMESTAMP);

┌──────────────────────────────────────────────────────────────────┐ │ timestamp_diff('2025-02-01'::TIMESTAMP, '2025-01-01'::TIMESTAMP) │ ├──────────────────────────────────────────────────────────────────┤ │ 744:00:00 │ └──────────────────────────────────────────────────────────────────┘
FUSE_TIME_TRAVEL_SIZE：计算表的历史数据（用于时间旅行）的存储大小。

-- Calculate historical data size for all tables in all databases SELECT ... FROM fuse_time_travel_size();

-- Calculate historical data size for all tables in a specified database SELECT ... FROM fuse_time_travel_size('<database_name>');

-- Calculate historical data size for a specified table in a specified database SELECT ... FROM fuse_time_travel_size('<database_name>', '<table_name>'));
ARRAYS_ZIP：将多个数组合并为一个数组元组。

SELECT ARRAYS_ZIP([1, 2, 3], ['a', 'b', 'c']);

┌────────────────────────────────────────┐ │ arrays_zip([1, 2, 3], ['a', 'b', 'c']) │ ├────────────────────────────────────────┤ │ [(1,'a'),(2,'b'),(3,'c')] │ └────────────────────────────────────────┘
MAP_INSERT：返回一个新的 MAP，其中包含输入 MAP 和插入的新键值对（如果键已存在，则更新为新值）。

SELECT MAP_INSERT({'a':1,'b':2,'c':3}, 'd', 4);

┌─────────────────────────────────────────┐ │ map_insert({'a':1,'b':2,'c':3}, 'd', 4) │ ├─────────────────────────────────────────┤ │ {'a':1,'b':2,'c':3,'d':4} │ └─────────────────────────────────────────┘

SELECT MAP_INSERT({'a':1,'b':2,'c':3}, 'a', 5, true);

┌───────────────────────────────────────────────┐ │ map_insert({'a':1,'b':2,'c':3}, 'a', 5, TRUE) │ ├───────────────────────────────────────────────┤ │ {'a':5,'b':2,'c':3} │ └───────────────────────────────────────────────┘
MAP_PICK：返回一个新的 MAP，包含来自现有 MAP 的指定键值对。

SELECT MAP_PICK({'a':1,'b':2,'c':3}, 'a', 'c');

┌─────────────────────────────────────────┐ │ map_pick({'a':1,'b':2,'c':3}, 'a', 'c') │ ├─────────────────────────────────────────┤ │ {'a':1,'c':3} │ └─────────────────────────────────────────┘

SELECT MAP_PICK({'a':1,'b':2,'c':3}, ['a', 'b']);

┌───────────────────────────────────────────┐ │ map_pick({'a':1,'b':2,'c':3}, ['a', 'b']) │ ├───────────────────────────────────────────┤ │ {'a':1,'b':2} │ └───────────────────────────────────────────┘
EXTRACT：现在，您可以从间隔值中提取组件，并新增对 EPOCH 作为可提取字段的支持。

SELECT NOW(), EXTRACT(DAY FROM NOW()), EXTRACT(DOY FROM NOW()), EXTRACT(EPOCH FROM NOW());

┌────────────────────────────────────────────────────────────────────────────────────────────────────────────┐ │ now() │ EXTRACT(DAY FROM now()) │ EXTRACT(DOY FROM now()) │ EXTRACT(EPOCH FROM now()) │ ├────────────────────────────┼─────────────────────────┼─────────────────────────┼───────────────────────────┤ │ 2025-02-08 03:51:51.991167 │ 8 │ 39 │ 1738986711.991167 │ └────────────────────────────────────────────────────────────────────────────────────────────────────────────┘

SELECT EXTRACT(DAY FROM '1 day 2 hours 3 minutes 4 seconds'::INTERVAL);

┌─────────────────────────────────────────────────────────────────┐ │ EXTRACT(DAY FROM '1 day 2 hours 3 minutes 4 seconds'::INTERVAL) │ ├─────────────────────────────────────────────────────────────────┤ │ 1 │ └─────────────────────────────────────────────────────────────────┘
SUM：现在支持 INTERVAL 值。

-- Create a table with integer, double, and interval columns CREATE TABLE sum_example ( id INT, int_col INTEGER, double_col DOUBLE, interval_col INTERVAL );

-- Insert data INSERT INTO sum_example VALUES (1, 10, 15.5, INTERVAL '2 days'), (2, 20, 25.7, INTERVAL '3 days'), (3, NULL, 5.2, INTERVAL '1 day'),
(4, 30, 40.1, INTERVAL '4 days');

-- Calculate the sum for each column SELECT SUM(int_col) AS total_integer, SUM(double_col) AS total_double, SUM(interval_col) AS total_interval FROM sum_example;

-- NULL values are ignored. -- SUM(interval_col) returns 240:00:00 (10 days).

┌──────────────────────────────────────────────────────────┐ │ total_integer │ total_double │ total_interval │ ├─────────────────┼───────────────────┼────────────────────┤ │ 60 │ 86.5 │ 240:00:00 │ └──────────────────────────────────────────────────────────┘
DATE_TRUNC：现在支持 WEEK 作为精度。

SELECT DATE_TRUNC(MONTH, to_date('2022-07-07')), DATE_TRUNC(WEEK, to_date('2022-07-07'));

┌────────────────────────────────────────────────────────────────────────────────────┐ │ DATE_TRUNC(MONTH, to_date('2022-07-07')) │ DATE_TRUNC(WEEK, to_date('2022-07-07')) │ ├──────────────────────────────────────────┼─────────────────────────────────────────┤ │ 2022-07-01 │ 2022-07-04 │ └────────────────────────────────────────────────────────────────────────────────────┘

关于 Databend

Databend 是一款开源、弹性、低成本，基于对象存储也可以做实时分析的新式湖仓。期待您的关注，一起探索云原生数仓解决方案，打造新一代开源 Data Cloud。

👨‍💻‍ Databend Cloud：databend.cn

📖 Databend 文档：docs.databend.com

💻 Wechat：Databend

✨ GitHub：github.com/databendlab...

微信关注我们

原文链接：https://my.oschina.net/u/5489811/blog/17829059

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

基于 MySQL 8.0 细粒度授权：单独授予 KILL 权限的优雅解决方案

基于 MySQL 8.0 细粒度授权：单独授予 KILL 权限的优雅解决方案一、引言作为一名数据库从业者，我在日常工作中经常会遇到一个棘手的问题：如何在保证安全的前提下，让业务团队拥有足够的权限去管理数据库执行的 SQL，尤其是终止那些失控的慢查询或异常线程？这个问题看似简单，却牵涉到权限设计、安全合规以及数据库稳定性等多方面的权衡。今天，我们就来聊聊 MySQL 8.0 如何通过权限体系的革新，特别是对 KILL 权限的细化支持，解决了这一痛点，并为 DBA 和业务开发团队带来了更大的灵活性。二、从痛点说起：KILL SQL 的权限困境在 MySQL 实际使用中，业务开发人员常希望拥有终止 SQL 的能力。例如，慢查询占用大量资源，或未优化的批量操作导致负载飙升，此时及时 KILL 问题 SQL 是最直接的解决办法。然而，MySQL 的权限设计限制让这一需求难以实现，开发人员往往只能依赖 DBA 操作，既低效又拖延响应。在 MySQL 的传统版本（比如 5.7 及更早版本）中，KILL 权限的实现存在以下几个问题：执行用户限制默认情况下，用户只能 KILL 自己创建的线...

2025-03-05

148

在代码的深海与数学的星空之间，国产自研旗舰DeepSeek-R1正以‌千亿级参数‌为舟，‌强大的推理和理解能力‌为帆，破浪前行。它不仅是代码战场上的解码高手，更是数学迷宫中的推理大师。当LazyLLM引擎与之并肩，一场关于算法与逻辑的盛宴悄然开启。为何要结合RAG？——DeepSeek-R1 的局限性及RAG的互补价值尽管 DeepSeek-R1 具备上述优势，但其静态知识库更新成本高和实时检索效率不足的特性，可能在动态教育场景中受限（现在，我们询问一个问题“何为大学”，希望得到的是儒家经典中《大学》里面关于该问题的解释，但是下面DeepSeek-R1给的回答非常宽泛）。而RAG（检索增强生成）技术可以通过以下方式弥补（DeepSee-R1结合RAG后的回答如下）：动态知识更新——解决模型“知识截止”问题痛点：DeepSeek-R1 的预训练知识依赖固定数据集，难以实时跟进教学热点（如新教材、学科竞赛题）。 RAG 解决方案：通过对接教育领域数据库（如教材库、试题库），实现知识的动态检索与增量学习，确保内容始终与时俱进。精准领域聚焦——提升垂直场景响应效率痛点：通用大模...

2025-03-05

260

资源下载

更多资源

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长，特征是大鼻子、头戴帽子、身穿背带裤，还留着胡子。与他的双胞胎兄弟路易基一起，长年担任任天堂的招牌角色。

Spring

Spring框架（Spring Framework）是由Rod Johnson于2002年提出的开源Java企业级应用框架，旨在通过使用JavaBean替代传统EJB实现方式降低企业级编程开发的复杂性。该框架基于简单性、可测试性和松耦合性设计理念，提供核心容器、应用上下文、数据访问集成等模块，支持整合Hibernate、Struts等第三方框架，其适用范围不仅限于服务器端开发，绝大多数Java应用均可从中受益。

Rocky Linux

Rocky Linux（中文名：洛基）是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版，作为CentOS稳定版停止维护后与RHEL（Red Hat Enterprise Linux）完全兼容的开源替代方案，由社区拥有并管理，支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性，采用模块化包装和SELinux安全架构，默认包含GNOME桌面环境及XFS文件系统，支持十年生命周期更新。

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能，例如代码缩略图，Python的插件，代码段等。还可自定义键绑定，菜单和工具栏。Sublime Text 的主要功能包括：拼写检查，书签，完整的 Python API ， Goto 功能，即时项目切换，多选择，多窗口等等。Sublime Text 是一个跨平台的编辑器，同时支持Windows、Linux、Mac OS X等操作系统。