Databend 开源周报第 109 期-低调大师

Databend 开源周报第 109 期

2023-09-05 870

Databend 是一款现代云数仓。专为弹性和高效设计，为您的大规模分析需求保驾护航。自由且开源。即刻体验云服务：https://app.databend.cn 。

What's On In Databend

探索 Databend 本周新进展，遇到更贴近你心意的 Databend 。

利用 Cluster Key 优化查询性能

通过定义 Cluster Key ，可以引导 Databend 对表进行聚类来提高查询性能，此时数据将会根据 Cluster Key 来组织和分组，而不仅仅依赖数据摄入的顺序。从而在处于大型表中获得优化的数据读取逻辑，加速查询。

一旦表设定了 Cluster Key ，在使用 COPY INTO 和REPLACE INTO 这两种方式写入数据时，会自动执行 compact 和 recluster 操作。

由于执行聚类和重聚类操作需要消耗一定的时间，所以我们建议主要为查询性能较慢的大型表定义集群键。

如果您想了解更多信息，请查看下面列出的资源。

Code Corner

一起来探索 Databend 和周边生态中的代码片段或项目。

Databend Local 模式

Databend 的 local 模式旨在为 Databend 提供一个简易版本，用户无需部署 Databend 服务就可以用 SQL 进行交互交互，从而方便开发者们用 SQL 使用 Databend 支持的功能进行简单的数据处理。

Local 模式将启动一个临时的 databend-query 进程，并且提供客户端和服务端的融合支持。其存储位于临时目录中，生命周期跟随进程，进程离开后资源也将销毁，你可以在一个服务器中启动多个 local 进程，他们的资源是相互隔离的。

❯ alias databend-local="databend-query local"
❯ echo " select sum(a) from range(1, 100000) as t(a)" | databend-local
4999950000

❯ databend-local

databend-local:) select number %3 n, number %4 m, sum(number) from numbers(1000000000) group by n,m limit 3 ;

┌───────────────────────────────────┐
│   n   │   m   │    sum(number)    │
│ UInt8 │ UInt8 │    UInt64 NULL    │
├───────┼───────┼───────────────────┤
│     0 │     0 │ 41666666833333332 │
│     1 │     0 │ 41666666166666668 │
│     2 │     0 │ 41666666500000000 │
└───────────────────────────────────┘
0 row result in 1.669 sec. Processed 1 billion rows, 953.67 MiB (599.02 million rows/s, 4.46 GiB/s)

如果你需要在生产环境使用 Databend，我们建议按官方文档部署 Databend 服务或使用 Databend Cloud，但如果你是开发人员或测试工程师，则可以使用 local 模式来体验 Databend 。

如果您想了解更多信息，请查看下面列出的资源。

PR | chore(query): improve databend local

Highlights

以下是一些值得注意的事件，也许您可以找到感兴趣的内容。

初步支持 MERGE INTO。
实现 SQLsmith 测试框架，以支持更精确的模糊测试。
阅读文档 Docs | Setting Environment Variables 了解如何通过环境变量变更 Databend 配置。
实现json_strip_nulls 和 json_typeof 函数，你也可以阅读 Docs | Semi-Structured Functions 了解 Databend 为半结构化数据处理设计和实现的函数。

What's Up Next

我们始终对前沿技术和创新理念持开放态度，欢迎您加入社区，为 Databend 注入活力。

优化 MERGE INTO 实现

在 PR #12350 | feat: support Merge-Into V1 中，Databend 初步支持了 MERGE INTO 语法。

在这个基础上，还有很多值得关注的优化可以实施，比如：提供并行和分布式的实现，减少 IO 并简化数据块拆分等。

Issue #12595 | Feature: Merge Into Optimizations

如果你对这个主题感兴趣，可以尝试解决其中的部分问题或者参与讨论和 PR review 。或者，你可以点击 https://link.databend.rs/i-m-feeling-lucky 来挑选一个随机问题，祝好运！

Changelog

前往查看 Databend 每日构建的变更日志，以了解开发的最新动态。

地址：https://github.com/datafuselabs/databend/releases

Contributors

非常感谢贡献者们在本周的卓越工作。

Connect With Us

Databend 是一款开源、弹性、低成本，基于对象存储也可以做实时分析的新式数仓。期待您的关注，一起探索云原生数仓解决方案，打造新一代开源 Data Cloud。

微信关注我们

原文链接：https://my.oschina.net/u/5489811/blog/10108046

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

为什么 Higress 是 Knative 入口网关的最佳实践?

在传统的应用开发中，通常需要管理底层的基础设施、服务器与网络配置等方面的工作。然而在云原生 Serverless 化的浪潮下，这些基础设施的细节被抽象和自动化，开发者无需关注服务器等配置、扩展、监控和维护等工作，可以更专注于应用程序的业务逻辑和功能开发。Serverless 架构的价值在于提供高效、弹性、无服务器管理、服务按需付费、快速部署与迭代、以及高可扩展性等优势，降低开发和运维的复杂性，提高开发效率和应用程序的质量。 Knative Serving 是一款基于 K8s 的 Serverless 开源平台，用于构建和管理现代化、可拓展、流量驱动、无服务器的应用程序。Knative Serving 提供了诸多特性来支持用户部署 Serverless 服务，如基于 HTTP 流量触发 pod 的自动扩缩容、服务版本修订、自动流量管理、故障恢复等。来源：https://knative.dev/docs/serving/architecture/ Knative 整体架构如上层所示，Controller 和 DomainMapping 等组件等负责管理 KnativeCRD 资源的生命周...

2023-09-05

867

Milvus 2.3 正式支持 NVIDIA A100！作为为数不多的支持 GPU 的向量数据库产品，Milvus 2.3 在吞吐量和低延迟方面都带来了显著的变化，尤其是与此前的 CPU 版本相比，不仅吞吐量提高了 10 倍，还能将延迟控制在极低的水准。不过，正如我前面提到的，鲜有向量数据库支持 GPU，这其中除了有技术门槛较高的因素外，还涉及诸多不确定性的问题。那么，Milvus 为什么要做一件充满挑战的事情？回想 Milvus 决定支持 GPU 的场景，很多细节仍旧历历在目。当时，随着 LLM 的兴起，用户对于向量数据库的性能提出了更高的要求，尤其是在一些对性能、延迟有着极高要求的场景，只通过 CPU 索引来支撑的难度越来越高，而 GPU 有着非常强大的并行处理能力。因此，我们决定在 Milvus 2.3 版本中支持 GPU。幸运的是，来自 NVIDIA 的小伙伴给予了我们诸多支持，他们主动给我们提供了Rapid Raft GPU 索引接入 Milvus 的支持代码。在 NVIDIA 和 Milvus 团队的共同努力下，Milvus GPU 版本如约而至。接下来，我们就来...

2023-09-05

972

资源下载

更多资源

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长，特征是大鼻子、头戴帽子、身穿背带裤，还留着胡子。与他的双胞胎兄弟路易基一起，长年担任任天堂的招牌角色。

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题，腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构，目前腾讯云软件源站支持公网访问和内网访问。

Rocky Linux

Rocky Linux（中文名：洛基）是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版，作为CentOS稳定版停止维护后与RHEL（Red Hat Enterprise Linux）完全兼容的开源替代方案，由社区拥有并管理，支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性，采用模块化包装和SELinux安全架构，默认包含GNOME桌面环境及XFS文件系统，支持十年生命周期更新。

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能，例如代码缩略图，Python的插件，代码段等。还可自定义键绑定，菜单和工具栏。Sublime Text 的主要功能包括：拼写检查，书签，完整的 Python API ， Goto 功能，即时项目切换，多选择，多窗口等等。Sublime Text 是一个跨平台的编辑器，同时支持Windows、Linux、Mac OS X等操作系统。