Databend 开源周报第 152 期
Databend 是一款现代云数仓。专为弹性和高效设计,为您的大规模分析需求保驾护航。自由且开源。即刻体验云服务:https://app.databend.cn 。
What's On In Databend
探索 Databend 本周新进展,遇到更贴近你心意的 Databend。
支持内置 UDFs
Databend 现在已经支持在配置文件中预定义 UDFs 的能力,允许在部署时预先内置部分实用的 UDFs。
示例如下:
[[query.udfs]] name = "ping" definition = "CREATE FUNCTION ping(STRING) RETURNS STRING LANGUAGE python HANDLER = 'ping' ADDRESS = 'http://0.0.0.0:8815'"
如果您想了解更多信息,欢迎联系 Databend 团队,或查看下面列出的资源。
Beyond the Code
一起来探索 Databend 社区和周边生态中的新鲜事。
使用 bend-ingest-kafka 实时导入数据
bend-ingest-kafka 是一个专为 Databend 设计的实时数据导入工具,它允许用户从 Apache Kafka 直接将数据流导入到 Databend 中,实现数据的实时分析和处理。这一工具相比 Kafka Connector 更加轻量、简单和可靠。
bend-ingest-kafka --kafka-bootstrap-servers="127.0.0.1:9092,127.0.0.2:9092"\ --kafka-topic="Your Topic"\ --kafka-consumer-group= "Consumer Group"\ --databend-dsn="http://root:root[@127.0.0.1](https://my.oschina.net/u/567043):8000"\ --databend-table="db1.tbl" \ --data-format="json" \ --batch-size=100000 \ --batch-max-interval=300
Highlights
以下是一些值得注意的事件,也许您可以找到感兴趣的内容。
- 支持基于败者树的排序算法。
- 支持利用 admin API 实时查询 profile 信息。
- 为 UDF 支持租户和查询 ID ,方便进一步追踪错误。
- 实现 HAVERSINE、ST_LENGTH 和 ST_DISTANCE 等函数。
What's Up Next
我们始终对前沿技术和创新理念持开放态度,欢迎您加入社区,为 Databend 注入活力。
改进优化器直方图
优化器通常使用直方图来估计列的数据分布,从而做出更优的查询计划。然而,假如数据分布假设不准确,可能会导致次优的查询执行计划。
目前 Databend 优化器的直方图假设数据是均匀分布的,但对于很多数据集而言,其数据分布可能并不均匀,这会导致优化器生成错误的连接顺序。
Issue #15963 | Improve optimizer histogram
如果你对这个主题感兴趣,可以尝试解决其中的部分问题或者参与讨论和 PR review。或者,你可以点击 https://link.databend.rs/i-m-feeling-lucky 来挑选一个随机问题,祝好运!
Changelog
前往查看 Databend 每日构建的变更日志,以了解开发的最新动态。
地址:https://github.com/datafuselabs/databend/releases
Contributors
非常感谢贡献者们在本周的卓越工作。
Connect With Us
Databend 是一款开源、弹性、低成本,基于对象存储也可以做实时分析的新式数仓。期待您的关注,一起探索云原生数仓解决方案,打造新一代开源 Data Cloud。

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
「RockYou2024」文件泄露:包含 100 亿条明文密码
网络安全公司 Cybernews 于 7 月 4 日发布博文,发现了包含 9948575739 条明文信息记录的rockyou2024.txt文件,已经预定成为 2024 年最大的密码泄露事件。 网名为 ObamaCare 的黑客于 7 月 4 日在暗网论坛发帖,分享了包含将近 100 亿个明文密码的 rockyou2024.txt 文件,在 RockYou 2021 文件(包含 84 亿个明文密码)基础上再新增了约 15 亿个新密码。 虽然该用户是在 2024 年 5 月底注册的,但他们之前曾分享过西蒙斯-西蒙斯律师事务所的员工数据库、在线赌场 AskGamblers 的线索以及伯灵顿郡罗文学院的学生申请表。 消息称本次新增的 15 亿个新密码中,来自 4000 个庞大数据库,覆盖了过去至少 20 年时间。 研究人员表示: 从本质上讲,RockYou2024 汇编了全球个人泄露的隐私隐私,意味着攻击者可以利用这些数据发起攻击是,大大增加了用户的风险。 我们已经联系了发布数据文件的威胁行为者,收到了大约 30GB 的 combolists 证明,从中提取了数据。不过,我们的研究团队并未...
- 下一篇
深入了解软件测试:从入门到奥秘,揭开测试的精髓
最新技术资源:(建议收藏) https://www.grapecity.com.cn/resources/ 前言 在软件开发的世界中,软件测试是不可或缺的一部分。它是确保软件质量、功能完整性和用户满意度的关键环节。本文小编将为大家介绍各类软件测试的奥秘,并提供入门级的指导和见解。 本文内容概要: 软件测试是什么? 黑盒测试vs白盒测试 自动化测试vs手工测试 功能测试方法论 非功能测试方法论 软件测试生命周期 软件测试最佳实践 软件测试是什么? 软件测试是在开发流程中被开发者用来持续地评估和纠正特性的功能性的一个循环进行的步骤。软件测试比对软件的当前构建和软件需求,以确认没有疏漏的需求。同样需要验证的是,软件在跨越不同媒介时、与现有软件集成时运行正确。 软件测试是如何运作的? 测试软件有不少办法。通常来讲,开发者首先决定一个需要验证的行为或者特性,创建一个测试来确认特性,接着要么修改特性,要么通过测试就直接继续后面事情了。 在早期软件设计哲学中,测试经常完全被忽视。现在软件已经变得更加复杂,在更大规模被实现,而且在不同设备与操作系统间各不相同。现代的开发周期中,软件测试已经是必要的部分...
相关文章
文章评论
共有0条评论来说两句吧...