Databend 开源周报第 148 期
Databend 是一款现代云数仓。专为弹性和高效设计,为您的大规模分析需求保驾护航。自由且开源。即刻体验云服务:https://app.databend.cn 。
What's On In Databend
探索 Databend 本周新进展,遇到更贴近你心意的 Databend 。
支持 ORC 文件加载
ORC(Optimized Row Columnar)格式是一种高效的列存储格式,广泛应用于数据分析领域。
Databend 现已支持对 ORC 文件进行查询、加载和转换,帮助用户获得更快的查询性能和更高的压缩率。
下面的示例展示了如何查询位于 Stage 中的 ORC 格式文件:
-- Create a ORC file format CREATE OR REPLACE FILE FORMAT orc_ff TYPE = 'ORC'; SELECT * FROM @orc_data_stage ( FILE_FORMAT => 'orc_ff', PATTERN => '.*[.]orc' ) t LIMIT 10;
如果您想了解更多信息,欢迎联系 Databend 团队,或查看下面列出的资源。
Beyond the Code
一起来探索 Databend 社区和周边生态中的新鲜事。
Toco 使用 Databend Cloud 应对大数据挑战
随着 Toco 业务在欧洲的扩展,面临的数据处理需求急剧增加。Toco 希望数据库解决方案能够访问 S3 Buckets 处理数据文件,并具备计算与存储分离架构,以提供灵活和可靠的数据分析方案。
Databend Cloud 以其卓越的计算与存储分离架构和全面的对象存储服务支持(超过 20 种)被 Toco 选中。此外,Databend Cloud 的 STAGE 支持使得用户可以轻松地加载和导出数据,进行查询,无需复杂的表创建或数据导入过程。
目前 Databend Cloud 为 Toco 提供从数据获取与处理到数据访问与展示的全面支持。
如果您想了解更多信息,欢迎联系 Databend 团队,或查看下面列出的资源。
Blog * Customer Success Story: Toco Chooses Databend Cloud to Tackle Big Data Challenges
Highlights
以下是一些值得注意的事件,也许您可以找到感兴趣的内容。
- 支持
task_history
函数。 - 为 show indexes 增加倒排索引相关信息。
- 新增 databend-metaverifier 实用程序。
What's Up Next
我们始终对前沿技术和创新理念持开放态度,欢迎您加入社区,为 Databend 注入活力。
RFC:使用 error-stack
增强错误处理
当前流行的错误处理主要是通过枚举类型树和 From
trait 实现,这导致难以追踪源自同一错误源的不同错误,缺乏错误跟踪信息,并且错误类型通常局限于单个 crate 的层面。
我们计划用 error-stack
替换现有的错误处理实践。这个 crate 能够详细追踪错误所有细节,并且能够在多线程或异步环境中跟踪错误,无需 async-backtrace
。
下面是 error-stack
的错误消息示例:
Error: a fatal error has occurred in the main loop ├╴at src/main.rs:11:51 │ ├─▶ failed to read index file: index.txt │ ╰╴at src/main.rs:29:35 │ ╰─▶ No such file or directory (os error 2) ╰╴at src/main.rs:29:3
Issue #15741 * RFC: Enhancing Error Handling in Rust with error-stack
如果你对这个主题感兴趣,可以尝试解决其中的部分问题或者参与讨论和 PR review 。或者,你可以点击 https://link.databend.rs/i-m-feeling-lucky 来挑选一个随机问题,祝好运!
New Contributors
一起认识社区中的新伙伴,Databend 因你们而变得更加美好。
Changelog
前往查看 Databend 每日构建的变更日志,以了解开发的最新动态。
地址:https://github.com/datafuselabs/databend/releases
Contributors
非常感谢贡献者们在本周的卓越工作。
Connect With Us
Databend 是一款开源、弹性、低成本,基于对象存储也可以做实时分析的新式数仓。期待您的关注,一起探索云原生数仓解决方案,打造新一代开源 Data Cloud。

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
一文带你搞清楚Python的多线程和多进程
本文分享自华为云社区《Python中的多线程与多进程编程大全【python指南】》,作者:柠檬味拥抱。 Python作为一种高级编程语言,提供了多种并发编程的方式,其中多线程与多进程是最常见的两种方式之一。在本文中,我们将探讨Python中多线程与多进程的概念、区别以及如何使用线程池与进程池来提高并发执行效率。 多线程与多进程的概念 多线程 多线程是指在同一进程内,多个线程并发执行。每个线程都拥有自己的执行栈和局部变量,但共享进程的全局变量、静态变量等资源。多线程适合用于I/O密集型任务,如网络请求、文件操作等,因为线程在等待I/O操作完成时可以释放GIL(全局解释器锁),允许其他线程执行。 多进程 多进程是指在操作系统中同时运行多个进程,每个进程都有自己独立的内存空间,相互之间不受影响。多进程适合用于CPU密集型任务,如计算密集型算法、图像处理等,因为多进程可以利用多核CPU并行执行任务,提高整体运算速度。 线程池与进程池的介绍 线程池 线程池是一种预先创建一定数量的线程并维护这些线程,以便在需要时重复使用它们的技术。线程池可以减少线程创建和销毁的开销,提高线程的重复利用率。在Pyt...
- 下一篇
vxe-table 4.7.9 已经发布,vue 表格解决方案
vxe-table 4.7.9 已经发布,vue 表格解决方案 此版本更新内容包括: 更新相关版本依赖 table 小 bug 修复 详情查看:https://gitee.com/xuliangzhan_admin/vxe-table/releases/4.7.9
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- CentOS8,CentOS7,CentOS6编译安装Redis5.0.7
- SpringBoot2整合Thymeleaf,官方推荐html解决方案
- Springboot2将连接池hikari替换为druid,体验最强大的数据库连接池
- SpringBoot2配置默认Tomcat设置,开启更多高级功能
- CentOS7设置SWAP分区,小内存服务器的救世主
- SpringBoot2全家桶,快速入门学习开发网站教程
- Hadoop3单机部署,实现最简伪集群
- Docker使用Oracle官方镜像安装(12C,18C,19C)
- CentOS关闭SELinux安全模块
- CentOS6,CentOS7官方镜像安装Oracle11G