Databend 开源周报第 128 期
Databend 是一款现代云数仓。专为弹性和高效设计,为您的大规模分析需求保驾护航。自由且开源。即刻体验云服务:https://app.databend.cn 。
What's On In Databend
探索 Databend 本周新进展,遇到更贴近你心意的 Databend 。
使用 Databend 查询位于 HuggingFace 文件系统上的数据
HuggingFace 是目前最火热的 AI 社区。Databend 现已支持直接查询和分析存储在 HuggingFace 文件系统中的海量数据和模型,帮助您释放数据潜能。
URI格式:hf://{repo_id}/path/to/file
,其中repo_id
类似 fka/awesome-chatgpt-prompts
。
支持的配置包括:
repo_type
: HuggingFace 仓库类型,默认为dataset
,可用选项有dataset
,model
。revision
: HuggingFace 修订版本,默认为main
。可以是仓库中的分支、标签或提交。token
: HuggingFace 的 API 令牌。
下面示例使用 Databend 查询 fka/awesome-chatgpt-prompts
,列出其中 CSV 文件第一列的 5 条数据。
如果您想了解更多信息,欢迎联系 Databend 团队,或查看下面列出的资源。
Code Corner
一起来探索 Databend 和周边生态中的代码片段或项目。
了解 Databend 与 MySQL,Oracle 之间的类型对照
Databend | MySQL | Oracle |
---|---|---|
TINYINT | TINYINT | NUMBER(3,0) |
SMALLINT | SMALLINT | NUMBER(5,0) |
INT | INT | NUMBER(10,0) |
BIGINT | BIGINT | NUMBER(19,0) |
FLOAT | FLOAT | FLOAT |
DOUBLE | DOUBLE | FLOAT(24) |
DECIMAL | DECIMAL | FLOAT(24) |
DATE | DATE | DATE |
TIMESTAMP | TIMESTAMP | NUMBER |
DATETIME | DATETIME | DATE |
YEAR | INT | NUMBER |
VARCHAR | VARCHAR | VARCHAR2 |
VARCHAR | CHAR | CHAR |
VARBINARY | VARBINARY | RAW, BLOB |
VARCHAR | VARCHAR | VARCHAR2 |
VARCHAR | VARCHAR | RAW, CBLOB |
VARBINARY | VARBINARY | RAW, BLOB |
VARCHAR | VARCHAR | RAW, CBLOB |
VARCHAR | VARCHAR | VARCHAR2 |
VARCHAR | VARCHAR | VARCHAR2 |
ARRAY | N/A | N/A |
BOOLEAN | N/A | N/A |
TUPLE | N/A | N/A |
MAP | N/A | N/A |
JSON, VARIANT | JSON | JSON |
BITMAP | N/A | N/A |
Highlights
以下是一些值得注意的事件,也许您可以找到感兴趣的内容。
- 新增 Binary 数据类型,并且支持 String 和 Binary 之间的转换。
- 支持自适应的 filter reorder 。
- 支持 JSON 处理函数
concat
。 - 支持自动刷新
ReadOnlyAttach
的表模式。
What's Up Next
我们始终对前沿技术和创新理念持开放态度,欢迎您加入社区,为 Databend 注入活力。
支持任务建议系统表
Databend 计划支持 task_advice
系统表,为日常运维提供有效洞见,帮助数据库运维人员更轻松自如地管理数据。
catalog_name | database_name | table_name | task_type | need_run | task_sql | reason(variant) |
---|---|---|---|---|---|---|
default | db | xx | COMPACT | 1 | optimize table xx compact limit 3 | "{status in json}" |
default | db | xx | AGGREGATING_INDEX | 0 | refresh aggregating index xx_agg_idx limit 10 | "{status in json}" |
default | db | yy | ADD_CLUSTER_KEY | 1 | alter table yy cluster by(col1) | "{status in json}" |
Issue #14323 | feat: task_advice system table
如果你对这个主题感兴趣,可以尝试解决其中的部分问题或者参与讨论和 PR review 。或者,你可以点击 https://link.databend.rs/i-m-feeling-lucky 来挑选一个随机问题,祝好运!
Changelog
前往查看 Databend 每日构建的变更日志,以了解开发的最新动态。
地址:https://github.com/datafuselabs/databend/releases
Contributors
非常感谢贡献者们在本周的卓越工作。
Connect With Us
Databend 是一款开源、弹性、低成本,基于对象存储也可以做实时分析的新式数仓。期待您的关注,一起探索云原生数仓解决方案,打造新一代开源 Data Cloud。

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
5分钟带您了解DRS录制回放
什么是DRS录制回放? DRS录制回放是将源数据库发生的真实业务流量,在目标数据库模拟执行,从而观察和检验目标数据库的功能和性能表现。录制回放主要分为录制、回放两个阶段,录制过程是从源数据库上将所需时间段内的全部SQL原语句(包括增、删、改、查)通过审计日志下载、录制代理等进行采集;回放是将采集到的全部SQL语句在目标数据库上进行执行(目标数据库需有源数据库的初始数据)。 DRS录制回放与DRS、UGO的关系 数据复制服务(Data Replication Service,简称DRS)是一种易用、稳定、高效,用于数据库实时迁移和数据库实时同步的云服务,着重于数据库毫秒级数据同步,支持同构异构数据库之间的数据传输/搬迁,降低数据库之间数据流通的复杂性,减少数据传输成本。 数据库和应用迁移 UGO(Database and Application Migration UGO,简称UGO)是专注于异构数据库结构迁移的云服务,可将源数据库中的DDL、DML和DCL一键自动转换为华为云GaussDB的SQL语法,最大化降低用户数据库的迁移成本。 录制回放是DRS提供的业务仿真特性,结合DRS+U...
- 下一篇
无需改动代码:将传统应用平滑迁移到云端
随着云计算的迅猛发展,云原生已成为企业数字化转型的关键词。然而,对于那些根植于传统IT架构的应用来说,迁移到云端不仅意味着技术栈的更新,更涉及到运维文化和业务流程的重大调整。本文将介绍如何在不改动代码的情况下,快速实现将传统应用迁移到云端。 传统应用与云原生应用的区别 传统应用通常是在单一且封闭的环境中开发和部署的。这些应用通常依赖于特定的硬件环境,与底层操作系统和网络配置紧密耦合,缺乏必要的弹性和可扩展性。此外,由于紧密耦合的架构,更新和维护通常耗时且风险较高。 相比之下,云原生应用的特点在于其轻量级、弹性和可扩展性,它们通常基于微服务架构,每个服务都可以独立更新和扩展;应用以容器化方式运行,并由动态编排系统管理,使其能够根据负载自动调整资源使用,优化性能和成本。 从传统到云原生:常见的挑战和考虑因素 迁移传统应用到云环境是一个复杂的过程,涉及多方面的考量。评估时需要重点考虑以下几点: 业务需求:明确迁移的目的和预期效果,如提高可靠性、降低成本或增强灵活性。 应用特性:分析应用的大小、复杂性以及对现有架构的依赖程度。 技术兼容性:确定迁移工具是否支持现有技术栈和依赖。 在考虑完以上因...
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- CentOS6,7,8上安装Nginx,支持https2.0的开启
- CentOS8,CentOS7,CentOS6编译安装Redis5.0.7
- SpringBoot2更换Tomcat为Jetty,小型站点的福音
- Jdk安装(Linux,MacOS,Windows),包含三大操作系统的最全安装
- CentOS7,8上快速安装Gitea,搭建Git服务器
- SpringBoot2整合MyBatis,连接MySql数据库做增删改查操作
- SpringBoot2全家桶,快速入门学习开发网站教程
- CentOS8安装MyCat,轻松搞定数据库的读写分离、垂直分库、水平分库
- CentOS8编译安装MySQL8.0.19
- CentOS7,CentOS8安装Elasticsearch6.8.6