Databend 基于青云 DeepSeek-V3 服务拥抱技术创新
随着业务的飞速发展, 依托创新数据处理技术来为众多企业提供云原生湖仓解决方案的 Databend,面临着用户日益增长的复杂数据处理需求,从 2023 年起便开始探索将大模型能力引入湖仓,对算力和 API 稳定性提出了近乎苛刻的要求,青云科技旗下基石智算CoresHub 提供 DeepSeek 稳定的 API 调用,为 Databend 的能力创新筑牢了坚实基础。
业务创新拥抱 DeepSeek
Databend 是一款基于 Rust 语言,开源的新一代云原生数据湖仓,围绕着大规模数据提供实时分析、复杂查询以及数据湖仓的高效管理,处理的数据类型丰富多样,涵盖了结构化、半结构化和非结构化数据,数据量动辄以 PB 级别计算,需要对海量的实时数据进行快速处理,为企业提供即时的决策支持。
Databend 通过 SQL 调用模式,将自身的数据处理能力与 DeepSeek 强大的自然语言处理和数据理解能力相结合,帮助用户高效处理数据,挖掘数据价值。目前已经在内部质量保证系统、AI 函数服务、非结构化数据处理等国内场景中,成功以青云提供的 DeepSeek 服务替换海外的 OpenAI 服务,在数据处理与分析、智能查询与交互优化、自动化与智能化工作流等方面受益,减少人工分析的时间和工作量。
- 内部质量保障系统
为确保企业用户在升级过程中受到的影响最小化,Databend 基于 DeepSeek 的 SQL 模式生成了一套冒烟测试(Smoke Test)集合。测试数据生成引擎的核心技术依赖于 DeepSeek 的强大数据处理能力,能够根据 SQL 模式生成更接近用户真实业务场景的数据分布,尤其是容易触发边界问题的测试数据。该方式不仅提高了测试覆盖率,还能更有效地发现潜在系统风险,为企业用户提供更加可靠的质量保障。
- AI 函数服务
Databend 为用户提供了一系列 AI 函数(AI Functions)服务实现数据的 ETL,用户可以直接在 SQL 中调用函数,利用 AI 能力从数据中挖掘更大价值。此前,Databend 全球服务均基于 OpenAI 的 API 支撑。但由于其仅支持海外用户场景,在 DeepSeek-V3 发布后,Databend 将国内场景替换为 DeepSeek,以更好满足国内用户需求。
- 非结构化数据处理
Databend 的很多用户在实际业务场景中,常常需要从非结构化数据中提取实体信息并转化为结构化数据,挖掘其数据价值。Databend 利用 Deepseek 的数据处理与分析能力,可以更高效地提取数据信息,并以 JSON 格式输出。以下是一个通过 DeepSeek V3 实现的示例: 输入 : "请发送邮件至 hi@example.com 与我联系,或访问我们在北京市中关村大街 123 号的办公室。" 输出:
{ "邮箱": "hi@example.com", "地址": "北京市中关村大街 123 号" }
DeepSeek-V3 作为一个通用 NLP 模型,适用于广泛的应用场景,能够高效处理各种文本生成、摘要和对话任务,671B 满血版本能提供更强大的功能和更准确的结果,真正为 Databend 业务创新提供有效支持。
基石智算CoresHub 通过 AI 算力云提供的 DeepSeek- V3 671B 模型服务,不仅提供了兼容 OpenAI 接口规范的使用方式,而且支持 API 调用、一键云端部署和私有化部署方式。用户仅需创建 API 密钥,即可通过 AI 应用或第三方客户端完成对特定模型的调用访问。
API 稳定是数据交互的生命线
目前,Databend 在游戏、社交、金融、广告、电商等多个行业领域中的企业级生产环境得到应用,每天处理超过 1 亿次查询,管理超过 800PB 的分析数据,某些核心生产业务单表超过 PB 级。一旦 API 出现故障或不稳定,就会影响 Databend 的对内对外服务。特别是在对外服务中,无法为用户提供 AI 函数,将影响用户的业务连续性。因此,保证 API 服务的稳定可靠,对 Databend 尤为重要。
青云科技扎根企业级市场十余年,深刻理解 Databend 对于 API 稳定的需求。基石智算CoresHub AI 底层采用分布式架构,能够有效避免单点故障,并通过动态流量调整,保障 API 始终以最优性能运行。基石智算CoresHub 监控系统会对对API 关键性能指标进行实时跟踪,一旦监测到异常,专业运维团队就会及时响应。更重要的是,根据用户反馈和业务发展需求,基石智算CoresHub 会持续改进 API 的功能和服务质量。
此次 Databend 与青云科技的密切合作创新,必将为双方的深度协作与业务拓展奠定坚实基础,共同引领数据处理行业迈向新的高度。
关于 Databend
Databend 是一款开源、弹性、低成本,基于对象存储也可以做实时分析的新式湖仓。期待您的关注,一起探索云原生数仓解决方案,打造新一代开源 Data Cloud。
👨💻 Databend Cloud:https://databend.cn
📖 Databend 文档:https://docs.databend.com
💻 Wechat:Databend

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
一文详解 RocketMQ 如何利用 Raft 进行高可用保障
作者:季俊涛 前言 Apache RocketMQ 自诞生以来,因其架构简单、业务功能丰富、具备极强可扩展性等特点被众多企业开发者以及云厂商广泛采用。历经十余年的大规模场景打磨,RocketMQ 已经成为业内共识的金融级可靠业务消息首选方案,被广泛应用于互联网、大数据、移动互联网、物联网等领域的业务场景。由于其业务场景愈加丰富,在工业界的使用率日益提高,开发者们也必须更完善地考虑 RocketMQ 的可靠性、可用性。 由于 RocketMQ 底层实际上是一种基于日志的存储系统,而前人为了避免这种存储系统中单个机器可能出现的数据丢失、单点故障等问题,已经有了相对成熟的解决方案------例如同时复制数据到多个机器上。在这个过程中,需要解决的问题便被简化了:如何保证多个机器上的数据是一致的,而且这种一致性强大到可以对抗宕机、脑裂等问题。而这些问题,可以通过分布式一致性算法来彻底解决。 在开源的 Apache RocketMQ 中,我们已经引入了 DLedger [ 2] 和 SOFAJRaft [ 3] 来作为 Raft [ 4] 算法的具体实现,以支撑系统高可用。 本文将介绍 Rocke...
- 下一篇
【GreatSQL优化器-12】make_tmp_tables_info
【GreatSQL优化器-12】make_tmp_tables_info 一、make_tmp_tables_info介绍 GreatSQL的优化器对于聚合函数和窗口函数需要创建内部临时表来进行计算并输出最后结果,这个内部临时表又需要原始表来作为数据输入源,具体的代码处理在make_tmp_tables_info函数实现。 下面用一个简单的例子来说明make_tmp_tables_info是做什么的。 greatsql> CREATE TABLE t1 (c1 INT PRIMARY KEY, c2 INT,date1 DATETIME); greatsql> INSERT INTO t1 VALUES (1,10,'2021-03-25 16:44:00.123456'),(2,1,'2022-03-26 16:44:00.123456'),(3,4,'2023-03-27 16:44:00.123456'),(5,5,'2024-03-25 16:44:00.123456'),(7,null,'2020-03-25 16:44:00.123456'),(8,10,...
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- MySQL8.0.19开启GTID主从同步CentOS8
- CentOS8安装Docker,最新的服务器搭配容器使用
- Linux系统CentOS6、CentOS7手动修改IP地址
- 2048小游戏-低调大师作品
- Springboot2将连接池hikari替换为druid,体验最强大的数据库连接池
- CentOS8安装MyCat,轻松搞定数据库的读写分离、垂直分库、水平分库
- CentOS8编译安装MySQL8.0.19
- CentOS6,CentOS7官方镜像安装Oracle11G
- CentOS7,8上快速安装Gitea,搭建Git服务器
- SpringBoot2整合Thymeleaf,官方推荐html解决方案