Databend 八月月报:向量检索重磅上线,性能飞跃几十倍
Hi,Databend 的朋友们!🚀
八月我们重磅推出:基于对象存储的向量检索功能。通过 HNSW 索引算法实现了相似性搜索 23 倍性能提升,AI 应用终于可以在对象存储上高效运行了。结合我们已有的结构化数据和 JSON 处理能力,Databend 现在是完全基于对象存储构建的多模态数据仓库。
八月数据
15+ 个新功能,20+ 个 bug 修复,15+ 项性能优化。最亮眼的还是向量检索,让 AI 应用在对象存储上也能获得极致性能。
本月亮点
🔥 重磅功能
- HNSW 向量检索 - 基于 HNSW 索引,相似性搜索快 23 倍
- 时间切片函数 - 时序数据分析更强大
- JSON5 解析增强 - JSON 处理更灵活
⚡ 性能和稳定性
- 防栈溢出 - 解决了 CTE 和物理计划的递归溢出
- 内存管理升级 - 大数据操作的溢出配置更合理
- Meta 服务优化 - 压力减少 40%
- 向量检索稳定性 - 修复了刷新时丢数据的问题
向量检索
📊 23 倍性能提升
优化前:
SELECT title, cosine_distance(embedding, :query) as score
FROM documents ORDER BY score LIMIT 10;
-- 8.2 秒,全表扫描
优化后(HNSW 索引加速):
-- 一模一样的查询
SELECT title, cosine_distance(embedding, :query) as score
FROM documents ORDER BY score LIMIT 10;
-- 0.35 秒,索引加速
🎮 生产验证:游戏行业成功实践
在 Databend Cloud 上,已有多家游戏公司在生产环境使用向量检索:
- 游戏推荐系统:基于玩家行为特征向量,实时推荐游戏内容和商品
- 用户画像分析:通过玩家行为向量聚类,精准识别用户类型和价值
- 反作弊检测:利用行为特征向量,快速识别异常玩家行为模式
- 内容匹配:根据玩家偏好向量,智能匹配游戏关卡和活动
这些客户的真实业务需求持续推动着我们的技术改进,让向量检索功能越来越成熟可靠。
🚀 快速上手指南
语义搜索三步搞定:
1. 建表加索引
CREATE TABLE products (
id INT,
name VARCHAR,
embedding VECTOR(1024),
-- 自动获得 23 倍加速,HNSW 索引存储在对象存储
VECTOR INDEX idx(embedding) distance='cosine'
);
2. 插入数据
INSERT INTO products VALUES
(1, 'Wireless Headphones', [0.1, 0.2, ...]::VECTOR(1024)),
(2, 'Bluetooth Speaker', [0.3, 0.1, ...]::VECTOR(1024));
3. 高性能搜索
-- 毫秒级响应
SELECT name FROM products
ORDER BY cosine_distance(embedding, :search_vector)
LIMIT 5;
支持三种距离算法:
- Cosine(余弦) - 文本语义相似性
- L2(欧式距离) - 图像视觉相似性
- L1(曼哈顿距离) - 特征对比分析
多模态数据仓库的价值
Databend 在对象存储上支持三大类数据的统一处理:
🏗️ 结构化数据 - 传统行列数据,列式存储高性能分析
📄 半结构化数据 - JSON文档,虚拟列技术 3 倍加速(七月)
🔍 非结构化数据 - 向量嵌入,HNSW 索引加速检索 23 倍(八月)
💰 成本优势
传统方案: 多系统拼凑
- 结构化数据:ClickHouse/PostgreSQL
- JSON 数据:MongoDB/Elasticsearch
- 向量搜索:Pinecone等专用向量数据库
- 复杂的数据管道连接各系统
Databend 方案: 统一平台
- 所有数据类型存储在对象存储,成本降低 80%
- 一套 SQL 处理所有数据类型,开发效率大幅提升
- 无需数据搬迁和系统整合
🎯 实际应用
现在你可以用纯 SQL 搭建完整的 AI 应用 —— 推荐系统、语义搜索、RAG 知识库,各种数据类型无缝配合。
Databend:多模态数据仓库,为 AI 应用而生
🔗 立即体验

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
-
上一篇
从怕需求到好配置:Oinone 把中国式审批变轻了
在中国企业里,审批像一条绕城高架:临时加人、领导出差、月底集中提交、跨子公司签批、法务/财务反复退回……流程图画得很美,现场却总要“打补丁”。Oinone 工作流这轮更新,目标就是把这些“补丁动作”产品化,让流程既守规则,又能机动。 一|业务背景 多层级、多法人、多条线并行的组织结构很常见; “请示—批示—用印—归档”链路中,经常需要临时加签、委托代批、条件化退回; 预算、合同、采购、费用报销等场景金额/品类差异大,分支规则多、变化快; 合规与效率并重,既要留痕,又要快速落地。 这套诉求的共同点:要灵活,还要可控可回溯。 DEMO点击体验: 演示环境 相关视频 ⚡ 直达演示环境 ☕ 账号:admin ☕ 密码:admin 🎬 1. [数式Oinone] #产品化演示# 后端研发与无代码辅助 🎬 2. [数式Oinone] #产品化演示# 前端开发 🎬 3. [数式Oinone] #个性化二开# 后端逻辑 🎬 4. [数式Oinone] #个性化二开# 前端交互 🎬 5. [数式Oinone] #个性化二开# 无代码模式 二|典型痛点 临时加签没边界:加在前?加在后?能否让审...
-
下一篇
2025 年大语言模型架构演进:DeepSeek V3、OLMo 2、Gemma 3 与 Mistral 3.1 核心技术剖析
编者按: 在 Transformer 架构诞生八年之际,我们是否真的见证了根本性的突破,还是只是在原有设计上不断打磨?今天我们为大家带来的这篇文章,作者的核心观点是:尽管大语言模型在技术细节上持续优化,其核心架构仍保持延续,真正的创新更多体现在效率提升与工程实现上。 文章系统梳理了 2025 年多个主流开源模型的架构演进,重点分析了 DeepSeek-V3/R1 的多头潜在注意力(MLA)与混合专家模型(MoE)、OLMo 2 的归一化层放置策略与 QK 归一化、Gemma 3 的滑动窗口注意力机制,以及 Mistral Small 3.1 在推理效率上的优化。 这篇文章为我们提供了一个冷静而深入的视角,提醒我们在追逐 SOTA 榜单的同时,不应忽视那些真正推动技术前进的、看似细微却至关重要的架构设计选择。 作者 | Devansh and Sebastian Raschka, PhD 编译 | 岳扬 目录 01 DeepSeek V3/R1 1.1 多头潜在注意力机制(MLA) 1.2 混合专家模型(MoE) 1.3 DeepSeek 架构总结 02 OLMo 2 2.1 归一化层放...
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- MySQL数据库在高并发下的优化方案
- SpringBoot2全家桶,快速入门学习开发网站教程
- CentOS8编译安装MySQL8.0.19
- Docker使用Oracle官方镜像安装(12C,18C,19C)
- MySQL8.0.19开启GTID主从同步CentOS8
- Springboot2将连接池hikari替换为druid,体验最强大的数据库连接池
- SpringBoot2初体验,简单认识spring boot2并且搭建基础工程
- Dcoker安装(在线仓库),最新的服务器搭配容器使用
- Docker快速安装Oracle11G,搭建oracle11g学习环境
- Docker容器配置,解决镜像无法拉取问题