Google 在 MySQL 中推进矢量搜索,在 LLM 支持方面超越 Oracle
谷歌已将向量搜索引入其 MySQL 数据库服务,这一步领先了 MySQL 的所属公司 Oracle,迄今为止,Oracle 尚未给 MySQL 添加任何大型语言模型(LLM)方面的功能。
谷歌云数据库副总裁安迪·古特曼斯 (Andi Gutmans) 表示,在过去 12 年里,谷歌在向量方面的创新速度相当快。目前,在多个 Google Cloud 数据库中提供向量搜索预览版,包括 Cloud SQL for MySQL、Memorystore for Redis 以及 Google 的分布式数据库管理和存储服务 Spanner。
向量是 LLM 的基本元素,自 2022 年 ChatGPT 推出以来,LLM 已成为大型科技公司、政府和媒体的关注焦点。LLM 依赖于单词或语言的其他组成部分,根据其与其他语言的统计相似性将其表示为向量嵌入。Google 支持 Word2Vec,这是一种 2013 年推出的自然语言处理技术,尽管它已被法学硕士采用的转换器架构所取代。
开源数据库服务公司 Percona 的技术传播者 Dave Stokes 表示,Oracle 工程部门近期没有计划向 MySQL 支持向量类的功能。
“可悲的是,Oracle 似乎将所有资源投入到 HeatWave 中,同时为社区版做了绝对最低限度的资源,”他说。“这将使得 MySQL 进一步落后于 PostgreSQL 和新的向量数据库等。社区版普遍缺乏新特性和功能,而将 JavaScript 和向量嵌入到商业版本中,这将使社区客户寻求其他替代方案,例如 Google 提供的产品”。
不过,谷歌并不是唯一一家将向量搜索添加到 MySQL 服务的供应商。PlanetScale 是基于 MySQL/Vitesse 的分布式事务系统,于去年 10 月宣布了这一新功能。
Redis 是一种流行的内存数据库,通常用作缓存和系统代理,也已经在发布的版本中支持向量搜索。
分布式文档数据库 Couchbase 在 DBaaS Capella 和 Couchbase Enterprise Edition 中引入了向量搜索作为新功能。Couchbase 产品管理和业务运营高级副总裁 Scott Anderson 表示,向平台添加向量搜索是“使我们的客户能够构建新一波自适应应用程序”的下一步。
去年,Oracle数据库、Cassandra、MongoDB、PostgreSQL 和 SingleStore 在其数据库系统中增加了对向量搜索的支持,而像 Pinecone 这样的专业向量数据库也如雨后春笋般涌现,以支持计算趋势。
Forrester Research 副总裁兼首席分析师 Noel Yuhanna 表示,向量搜索现在或多或少已经成为任何专业企业数据库的标准。
“那些没有它的企业可能会看到对其增长的影响。根据我们的研究,大约 35% 的企业正在考虑向量数据库,预计在未来 18 个月内将增长到 50%,”他说。
他表示,向量搜索对于生成式人工智能应用程序变得至关重要,可以帮助寻找类似的数据、图像和文档,以及客户智能、欺诈检测、聊天机器人和内容个性化等新兴应用程序。
Yuhanna 说,虽然专业向量数据库有其优势,但集成数据库为组织提供了更多背景和更丰富的数据体验。“没有哪家供应商能脱颖而出,因为向量功能仍在不断发展,而且许多供应商尚未展现出高端规模。”
然而,目前只有约 22% 的组织正在为其数据库考虑 LLM/GenAI 战略,尽管 Forrester 预计这一数字在未来两到三年内会翻一番。Yuhanna 表示:“我们看到的大部分需求是希望利用向量进行新部署的新 GenAI 应用程序;要使现有数据库转向向量,我们至少需要几年时间。”
谷歌还试图让自己的 GenAI 模型更接近其分析环境。谷歌表示,它正在通过 Vertex AI 为 BigQuery(其数据仓库系统)的用户提供 Gemini。与 AI 和 ML 平台的新集成旨在帮助数据工程师和分析师使用 Gemini 模型为其 BigQuery 数据提供多模式和高级推理功能。
Yuhanna 表示,将 Vertex AI、BigQuery 和 BigLake 更紧密地结合在一起不仅可以帮助组织避免数据移动,还可以帮助提供见解、改善数据治理和安全性、删除冗余数据,并通过最大限度地减少管理要求来降低成本。
他表示,企业将非结构化数据与结构化 BI 风格数据合并为所谓的 Lakehouse 概念是趋势的一部分,目前约有四分之一的企业采用这种概念,以降低成本并运行 BI、数据科学、AI/ML、运营单一平台上的见解和 SQL 分析。
更多技术文章,请访问:https://opensource.actionsky.com/
关于 SQLE
SQLE 是一款全方位的 SQL 质量管理平台,覆盖开发至生产环境的 SQL 审核和管理。支持主流的开源、商业、国产数据库,为开发和运维提供流程自动化能力,提升上线效率,提高数据质量。
SQLE 获取
低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
OpenAI 开源 Transformer Debugger
OpenAI 超级对齐负责人 Jan Leike 宣布,推出了一个该公司内部使用的分析 Transformer 内部结构的工具 -- Transformer Debugger (TDB) 。它结合了自动可解释性和稀疏自动编码器,无需编写代码即可快速探索模型。 目前,该项目仓库已在 MIT 协议下开放。Jan Leike 表示,TDB 目前仍然是一个处于早期阶段的研究工具,他们希望通过开源的方式让更多人使用,并在此基础上加以改进。 根据介绍,Transformer Debugger 是 OpenAI 的 Superalignment 团队开发的一款工具,旨在支持对小语言模型的特定行为进行研究。 TDB 可以在编写代码之前进行快速探索,能够干预前向传递并查看它对特定行为的影响。它可以用来回答诸如"为什么模型会输出 token A 而不是 token B"或"为什么 attention head H 会关注 token T"之类的问题。它通过识别对行为有贡献的特定组件(neurons、attention heads、autoencoder latents),显示自动生成的关于导致这些组件激活...
- 下一篇
AI 推理框架软件 ONNX Runtime 正式支持龙架构
近日,知名AI推理框架开源社区ONNX Runtime正式发布支持龙架构的版本1.17.0。 今后,用户可以直接使用ONNX Runtime开源社区发布的版本在龙芯平台完成AI推理类应用的开发和部署,标志着龙架构软件生态得到进一步完善。 ONNX Runtime(ORT)是近年来兴起的AI推理框架软件,被大量AI应用作为基础AI推理引擎。ORT可支持PyTorch、Tensorflow、TFLite等多种格式的模型输入,以及CPU、GPU、IoT、NPU、FPGA等多样化算力后端。 在ONNX Runtime 社区1.17.0版本的研制过程中,龙芯中科技术团队与社区保持紧密合作,期间向ONNX Runtime社区代码仓库提交了7697行代码,对矩阵乘法、卷积、转置等核心算子进行深度向量优化。 在社区支持下,龙架构优化代码通过了检视、测试验证等质量保证流程,ONNX Runtime社区自1.17.0版本起正式实现对龙架构的原生支持。
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- MySQL8.0.19开启GTID主从同步CentOS8
- SpringBoot2配置默认Tomcat设置,开启更多高级功能
- SpringBoot2整合Thymeleaf,官方推荐html解决方案
- 设置Eclipse缩进为4个空格,增强代码规范
- SpringBoot2整合Redis,开启缓存,提高访问速度
- Docker使用Oracle官方镜像安装(12C,18C,19C)
- SpringBoot2全家桶,快速入门学习开发网站教程
- Jdk安装(Linux,MacOS,Windows),包含三大操作系统的最全安装
- SpringBoot2初体验,简单认识spring boot2并且搭建基础工程
- CentOS7设置SWAP分区,小内存服务器的救世主