Google 推出全新 Gemini 嵌入文本模型,8k token 输入,3000 维输出,评分遥遥领先
2025年3月7日,Google Developers Blog 宣布了一款全新的实验性 Gemini 嵌入文本模型(gemini-embedding-exp-03-07),现已通过 Gemini API 向全球开发者开放试用。此次发布标志着 Google 在文本嵌入技术领域取得了显著进步,为众多应用场景带来了前所未有的语义理解和性能提升。
卓越的模型表现
这款基于 Gemini 模型本身训练的嵌入模型,凭借其对语言和语境的深刻把握,已在 Massive Text Embedding Benchmark(MTEB)多语言排行榜上以平均得分68.32的成绩遥遥领先,超过竞争对手5.81分。其出色的表现不仅证明了模型的高通用性,也使其在金融、科学、法律、搜索等多个领域具备广泛的应用潜力。
关键技术与新特性
- 更长的输入支持:模型支持高达8K个 token 的输入,这一提升允许开发者处理更大规模的文本数据,无论是长篇文章、代码片段还是复杂的文档,都能得到有效嵌入。
- 高维输出:输出维度达到3000维,相比以往的模型,嵌入向量更高维,能捕捉到更细致的语义信息。
- Matryoshka Representation Learning (MRL):该技术允许用户根据实际存储需求,对高维嵌入向量进行截断,灵活调整数据表示的精度与存储成本。
- 扩展的语言支持:目前模型支持的语言数量已扩展至100多种,显著提升了多语言文本处理能力,为全球化应用提供坚实支持。
- 统一模型架构:新模型在质量上超越了之前的多任务、多语言以及代码专用模型,成为了一个更为通用且高效的文本嵌入解决方案。
开发者早期试用与未来展望
目前,该 Gemini 嵌入模型仍处于实验阶段,容量有限,但 Google 已经通过 Gemini API 的 embed_content
接口开放了早期试用通道。开发者可以通过简单的 API 调用,快速实现智能检索、文本分类、推荐系统、文档聚类等多种应用场景。示例代码如下:
from google import genai client = genai.Client(api_key="GEMINI_API_KEY") result = client.models.embed_content( model="gemini-embedding-exp-03-07", contents="How does alphafold work?", ) print(result.embeddings)
此外,在 Vertex AI 平台上,该模型以 “text-embedding-large-exp-03-07” 名称进行部署。未来,随着实验版向稳定版本过渡,Google 将持续优化这一技术,力求在性能和可用性上实现更大突破。
Google 团队诚邀开发者通过反馈帮助改进产品,共同推动文本嵌入技术的发展,为人工智能应用注入新的活力。

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
Apache Tomcat Default Servlet任意文件上传RCE漏洞
漏洞描述 Apache Tomcat是美国阿帕奇(Apache)基金会的一款轻量级Web应用服务器,partial PUT是其中用于文件分块上传的功能。 在受影响版本中,由于针对partial PUT的临时文件路径依赖于用户输入,通过将/替换为.的实现存在绕过风险。 当启用了默认 servlet 的写入功能(将readonly 初始化参数设置为非默认值 false),以及支持partial PUT(默认支持)时,攻击者可能利用该漏洞,向特定文件(如jsp)写入恶意代码,从而执行远程命令。 漏洞名称 Apache Tomcat Default Servlet任意文件上传RCE漏洞 漏洞类型 路径等价:'file.name' (内部点号) 发现时间 2025-03-11 漏洞影响广度 - MPS编号 MPS-2yw6-ghal CVE编号 CVE-2025-24813 CNVD编号 - 影响范围 tomcat@(-∞, 9.0.99) tomcat@[10.1.0-M1, 10.1.35) org.apache.tomcat.embed:tomcat-embed-core@[10.1.0-...
- 下一篇
音乐软件接入 DeepSeek 分析用户听歌品味
近日,QQ 音乐和网易云音乐纷纷上线「DeepSeek 解读个人听歌品味」的趣味功能。 QQ 音乐在昨日发文宣布,其 App 内的 AI 小助手现已升级支持「DeepSeek 解读用户音乐听歌品味」。用户只需要通过 QQ 音乐 App 内的 AI 助手区入口,或者直接搜索「听歌品味」点击结果顶部入口,在功能专区内就能通过 DeepSeek 进行音乐品味解读。 而网易云音乐在 3 月 7 日正式支持了「DeepSeek 点评用户的红心歌单(用户个人收藏 / 喜爱的歌单)」功能,该可以解析网易云音乐用户最近 100 首红心歌曲,并通过 DeepSeek 给出锐利而有趣味的点评。但网易云音乐该功能为指令生成,无法在音乐 App 内查看结果,需要复制到 DeepSeek App 或网页端进行点评。
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- CentOS7设置SWAP分区,小内存服务器的救世主
- Windows10,CentOS7,CentOS8安装MongoDB4.0.16
- SpringBoot2全家桶,快速入门学习开发网站教程
- SpringBoot2整合Redis,开启缓存,提高访问速度
- Jdk安装(Linux,MacOS,Windows),包含三大操作系统的最全安装
- CentOS7编译安装Cmake3.16.3,解决mysql等软件编译问题
- CentOS6,7,8上安装Nginx,支持https2.0的开启
- CentOS7,CentOS8安装Elasticsearch6.8.6
- SpringBoot2整合MyBatis,连接MySql数据库做增删改查操作
- Hadoop3单机部署,实现最简伪集群