Google 推出全新 Gemini 嵌入文本模型，8k token 输入，3000 维输出，评分遥遥领先-低调大师

Google 推出全新 Gemini 嵌入文本模型，8k token 输入，3000 维输出，评分遥遥领先

2025-03-10 369

2025年3月7日，Google Developers Blog 宣布了一款全新的实验性 Gemini 嵌入文本模型（gemini-embedding-exp-03-07），现已通过 Gemini API 向全球开发者开放试用。此次发布标志着 Google 在文本嵌入技术领域取得了显著进步，为众多应用场景带来了前所未有的语义理解和性能提升。

卓越的模型表现

这款基于 Gemini 模型本身训练的嵌入模型，凭借其对语言和语境的深刻把握，已在 Massive Text Embedding Benchmark（MTEB）多语言排行榜上以平均得分68.32的成绩遥遥领先，超过竞争对手5.81分。其出色的表现不仅证明了模型的高通用性，也使其在金融、科学、法律、搜索等多个领域具备广泛的应用潜力。

关键技术与新特性

更长的输入支持：模型支持高达8K个 token 的输入，这一提升允许开发者处理更大规模的文本数据，无论是长篇文章、代码片段还是复杂的文档，都能得到有效嵌入。
高维输出：输出维度达到3000维，相比以往的模型，嵌入向量更高维，能捕捉到更细致的语义信息。
Matryoshka Representation Learning (MRL)：该技术允许用户根据实际存储需求，对高维嵌入向量进行截断，灵活调整数据表示的精度与存储成本。
扩展的语言支持：目前模型支持的语言数量已扩展至100多种，显著提升了多语言文本处理能力，为全球化应用提供坚实支持。
统一模型架构：新模型在质量上超越了之前的多任务、多语言以及代码专用模型，成为了一个更为通用且高效的文本嵌入解决方案。

开发者早期试用与未来展望

目前，该 Gemini 嵌入模型仍处于实验阶段，容量有限，但 Google 已经通过 Gemini API 的 embed_content 接口开放了早期试用通道。开发者可以通过简单的 API 调用，快速实现智能检索、文本分类、推荐系统、文档聚类等多种应用场景。示例代码如下：

from google import genai

client = genai.Client(api_key="GEMINI_API_KEY")
result = client.models.embed_content(
        model="gemini-embedding-exp-03-07",
        contents="How does alphafold work?",
)
print(result.embeddings)

此外，在 Vertex AI 平台上，该模型以 “text-embedding-large-exp-03-07” 名称进行部署。未来，随着实验版向稳定版本过渡，Google 将持续优化这一技术，力求在性能和可用性上实现更大突破。

Google 团队诚邀开发者通过反馈帮助改进产品，共同推动文本嵌入技术的发展，为人工智能应用注入新的活力。

微信关注我们

原文链接：https://www.oschina.net/news/337916/gemini-embedding-text-model-gemini-api

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

Apache Tomcat Default Servlet任意文件上传RCE漏洞

漏洞描述 Apache Tomcat是美国阿帕奇（Apache）基金会的一款轻量级Web应用服务器，partial PUT是其中用于文件分块上传的功能。在受影响版本中，由于针对partial PUT的临时文件路径依赖于用户输入，通过将/替换为.的实现存在绕过风险。当启用了默认 servlet 的写入功能（将readonly 初始化参数设置为非默认值 false），以及支持partial PUT（默认支持）时，攻击者可能利用该漏洞，向特定文件（如jsp）写入恶意代码，从而执行远程命令。漏洞名称 Apache Tomcat Default Servlet任意文件上传RCE漏洞漏洞类型路径等价：'file.name' (内部点号) 发现时间 2025-03-11 漏洞影响广度 - MPS编号 MPS-2yw6-ghal CVE编号 CVE-2025-24813 CNVD编号 - 影响范围 tomcat@(-∞, 9.0.99) tomcat@[10.1.0-M1, 10.1.35) org.apache.tomcat.embed:tomcat-embed-core@[10.1.0-...

2025-03-11

398

近日，QQ 音乐和网易云音乐纷纷上线「DeepSeek 解读个人听歌品味」的趣味功能。 QQ 音乐在昨日发文宣布，其 App 内的 AI 小助手现已升级支持「DeepSeek 解读用户音乐听歌品味」。用户只需要通过 QQ 音乐 App 内的 AI 助手区入口，或者直接搜索「听歌品味」点击结果顶部入口，在功能专区内就能通过 DeepSeek 进行音乐品味解读。而网易云音乐在 3 月 7 日正式支持了「DeepSeek 点评用户的红心歌单（用户个人收藏 / 喜爱的歌单）」功能，该可以解析网易云音乐用户最近 100 首红心歌曲，并通过 DeepSeek 给出锐利而有趣味的点评。但网易云音乐该功能为指令生成，无法在音乐 App 内查看结果，需要复制到 DeepSeek App 或网页端进行点评。

2025-03-10

270

资源下载

更多资源

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长，特征是大鼻子、头戴帽子、身穿背带裤，还留着胡子。与他的双胞胎兄弟路易基一起，长年担任任天堂的招牌角色。

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题，腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构，目前腾讯云软件源站支持公网访问和内网访问。

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称，一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集，帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Spring

Spring框架（Spring Framework）是由Rod Johnson于2002年提出的开源Java企业级应用框架，旨在通过使用JavaBean替代传统EJB实现方式降低企业级编程开发的复杂性。该框架基于简单性、可测试性和松耦合性设计理念，提供核心容器、应用上下文、数据访问集成等模块，支持整合Hibernate、Struts等第三方框架，其适用范围不仅限于服务器端开发，绝大多数Java应用均可从中受益。