Google 推出全新 Gemini 嵌入文本模型,8k token 输入,3000 维输出,评分遥遥领先
2025年3月7日,Google Developers Blog 宣布了一款全新的实验性 Gemini 嵌入文本模型(gemini-embedding-exp-03-07),现已通过 Gemini API 向全球开发者开放试用。此次发布标志着 Google 在文本嵌入技术领域取得了显著进步,为众多应用场景带来了前所未有的语义理解和性能提升。 卓越的模型表现 这款基于 Gemini 模型本身训练的嵌入模型,凭借其对语言和语境的深刻把握,已在 Massive Text Embedding Benchmark(MTEB)多语言排行榜上以平均得分68.32的成绩遥遥领先,超过竞争对手5.81分。其出色的表现不仅证明了模型的高通用性,也使其在金融、科学、法律、搜索等多个领域具备广泛的应用潜力。 关键技术与新特性 更长的输入支持:模型支持高达8K个 token 的输入,这一提升允许开发者处理更大规模的文本数据,无论是长篇文章、代码片段还是复杂的文档,都能得到有效嵌入。 高维输出:输出维度达到3000维,相比以往的模型,嵌入向量更高维,能捕捉到更细致的语义信息。 Matryoshka Represe...
