横扫 11 项榜单 SOTA:高性能、全尺寸、超高效的多语嵌入模型 F2LLM-v2 来了
在人工智能席卷全球的今天,你是否发现:大多数顶尖的 Embedding(嵌入)模型,在英语和中文环境下表现惊艳,但一旦切换到日语、韩语、德语或是小众语种,表现就大打折扣?你是否也曾在搭建 RAG(检索增强生成)系统时因为可选 Embedding 模型太少,找不到一款适合你算力的模型而发愁? 今天,蚂蚁集团 CodeFuse 团队联合上海交通大学给出了答案:F2LLM-v2 系列正式发布!它不仅打破了“英语中心主义”的壁垒,更以全开源的姿态,为全球开发者提供了一套高性能、全尺寸、极致高效的语义表征方案。 🚀 实力霸榜:横扫11项MTEB榜单 在衡量 Embedding 模型最权威的 MTEB(Massive Text Embedding Benchmark)评测中,F2LLM-v2 展现了统治级的表现: 11项冠军:在德语、法语、波兰语、日语以及代码等 11 个语种/领域榜单中位列第一。 全线碾压:即使是家族中的小个子成员,在同尺寸下也多次击败了 Qwen3-Embedding 和 EmbeddingGemma 等业界大模型。 深度覆盖:从代码检索、医疗问答到语义相似度分析,430 ...




