Jina AI 发布全球首个开源 8K 文本嵌入模型,超越 OpenAI
人工智能公司Jina AI 宣布推出其第二代文本嵌入模型: jina-embeddings-v2
。这款模型现在是唯一支持 8K(8192个 token)上下文长度的开源产品。在能力和性能上与OpenAI的 text-embedding-ada-002
相当。
与OpenAI的8K模型 text-embedding-ada-002
进行比较,jina-embedding-v2
在分类平均值、重排平均值、检索平均值和摘要平均值方面超越了 OpenAI 的 text-embedding-ada-002
。
Rank | Model | Model Size (GB) | Embedding Dimensions | Sequence Length | Average (56 datasets) | Classification Average (12 datasets) | Reranking Average (4 datasets) | Retrieval Average (15 datasets) | Summarization Average (1 dataset) |
---|---|---|---|---|---|---|---|---|---|
15 | text-embedding-ada-002 | Unknown | 1536 | 8191 | 60.99 | 70.93 | 84.89 | 56.32 | 30.8 |
17 | jina-embeddings-v2-base-en | 0.27 | 768 | 8192 | 60.38 | 73.45 | 85.38 | 56.98 | 31.6 |
text-embedding-ada-002
的特点:
- 从零到卓越:这个
jina-embeddings-v2
是从头开始构建的。在过去的三个月里,Jina AI的团队进行了密集的研发、数据收集和调整。 - 利用8K解锁扩展上下文潜力:
jina-embeddings-v2
8K的上下文长度为新的行业应用开启了大门:- 法律文件分析:确保对大量法律文本中的每一个细节进行捕捉和分析。
- 医学研究:为了进行高级分析和发现,全面地嵌入科学论文。
- 文学分析:深入研究长篇内容,捕捉微妙的主题元素。
- 财务预测:通过详细的财务报告获得卓越的洞察力。
- 会话式AI:提升聊天机器人对复杂用户查询的响应能力。
同时,基准测试显示,在多个数据集中,这种 8K 上下文长度的扩展使得jina-embeddings-v2超越了其它领先的嵌入模型:
接下来,Jina 将会有一篇相关的学术洞察文章发表。同时团队正在开发类似OpenAI的嵌入式API平台的产品;语言方面,正在进入多语种嵌入领域,目标是推出德英模型。

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
DHorse 改用 fabric8 的 SDK 与 K8s 集群交互
现状 在dhorse 1.4.0版本之前,一直使用k8s官方提供的sdk与k8s集群交互,官方sdk的Maven坐标如下: <dependency> <groupId>io.kubernetes</groupId> <artifactId>client-java</artifactId> <version>18.0.0</version> </dependency> 但是自从1.4.0版本以后,dhorse开始支持fabric8的sdk,fabric8的sdk的Maven坐标如下: <dependency> <groupId>io.fabric8</groupId> <artifactId>kubernetes-client</artifactId> <version>6.9.0</version> </dependency> 那么,为什么要替换为fabric8的sdk...
- 下一篇
香橙派 Orange Pi OS (OH) 即将发布,开源鸿蒙 PC 端
香橙派官方发文称,基于OpenHarmony定制研发的Orange Pi OS(OH)即将发布! 日前,迅龙开源鸿蒙的工程师团队已经在搭载RK3566的开发板Orange Pi 3B上完成了Orange Pi OS(OH)对PC的初步适配,这是国内首次将开源鸿蒙操作系统运行在PC设备上,意味着迅龙软件将领先于华为、深开鸿等,在业内率先推出PC端的开源鸿蒙系统。 完成OpenHarmony对PC的适配 Orange Pi OS(OH)已经完成了HDMI适配、5寸LCD显示屏适配、触摸功能适配、定制化的系统应用、开机动画、主题、壁纸、设置、文件管理器等,支持十几种hap应用。 从相关演示可见,此次适配已经支持设备的正常开关机,原创应用包括任务栏、控制中心、设置、文件管理器、输入法、浏览器、播放器、应用商城等,具备运行热门App等基础功能,可以满足基本的办公、娱乐需求。 控制中心 文件管理器 应用展示 应用市场 首先适配Orange Pi 3B、Orange Pi 5/5 Plus 按照计划,Orange Pi OS(OH)将首先适配三款设备: 搭载RK3566的开发板Orange Pi 3...
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- CentOS6,7,8上安装Nginx,支持https2.0的开启
- CentOS8,CentOS7,CentOS6编译安装Redis5.0.7
- SpringBoot2更换Tomcat为Jetty,小型站点的福音
- Jdk安装(Linux,MacOS,Windows),包含三大操作系统的最全安装
- CentOS7,8上快速安装Gitea,搭建Git服务器
- SpringBoot2整合MyBatis,连接MySql数据库做增删改查操作
- SpringBoot2全家桶,快速入门学习开发网站教程
- CentOS8安装MyCat,轻松搞定数据库的读写分离、垂直分库、水平分库
- CentOS8编译安装MySQL8.0.19
- CentOS7,CentOS8安装Elasticsearch6.8.6