首页 文章 精选 留言 我的
优秀的个人博客,低调大师

微信关注我们

原文链接:https://my.oschina.net/u/4587289/blog/18638278

转载内容版权归作者及来源网站所有!

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

Jina AI 开源多模态多语言向量模型 Jina Embeddings V4

Jina AI 宣布正式推出 jina-embeddings-v4,一款全新的多模态向量模型,参数规模达到 38 亿,并首次实现了对文本与图像的同步处理。 项目团队在模型内置了一套面向特定任务的 LoRA 适配器,专门强化了模型在处理查询-文档检索、语义匹配以及代码搜索等任务时的表现。 公告称,在 MTEB、MMTEB、CoIR、LongEmbed、STS、Jina-VDR 及 ViDoRe 等多项基准测试中,jina-embeddings-v4 在多模态、多语言检索任务上均展现了顶尖性能。它尤其擅长解读富含视觉信息的内容,无论是表格、图表还是复杂的示意图,都能精准捕捉其深层语义。此外,模型还同时支持单向量和多向量表示,灵活满足各种场景需求。 “jina-embeddings-v4是我们迄今为止最具突破性的一款向量模型。作为一款开源模型,它的性能表现已全面超越来自主流供应商的顶尖闭源模型。” 在多语言检索方面,其性能比 OpenAI 的 text-embedding-3-large 高出 12%(66.49 vs 59.27)。 在长文档任务上,性能提升了 28%(67.11 vs 5...

开源模拟器 QEMU 拒绝 AI 生成代码的贡献

开源模拟器 QEMU 开始对用 AI 生成的代码进行治理,项目维护者Daniel Berrangé 撰写并提交了一份“禁止使用人工智能代码生成器”的文档: 近年来,所谓的人工智能代码生成器引发了极大的关注。然而,迄今为止,尚未形成关于代码生成器输出结果的许可影响的普遍认可的法律解释。尽管供应商可能声称不存在问题且可以自由选择许可协议,但他们在推广这一解释时存在固有的利益冲突。 更广泛地说,目前尚未就基于多种不同许可协议输入数据训练的代码生成器的许可影响形成广泛共识。 DCO要求贡献者声明其有权在指定项目许可下进行贡献。鉴于对AI代码生成器输出许可问题的共识缺失,若补丁包含此类生成代码,则声称符合DCO条款(b)或(c)被视为不可信。 因此,本补丁定义了QEMU项目当前不会接受涉及已知或疑似使用AI代码生成器的贡献。 这是人工智能辅助软件开发的早期阶段。法律问题最终将得到解决。工具将成熟,我们可预期部分工具将安全适用于自由软件项目。 我们当前制定的政策必须适用于当下,并保持开放修订。最好从严格和安全开始,随后逐步放宽。 同时,可根据具体情况考虑例外请求。

相关文章

发表评论

资源下载

更多资源
Mario

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长,特征是大鼻子、头戴帽子、身穿背带裤,还留着胡子。与他的双胞胎兄弟路易基一起,长年担任任天堂的招牌角色。

Oracle

Oracle

Oracle Database,又名Oracle RDBMS,或简称Oracle。是甲骨文公司的一款关系数据库管理系统。它是在数据库领域一直处于领先地位的产品。可以说Oracle数据库系统是目前世界上流行的关系数据库管理系统,系统可移植性好、使用方便、功能强,适用于各类大、中、小、微机环境。它是一种高效率、可靠性好的、适应高吞吐量的数据库方案。

Apache Tomcat

Apache Tomcat

Tomcat是Apache 软件基金会(Apache Software Foundation)的Jakarta 项目中的一个核心项目,由Apache、Sun 和其他一些公司及个人共同开发而成。因为Tomcat 技术先进、性能稳定,而且免费,因而深受Java 爱好者的喜爱并得到了部分软件开发商的认可,成为目前比较流行的Web 应用服务器。

Eclipse

Eclipse

Eclipse 是一个开放源代码的、基于Java的可扩展开发平台。就其本身而言,它只是一个框架和一组服务,用于通过插件组件构建开发环境。幸运的是,Eclipse 附带了一个标准的插件集,包括Java开发工具(Java Development Kit,JDK)。