零一万物 Yi-1.5-34B 开源小尺寸打平千亿模型
零一万物旗下 Yi-1.5-34B 近日在 Chatbot Arena 总榜中以 1162 的 ELO 积分超越了 GPT-4-0613、Mistral-large-2402 等知名海外厂商发布的大尺寸模型,与 Qwen1.5-110B-Chat 并列第20名(2024.6.6)。
在中文分榜上,Yi-1.5-34B 以 1274 的 ELO 积分跻身世界前十,同时在采用 Apache 2.0 许可协议的模型中位居第一(2024.6.6)。零一万物称其可谓是开源界中小模型中最能打的羽量级选手,LMSYS 评测组织方也发帖进行了恭贺。
相比 7B、13B 等尺寸,34B 模型具备更优越的知识容量、下游任务的容纳能力,也达到了大模型 “涌现”的门槛;而比起 70B 以上的参数量,34B 是单卡推理可接受的模型尺寸的上限,经过量化的模型可以在一张消费级显卡(如4090)上进行高效率的推理。因此,34B 的模型尺寸在开源社区属于稀缺的“黄金比例”尺寸。也是基于这一认知,零一万物正式开源的首款预训练大模型就是 Yi-34B。
相较于去年 11 月的开源版本,这次的 Yi-1.5-34B 在保持原 Yi 系列模型优秀的通用语言能力的前提下,通过增量训练 500B 高质量 token,大幅提高了数学逻辑、代码能力。与迭代前的 Yi-34B 相比, Yi-1.5-34B 在 LMSYS 总榜上的 ELO 积分大幅提升,从 Yi-34B 的 1111 增至 1162(2024.6.6);在“Coding”分榜上,Yi-1.5-34B 的 ELO 积分也由上一版本的 1108 增至 1161(2024.6.6)。
此外,在 MixEval、MMLU-Pro、WildBench 等其他评测集上,Yi-1.5-34B 也取得了优于同量级模型的成绩。在 WildBench 排名中,Yi-1.5-34B 的表现更是优于更大参数量级的 Qwen2-72B-Instruct(2024.6.6)。
零一万物开源负责人林旅强表示,“我们相信开源开发者生态依赖于口碑,国内生态需要更多中立角色,以开发者为中心进行良性竞争。海外开发者更注重体验,无论是使用开源模型还是 API,都追求良好体验。我们真诚地希望,升级后的 Yi-1.5 系列开源模型能够为大家带来真正的价值。”

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
Compose Multiplatform 1.6.10 最新变化
记得加关注, Kotlin 之路不迷路! Kotlinlang.org Compose Multiplatform 是由 JetBrains 开发的声明式 UI 框架,允许开发者跨平台共享 UI 实现。Compose Multiplatform 使 Kotlin Multiplatform¹ 项目的代码共享灵活性得到完全释放,让您能够以最高 100% Kotlin 代码编写应用。1.6.10 版本包含多项强大功能,并将 iOS 支持升级至 Beta 版,将 Web 支持升级至 Alpha 版。 Compose Multiplatform 使用入门:https://www.jetbrains.com.cn/help/kotlin-multiplatform-dev/compose-multiplatform-getting-started.html 此版本的亮点包括: 多平台资源 API 现在已经稳定,并且对此库引入了多项期待已久的改进。 基于 Jetpack Compose Navigation 的实验性导航库。 通用 Lifecycle 库,具有通用 ViewModel 实现。 ...
- 下一篇
银河麒麟操作系统通过首批软件供应链安全能力认证
麒麟软件产品供应链安全能力获双重肯定!5月30日,经北京赛迪认证中心评估,银河麒麟高级服务器操作系统V10和银河麒麟桌面操作系统V10成为首批获得软件供应链安全能力认证产品,并在操作系统类产品中名列前茅。 软件供应链安全能力评估依据国家标准《网络安全技术 软件供应链安全要求》(GB/T 43698-2024)以软件产品为评估对象,实施客观、详实、专业的软件供应链安全能力分析,重点考察组织管理和供应活动管理能力域,涵盖机构、制度、人员、供应商、知识产品、基本流程、软件开发、交付、采购、获取、运维、废止等12大类90个能力项。 近年来,软件供应链安全事件频发,严重危害网络安全。软件供应链引入的停服断供、安全漏洞以及外部代码组件违规使用等供应关系安全风险、技术安全风险和知识产权安全风险,导致传统软件安全面临新的挑战。为贯彻落实国家有关法律法规的要求,建立软件供应链安全风险管理能力体系,增强软件供应链安全风险管理、组织管理和供应活动管理能力,中国信息安全测评中心牵头研制了国家标准《网络安全技术 软件供应链安全要求》((GB/T 43698-2024),用于指导软件供应链中的供需双方开展风险管理...
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- CentOS8安装MyCat,轻松搞定数据库的读写分离、垂直分库、水平分库
- Springboot2将连接池hikari替换为druid,体验最强大的数据库连接池
- Docker安装Oracle12C,快速搭建Oracle学习环境
- SpringBoot2整合Redis,开启缓存,提高访问速度
- CentOS8,CentOS7,CentOS6编译安装Redis5.0.7
- Windows10,CentOS7,CentOS8安装MongoDB4.0.16
- SpringBoot2更换Tomcat为Jetty,小型站点的福音
- Eclipse初始化配置,告别卡顿、闪退、编译时间过长
- CentOS7安装Docker,走上虚拟化容器引擎之路
- SpringBoot2编写第一个Controller,响应你的http请求并返回结果