360 开源升级自研 7B 参数模型 360Zhinao3-7B
360集团宣布对其自研的7B参数模型360Zhinao3-7B进行了开源升级,可免费商用。
公告称,模型各项能力得到全面提升,在多个benchmark上表现优秀。本次开源推出的360Zhinao3-7B-O1.5模型,不止是数学和科学的单点模型,在通用能力上表现优秀,可以在端侧应用上发挥更大价值。
本次升级的360Zhinao3-7B模型,在模型参数量不变的情况下,仅增量训练了700B的高质量token(相比360Zhinao2-7B的10.1T token成本小得多),模型效果取得了显著提升。
360 方面表示,其在内部实践中的多个版本,增量训练了更多的token,但是模型效果大多增益不明显,效果不达预期。因此得到一条启示:训练数据的质量重要性,远大于训练数据的token量,不断提升训练数据的质量,是一条有前途的Scaling Law发展方向,而且模型的训练成本大幅降低,且也不会增加模型推理成本。
在数据筛选方面,项目团队加大了筛选力度,离线训练了多种数据筛选模型,对不同种类的数据进行分档打分,显著提升了数据质量。其次还进一步加大了数学、代码、指令这三种数据的占比,大幅降低网页和书籍的占比,从而进一步提升了模型的指令遵循和推理能力。
360Zhinao3-7B模型还增加了长文本预训练阶段,将最大窗口长度从4k提升至32k,ROPE的base从1w改为100w。在长文本预训练阶段,团队增加了超长文本和长代码的比例,进一步优化了模型的长文本处理能力。
基础模型效果
在模型效果方面,360方面使用开源工具opencompass对模型进行了多维度评估。结果显示,模型的benchmark平均分在10B尺寸附近的模型中,具备竞争力。
Instruct模型效果
在IFEval、MT-bench、CF-Bench三个流行的评测上对360Zhinao3-7B-Instruct模型进行了评测比较,MT-bench 和CFBench,IFEval 均在同级别开源模型中表现抢眼,具备较强竞争力。
长思维链模型效果
从以下结果可以看出,在math和science数据上,360zhinao3-7B-O1.5 模型与从0训练的7B推理模型具备一定竞争力,但可以看到目前较火的推理模型在通用多轮对话,角色扮演及复杂指令遵循上效果较差,而360zhinao3-7B-O1.5 综合效果更佳,不止是数学和科学的单点模型,可以在端侧应用上发挥更大价值。

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
Ubuntu 25.10 计划默认使用内存安全的 sudo-rs 命令
Canonical 计划在 Ubuntu 25.10 中使用更多 Rust 编写的系统组件,目前为止,大部分讨论都集中在过渡到 Rust Coreutils“uutils” 来取代 GNU Coreutils。 现在,Canonical 宣布了新的计划——默认使用 sudo-rs 来替代 sudo。 sudo-rs 项目已经开发了好几年,是一个基于 Rust 的内存安全 sudo 实现,可以作为 sudo 的直接替代品。 sudo-rs 项目由非营利组织 Trifecta Tech Foundation 维护,他们确认了 Canonical 计划在 Ubuntu 25.10 中默认使用 sudo-rs。 他们在公告中写道: Canonical 计划将 sudo-rs 设为 Ubuntu 25.10 的默认命令。这将为最终用户提供时间进行验收测试,并确保 sudo-rs 在纳入下一个长期支持 (LTS) 版本:Ubuntu 26.04 LTS 之前经过实战检验,该版本将获得至少 12 年的支持。我们期待从社区学习如何进一步改进 sudo-rs。 反过来,sudo-rs 开发人员将致力于添...
- 下一篇
Docker Desktop 上架 Microsoft Store
Docker 宣布 Docker Desktop 已上架 Microsoft Store,称这个新的分发渠道不仅增强了个人开发者的安装和更新体验,还显著简化了企业 IT 团队的管理工作。 在公告博客中,Docker 团队强调 Windows 是 Docker Desktop 用户中使用最广泛的平台,而 MicrosoftStore 的自动更新功能将确保 Docker Desktop 定期更新,以直接解决合规性和安全性问题,同时最大限度地减少停机时间。 Microsoft Store 上的 Docker Desktop 应用将为 IT 管理员提供以下服务: 原生 Intune MDM 集成:使用 Microsoft 的企业管理工具(包括 Intune)在整个组织中部署 Docker Desktop。 集中控制:通过微软轻松推出 Docker Desktop商店的企业分销渠道。 安全兼容更新:更新由Microsoft Store自动处理基础设施,即使在用户无法直接访问商店的组织中也是如此。 无需直接访问商店即可更新:与 Intune 的原生集成允许自动更新功能,即使用户没有Microsof...
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- SpringBoot2初体验,简单认识spring boot2并且搭建基础工程
- 2048小游戏-低调大师作品
- CentOS7,8上快速安装Gitea,搭建Git服务器
- SpringBoot2配置默认Tomcat设置,开启更多高级功能
- Jdk安装(Linux,MacOS,Windows),包含三大操作系统的最全安装
- Docker使用Oracle官方镜像安装(12C,18C,19C)
- CentOS6,7,8上安装Nginx,支持https2.0的开启
- CentOS7设置SWAP分区,小内存服务器的救世主
- Docker安装Oracle12C,快速搭建Oracle学习环境
- Docker快速安装Oracle11G,搭建oracle11g学习环境