360 开源升级自研 7B 参数模型 360Zhinao3-7B-低调大师

360 开源升级自研 7B 参数模型 360Zhinao3-7B

2025-05-07 218

360集团宣布对其自研的7B参数模型360Zhinao3-7B进行了开源升级，可免费商用。

公告称，模型各项能力得到全面提升，在多个benchmark上表现优秀。本次开源推出的360Zhinao3-7B-O1.5模型，不止是数学和科学的单点模型，在通用能力上表现优秀，可以在端侧应用上发挥更大价值。

本次升级的360Zhinao3-7B模型，在模型参数量不变的情况下，仅增量训练了700B的高质量token（相比360Zhinao2-7B的10.1T token成本小得多），模型效果取得了显著提升。

360 方面表示，其在内部实践中的多个版本，增量训练了更多的token，但是模型效果大多增益不明显，效果不达预期。因此得到一条启示：训练数据的质量重要性，远大于训练数据的token量，不断提升训练数据的质量，是一条有前途的Scaling Law发展方向，而且模型的训练成本大幅降低，且也不会增加模型推理成本。

在数据筛选方面，项目团队加大了筛选力度，离线训练了多种数据筛选模型，对不同种类的数据进行分档打分，显著提升了数据质量。其次还进一步加大了数学、代码、指令这三种数据的占比，大幅降低网页和书籍的占比，从而进一步提升了模型的指令遵循和推理能力。

360Zhinao3-7B模型还增加了长文本预训练阶段，将最大窗口长度从4k提升至32k，ROPE的base从1w改为100w。在长文本预训练阶段，团队增加了超长文本和长代码的比例，进一步优化了模型的长文本处理能力。

基础模型效果

在模型效果方面，360方面使用开源工具opencompass对模型进行了多维度评估。结果显示，模型的benchmark平均分在10B尺寸附近的模型中，具备竞争力。

Instruct模型效果

在IFEval、MT-bench、CF-Bench三个流行的评测上对360Zhinao3-7B-Instruct模型进行了评测比较，MT-bench 和CFBench，IFEval 均在同级别开源模型中表现抢眼，具备较强竞争力。

长思维链模型效果

从以下结果可以看出，在math和science数据上，360zhinao3-7B-O1.5 模型与从0训练的7B推理模型具备一定竞争力，但可以看到目前较火的推理模型在通用多轮对话，角色扮演及复杂指令遵循上效果较差，而360zhinao3-7B-O1.5 综合效果更佳，不止是数学和科学的单点模型，可以在端侧应用上发挥更大价值。

微信关注我们

原文链接：https://www.oschina.net/news/348524

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

Ubuntu 25.10 计划默认使用内存安全的 sudo-rs 命令

Canonical 计划在 Ubuntu 25.10 中使用更多 Rust 编写的系统组件，目前为止，大部分讨论都集中在过渡到 Rust Coreutils“uutils” 来取代 GNU Coreutils。现在，Canonical 宣布了新的计划——默认使用 sudo-rs 来替代 sudo。 sudo-rs 项目已经开发了好几年，是一个基于 Rust 的内存安全 sudo 实现，可以作为 sudo 的直接替代品。 sudo-rs 项目由非营利组织 Trifecta Tech Foundation 维护，他们确认了 Canonical 计划在 Ubuntu 25.10 中默认使用 sudo-rs。他们在公告中写道： Canonical 计划将 sudo-rs 设为 Ubuntu 25.10 的默认命令。这将为最终用户提供时间进行验收测试，并确保 sudo-rs 在纳入下一个长期支持 (LTS) 版本：Ubuntu 26.04 LTS 之前经过实战检验，该版本将获得至少 12 年的支持。我们期待从社区学习如何进一步改进 sudo-rs。反过来，sudo-rs 开发人员将致力于添...

2025-05-07

339

Docker 宣布 Docker Desktop 已上架 Microsoft Store，称这个新的分发渠道不仅增强了个人开发者的安装和更新体验，还显著简化了企业 IT 团队的管理工作。在公告博客中，Docker 团队强调 Windows 是 Docker Desktop 用户中使用最广泛的平台，而 MicrosoftStore 的自动更新功能将确保 Docker Desktop 定期更新，以直接解决合规性和安全性问题，同时最大限度地减少停机时间。 Microsoft Store 上的 Docker Desktop 应用将为 IT 管理员提供以下服务：原生 Intune MDM 集成：使用 Microsoft 的企业管理工具（包括 Intune）在整个组织中部署 Docker Desktop。集中控制：通过微软轻松推出 Docker Desktop商店的企业分销渠道。安全兼容更新：更新由Microsoft Store自动处理基础设施，即使在用户无法直接访问商店的组织中也是如此。无需直接访问商店即可更新：与 Intune 的原生集成允许自动更新功能，即使用户没有Microsof...

2025-05-07

218

资源下载

更多资源

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题，腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构，目前腾讯云软件源站支持公网访问和内网访问。

Spring

Spring框架（Spring Framework）是由Rod Johnson于2002年提出的开源Java企业级应用框架，旨在通过使用JavaBean替代传统EJB实现方式降低企业级编程开发的复杂性。该框架基于简单性、可测试性和松耦合性设计理念，提供核心容器、应用上下文、数据访问集成等模块，支持整合Hibernate、Struts等第三方框架，其适用范围不仅限于服务器端开发，绝大多数Java应用均可从中受益。

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能，例如代码缩略图，Python的插件，代码段等。还可自定义键绑定，菜单和工具栏。Sublime Text 的主要功能包括：拼写检查，书签，完整的 Python API ， Goto 功能，即时项目切换，多选择，多窗口等等。Sublime Text 是一个跨平台的编辑器，同时支持Windows、Linux、Mac OS X等操作系统。

WebStorm

WebStorm 是jetbrains公司旗下一款JavaScript 开发工具。目前已经被广大中国JS开发者誉为“Web前端开发神器”、“最强大的HTML5编辑器”、“最智能的JavaScript IDE”等。与IntelliJ IDEA同源，继承了IntelliJ IDEA强大的JS部分的功能。