Qwen 发布全新偏好建模模型系列 WorldPM 模型-低调大师

Qwen 发布全新偏好建模模型系列 WorldPM 模型

2025-05-19 288

阿里巴巴旗下Qwen团队宣布推出全新偏好建模模型系列——WorldPM（World Preference Modeling），包括WorldPM-72B及其衍生版本WorldPM-72B-HelpSteer2、WorldPM-72B-RLHFLow和WorldPM-72B-UltraFeedback。

根据官方介绍，该模型通过对1500万条偏好数据的超大规模训练，验证了偏好建模遵循与语言建模相似的规模化定律(scaling laws)。这一发现意味着，随着数据和模型规模的扩展，偏好模型能够学习到统一的偏好表示，从而显著提升模型在监督学习中的表现。

WorldPM-72B系列基于72亿参数规模打造，专为评估和优化其他模型的输出而设计。官方表示，与从零开始训练相比，基于WorldPM进行微调能够显著提升性能，尤其在需要捕捉人类偏好的场景中表现优异。

值得注意的是，WorldPM并非通用的对话模型，而是专注于为其他模型提供偏好评分和优化指导。例如，开发者可以利用WorldPM-72B对生成式AI的回答进行打分，从而提升模型在特定任务上的表现。

微信关注我们

原文链接：https://www.oschina.net/news/350611

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

腾讯：QQ 浏览器升级为 AI 浏览器

腾讯公众号消息，腾讯QQ浏览器升级为AI浏览器，全新推出QBot，搭载腾讯混元和DeepSeek双模型。目前涵盖AI搜索、AI浏览、AI写作、AI办公、AI学习五大功能。此外，QBo 还集合了多个Agent执；首批正在灰度的Agent包括行业首个高考Agent“AI高考通”、下载助理、更新助理、股票助理。腾讯公司公关总监张军也发博晒出新页面称：“QQ浏览器今天全面升级，4 亿用户光速进入AI时代。”

2025-05-19

239

本文介绍了OR算法+ML模型混合推理能力建设思路及业务背景，此场景相比常规模型推理更具特殊性和复杂性，在工程实现上面临多维挑战，因此本文分别从性能、稳定性和扩展性三个维度分析问题和解法，并以推理框架架构演进为线总结了过去两年的分期迭代实践历程和收益，其中有一些较为通用的经验，希望能够给大家带来一些帮助或启发。 1 背景调度系统主要职责是需要在合适的时间以合适的方式将合适的运单分给合适的骑手，承载着海量的调度规模。为追求更高用户体验，需要在强时间约束下完成每一轮次的调度任务，对性能极度敏感；其中计算密集的运筹学算法（Operations Research，OR）和机器学习模型（Machine Learning，ML）是主要性能热点，如OR部分计算量最大的「路径规划算法」和ML部分计算量最大的「送达时间预估深度学习模型（ETR）」计算量占比60%以上，若使用远程CPU承载此计算，集群规模将在万台以上，长尾问题明显，运维压力和资源成本难以控制。因此，在调度系统工程架构中引入GPU硬件并通过手写CUDA算子的方式来加速这些性能热点，在模块级取得了较好的加速效果[1]，与此同时在系统级出现面...

2025-05-13

365

资源下载

更多资源

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称，一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集，帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Rocky Linux

Rocky Linux（中文名：洛基）是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版，作为CentOS稳定版停止维护后与RHEL（Red Hat Enterprise Linux）完全兼容的开源替代方案，由社区拥有并管理，支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性，采用模块化包装和SELinux安全架构，默认包含GNOME桌面环境及XFS文件系统，支持十年生命周期更新。

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能，例如代码缩略图，Python的插件，代码段等。还可自定义键绑定，菜单和工具栏。Sublime Text 的主要功能包括：拼写检查，书签，完整的 Python API ， Goto 功能，即时项目切换，多选择，多窗口等等。Sublime Text 是一个跨平台的编辑器，同时支持Windows、Linux、Mac OS X等操作系统。

WebStorm

WebStorm 是jetbrains公司旗下一款JavaScript 开发工具。目前已经被广大中国JS开发者誉为“Web前端开发神器”、“最强大的HTML5编辑器”、“最智能的JavaScript IDE”等。与IntelliJ IDEA同源，继承了IntelliJ IDEA强大的JS部分的功能。