微软开源 DeepSeek-R1 魔改版「MAI-DS-R1」：响应 99% 敏感提示、风险降 50%-低调大师

微软开源 DeepSeek-R1 魔改版「MAI-DS-R1」：响应 99% 敏感提示、风险降 50%

2025-04-18 709

微软今天开源了一款“魔改版”的 DeepSeek-R1 模型「MAI-DS-R1」，其在保留原有推理性能的基础上进行了大幅度增强，尤其是在响应和屏蔽词方面有了显著改进：

MAI-DS-R1 可以响应 99.3% 的敏感话题提示，比原版 R1 提升了2倍，这对于政治学术研究、社会问题、伦理道德研究等帮助巨大；但在安全风险大幅度降低，比原版 R1 降低了 50%。

据介绍，MAI-DS-R1 是后训练优化的 DeepSeek-R1 模型，微软在训练 MAI-DS-R1 的过程中，从大约 350000 个被屏蔽的主题示例中，收集和筛选查询关键词，将这些关键词转化为多个问题，并翻译成不同语言；还通过 DeepSeek R1 和内部模型为这些问题生成答案和思维链。

此外，训练数据中还纳入了来自Tulu3 SFT数据集的 110K 个安全和违规示例，这些示例涵盖了 CoCoNot、WildJailbreak 和 WildGuardMix 等内容。

https://huggingface.co/microsoft/MAI-DS-R1

随后，微软对 MAI-DS-R1 进行了综合评估。在敏感话题响应方面，MAI-DS-R1 能够成功响应 99.3% 的敏感话题提示，这一表现显著优于 DeepSeek R1 和 R1-1776。

在安全性评估方面，MAI-DS-R1 在 HarmBench 评估中表现出色，相比 DeepSeek R1 和 R1-1776，在减少有害内容方面降低了 50% 风险。这说明虽然 MAI-DS-R1 能响应更多的敏感话题，但还是在安全控制范围之内。

总而言之，那些想体验一下“放飞自我”版 R1 的小伙伴们可以试试这个，体验一下打开全新世界。

微信关注我们

原文链接：https://www.oschina.net/news/345301/microsoft-mai-ds-r1

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

法官裁定谷歌非法垄断，或迫使其拆分广告业务

美国联邦法院的最新一项裁决判定，谷歌因“故意获取并维持广告技术市场的垄断权”而违反了反垄断法。根据周四提交的文件，当地法院将制定简报时间表和听证日期，以确定针对反垄断违法行为的适当补救措施。补救措施可能包括迫使谷歌拆分其广告业务，例如出售其谷歌广告管理器，其中包括 AdX 广告交易平台和 DFP（DoubleClick for Publishers），即用于发布商的广告服务器。或者，法院可以强制采取行为补救措施，允许谷歌保持其业务完整，但会施加限制以确保公平竞争，例如禁止谷歌在拍卖中优先考虑自己的交易或需求。对此，谷歌监管事务副总裁 Lee-Anne Mulholland 在一封电子邮件声明中表示：“我们赢了一半的官司，剩下的一半我们会上诉。法院裁定，我们的广告商工具和收购（例如 DoubleClick）不会损害竞争。我们不同意法院关于我们发布商工具裁决。发布商有很多选择，他们选择谷歌是因为我们的广告技术工具简单、实惠且有效。” 此外，在另一起反垄断案件中，另一位美国联邦法官去年裁定谷歌非法垄断了整个互联网搜索市场。该法官尚未就该案发布救济措施，但预计将在2025年中期发布。相...

2025-04-18

225

字节跳动宣布开源 Godel-Rescheduler，一个基于全局最优调度策略的重调度框架。不仅能识别集群中的异常节点和任务，还能智能推荐任务到最合适的位置，并通过图算法生成详细的迁移步骤，确保集群的整体稳定性，真正实现全局最优调度。 Godel-Rescheduler 由两个核心模块组成：Policy Manager 和 Movement Manager。其中，Policy Manager 负责输出重调度决策，而 Movement Manager 则负责拆解并执行这些决策。整个框架的目标是通过重调度，使集群朝向全局最优状态发展。目前，字节跳动已经成功将 Godel-Rescheduler 应用到多个内部项目中，支持多种重调度策略的协同工作。例如：合并部署重调度：优化上下游应用实例在相同节点上的调度。负载均衡重调度：在负载、内存带宽、网络带宽等方面进行优化。碎片整理重调度：有效减少 CPU、GPU 等资源的碎片率等。在实际应用中，Godel-Rescheduler 已帮助字节跳动的数万卡 GPU 集群将碎片率控制在 5% 以下，同时在大规模混合部署集群中，热点节点比例控制在 ...

2025-04-18

253

资源下载

更多资源

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长，特征是大鼻子、头戴帽子、身穿背带裤，还留着胡子。与他的双胞胎兄弟路易基一起，长年担任任天堂的招牌角色。

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题，腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构，目前腾讯云软件源站支持公网访问和内网访问。

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称，一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集，帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Spring

Spring框架（Spring Framework）是由Rod Johnson于2002年提出的开源Java企业级应用框架，旨在通过使用JavaBean替代传统EJB实现方式降低企业级编程开发的复杂性。该框架基于简单性、可测试性和松耦合性设计理念，提供核心容器、应用上下文、数据访问集成等模块，支持整合Hibernate、Struts等第三方框架，其适用范围不仅限于服务器端开发，绝大多数Java应用均可从中受益。