浙大联合华为发布开源安全大模型 DeepSeek-R1-Safe
浙江大学网络空间安全学院与华为公司合作,共同发布了 DeepSeek R1 模型的安全加强版——DeepSeek-R1-Safe。
据介绍,该模型利用华为的昇腾芯片和 MindSpeedLLM 等框架进行开发,训练流程如下:
-
训练数据生成:构建安全、合规的数据集
-
安全监督训练:在训练过程中引入安全约束
-
安全强化学习:通过 RLHF 等方法优化模型行为
-
模型性能评测:对安全性能和通用性能进行全面评估
其核心优势在于显著提升安全防护能力的同时,有效保持模型的通用性能,从而在安全性与可用性之间实现了理想的平衡。
开源地址:https://github.com/ZJUAISafety/DeepSeek-R1-Safe
关注公众号
低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
-
上一篇
美团开源推理大模型 LongCat-Flash-Thinking
美团发布了一款基于混合专家架构的大型推理模型LongCat-Flash-Thinking,总参数量达5600亿,根据上下文需求动态激活186亿至313亿参数,平均激活约270亿参数。 该模型在逻辑、数学、编程及Agent任务上表现出色,并声称在AIME25等任务上,使用原生工具可以减少64.5%的token消耗来达到顶级准确率。 根据官方公布的评测结果,LongCat-Flash-Thinking在多个基准测试中与其他主流模型进行了对比,在数学推理(如MATH500, AIME25)、通用推理(如GPQA-Diamond)、代码生成(如LiveCodeBench, OJBench)、Agent工具使用(如SWE-Bench, τ²-Bench)以及形式化定理证明(如MiniF2F-Test)等取得了接近领先模型的水平。 LongCat-Flash-Thinking的模型权重已根据MIT许可证开源。官方提供了详细的聊天模板,模型也已上线官方聊天网站。 https://huggingface.co/meituan-longcat/LongCat-Flash-Thinking https:/...
-
下一篇
Valkey:对开源的投资
Valkey 于一年前成立,旨在为开源社区保留高性能的键值存储,避免被厂商锁定或受限于限制性许可。项目得到了 AWS、Google Cloud、Ericsson、Oracle、Alibaba、Huawei、Tencent、Percona、Aiven、Heroku、Verizon、Chainguard 和 Canonical 等贡献者的支持,展示了开源“免费”的背后,依赖于时间、人才和持续的资金投入。 由开发者打造,Linux 基金会支持 Valkey 于 2024 年 3 月 28 日诞生,已成为支持缓存、消息队列等多种工作负载的开源高性能键值数据库,也可用作主数据库。它由 2000 年成立的中立组织 Linux 基金会支持,后者帮助开发者和技术人员管理、扩展开源项目。Valkey 采用开放治理模式,专注于扩大社区贡献和用户采纳。 一年回顾:成长与动力 仅用一年时间,项目发布了两次重要版本,企业参与者从 22 家增至 47 家,正在定义、创新并推进路线图,用户规模不断扩大。社区积极拥抱 Valkey,坚定致力于持续改进,惠及所有最终用户。 Valkey 新功能与应用场景 用 JSON ...
相关文章
文章评论
共有0条评论来说两句吧...



微信收款码
支付宝收款码