首页 文章 精选 留言 我的
优秀的个人博客,低调大师

微信关注我们

原文链接:https://my.oschina.net/candou/blog/18099033

转载内容版权归作者及来源网站所有!

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

基于 DeepSeek GRPO 的 1.5B Rust 代码生成模型训练实战

编者按: 群组相对策略优化(GRPO)如何让小型专用模型在特定任务上实现性能提升?我们今天为大家带来的这篇文章展示了如何使用 GRPO,训练一个仅有 1.5B 参数的 Rust 代码生成模型,实现性能大幅提升。 文章详细介绍了作者基于 Qwen2.5-Coder-1.5B-Instruct 模型使用 GRPO 技术进行训练的实践经验。作者选择 Rust 语言作为实验对象,利用其严格的编译器和完善的工具链作为反馈机制,构建了一套基于格式验证与 Cargo 的奖励函数。通过单次 GRPO 训练,模型的代码编译通过率从 61% 提升至 80%,单元测试通过率从 22% 提升至 37%,成本不到 100 美元。 作者 | Greg Schoeninger 编译 | 岳扬 群组相对策略优化(Group Relative Policy Optimization,GRPO)已被证明是一种有效的算法,可用于训练大语言模型(LLMs),使其具备推理能力并在基准测试中持续提升性能表现。DeepSeek-R1 展示了如何通过监督式微调(Supervised Fine-Tuning)与 GRPO 技术的结合,...

IngressNightmare:Ingress Nginx 再曝5个安全漏洞,可接管你的 K8s 集群

作者:望宸&魁宇 是否还记得 2022 年 K8s Ingress Nginx 披露了的 3 个高危安全漏洞(CVE-2021-25745, CVE-2021-25746, CVE-2021-25748),并在那一年宣布停止接收新功能 PR,专注修复并提升稳定性。但近期再次被披露 5 个安全漏洞,攻击者可利用安全漏洞,接管你的 K8s 集群,被业内称为 #IngressNightmare 【1】 目录 01 背景 02 Nginx Ingress 安全漏洞频出的根因:架构设计缺陷 03 架构设计缺陷带来安全问题,还带来稳定性问题 04 自建网关容易忽略的细节 05 Higress&MSE Ingress:Ingress 的另一种选择 背景 近日,云安全平台 Wiz Research 披露了 Ingress Nginx 的 5 个安全漏洞,分别是 CVE-2025-1097、CVE-2025-1098、CVE-2025-24514 和 CVE-2025-1974,这是 Kubernetes Ingress Nginx Controller 中未经身份验证的远程代码执行漏洞...

相关文章

发表评论

资源下载

更多资源
优质分享App

优质分享App

近一个月的开发和优化,本站点的第一个app全新上线。该app采用极致压缩,本体才4.36MB。系统里面做了大量数据访问、缓存优化。方便用户在手机上查看文章。后续会推出HarmonyOS的适配版本。

Apache Tomcat

Apache Tomcat

Tomcat是Apache 软件基金会(Apache Software Foundation)的Jakarta 项目中的一个核心项目,由Apache、Sun 和其他一些公司及个人共同开发而成。因为Tomcat 技术先进、性能稳定,而且免费,因而深受Java 爱好者的喜爱并得到了部分软件开发商的认可,成为目前比较流行的Web 应用服务器。

Eclipse

Eclipse

Eclipse 是一个开放源代码的、基于Java的可扩展开发平台。就其本身而言,它只是一个框架和一组服务,用于通过插件组件构建开发环境。幸运的是,Eclipse 附带了一个标准的插件集,包括Java开发工具(Java Development Kit,JDK)。

Sublime Text

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能,例如代码缩略图,Python的插件,代码段等。还可自定义键绑定,菜单和工具栏。Sublime Text 的主要功能包括:拼写检查,书签,完整的 Python API , Goto 功能,即时项目切换,多选择,多窗口等等。Sublime Text 是一个跨平台的编辑器,同时支持Windows、Linux、Mac OS X等操作系统。