苹果公布最新研究成果:AI 可自动发现代码漏洞并生成测试用例
苹果近日在机器学习研究博客上公布三项最新成果,探讨如何利用大语言模型(LLM)和多智能体系统(AI Agents)改进软件测试、缺陷检测与代码修复流程,目标是让 AI 在质量工程(QE, Quality Engineering)中扮演更自动化、更高效的角色,从而减少人工手工写测试、查 bug 的工作量。
研究显示,AI 不仅能自动识别程序中的潜在缺陷,还能生成高质量的测试用例,大幅降低人工测试成本。
三篇论文的亮点包括:
1、Agentic RAG 框架:通过多个 AI 代理协作完成测试生成、审查与合规性检查任务,测试准备时间减少约 85%,缺陷检测率提升 35%。
2、SWE-Gym 平台:为训练软件工程类 AI 代理而设计,能在真实 GitHub 任务中自动解决 72% 以上的问题,并支持“人类在环”的可控测试。
3、ADE-QVAET 模型:结合量子变分自编码器与 Transformer,用于在开发阶段预测潜在代码缺陷,显著提升预测准确率。
苹果表示,这些研究有望未来融入其开发生态,例如 Xcode 测试工具链,为工程师提供智能化的 Bug 检测与测试生成能力。这也意味着,AI 正在逐步成为苹果软件开发流程中的关键助手。
论文地址:
- https://machinelearning.apple.com/research/software-defect-prediction
- https://machinelearning.apple.com/research/hybrid-vector-graph
- https://machinelearning.apple.com/research/training-software


