MetaGPT 发布 RealDevWorld:92% 精准度碾压 Claude
MetaGPT团队重磅推出了一款端到端自动化测试工具RealDevWorld,在AI驱动的软件开发领域掀起热议。这款工具以其惊艳的性能表现和高效的测试能力,在RealDevBench基准测试中取得了92%的精准度,评估一致性更是超越了Claude等前沿模型。 RealDevWorld是MetaGPT基于其多智能体框架开发的全新自动化测试工具,旨在实现从代码生成到质量保障的全链路自主化。该工具通过AppEvalPilot模块,模拟专业测试工程师的系统化流程,能够按照产品设计和场景边界进行验收测试,同时支持7×24小时不间断的全面测试。 相较于传统测试工具,RealDevWorld采用动态评估机制,摒弃静态基准测试的局限性,能够实时适应复杂开发场景。其高效性令人瞩目:平均8-9分钟即可完成对一个应用中15-20个功能组件的全面评估,且每次测试的成本低至约0.26美元,极大地降低了开发团队的测试成本。 在RealDevBench基准测试中,RealDevWorld展现了强大的性能表现,精准度高达92%,且在评估一致性上超越了Anthropic的Claude模型。这一突破得益于MetaGPT多...



