GLM-5.2 vs Claude Opus 实测:开源模型离闭源旗舰还有多远?
科技媒体 Tech Stackups 发布了一篇在开发者社区引起广泛讨论的评测文章。这篇文章的测试方法很简单:给两个大模型同样的 prompt,要求它们从零构建一个完整的 3D 平台跳跃游戏——原始 WebGL2 渲染、GLB 模型解析、骨骼动画、碰撞检测、摄像机跟随——不借助任何游戏引擎或 Three.js 等第三方库。两个参赛者分别是 Anthropic 的 Claude Opus 4.8 和智谱刚刚发布的开源模型 GLM-5.2。 结果是:Opus 用 33 分钟交出了一个画面干净、可正常通关的作品;GLM-5.2 用了 71 分钟,产出了...

