Socket工程师Nolan Lawson在个人博客"Read the Tea Leaves"发表文章,分享了一种反直觉的AI编程工作流:用AI写更好、但更慢的代码。他主张,LLM极为灵活,不仅能快速生成代码,也能帮助写出质量更高但速度更慢的代码。

Lawson指出了一个常见误解:许多人认为AI编程的目的就是尽快吐出低质量的代码——快速打开巨大的PR,不经验证就合并。但实际上,用AI写高质量代码需要一种完全相反的策略:慢下来,反复审视。
他的核心做法是:让多个AI模型(Claude、Codex、Cursor Bugbot)同时审查PR,分别找出关键级、高优先级、中级、低级的bug,汇总后再做人工核实。这种多模型交叉审查的方式能显著减少幻觉和虚假bug。审查完成后,由主agent按优先级逐一修复:先清掉所有关键和高优先级bug,再判断中低级bug是否值得处理,如果整个方案从根本上就有问题就放弃这个PR。
Lawson特别提到了Anthropic的Mythos模型,表明LLM agents非常擅长发现bug——当足够多的模型审视同一个代码库时,发现的bug多到开发者几乎不知道如何处理。但问题的关键不在于找到bug,而在于优先级排序和验证虚假警报。他的Claude skill正是围绕这一洞察构建的。
文章中一个有趣的观点是:使用这种工作流后,代码审查往往会发现许多早就存在于代码库中的历史bug,Lawson最终会在这些支线任务上花时间补充单元测试和修复隐患。这与"10倍生产力"的slop-cannon式开发(slop = 粗制滥造;cannon = 猛烈输出)截然不同,但他认为这非常令人满足——既改善了代码库整体健康状况,又加深了对代码库各个角落的理解。
Lawson还建议开发者使用Matt Pocock的"/grill-me"技能让AI详细追问整个PR的来龙去脉,或者让AI生成Mermaid图表来解释代码逻辑,最终达到对整个PR从开头到结尾都了如指掌的程度。他坦言:按照这种方式编程,在原始代码行数上未必"更有生产力",可能烧掉大量token后发现整个方案从一开始就方向错了。但他认为,这是一种比LMM时代之前他就已经在尝试的编程方式更强大的版本:谨慎、严谨、追求质量、为下一个维护者着想。
原文链接:https://nolanlawson.com/2026/05/25/using-ai-to-write-better-code-more-slowly/