GitHub一边庆祝AI为开源生态带来的"巨大贡献",一边却对贡献质量的断崖式下跌视而不见。当大多数科技公司都在歌颂AI辅助编程的生产力神话时,一个获得VC支持的AI原生项目——Archestra选择站出来说真话:AI垃圾正在系统性地毁掉开源生态。

今年早些时候,Archestra团队在一个GitHub Issue上挂出了900美元的悬赏,希望吸引开发者为平台添加MCP Apps支持。真正有价值的贡献者很快出现了——他们提出方案、提出问题、提交尝试,但接下来发生的事情完全超出了预期。AI机器人蜂拥而至,迅速将这个Issue的评论数推到253条,其中充斥着毫无意义的"实施方案"和对维护者的攻击性言论。

这仅仅是开始。AI账号不仅轰炸这一个Issue,而是横扫整个代码库。每一条敷衍的评论都会触发所有关注者的通知,GitHub通知变成了一堵噪声之墙。真正在做事的人——比如正在攻克“悬赏issue”的@ethanwater、@developerfred、@Geetk172——他们的对话被淹没在垃圾信息中。
更严峻的问题出现在PR层面。仅为了添加x.ai提供商支持这一个功能,Archestra就收到了27个PR,其中大多数贡献者甚至没有尝试过运行他们提交的代码。团队成员不得不每周花费半天时间清理这些AI垃圾——删除未经测试的PR、关闭虚假Issue。当团队忘记及时清理时,代码库迅速变成了一个对合法贡献者完全敌对的地方。
安全风险也随之而来。就在LiteLLM代码库中,攻击者试图利用AI机器人来引导对话走向——这不再是烦人的问题,而是真实的安全威胁。
面对这种局面,Archestra首先尝试构建"声誉机器人"来计算贡献者的可信度,但显然无法阻止spam。随后推出的"AI sheriff"甚至误伤了合法PR。持续的垃圾信息流正在赶走真正的贡献者,迫使团队开始考虑:是否应该停止用悬赏激励贡献?是否应该停止向求职者提供有趣的测试任务?
最终,Archestra选择了反击:通过onboarding系统(https://archestra.ai/contributor-onboard)实现白名单机制。他们在网站上建立了一套五步onboarding流程,要求贡献者必须通过ethical AI规则验证和CAPTCHA测试。但问题在于GitHub本身并不提供"仅限白名单用户评论或提PR"的选项——Archestra不得不利用Git commit的author字段和GitHub的"prior contributor"设置来实现这一目标。

具体方案颇为巧妙:GitHub将"prior contributor"定义为在main分支上有commit作者身份的人。通过Git的--author参数,可以用他人的身份创建commit——只要邮箱与他们的GitHub账号匹配,该commit就会被归因到他们名下,授予贡献者身份。Archestra构建了一套自动化流程:用户在网站onboarding后,GitHub Action会自动查询用户的GitHub ID,生成一个以用户身份创建的commit,将他们添加到外部贡献者名单,从而获得代码库访问权限。
Archestra承认这是一个"终极手段",对于一家用GitHub活动数据衡量团队表现的VC支持的创业公司来说尤其敏感。但它的态度很明确:质量重于数量,不要被AI垃圾填充的指标。
这不仅是某个项目的困境。当GitHub报告的指标增长中相当一部分来自AI生成内容时,整个开源生态正在默默承受着清洁AI垃圾的沉重负担。AI辅助编程的浪潮中,我们需要认真思考:所谓的生产力提升,是否正在以牺牲开源生态的健康为代价?
参考来源:https://archestra.ai/blog/only-responsible-ai