开源软件作者拿起律师执业证,准备起诉 GitHub Copilot
一名开源软件作者决定对 GitHub Copilot 发起诉讼。
Matthew Butterick 是拥有多重身份的程序员,他从 1998 年开始深度参与开源社区,曾在 Red Hat 工作了两年,同时也是作家、设计师和律师,写过两本关于排版的书——《Practical Typography》和《Typography for Lawyers》,设计了多款字体:Equity,Concourse 和 Triplicate。Matthew 目前是 Racket 的贡献者,自己也写了不少开源软件(托管在自建的仓库),包括用来出版在线书籍的 Pollen ,以及在工作中使用的 AI 软件。
今年 6 月份,Matthew 撰写文章指出 GitHub Copilot 存在法律问题,尤其是对开源 License 的不当处理。近日,对于 GitHub Copilot 的法律问题,Matthew 做出了进一步举动,他重新激活了自己的加州律师执业证,并联合多名其他优秀律师,准备对 GitHub Copilot 发起集体诉讼——理由是它违反了对开源作者和用户的法律责任。
GitHub Copilot 自称是 “AI 编程助手”,基于机器学习技术来提供代码建议/自动补全。Copilot 的底层技术采用了由 OpenAI 打造的新 AI 系统 Codex——经过了数十亿行公开代码的训练。
Matthew 认为,Copilot 基于公开代码的训练和生成代码建议均存在法律问题。
- 训练中存在的法律问题
大多数开源软件采用的 License 都明确描述了授予使用者的权利和义务,比如保留代码的归属信息 (attribution)。而且原作者依旧拥有开源软件的版权 (Copyright)。
作为使用者,在面对开源软件时通常有两个选择:
- 如果软件代码有明确的 License,遵循开源 License 规定的义务
- 如果公开的部分代码没有明确指定开源 License,由于作者拥有软件的版权,使用者可在满足 fair-use 的条件下进行使用
Matthew 指出,GitHub Copilot 肯定无法满足上面的第一条要求,因为如果它在遵守开源 License 的前提下使用公开代码,那么就需要提供大量的 attribution 信息,这几乎是每个开源 License 的最低要求。但现实情况是几乎看不到 GitHub Copilot 提供的任何 attribution 信息。
因此,GitHub Copilot 对公开代码的使用需要满足 fair-use 条件。虽然 GitHub 的前任 CEO Nat Friedman 曾表示,GitHub Copilot 基于公开代码进行机器学习训练属于 fair-use。但 Matthew 认为,这是涉及到法律的问题,而不是谁说了就算的。
软件自由保护组织 (Software Freedom Conservancy,SFC) 不同意 Nat Friedman 的说法,并要求微软提供证据来支持其立场。SFC 负责人曾透露:
我们在 2021 年 6 月私下询问了 Friedman 和其他微软、GitHub 的代表,要求他们为 GitHub 的公开法律立场提供可靠的法律参考…… 但他们什么都没有提供。
为什么微软不能为他们的立场提供一些法律依据?因为 SFC 是对的:他们根本就没有依据。尽管一些法院已经考虑了相关问题,但目前还没有一个判例直接解决 AI 训练的 fair-use 问题。
- 使用中存在的法律问题
对于 GitHub Copilot 生成的建议代码,微软表示“不主张任何权利”。不过微软也没有对生成代码的正确性、安全性或引申出的知识产权问题作出任何保证。一旦使用者接受了 Copilot 的建议,所有这些都将成为自己的问题。
Matthew 举了一个最近的例子。得克萨斯农工大学教授 Tim Davis 在使用 GitHub Copilot 时,得到的建议代码竟然完全和他自己公开的代码一模一样。但这段代码并不是真正的“开源”代码,因为它没有采用开源 License。
我们都知道,使用了开源代码就要遵守其 License 规定的义务。但根据 Copilot 的设计,用户根本看不到生成代码的来源、作者,以及 License 等信息,所以他们如何遵守 License?
Matthew 最后谈到了 GitHub Copilot 对开源社区的影响。他认为,也许大多数人不会介意 GitHub Copilot 在没有告知你的情况下就使用你的代码,但如果 Copilot 在抹去开源社区各种痕迹的前提下,随意使用他们的开源代码,你会有什么感想?
延伸阅读

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
-
上一篇
PHP 8.2 被批准在 Fedora 38 中引入
Fedora 工程和指导委员会 (FESCo) 已批准将 Fedora 38 的 PHP 包升级到 PHP 8.2。与大多数软件包一样,Fedora Linux 在发布时往往总是附带最新的 PHP 版本。这意味着在明年春天,Fedora Linux 38 将为那些想在这个由 Red Hat 赞助的 现代Linux 发行版上运行 LAMP 的用户提供 PHP 8.2。 PHP 8.2 包含了大量的改进内容。具体有: 增加了对在 traits 中定义常量的支持 Random code 中的extension-specific Exceptions/Errors 更新内置 Web 服务器的 MIME 类型表 减少各种函数返回的字符串的内存占用 新的Random扩展 为 Linux 启用 arc4random_buf 与 Glibc 2.36+ 随机字节 初步支持 ARM64 的 Windows 上的交叉构建 将 JIT 缓冲区 Opcache 分配到靠近 PHP .text 段,以允许使用直接的 IP 相关调用和跳转 PHP Sockets的新选项 支持新 Curl 选项 新的 ZipArc...
-
下一篇
知名 KDE 开发者 Nate Graham 入选 KDE e.V. 董事会
Nate Graham 是 KDE 的主要开发者之一,也主导了很多 KDE 相关的开发和规划任务,他每周发布的 "This Week In KDE" 总结,也是大家快速了解 KDE 目前开发进度的一个重要信息来源。我们过去多篇有关 KDE 的文章中都出现过他的身影(如:KDE 2022 路线图)。 近日,在 KDE 开发者的 Akademy 年度会议上,Nate Graham 成功入选了 KDE e.V. 董事会,成为了其中的一员(下图左二)。 KDE e.V. 是 KDE 桌面背后的非营利组织,同时也是其财务和法律实体,其目的是为 KDE 筹集更多的资金,并希望雇用更多的开发者来进一步加速这个开源桌面环境的开发。除此之外,KDE e.V. 还负责推广和营销,项目管理和活动策划等。 Nate Graham 认为 KDE e.V. 需要有更多的技术职位,可以直接雇用 KDE 社区成员,这样这些开发者就不必在第三方公司寻求工作。虽然 KDE e.V. 也正在朝这个方向发展了,但他认为这个速度还是太慢了,而且与 KDE 社区未来的目标相比,他们可用的预算也不多(2021 年收入 23.9 万...
相关文章
文章评论
共有0条评论来说两句吧...