您现在的位置是:首页 > 文章详情

Anthropic 未经许可使用书籍训练 AI 模型属于“合理使用”

日期:2025-06-25点击:17

美国旧金山联邦法官威廉・阿尔苏普(William Alsup)裁定Anthropic 在未经作者许可的情况下使用已出版书籍训练其 AI 模型属于“合理使用 (fair use)”

这标志着法院首次认可 AI 公司的主张,即当 AI 公司使用受版权保护的材料训练大型语言模型(LLM)时,合理使用原则可使其免于承担责任。

法官指出,AI 模型对作品的训练类似于读者阅读并从中汲取灵感以创作新内容,而非复制或取代原作。然而,判决也指出,Anthropic 在 2021 年至 2022 年期间从 Books3、Library Genesis 和 Pirate Library Mirror 等来源下载的超过 700 万本盗版电子书不属于合理使用,这部分内容将面临陪审团审判。Anthropic 曾花费数百万美元购买并扫描大量印刷书籍,将其转换为数字格式用于内部研究。

这一裁决被认为是 AI 行业在版权合理使用方面的一个重要里程碑。同时对作者、艺术家和出版商是一个打击,他们已对 OpenAI、Meta、Midjourney、Google 等公司提起数十起诉讼。尽管这一裁决并不能保证其他法官会效仿阿尔苏普法官的做法,但它为支持科技公司而非创作者的先例奠定了基础。

这些诉讼通常取决于法官如何解释合理使用原则,这是版权法中一个出了名难以界定的例外条款,该条款自 1976 年以来就未更新过 —— 那时互联网尚未出现,更不用说生成式 AI 训练数据集的概念了。

合理使用裁决会考虑作品的使用目的(模仿和教育用途可能是可行的)、是否为商业利益而复制(你可以写《星球大战》同人小说,但不能出售),以及衍生作品与原作相比的转换性程度。

像 Meta 这样的公司在为使用受版权保护的作品进行训练辩护时也提出了类似的合理使用论点,不过在本周的裁决之前,法院会如何裁决还不太明确。

在这起具体的 Bartz 诉 Anthropic 案中,原告作者团体还对 Anthropic 获取和存储他们作品的方式提出了质疑。根据诉讼称,Anthropic 试图创建一个 “中央图书馆”,收录 “世界上所有的书籍” 并 “永久” 保存。但这些受版权保护的数百万本书籍是从盗版网站免费下载的,这显然是非法的。

尽管法官承认 Anthropic 对这些材料的训练属于合理使用,但法院将对 “中央图书馆” 的性质进行审判。

“我们将对用于创建 Anthropic 中央图书馆的盗版副本及其造成的损害进行审判,” 阿尔苏普法官在裁决中写道,“Anthropic 后来购买了一本之前从互联网上窃取的书,并不能免除其盗窃责任,但可能会影响法定损害赔偿的程度。”

 

相关阅读:Reddit 起诉 Anthropic 未经许可使用其数据训练 AI 模型

 

原文链接:https://www.oschina.net/news/357201
关注公众号

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。

持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。

文章评论

共有0条评论来说两句吧...

文章二维码

扫描即可查看该文章

点击排行

推荐阅读

最新文章