加州法院裁定使用版权内容训练 AI 合规
美国加州北区地方法院裁定,Anthropic 公司在未经作者许可的情况下,使用已出版的书籍训练其 AI 模型是合法的。这标志着法院首次认可 AI 公司的说法,即合理使用原则可以免除 AI 公司在使用受版权保护的材料训练大语言模型(LLM)时的过错。
根据科技媒体 AppleInsider 的报道,许多创作者和艺术家长期以来都在为人工智能公司未经许可抓取其作品而苦恼。这些公司利用抓取的数据来训练大型语言模型(LLM),并将其商业化,然而内容的原创者却未能得到应有的补偿。对此,Andrea Bartz、Charles Graeber 和 Kirk Wallace Johnson 于2024年向法院提起诉讼,指控 Anthropic 公司侵犯其版权,使用了盗版材料。
法官 William Alsup 在裁决中支持了双方的部分请求,但最终认为用于训练特定大语言模型的副本属于合理使用。这一裁定意味着 AI 公司在训练其模型时可以合法使用受版权保护的内容,而这也让众多艺术家、音乐家和作家感到失望。
对于这些创作者来说,这项决定可能会使他们面临更大的商业风险,AI 模型的生成能力有可能进一步侵蚀他们的作品价值。
Alsup 法官在判决书中明确表示:"我们将就Anthropic公司用于创建中央图书馆的盗版书籍及其造成的损失进行审理。Anthropic公司后来购买了之前从网上盗取的书籍,这并不能免除其盗窃责任,但这可能会影响法定赔偿的数额。"
