您现在的位置是:首页 > 文章详情

OpenAI 称《纽约时报》的版权诉讼毫无根据

日期:2024-01-09点击:56

《纽约时报》曾于去年 12 月起诉 OpenAI 和微软公司,称这两家公司非法使用其受版权保护的材料来训练 AI 模型。时至今日,OpenAI 公开回击并发表了一篇博文称:“我们支持新闻业,与新闻机构合作,并认为《纽约时报》的诉讼毫无根据。”

该公司在博文中重申了以下四点立场:

  • 我们与新闻机构合作并创造新的机会
  • 培训属于合理使用,但我们提供选择退出的机会,因为这是正确的做法
  • “反刍(Regurgitation)”是一种罕见的错误,我们正在努力将其降至为零
  • 《纽约时报》没有讲述完整的事实

OpenAI 方面表示,其目标是支持健康的新闻生态系统、成为良好的合作伙伴、创造互利的机会;考虑到这一点,该公司一直在寻求与新闻机构建立合作伙伴关系。通过与美联社、Axel Springer、American Journalism Project 和纽约大学的早期合作,他们已经对相关方法有了初步了解。

该公司认为,一些已经普遍被接受的先例表明,使用公开可用的互联网资料训练 AI 模型是属于合理使用范畴。“我们认为这一原则对创造者是公平的,对创新者是必要的,对美国的竞争力也是至关重要的。”

而关于“反刍”问题,OpenAI 则解释道,他们已经采取了措施来限制非故意记忆,并防止大模型输出中的反刍现象。并指出,如果训练数据来自单一来源(如《纽约时报》),则反刍的可能性较小;同时也敦促用户"act responsibly",避免故意促使其模型反刍。“故意操纵我们的模型进行反刍不是对我们技术的适当使用,也违反了我们的使用条款”。“反刍”是指特定内容在大模型的训练数据中多次出现的一种现象。

OpenAI 透露与《纽约时报》的最后一次沟通是在 2023 年 12 月 19 日,“我们与《纽约时报》的讨论似乎取得了建设性进展......我们向《纽约时报》解释说,与任何单一来源一样,他们的内容对我们现有模型的训练没有任何有意义的贡献,也不会对未来的训练产生足够的影响。但他们于 12 月 27 日提起了诉讼 —— 我们是也通过《纽约时报》才了解到的 —— 这令我们感到惊讶和失望。”

值得一提的是,OpenAI 称《纽约时报》在双方的沟通过程中已经发现了一些内容的反刍,但却在 OpenAI 承诺调查和解决任何问题的前提下,一再拒绝分享任何示例。

有趣的是,《纽约时报》提到的反刍似乎来自于多个第三方网站上大量传播的多年前的文章。为了让我们的模型进行反刍,他们似乎有意篡改了提示语,通常包括冗长的文章节选。即使在使用此类提示时,我们的模型通常也不会像《纽约时报》影射的那样,这表明他们要么是指示模型进行反刍,要么是从众多尝试中精心挑选了一些示例。

尽管他们声称,这种误用并非典型或允许的用户行为,也不能替代《纽约时报》。但无论如何,我们都在不断提高系统的抗逆向攻击能力,以避免训练数据被反刍,并在最近的模型中取得了很大进展。

在声明的最后,OpenAI 表示,尽管他们认为《纽约时报》的诉讼毫无根据;但仍然对《纽约时报》保持尊重并希望与其建立建设性的合作伙伴关系。“我们期待与新闻机构继续合作,通过实现 AI 的变革潜力,帮助他们提高生产高质量新闻的能力。”

OpenAI 做出回应之际,围绕生成式 AI 的版权争论正值白热化。一些数据表明,公众更倾向于站在媒体出版商这一方。The AI Policy Institute 最近的一项民意调查结果显示,当得知《纽约时报》起诉 OpenAI 的详情后,59% 的受访者同意 AI 公司不应该被允许使用出版商的内容来训练模型;70% 的受访则表示,如果这些公司想在模型训练中使用受版权保护的材料,就应该向出版商提供补偿。

延伸阅读:

原文链接:https://www.oschina.net/news/274916/openai-and-journalism
关注公众号

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。

持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。

文章评论

共有0条评论来说两句吧...

文章二维码

扫描即可查看该文章

点击排行

推荐阅读

最新文章