未经许可重复使用原创文章训练模型，OpenAI 遭美国 8 家报纸出版商起诉

2024-05-01 16:12 IT之家 - 清源

感谢IT之家网友咩咩洋、Diixx 的线索投递！

IT之家 5 月 1 日消息，据 CNBC 报道，当地时间 4 月 30 日，8 家美国报纸出版商在纽约的一家联邦法院对微软、OpenAI 提起诉讼，声称后者未经许可在生成式 AI 产品中重复使用这些出版商创作的文章，还将信息的不准确性归咎于出版商本身。

图源 Pixabay

根据 8 家出版商向美国纽约南区地方法院提交的诉状，ChatGPT 一直在“未经许可、未付款”的情况下，盗用了出版商数百万篇受版权保护的文章。

IT之家查询发现，参与诉讼的出版商包括《纽约每日新闻》《芝加哥论坛报》《奥兰多哨兵报》《佛罗里达太阳哨兵报》《圣何塞水星报》《丹佛邮报》《橙郡纪事报》和《先锋报》，这些出版商都为对冲基金 Alden Global Capital 所有。

这些出版商在指控中表示，OpenAI 利用包含其报纸文本的数据集来训练其 GPT-2 和 GPT-3 模型；微软则从报纸上复制信息，用于必应搜索索引，或作为其 AI 助手所提供答案的信息来源。“当前的 GPT-4 LLM 在收到提示时，会输出出版商作品相当一部分内容的近乎逐字逐句的副本。”

OpenAI 发言人在声明中表示，公司之前“并不知道”Alden Global Capital 的担忧，但目前正积极与世界各地的多个新闻机构开展“建设性的”合作与对话，以探索机会、化解担忧及提供解决方案。微软则拒绝对此发表评论。

广告声明：文内含有的对外跳转链接（包括不限于超链接、二维码、口令等形式），用于传递更多信息，节省甄选时间，结果仅供参考，IT之家所有文章均包含本声明。