未经许可重复使用原创文章训练模型,OpenAI 遭美国 8 家报纸出版商起诉
IT之家 5 月 1 日消息,据 CNBC 报道,当地时间 4 月 30 日,8 家美国报纸出版商在纽约的一家联邦法院对微软、OpenAI 提起诉讼,声称后者未经许可在生成式 AI 产品中重复使用这些出版商创作的文章,还将信息的不准确性归咎于出版商本身。
根据 8 家出版商向美国纽约南区地方法院提交的诉状,ChatGPT 一直在“未经许可、未付款”的情况下,盗用了出版商数百万篇受版权保护的文章。
IT之家查询发现,参与诉讼的出版商包括《纽约每日新闻》《芝加哥论坛报》《奥兰多哨兵报》《佛罗里达太阳哨兵报》《圣何塞水星报》《丹佛邮报》《橙郡纪事报》和《先锋报》,这些出版商都为对冲基金 Alden Global Capital 所有。
这些出版商在指控中表示,OpenAI 利用包含其报纸文本的数据集来训练其 GPT-2 和 GPT-3 模型;微软则从报纸上复制信息,用于必应搜索索引,或作为其 AI 助手所提供答案的信息来源。“当前的 GPT-4 LLM 在收到提示时,会输出出版商作品相当一部分内容的近乎逐字逐句的副本。”
OpenAI 发言人在声明中表示,公司之前“并不知道”Alden Global Capital 的担忧,但目前正积极与世界各地的多个新闻机构开展“建设性的”合作与对话,以探索机会、化解担忧及提供解决方案。微软则拒绝对此发表评论。
广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。