AIPress.com.cn报道
1月7日消息,美国法院日前裁定,OpenAI 必须向多家新闻机构提供多达 2000 万条经匿名化处理的 ChatGPT 输出日志,用于版权侵权相关诉讼取证。这一决定不仅驳回了 OpenAI 以用户隐私为由提出的反对意见,也可能进一步推动已被删除的聊天记录重新进入司法审查范围。

据悉,此次诉讼由《纽约时报》等新闻机构发起。原告认为,ChatGPT 的部分回答存在复制新闻内容、淡化新闻机构商标标识,或移除版权管理信息等行为。随着法院裁定日志披露,新闻机构也开始要求进一步追究 OpenAI 在数据保存方面的责任。
根据裁决,美国联邦地区法院法官 Sidney Stein 维持了此前由治安法官 Ona Wang 作出的命令,认为在当前诉讼背景下,调取完整的 2000 万条对话样本是合理且必要的。法院指出,相关日志已从最初可能涉及的数百亿条记录中大幅缩减,并在移交前完成去标识化处理,足以在一定程度上保护普通 ChatGPT 用户的隐私。
OpenAI 曾主张,应由公司自行通过关键词搜索方式筛选可能涉及侵权的对话,再向原告提供结果,以降低对用户隐私的影响。但法院认为,新闻机构有权直接检索完整样本,因为即便不包含明确侵权内容的对话,也可能与 OpenAI 的“合理使用”抗辩相关。
新闻机构在最新提交的文件中指控,OpenAI 在诉讼启动后未能及时中止既有的数据删除机制,导致大量潜在证据被清除。其中包括部分免费版、订阅版用户的聊天记录,而这些记录被认为更可能涉及绕过付费墙的使用场景。原告方称,相关删除行为发生在诉讼期间,且 OpenAI 未给出充分解释。
与之形成对比的是,作为共同被告的微软已同意提供超过 800 万条 Copilot 日志,并未出现类似规模的数据缺失问题。新闻机构因此要求法院调查 OpenAI 是否存在选择性保存有利证据、却未保留不利证据的情况,并考虑是否对其采取制裁措施。
此外,原告方还请求法院维持数据保全令,禁止 OpenAI 继续永久删除临时或已标记删除的聊天记录,并要求其披露已销毁数据的具体范围,以及这些记录是否具备技术层面的恢复可能。
OpenAI 表示,目前仍在评估是否存在进一步抗辩空间,并强调即将披露的数据均已完成匿名化处理,仅供案件取证使用。随着诉讼推进,围绕 AI 训练、用户数据、版权保护之间的边界问题,正被推向更具实质性的司法审视阶段。(AI普瑞斯编译)
扫码下载app 最新资讯实时掌握
