OpenAI版权诉讼越来越多：寻求更多数据来训练人工智能

416次阅读 | 发布于4月以前

7月1日消息，据外媒报道，OpenAI使用所有公开可用的数据来训练ChatGPT，包括来自互联网的书籍和文章。训练数据是创建正在占领科技世界的人工智能模型的重要组成部分。

谷歌、Meta、OpenAI、Anthropic和微软等领先的科技公司都在争相寻找新的数据来源。Meta甚至一度考虑收购世界上最大的出版社之一西蒙舒斯特。

问题的一部分在于，出版商越来越多地指责这些公司窃取受版权保护的数据。他们希望为自己的工作获得报酬。而Meta和OpenAI在向美国版权局提交的评论中辩称，将受版权保护的材料放在互联网上使其公开可用，因此属于合理使用。但他们仍必须在法庭上提出这一论点，因为该公司面临来自多个团体的有关版权材料的诉讼。