我们使用Cookie来详细了解您如何使用我们的网站以及我们可以改进的内容。通过点击“接受”，继续使用我们的网站。详细内容

市场新闻作者称，尽管Meta 自己的律师提出警告，但仍使用受版权保护的书籍进行人工智慧培训

股市新闻

作者称，尽管Meta 自己的律师提出警告，但仍使用受版权保护的书籍进行人工智慧培训

TOPONE Markets分析师

2023-12-13 10:26:42

屏幕截图 2023-12-13 102459.png

根据今年夏天最初提起的版权侵权诉讼中的一份新文件，Meta Platforms（纳斯达克股票代码： META ）的律师曾警告其使用数千本盗版书籍来训练其人工智慧模型的法律风险，但该公司还是这么做了。

周一晚间提交的新文件合并了喜剧演员莎拉·西尔弗曼(Sarah Silverman)、普利策奖得主迈克尔·查邦(Michael Chabon) 和其他著名作家对Facebook 和Instagram 所有者提起的两起诉讼，他们指控Meta 未经许可使用他们的作品来训练其人工智慧语言模型，骆驼。

加州法官上个月驳回了西尔弗曼诉讼的部分内容，并表示他将允许提交人修改他们的主张。

Meta 没有立即回应对这些指控发表评论的请求。

周一提交的新投诉包括一位Meta 附属研究人员讨论在Discord 伺服器中采购资料集的聊天记录，这是一个潜在的重要证据，表明Meta 意识到其对这些书籍的使用可能不受美国的保护。版权法。

在投诉中引用的聊天记录中，研究员Tim Dettmers 描述了他与Meta 法律部门就使用书籍文件作为训练资料是否「合法」进行的反覆讨论。

「在Facebook，有很多人有兴趣与(T)he (P)ile 合作，包括我自己，但就目前的形式而言，我们出于法律原因无法使用它，」Dettmers 在2021 年写道，指的是根据起诉书，Meta 承认使用资料集来训练其第一个版本的Llama。

一个月前，德特莫斯写道，Meta 的律师告诉他，「如果他们接受了这些数据的训练，就不能使用这些数据，也不能发布模型」。

虽然戴特莫斯没有描述律师们的担忧，但他在聊天中的同行认为「具有有效版权的书籍」是最可能的担忧来源。他们表示，对资料的培训应该“属于合理使用”，这是一项美国法律原则，旨在保护受版权保护的作品的某些未经许可的使用。

华盛顿大学博士生德特莫斯告诉路透社，他无法立即对这些说法发表评论。

今年，科技公司面临来自内容创作者的大量诉讼，这些内容创作者指控他们抄袭受版权保护的作品来构建生成人工智慧模型，这些模型引起了全球轰动并刺激了投资狂潮。

如果成功，这些案例可能会抑制生成式人工智慧的热潮，因为它们可能会迫使人工智慧公司向艺术家、作家和其他内容创作者提供使用其作品的补偿，从而提高构建需要大量数据的模型的成本。

同时，欧洲监管人工智慧的新临时规则可能会迫使公司揭露用于训练模型的数据，这可能会使它们面临更多法律风险。

Meta 在2 月发布了Llama 大语言模型的第一个版本，并发布了用于训练的资料集列表，其中包括「ThePile 的Books3 部分」。根据起诉书，收集该资料集的人曾在其他地方表示，该资料集包含196,640 本书。

该公司没有透露其最新版本的模型Llama 2 的训练数据，该模型于今年夏天投入商业使用。

Llama 2 可供每月活跃用户数低于7 亿的公司免费使用。它的发布在科技领域被视为潜在的人工智慧生成软体市场游戏规则改变者，有可能颠覆OpenAI 和Google（纳斯达克股票代码： GOOGL ）等对其模型使用收费的参与者的主导地位。

赠金奖励，助力交易成长！

或尝试 免费模拟交易

需要帮助吗？

7×24 H

$20 起交易黄金及热门资产