A Meta está neste momento a lidar com um processo onde é acusada de recorrer a conteúdo pirateado para treinar o seu modelo de Inteligência Artificial (IA) de nome Llama, com uma página na rede social X a partilhar documentos judiciais que fornecem mais pormenores sobre estas práticas.
De acordo com as informações partilhadas pela página @vxunderground (abaixo), a Meta terá usado o equivalente a 81,7TB de dados de livros pirateados para treinar a Llama, com os livros pirateados a terem sido retirados de plataformas como Anna’s Archive, Z-Library e LibGen.
Os documentos mostram também comunicações internas entre os investigadores e as preocupações com a adoção destas práticas para treinar modelos de IA. “Acho que não devíamos usar material pirateado [para treinar IA]. Temos de traçar uma linha”, disse um investigador. “[Fazer download] de torrents de um computador corporativo não parece certo”, notou outro investigador da Meta.
Como conta o site Tom’s Hardware, a gigante tecnológica liderada por Mark Zuckerberg também terá procurado garantir que estas práticas não podiam ser ligadas à empresa, o que pode provar em tribunal que o uso de material pirateado foi intencional e deliberado da parte da Meta.
Unsealed court documents from February 5th, 2024, in Kadrey v. Meta show Meta (formerly Facebook) illegally torrented 81.7TB of data from "shadow libraries" such as Anna's Archive, Z-Library, and LibGen to train Meta artificial intelligence.
— vx-underground (@vxunderground) February 8, 2025
Highlights include:
- A senior AI… pic.twitter.com/Bqf60Hhbb6
Leia Também: Cimeira sobre IA conclui com apelo a tecnologia mais "aberta" e "ética"