Uma nova investigação levada a cabo pela Proof News indica que algumas das maiores empresas do mundo na área da Inteligência Artificial (IA) recorreram a vídeos do YouTube para treinarem as respectivas tecnologias.
A base de dados da EleutherAI,que serviu de ponto de partida para a investigação, indica que empresas como a Apple, a Nvidia e a Anthropic fizeram uso de transcrições de mais de 173 mil vídeos pertencentes a mais 48 mil canais no YouTube.
Sublinhar que esta base de dados não inclui imagens ou som mas, tendo em conta que as transcrições dizem respeito a texto de alguns dos criadores de conteúdos mais conhecidos da plataforma da Google e que estes não foram devidamente compensados pelo seu trabalho, o caso está a servir para desvendar a forma como estas tecnologias são desenvolvidas.
“A Apple obteve dados para sua IA de várias empresas. Uma delas reuniu toneladas de dados/transcrições de vídeos do YouTube, incluindo os meus. A Apple evita tecnicamente a ‘culpa’ porque não foram eles que fizeram essa recolha. Este será um problema em evolução por muito tempo”, escreveu Marques Brownlee (um dos youtubers afetados) numa publicação na rede social X.
Apple has sourced data for their AI from several companies
— Marques Brownlee (@MKBHD) July 16, 2024
One of them scraped tons of data/transcripts from YouTube videos, including mine
Apple technically avoids "fault" here because they're not the ones scraping
But this is going to be an evolving problem for a long time https://t.co/U93riaeSlY
Leia Também: Autoridade para a concorrência de França está a investigar a Nvidia