
Antes de começar, observe várias advertências: alguns livros aparecem várias vezes, refletindo edições, traduções, abreviação ou anotações diferentes.Esses autores passaram anos pensando, pesquisando, imaginando e escrevendo, e não tinham idéia de que seus livros estavam sendo usados para treinar máquinas que um dia poderiam substituí -las.Neste verão, adquiri um conjunto de dados de mais de 191.000 livros que foram usados sem permissão para treinar sistemas generativos-AI pela Meta, Bloomberg e outros.Devido a inconsistências na ortografia dos nomes dos autores, a pesquisa não pode devolver livros que estão, de fato, nos livros3.Procurado para comentar, um porta-voz da Meta não respondeu diretamente a perguntas sobre o uso de livros piratas para treinar Llama, o produto generativo-AI da empresa.