Sábado, 11 de janeiro de 2025
Por Redação O Sul | 11 de janeiro de 2025
A Meta, que controla o Facebook, o Instagram e o Threads, aparece num processo judicial nos Estados Unidos por violar direitos autorais. A empresa é acusada de usar indevidamente material para o treinamento de seu modelo de inteligência artificial (IA), a Llama. Advogados de acusação alegam que o próprio CEO da Meta, Mark Zuckerberg, teria dado sinal verde à equipe por trás do uso indevido de conteúdo, segundo o site TechCrunch.
Em sua defesa, a Meta diz estar protegida pela “doutrina do uso justo”, prevista no Estatuto do Direito Autoral dos Estados Unidos (US Copyright Statute), que permitiria a utilização do material com a premissa de criar de algo novo.
Nessa disputa, conhecida como Kandrey vs Meta, estão envolvidos nomes como a da comediante e roteirista do The Sarah Silverman Program, Sarah Silverman, e do jornalista TaNahisi Coates, autor do livro Entre o Mundo e Eu (de 2015). Documentos apresentados ao Tribunal Distrital dos Estados Unidos do Distrito da Carolina do Norte indicam que Zuckerberg liberou o uso de um conjunto de material literário e acadêmico da LibGen para treinar os modelos Llama.
O problema é que a LibGen, por sua vez, não tem direito sobre nenhuma das obras disponíveis. Em defesa, a plataforma se descreve como um “agregador de links”. Ou seja: ela não hospeda o conteúdo, mas fornece links que direcionam os usuários a sites onde os arquivos podem ser baixados. No meio dos conteúdos piratas, há obras das editoras de livros didáticos Cengage Learning, Macmillan Learning, McGraw Hill e Pearson Education.
Dupla violação
A LibGen também frequenta os tribunais com frequência – multas que somam mais algumas dezenas de milhões de dólares já foram aplicadas e seu fechamento já foi determinado pela Justiça dos EUA. Tudo por causa de infrações de direitos autorais. E o processo revela que a Meta usou Torrent (um protocolo de compartilhamento de arquivos sem um servidor central) para acessar a biblioteca digital, o que configuraria uma segunda violação de direitos.
De acordo com a acusação, funcionários da Meta alertaram que o LibGen era “um conjunto de dados que sabemos ser pirata”, no entanto Mark Zuckerberg deixou explícito a intenção de usar os dados no treinamento da IA.
O processo também menciona um documento que circulou entre diretores da área de IA da Meta, no qual há a ordem explícita de usar o conteúdo ilícito. E a empresa ainda teria tentado encobrir a infração ao remover dados de atribuição ao LibGen.
Estratégia
A estratégia de apagar os rastros seria parte de um roteiro criado por um dos engenheiros da Meta, Nikolay Bashlykov, onde palavras como “copyright” dos arquivos acessados eram apagadas. Segundo a acusação, isso indica que a empresa não só usava os dados para treinamento de modelos de linguagem, como também tinha a intenção de ocultar a violação.
O processo se tornou público porque o juiz Thomas Hixson rejeitou um pedido de sigilo feito pela Meta, com o qual, segundo o magistrado, a empresa não visava proteger informações sensíveis, mas sim evitar publicidade negativa.
No último ano, empresas desenvolvedoras de IA tornaram-se alvos de processos sobre o uso sem autorização de obras protegidas para o treinamento de seus modelos. E na maioria das vezes, réus como a Meta baseiam suas defesas na mesma “doutrina do uso justo”.
Casos como esse já aconteceram antes, por exemplo quando o jornal americano The New York Times abriu, em 2023, um processo judicial contra a OpenAI, dona do ChatGPT, e a Microsoft por violação de direitos autorias.
A ação pedia um julgamento com júri e só foi protocolada depois de meses de negociações malsucedidas entre representantes dos setores de tecnologia e comunicação. Criadores de série Game of Thrones também processaram a empresa de Sam Altman. Em 2023, George RR Martin e John Grisham alegram que os direitos autorais da série haviam sido violados para treinar o modelo de IA da companhia. (Estadão Conteúdo)