Ícone do site Jornal O Sul

Amazon, Reuters e The New York Times bloquearam o robô que tem a função de rastrear textos na internet para alimentar e treinar o ChatGPT

Diversos sites de grandes bloquearam o GPTBot, robô da OpenAI. (Foto: Reprodução)

Diversos sites de grandes empresas, como Amazon, Reuters e The New York Times, bloquearam o GPTBot, robô da OpenAI, lançado no dia 8 de agosto, que tem função de rastrear textos na internet para alimentar e treinar o ChatGPT. Até o dia 22 de agosto, ao menos 69 sites bloquearam o dispositivo, segundo análise da Originality.ai, empresa de verificação de conteúdos gerados por inteligência artificial (IA) e plágio.

Pelo menos 15% dos mil sites mais populares barraram o GPTBot nas últimas duas semanas. “O GPTBot foi lançado há 14 dias e a porcentagem dos mil principais sites que o bloqueiam aumenta constantemente”, afirma a pesquisa.

A obstrução impede o uso do conteúdo protegido por direitos autorais para alimentar e treinar o chatbot de IA. “Propriedade intelectual é a força vital dos nossos negócios, e precisamos proteger os direitos autorais do nosso conteúdo”, disse um porta-voz da agência de notícias Reuters ao jornal The Guardian.

A análise foi feita entre os dias 8 e 22 de agosto. Durante o estudo, foram analisados todos os arquivos robots.txt dos endereços selecionados para verificar se o GPTBot estava bloqueado ou não.

A discussão sobre os direitos autorais dos conteúdos usados por IAs generativas não é de hoje. Em janeiro, por exemplo, o banco de imagens Getty Images processou os criadores da IA Stable Diffusion por treinar o sistema usando imagens protegidas por direitos autorais.

O ChatGPT foi lançado em novembro do ano passado e deu início a uma onda de inteligências artificiais generativas capazes de gerar textos, imagens e até vídeos. Influenciadas pela nova tecnologia, grandes empresas, como Microsoft e Google, também passaram a investir mais nessa área.

A medida também foi adotada por veículos de comunicação franceses, como France 24, RFI, Mediapart, Radio France e TF1.

“Tem uma coisa que não vamos tolerar: o roubo não autorizado de conteúdo”, disse na segunda-feira, durante coletiva de imprensa, a presidente da Radio France, Sibyle Veil.

“Não há nenhuma razão para que se beneficiem dos nossos conteúdos sem contraparte”, disse à AFP Laurent Frisch, diretor de estratégia digital e inovação da Radio France.

“Já chega de sermos pilhados por estas empresas, que obtêm lucros às custas da nossa produção”, queixou-se Vincent Fleury, diretor digital da France Medias Monde, empresa matriz da France 24 e da RFI.

Diretores de alguns meios de comunicação franceses também expressaram preocupação de que seus conteúdos sejam associados a informação falsa. Eles exigem que sejam abertas discussões com a OpenAI e outras empresas de IA.

“Os veículos devem ser remunerados de forma justa. Nosso desejo é obter acordos de licença e pagamento”, declarou Bertrand Gié, diretor da divisão de notícias do jornal Le Figaro. As informações são do jornal O Estado de S. Paulo e da agência de notícias AFP.

Sair da versão mobile