Na quarta-feira, o Reddit entrou com uma ação judicial contra a Anthropic, alegando violação contratual. A plataforma de discussão afirma que a startup de inteligência artificial utilizou dados pessoais de seus usuários para treinar modelos sem autorização, continuando com essa prática mesmo após ter sido informada sobre a proibição de acesso aos dados.
O processo, apresentado no Tribunal Superior da Califórnia, no Condado de São Francisco, acusa a Anthropic de realizar “atos comerciais ilegais e injustos”. Alega que a empresa “treinou intencionalmente” seus sistemas com informações de usuários do Reddit sem solicitar consentimento ou efetuar pagamento. O Reddit havia tentado iniciar negociações de licenciamento com a Anthropic, mas a empresa recusou-se e afirmou que interromperia o acesso aos servidores da plataforma, segundo a denúncia.
Conforme a queixa, a Anthropic continuou a acessar os servidores do Reddit mais de 100.000 vezes, mesmo após afirmar que não o faria. O Reddit requer que os danos sejam avaliados em um julgamento com júri e busca uma liminar para impedir a Anthropic de acessar os dados dos usuários do Reddit ou de utilizar informações antigas para novos produtos. Até o momento, a Anthropic não apresentou um comentário sobre o assunto.
O Reddit tomou posição, afirmando que a Anthropic tem coletado dados pessoais de seus usuários sem consentimento, descrevendo a empresa como uma “de crescimento tardio” que se autodenomina uma “cavaleira branca” na indústria de IA.
Nos últimos anos, os fóruns do Reddit, que existem há décadas, têm sido alvos de várias empresas de IA em busca de dados para treinar seus modelos. O CEO e cofundador da plataforma, Steve Huffman, comentou que inicialmente o Reddit ofereceu seus dados gratuitamente, mas percebeu que as empresas de IA estavam em uma “corrida armamentista”. Ele afirmou que o Reddit está “em negociações com quase todos” para formalizar acordos de licenciamento.
As empresas de IA necessitam de “inteligência real” para desenvolver seus modelos, sendo isso encontrado em grande quantidade nos fóruns do Reddit. Recentemente, a OpenAI e o Reddit anunciaram uma parceria destinada a “aprimorar” o chatbot de IA ChatGPT. Este acordo surgiu após um contrato de US$ 60 milhões entre o Reddit e o Google, permitindo que este último treinasse seus modelos de IA utilizando postagens da plataforma. Além disso, o Reddit firmou parcerias para acesso a dados com outras empresas de software, como Sprinklr e Cision.