Grandes editoras processam Perplexity AI por raspagem sem pagar
As principais editoras de notícias dos EUA, Dow Jones & Co e NYP Holdings, processaram a Perplexity, startup do mecanismo de busca de IA, por copiar seu conteúdo sem pagar por isso.
A ação, movida em nome do The Wall Street Journal e de seu tablóide irmão New York Post pela empresa-mãe News Corporation, alega duas acusações de violação de direitos autorais e uma de falsa designação de origem e diluição de marcas registradas. Os demandantes acusam o negócio da IA de roubar o trabalho árduo dos jornalistas para alimentar os requisitos de dados dos seus modelos de treinamento. O CEO da News Corp, Robert Thomson, afirmou que este poderia ser o primeiro de muitos processos contra desenvolvedores de IA.
“O desconcertante Perplexity copiou deliberadamente grandes quantidades de material protegido por direitos autorais sem compensação e descaradamente apresenta material reaproveitado como um substituto direto para a fonte original. Perplexity afirma com orgulho que os usuários podem 'pular os links' – aparentemente, Perplexity quer pular a verificação, “ele disse O Registro em um comunicado.
“Aplaudimos empresas de princípios como a OpenAI, que entende que a integridade e a criatividade são essenciais se quisermos concretizar o potencial da Inteligência Artificial. A Perplexity não é a única empresa de IA que abusa da propriedade intelectual e não é a única empresa de IA que perseguiremos com vigor e rigor. Deixámos claro que preferíamos cortejar a processar – mas, para o bem dos nossos jornalistas, dos nossos escritores e da nossa empresa, temos de desafiar a cleptocracia do conteúdo.”
A News Corp não é contra o compartilhamento de sua propriedade intelectual para treinar sistemas de IA – mas quer o dinheiro adiantado. Em maio isso assinou um acordo com o já citado OpenAI justamente para esse fim, com um relatado preço superior a US$ 250 milhões. O rolo compressor do aprendizado de máquina também tem acordos semelhantes em vigor com Reddit e Estouro de pilha.
De acordo com documentos judiciais [PDF] arquivado no Tribunal Distrital do Distrito Sul de Nova York, a News Corp contatou a Perplexity pela primeira vez sobre o assunto em julho, mas não recebeu resposta. Ele quer US$ 150 mil para cada infração comprovada – que, se aplicada, poderá impactar gravemente ou até mesmo levar a startup à falência.
A gigante das notícias também não está apenas irritada com a coleta de dados em si, mas também com o fato de a Perplexity não citar suas fontes. Alegou que o “mecanismo de resposta” de IA da Perplexity pode “pular os links” e que isso priva os editores de receita direta. Pior ainda, faz as coisas erradas.
“Além de usar o trabalho protegido por direitos autorais dos Requerentes para desenvolver um produto substituto que reproduza ou imite o conteúdo original dos Requerentes, a Perplexity também prejudica as marcas dos Requerentes ao atribuir falsamente aos Requerentes determinado conteúdo que os Requerentes nunca escreveram ou publicaram”, afirma o processo.
“Não é raro que, se a Perplexity for questionada sobre o que as publicações dos Requerentes relataram, a Perplexity 'responde' com informações falsas. Os desenvolvedores de IA chamam eufemisticamente esses resultados factualmente incorretos de 'alucinações'. As alucinações da Perplexidade podem atribuir falsamente fatos e análises a produtores de conteúdo como os Requerentes, às vezes citando uma fonte incorreta, e outras vezes simplesmente inventando e atribuindo aos Requerentes notícias fabricadas.”
Um caso citado é um artigo do New York Post de agosto de 2024 sobre as tentativas europeias de “silenciar grandes americanos como Elon Musk”. Alega que a Perplexity, quando solicitada a fornecer um resumo, copiou as primeiras 139 palavras da peça e depois adicionou mais cinco parágrafos de informações factualmente incorretas.
No lado da coleta de dados, existe um mecanismo para os operadores de sites optarem por não adicionar seu conteúdo à boca voraz dos bancos de dados de treinamento de IA: o arquivo robots.txt, implementado por Google, OpenAIe nuvemflare. Embora o CEO da Perplexity, Aravind Srinivas, tenha afirmado que sua empresa respeita o comando de não raspar, alguns terceiros que ela utiliza podem não ser tão éticos.
A Perplexity não fez comentários até o momento da publicação. ®