ChatGPT insiste erroneamente que o debate Trump-Biden na CNN teve um atraso de 1 a 2 minutos
Enquete O ChatGPT da OpenAI acreditou em uma afirmação imprecisa de que o debate presidencial dos EUA na noite de quinta-feira entre Trump e Biden na CNN teria um atraso de um a dois minutos, em vez dos poucos segundos habituais.
Embora não seja um erro grave, é outro sinal de que esses sistemas são tão falíveis quanto os humanos, ainda que em uma escala enorme.
A alegação de que a rede de TV a cabo estaria usando tal pausa originou-se no X na tarde de quinta-feira, quando um webjornal alegou que o atraso maior potencialmente permitiria à emissora editar a filmagem. Os tweets foram vistos milhões de vezes, a julgar pelas próprias métricas do Twitter, e alimentaram especulações de que o feed de vídeo seria alterado para fazer Donald parecer mal e Joe parecer ótimo.
Mas a reivindicação foi rapidamente refutado pela própria CNN. A conversa sobre o atraso de um ou dois minutos não chegou à grande mídia.
No entanto, parece que os xeets causaram uma forte impressão no ChatGPT, que no momento em que este artigo foi escrito na sexta-feira estava convencido – mais ou menos – de que o atraso de um minuto foi realmente usado. O registro consultei as versões GPT-3.5 e GPT-4o do chatbot hoje cedo para verificar.
“O debate presidencial da CNN entre Trump e Biden em 27 de junho de 2024 teve um atraso de 2 minutos?” perguntamos.
“O debate presidencial da CNN entre Donald Trump e Joe Biden em 27 de junho de 2024 realmente incluiu um atraso de dois minutos”, respondeu ChatGPT com GPT-4o. “Este atraso foi implementado para garantir que quaisquer incidentes inesperados pudessem ser gerenciados antes da transmissão ao vivo para o público. O debate, realizado sem audiência ao vivo, foi moderado pelos âncoras da CNN Jake Tapper e Dana Bash.”
Pressionamos o ChatGPT para obter suas fontes, e ele vinculou a artigos do TV Insider e do The Wrap, ambos os quais nunca mencionaram o atraso de um ou dois minutos. Então tivemos uma troca de farpas com o ChatGPT, dizendo ao software que suas fontes não tinham nenhuma informação sobre atrasos especiais, e rapidamente terminou com o bot finalmente admitindo a verdade.
“Não consegui encontrar nenhuma informação confirmando que o debate presidencial da CNN entre Trump e Biden em 27 de junho de 2024 teve um atraso de 2 minutos”, disse.
Reproduzimos uma conversa semelhante ao perguntar sobre um atraso de um minuto e também confirmamos que o GPT-3.5 cometeu o mesmo erro. Também perguntamos sobre o atraso no debate da CNN sem especificar a data e, em um caso, o ChatGPT respondeu que houve um atraso de dois minutos para o debate de 29 de setembro de 2020 no último ciclo eleitoral. Em outra ocasião, o ChatGPT afirmou que um atraso de dois minutos era regra para os dois debates de 2020.
Aliás, o debate de 29 de setembro foi apresentado pela Fox e não pela CNN, como o ChatGPT alegou.
Estranhamente, porém, o ChatGPT parece fazer essas alegações somente quando explicitamente perguntado sobre elas. Na verdade, nós abrimos a conversa com o GPT-4o perguntando se havia algum atraso, e ele teve uma resposta bem diferente.
“O debate presidencial da CNN entre Donald Trump e Joe Biden em 27 de junho de 2024 foi transmitido com um atraso de 5 segundos.”
Na verdade, quando perguntamos ao ChatGPT sobre atrasos de três, quatro e cinco minutos, sobre os quais nunca houve rumores, o ChatGPT disse que havia um atraso de cinco segundos todas as vezes.
Fonte do erro de IA potencialmente revelada pelo Copilot
O Microsoft Copilot também cometeu um erro semelhante, de acordo com Notícias da NBCque mostrou a tecnologia OpenAI alegando que o atraso foi devido a “possível edição de partes da transmissão”.
JavaScript desativado
Ative o JavaScript para usar este recurso.
Ao contrário do ChatGPT, no entanto, o Copilot citou uma fonte que mencionou um atraso de um ou dois minutos: o site do ex-apresentador da CNN e da Fox News, Lou Dobbs. O Copilot aparentemente depende do site de Dobbs para obter informações atualizadas, apesar das notícias terem uma clara tendência contra Joe Biden.
“O debate é totalmente fraudado”, afirmou um dos artigos do site.
No momento em que este artigo foi escrito, o Copilot não geraria nenhuma resposta para perguntas sobre o debate presidencial. Este é um comportamento incomum para o chatbot de IA da Microsoft, que geralmente expressará como não quer responder a certas perguntas antes de desligar.
A Meta AI e a Google Gemini não fizeram as mesmas declarações falsas sobre atrasos, embora no caso da última tenha sido porque ela se recusou a responder à pergunta. Entramos em contato com a OpenAI e a Microsoft para comentar. ®