Confere.ai: os 100 dias de checagem automática de boatos na internet
Além de coronavírus e política, textos e links de golpes virtuais estiveram entre os conteúdos mais enviados para a plataforma
E se pudéssemos criar uma máquina para te ajudar a identificar boatos da internet? Essa pergunta foi o pontapé para o desenvolvimento da primeira ferramenta de checagem automática de fatos do Nordeste, o Confere.ai, projeto lançado em 2020 pelo Jornal do Commercio. Há 100 dias no ar, a plataforma que identifica padrões de desinformação em textos e links já recebeu quase 4 mil conteúdos para verificar. Entre os principais temas que mobilizaram o uso do Confere.ai no ano passado, estavam a pandemia do coronavírus e as eleições municipais.
O Confere.ai é um medidor de características de desinformação desenvolvido pelo Jornal do Commercio em parceria com pesquisadores da Universidade Católica de Pernambuco e a startup Verific.ai. Uma das 30 iniciativas selecionadas pelo primeiro Desafio de Inovação do Google News Initiative na América Latina, a ferramenta recebeu entre os dias 24 de setembro - lançamento da primeira versão - e 31 de dezembro, 3.787 conteúdos para verificar. Destes, 68% foram links de notícias e 32% foram textos.
Os conteúdos referentes à pandemia, que citavam as palavras “coronavírus”, “covid” ou “vacina”, representaram 15% de todos os links que puderam ser checados na ferramenta. Já em relação aos textos, 20% de todos os conteúdos recebidos fizeram referência às palavras “coronavírus”, “covid” ou “vacina”. No que diz respeito aos conteúdos que citavam as palavras “política” ou “eleições”, eles representaram 10% dos links enviados que puderam ser analisados pela plataforma.
O Confere.ai também recebeu conteúdos das áreas de economia, celebridades, meio ambiente, segurança pública, tecnologia e conteúdos em outras línguas - inglês e espanhol. A primeira versão da ferramenta foi lançada no dia 24 de setembro, apenas para checar links de notícias. Em 26 de outubro, entrou no ar a versão da plataforma que checa também textos, além de um widget que pode ser adicionado a qualquer site.
Links e textos de golpes da internet estiveram entre os mais recebidos
Para além dos conteúdos noticiosos, um tipo de dado específico teve grande inserção na ferramenta ao longo de 2020, links de golpes do tipo phishing, que tentam roubar dados de usuários desprevenidos na internet. O link mais recebido pelo Confere.ai era sobre um falso golpe relacionado à previdência. O link que circulava com uma mensagem pelo Whatsapp direcionava para um suposto cadastro, no qual o usuário teria direito a uma suposta liberação de saques do fundo previdenciário.
O conteúdo foi enviado 64 vezes para o Confere.ai e é um boato, como confirmado em checagem realizada pela Agência Lupa em novembro. O mesmo tipo de golpe já havia sido checado pela Aos Fatos e também pelo Boatos.org. Da mesma forma, também entre os cinco links mais enviados, o Confere.ai recebeu por 38 vezes links referentes a uma falta promoção que daria uma cafeteira a quem respondesse uma pesquisa da Três Corações durante a Black Friday. Foram recebidos quatro tipos de links direcionados para a mesma pesquisa. O boato foi checado e desmentido pela Agência Lupa e pelo Boatos.org em novembro.
A quantidade de conteúdos de golpes recebidos pelo Confere.ai está em consonância com a profusão de tentativas de golpes realizadas no ano passado. Um levantamento do Dfndr, laboratório especializado em segurança digital da Psafe, mostrou que os golpes de clonagem do WhatsApp somavam mais de 3 milhões de vítimas no Brasil até agosto de 2020.
O phishing, termo derivado do inglês fishing (pescaria), é um tipo de golpe no qual o fraudador lança uma “isca” persuasiva a fim de atrair a vítima para “pescar” suas informações pessoais ou financeiras. Durante os anos, o Brasil foi o país que mais divulgou ataques de phishing no mundo, segundo ranking da Kaspersky, como pode ser lido nesta matéria publicada pela equipe do Confere.ai.
Outros assuntos
O segundo link mais enviado para o Confere.ai foi o da portaria nº 518 do Governo Federal, sobre a restrição de entrada de estrangeiros de qualquer nacionalidade no país, conforme recomendação da Agência Nacional de Vigilância Sanitária (Anvisa). A restrição ocorreu em função da pandemia da covid-19 e foi renovada várias vezes. O Confere.ai recebeu 64 vezes o mesmo link, que direciona para uma página oficial do Governo Federal.
Em função da grande demanda de envio do link, a equipe da plataforma produziu uma matéria específica explicando quais as medidas vigentes sobre a entrada de estrangeiros no Brasil e como qualquer cidadão pode buscar pela informação nas fontes públicas de dados. “Foi importante e preocupante observar que as pessoas estavam enviando para a plataforma um conteúdo oficial, publicado no Diário Oficial da União. Isso pode ter acontecido por várias questões, desde uma displicência em não abrir o link ou até por uma falta de credibilidade das instituições oficiais. Seria necessário um estudo específico para tirar conclusões dessa análise preliminar”, afirma a coordenadora editorial do Confere.ai, Alice de Souza.
Conteúdos descontextualizados
O Confere.ai também recebeu boatos que já haviam circulado no passado, assim como conteúdos usados fora de contexto. O texto mais enviado para a plataforma é um exemplo disso. Era sobre uma suposta invasão de policiais federais, civis e militares ao Congresso Nacional. O material representou sozinho 11% de todos os textos enviados para a plataforma até dezembro, porém se refere a um vídeo de 2017, como checado pela Aos Fatos e pelo Boatos.org.
Os desafios de checar a desinformação com uso de tecnologia em ano de eleições e pandemia
O Confere.ai é uma plataforma desenhada a partir de um projeto desenvolvido no mestrado em Indústrias Criativas da Universidade Católica de Pernambuco (Unicap). Inicialmente, o desenvolvimento, teste e disponibilização da ferramenta estava orientado a acontecer seguindo o cronograma das eleições municipais de 2020, porém a pandemia da covid-19 se converteu em um desafio e, diante da quantidade de boatos derivados do tema, disponibilizar a checagem de boatos sobre a pandemia na ferramenta se tornou prioridade.
“O desafio de desenvolver uma ferramenta de automação de checagem começou no estudo para entender melhor o universo da desinformação e como é o trabalho das equipes de verificação de fatos. Esse passo inicial foi muito importante para trazer domínio a respeito daquilo que futuramente seria desenvolvido. A junção dos conhecimentos tecnológicos e os jornalísticos foram fundamentais”, explica o líder técnico do Confere.ai, Matheus Marinho.
Para produzir a ferramenta, foram necessários nove meses, entre pesquisa bibliográfica, estudos de casos de projetos semelhantes realizados em outros países, desenvolvimento de uma metodologia, criação de um banco de dados com notícias checadas e checáveis, além do desenvolvimento, teste e aplicação da tecnologia e do design. “Trabalhar com uma problemática tão importante para os dias atuais e complexa exigiu o uso de algumas tecnologias mais recente, como a utilização de técnicas de aprendizagem de máquina e processamento de linguagem natural. Foi um processo iterativo e incremental de muito conhecimento, muito estudo e muitos testes da ferramenta, para podermos entregar ao público essa versão final”, acrescenta Matheus Marinho.
Ao fim, foram criados produtos que juntos são o Confere.ai: um website, um widget, um dashboard de análise de conteúdos, uma inteligência artificial capaz de medir características de desinformação e um banco de dados com mais de 20 mil links e textos já checados. O trabalho envolveu uma equipe de 10 pessoas, entre desenvolvedores, jornalistas e designers. “O Confere.ai é um projeto cuja proposta é criar uma cultura da verificação, por isso enfrentamos o desafio de entregar conteúdos e experiências de diversas formas. Produzimos mais de 70 matérias para o JC Online, além de vídeos para as redes sociais e podcasts”, explica a coordenadora editorial do Confere.ai, Alice de Souza.
Em 2021, o Confere.ai continuará no ar, para ajudar você a checar a desinformação. Também poderão ser disponibilizados aos interessados, mediante solicitação à equipe do projeto, um token para inserção do widget em websites e acesso ao banco de dados criado pela equipe do Confere.ai (mediante citação formal) para pesquisas acadêmicas.