Ferramenta que busca identificar informação falsa na web é criada por grupo da USP e UFSCar

PUBLICIDADE

Plataforma pode ser acessada via WhatsApp e internet e está em fase de aperfeiçoamento.

Pesquisadores do Núcleo Interinstitucional de Linguística Computacional, que é formado por um grupo de pesquisadores da Universidade de São Paulo e da Universidade Federal de São Carlos (UFSCar), desenvolveram uma plataforma que usa inteligência artificial para identificar textos com conteúdo falso compartilhados e reproduzidos na internet.

É possível acessar a ferramenta, que está em fase de aperfeiçoamento, pela internet ou pelo whatsapp.

De acordo com o doutorando em Ciência de Computação do Instituto de Ciência, Matemática e Computação (ICMC-USP) Roney Lira, a principal motivação para o estudo foi a eleição. A intenção do grupo é colaborar para prevenir o compartilhamento de informações falsas.

“As notícias falsas sempre existiram, eram as fofocas, no boca a boca, mas estão dominando a internet atualmente. São um problema real com possíveis consequências graves na política e situações sociais. É importante distinguir essas informações para evitar problemas sérios, de favorecimento em eleições a linchamentos públicos reais”, disse.

Como funciona?

A plataforma foi criada com base em técnicas para detecção e filtragem de conteúdo enganoso na web. A ferramenta trabalha puramente com texto, analisando padrões linguísticos que, após serem definidos, orientam um algoritmo que consegue identificar o que é falso e o que é verdadeiro.

Os padrões a serem checados foram definidos após uma extensa análise de um conjunto de notícias composto por 3,6 mil textos falsos e 3,6 verdadeiros, que foram publicados na web entre janeiro de 2016 e janeiro de 2018. Eles foram coletados manualmente e analisados para garantir que apenas os que fossem totalmente falsos ou totalmente verdadeiros compusessem o conjunto.

Doutorando em Ciência da Computação na área de Processamento de Linguagem Natural pelo ICMC, Roney Lira — Foto: Fabio Rodrigues/G1

Doutorando em Ciência da Computação na área de Processamento de Linguagem Natural pelo ICMC, Roney Lira — Foto: Fabio Rodrigues/G1

“A forma como fazemos se baseia em coletar muitos textos – verdadeiros e com conteúdo enganoso – e tentar aprender padrões que os diferenciem. Às vezes, esses padrões são muito claros e nós mesmos podemos criar regras para os computadores aplicarem e detectarem as notícias. Outras vezes, é preciso correlacionar diversas pistas, o que pode ser bastante difícil para um ser humano, e deixamos o próprio computador fazer isso, usando técnicas avançadas de inteligência artificial”, declarou.

Padrões

Com base na análise textual foi possível, identificar padrões e comportamentos que ajudam a diferencial um conteúdo falso de um verdadeiro.

“Os textos verdadeiros costumam ser mais extensos que os falsos, porém, a quantidade de palavras e sentenças não é um fator adequado para diferenciá-los. Também analisamos o número médio de verbos, substantivos, adjetivos, advérbios e pronomes presentes. Além disso, a pessoa que mente utiliza mais verbos auxiliares em seu texto do que o que fala a verdade”, explicou.

Pesquisadores da USP e UFSCar criaram plataforma capaz de identificar fake news — Foto: Reprodução

Pesquisadores da USP e UFSCar criaram plataforma capaz de identificar fake news — Foto: Reprodução

A presença de erros ortográficos também é um dos parâmetros que são combinados. Isso porque a quantidade desses erros é 120% maior nas notícias falsas.

“Ainda estamos no início desse projeto e, no estado atual, o sistema identifica, com 90% de precisão, notícias que são totalmente verdadeiras ou totalmente falsas”, afirmou o professor Thiago Pardo, orientador do projeto.

“Estamos criando outros métdos e procurando novos padrões para aperfeiçoamento do sistema”, completou Lira.

Próximos passos

O pesquisador disse que a ferramenta passará por constante aperfeiçoamento e que deverá fazer a checagem dos fatos informados no texto. “É o próximo passo que deve ser realizado no futuro mais breve possível”, afirmou Lira.

O grupo também pretende identificar meias-verdades que se tratam de textos com verdade e mentira misturados e a pós-verdade, que é um texto opinativo.

“O desafio é fazer essa análise do conteúdo de forma eficiente e rápida. Trazendo para o mundo do Processamento de Linguagem Natural, será necessária uma análise mais semântica, ou seja, representando cada fato encontrado na sentença da notícia que contém meia verdade e comparando com algo que esteja disponível na web, por exemplo, que seja uma fonte confiável e que me diga que esse fato é verdade ou mentira. Acredito que o estudo vai avançar nesse sentido. As pós-verdades são algo bem mais complicado. Até o processo de coleta dessas pós-verdades já é desafiador”, explicou Lira.

Pesquisadores do Nilc em São Carlos, SP — Foto: Denise Casatti/ICMC USP São Carlos

Pesquisadores do Nilc em São Carlos, SP — Foto: Denise Casatti/ICMC USP São Carlos

Como usar

Para ver como a ferramenta funciona no WhatsApp, por exemplo, pegue seu smartphone e acesse o link: https://otwoo.app/nilc-fakenews. Automaticamente, uma janela de troca de mensagens do aplicativo se abrirá e você vai ler “Nilc-FakeNews” na tela.

Basta apertar a tecla enviar e, imediatamente, você receberá outra mensagem: “Olá! Seja bem-vindo ao detector de fake news do NILC-USP – Detecção Automática de Notícias Falsas para o Português! O sistema irá utilizar o modelo de detecção para avaliar se a notícia é falsa ou verdadeira. Insira o corpo de uma notícia”.

Depois, é só colar a notícia que deseja checar. Se forem verificados indícios de fake news, o sistema alertará: “Essa notícia pode ser falsa. Por favor, procure outras fontes confiáveis antes de divulgá-la”.

Na web, o usuário precisa acessar o site http://nilc-fakenews.herokuapp.com e colar o texto que pretende saber se é falso ou verdadeiro. Em segundos, o resultado é disponibilizado para o internauta.

Sob supervisão de Fabiana Assis, do G1 São Carlos e Araraquara *


Aviso: Os comentários só podem ser feitos via Facebook e são de responsabilidade de seus autores e não representam a opinião deste site. É vetada a inserção de comentários que violem a lei, a moral e os bons costumes ou violem direitos de terceiros, sendo passível de retirada, sem prévia notificação, comentários postados que não respeitem os critérios impostos neste aviso ou que estejam fora do tema proposto.

Tem uma sugestão de reportagem? Nos envie através do WhatsApp (19) 99861-7717.

PUBLICIDADE
PLÍNIO DPVAT