Ciência e Tecnologia

HATE COVID-19.PT: um projeto que seguirá o rastro ao discurso de ódio em português

O projeto liderado pela professora Paula Carvalho foi um dos contemplados no âmbito da linha de apoio "Impacto COVID-19 nos crimes de ódio e violência", promovida pela Fundação para a Ciência e a Tecnologia.

Ofensas diretas sem pudor.  Elogios camuflados de ódio com o intuito de depreciar. Ameaças físicas contra a vida de outrem ou da sua família. Um scroll por qualquer que seja a rede social oferece-nos uma viagem guiada – e para todos os desgostos – ao amargo mundo do discurso de ódio. As estatísticas dizem que este fenómeno aumentou com a pandemia, no entanto, bastava-nos olhar para os comentários que invadem as publicações para termos plena consciência disso.

Vários organismos europeus e internacionais emitiram recomendações para o reforço do conhecimento compreensivo de crimes de incitamento ao ódio e à violência de carácter racista, xenófobo, de género e homofóbico, alertando também para os baixos índices de denúncia e participação. Estas preocupações foram amplificadas perante os efeitos desproporcionais, em certas comunidades e grupos vulneráveis, destas práticas durante a pandemia da COVID-19. Como resposta a esta problemática, a Fundação para a Ciência e a Tecnologia (FCT) decidiu abrir uma linha de financiamento para apoiar projetos que se debrucem sobre o tema contribuindo para o seu combate. Um dos projetos selecionados conta com uma equipa de investigadores do Técnico/INESC-ID, liderada pela professora Paula Carvalho, docente do Departamento de Engenharia Informática (DEI).

Tal como o nome revela, “HATE COVID-19.PT –Detecting Overt and Covert Hate Speech in Social Media” o objetivo central deste projeto é contribuir para a análise e deteção de discurso de ódio, aquele que está exatamente nas plataformas online e em português. “Por um lado, é prioritário investir em línguas como o português, cujos recursos linguísticos para análise e deteção de ódio são ainda bastante escassos”, começa por explicar a professora Paula Carvalho. “Por outro lado, pretendemos analisar especificamente a dinâmica deste fenómeno na comunidade online portuguesa, tendo em consideração a dimensão temporal, de modo a compreender o impacto da pandemia no discurso de ódio nas redes sociais”, complementa a docente.

A equipa de investigação pretende estudar a dinâmica deste fenómeno num contexto específico, com grande impacto societal, e cujo início é possível de delimitar. Por isso mesmo a análise do discurso de ódio incidirá sobre o período da pandemia. Esta investigação “será, pois, fundamental para validar se, de facto, as circunstâncias atuais impulsionaram significativamente este fenómeno”, identificando concretamente os principais alvos do discurso de ódio em Portugal nos tempos pandémicos.

O projeto, que terá uma duração de 10 meses, arrancou no passado dia 1 de maio, tem como entidade proponente o INESC-ID, conta com a parceria da Agência de Notícias Lusa e o Centro Nacional de Cibersegurança (CNCS) e arrecadou em 35,8 mil euros de financiamento.

A investigação assentará na construção de um corpus representativo do fenómeno em análise que será manualmente anotado por linguistas e especialistas em comunicação. “Entre outros aspetos, a anotação envolverá a caracterização semântica do grupo-alvo de ódio, a intensidade do sentimento veiculado na mensagem, o grau de explicitação da informação e as principais ferramentas retóricas utilizadas- por exemplo, a metáfora, a ironia ou o humor”, esclarece a professora Paula Carvalho. Assim, e para além de identificar os alvos, a equipa procurará perceber que formas de expressão – direta e indireta – são utilizadas para os atacar. “Tencionamos explorar igualmente abordagens de aprendizagem semi-supervisionada, recorrendo a modelos baseados em Transformers (BERT), para aumentar o corpus”, acrescenta a líder do projeto.

De todo este trabalho resultará um protótipo, desenvolvido ainda no decorrer do “HATE COVID-19.PT”, que permitirá identificar as mensagens potencialmente veiculadoras de discurso de ódio nas redes sociais, distinguindo os alvos do discurso de ódio direto e indireto, e determinando a intensidade do sentimento utilizado nesses conteúdos. “Este protótipo ficará disponível para o uso da comunidade e poderá ser explorado, futuramente, por especialistas da linguagem, das ciências da comunicação e das sociais, profissionais da comunicação social, entre outros, para monitorizar, analisar e avaliar a evolução do discurso de ódio nas redes sociais”, adianta a docente do DEI.

No final do projeto, os resultados, os modelos computacionais e o protótipo ficarão disponíveis ao público e à comunidade científica para uso em futuros projetos. “A visão da equipa é a de que a partilha de conhecimento e de recursos é fundamental para o avanço do conhecimento científico”, destaca a líder do projeto.

A importância de esbater a escassez de recursos para a língua portuguesa neste domínio

A equipa de investigadores envolvida no “HATE COVID-19.PT” tem vindo, nos últimos anos, a dedicar-se a temáticas, direta ou indiretamente, relacionadas com o discurso de ódio, mais precisamente “o reconhecimento e análise de sentimento e ironia nas redes sociais” e, mais recentemente, “a identificação de estratégias para a deteção de desinformação nos media, em geral, e nas redes sociais, em particular”, como refere a professora Paula Carvalho.

De acordo com a investigadora do INESC-ID “a maioria dos estudos tem incidido no discurso de ódio direto, onde normalmente estão expressas palavras ou expressões insultuosas”. Encontra-se assim uma lacuna em aberto, visto que os utilizadores recorrem frequentemente “a um vasto conjunto de estratégias linguísticas e retóricas para expressar- de forma indireta ou dissimulada – opiniões discriminatórias ou comentários de incitamento à violência, ou ao ódio, colocando desafios adicionais ao seu reconhecimento”, salienta a docente do Técnico.

Ao vislumbrar os complexos desafios de investigação que este problema coloca, a escassez de recursos para a língua portuguesa neste domínio e o impacto societal do discurso de ódio, a equipa de investigação por trás deste projeto não hesitou em aderir a esta chamada da FCT. “Para tal, reunimos uma equipa de investigadores com valências multidisciplinares, cruzando o processamento da língua natural, a inteligência artificial e as ciências da comunicação”, denota a professora Paula Carvalho.

Além da professora Paula Carvalho que é linguista e trabalha o processamento da língua natural, estão envolvidos outros cientistas do INESC-ID que trabalham também em processamento de língua natural, em inteligência artificial e ainda uma cientista social com interesse nas áreas dos media digitais e interação homem-máquina, também ela docente do DEI. Alguns dos investigadores colaboram atualmente noutros projetos relacionados com a temática, nomeadamente no projeto Contrafake, dedicado à identificação de indicadores de credibilidade de conteúdos noticiosos.

No combate ao discurso de ódio o conhecimento é uma arma de peso

A Comissão Europeia Contra o Racismo e a Intolerância (ECRI, na sigla em inglês) do Conselho da Europa avisou no relatório anual do ano passado, que o racismo, a discriminação racial e a intolerância estão a aumentar. O conhecimento pode ter um contributo fulcral nesta batalha, tal como frisa a investigadora do INESC-ID: “acredito que o conhecimento é a resposta mais eficaz ao combate destes tipos de fenómenos”. “Portanto, estas iniciativas, que promovem a investigação e o avanço do conhecimento em áreas cruciais como estas, são indispensáveis para ajudar a travar este tipo de crimes”, adiciona.

Para cada mensagem que tiver sido selecionada como potencialmente veiculadora de ódio, o “HATE COVID-19.PT” permitirá também identificar “os indícios que levam a caracterizá-la como tal”. Assim, além de identificar o projeto estará também a contribuir para a formação das pessoas. “Queremos um modelo explicativo, que mostre aos utilizadores que está a acontecer”, destaca a professora Paula Carvalho.

Embora o projeto seja de natureza exploratória, a equipa está confiante que “os resultados permitirão à comunidade académica acompanhar e aprofundar a evolução do discurso de ódio, promovendo, assim, o desenvolvimento da investigação em diversas áreas que se dedicam a esta temática”. “Além disso, as análises dos estudos subsequentes poderão, na nossa perspetiva, direcionar políticas públicas voltadas, em particular, para a proteção e empoderamento dos grupos mais afetados”, complementa a docente.