E se fosse possível sabermos se estamos com COVID-19 apenas através dos sons que produzimos a tossir ou ao falar? Parece ficção científica, mas pode em breve tornar-se realidade. É este o objetivo do projeto “Deteção de COVID-19 a partir da tosse e fala”, desenvolvido por uma equipa de investigadores do Instituto Superior Técnico, e do INESC-ID.
Recorrendo a tecnologias de Inteligência Artificial (IA), o projeto procura desenvolver um sistema robusto que ajude a identificar quem está infetado com o vírus SARS-CoV-2 apenas com base no registo da nossa voz e tosse. “O objetivo geral é ser mais uma pista que pode indiciar a doença e que poderá até ser combinada com outros biomarcadores”, evidencia a professora Isabel Trancoso, docente do Departamento de Engenharia Eletrotécnica e de Computadores (DEEC), investigadora do INESC-ID e responsável pelo projeto.
Certamente está a questionar-se como é que estes sinais acústicos podem indicar um potencial contágio, sendo que mais de 40% dos infetados são assintomáticos. A verdade é que a investigação feita em torno do tema já vai tendo algumas respostas entusiasmantes, ainda que não completamente conclusivas sobre o assunto. Vários artigos publicados sobre a matéria apontam a hipótese de que mesmo os pacientes que não apresentam quaisquer sintomas revelam alterações na voz, devido ao impacto do vírus nos pulmões e cordas vocais, apresentando ligeiras diferenças em relação a uma pessoa saudável. Apesar desta diferença ser impercetível ao ouvido humano, um modelo de IA poderá conseguir detetar essas alterações.
O diagnóstico clínico de COVID-19 é geralmente realizado através do teste RT-PCR, e mais recentemente, testes de antigénio. Há várias desvantagens associadas a este protocolo de testagem, nomeadamente os atrasos que o caraterizam, decorrentes da saturação dos laboratórios e dada a enorme procura que existe. Por isso mesmo, há um interesse crescente em desenvolver um sistema barato, imediato e fácil de usar que permita otimizar o processo de rastreio. É no seguimento desta necessidade e aproveitando o conhecimento sólido que já existe acerca do potencial da fala como biomarcador na área da saúde que este projeto surge, fortemente assente em métodos de IA.
Analisar padrões de fala pode ajudar a diagnosticar doenças
Falar requer a coordenação de numerosas estruturas e sistemas anatómicos. Os pulmões enviam ar através das cordas vocais, que produzem sons que são moldados pela língua, lábios e cavidades nasais, entre outras estruturas. O cérebro, juntamente com outras partes do sistema nervoso, ajuda a regular todos estes processos que vão dar origem à produção da fala. Uma doença que afeta qualquer um destes sistemas pode deixar pistas de diagnóstico no discurso do paciente.
A docente do Técnico explica que “o potencial da fala como biomarcador para a saúde foi já identificado para doenças que afetam órgãos respiratórios, como uma simples constipação, ou a apneia do sono, para perturbações mentais como a depressão, a doença bipolar, o espectro do autismo, e para doenças neurodegenerativas como a doença de Parkinson, Alzheimer, Huntington, ou a esclerose lateral amiotrófica, entre muitas outras doenças”. Ao longo da última década, os cientistas têm utilizado sistemas de aprendizagem automática para identificar potenciais biomarcadores vocais de uma grande variedade destas condições.
Com uma vasta experiência em Reconhecimento e Síntese de Fala, a professora Isabel Trancoso partilha que a ideia deste projeto surge logo no início do primeiro confinamento. “A nossa experiência com estas doenças apontava claramente para a necessidade de se fazer um grande esforço de recolha de dados acústicos com o COVID-19”, evidencia a docente. Ainda que a ideia existisse e o conhecimento para a prosseguir também, a equipa “não considerou na altura que o volume de dados que poderíamos vir a recolher fosse de molde a possibilitar essa recolha em tempo útil”.
Um projeto semelhante, realizado por uma equipa de investigadores da Universidade de Cambridge, explorou o uso de pistas acústicas tradicionais (coeficientes cepstrais, energia, frequência fundamental, etc.) e pistas obtidas através de técnicas de transfer learning com redes neuronais, juntamente com vários classificadores na deteção da COVID-19. Os modelos desenvolvidos atingiram desempenhos próximos de 80% na deteção de COVID-19, mesmo quando testados com sinais de indivíduos sem COVID-19, mas também com tosse devida a constipação ou asma.
De acordo com a investigadora do INESC-ID, “os resultados dos vários artigos sobre este tema são muito promissores, mas há ainda muito por explorar”.
A importância da comunidade do Técnico neste projeto
O projeto inicia-se com uma etapa crucial: a recolha de um conjunto de dados com exemplos representativos de tosse e fala de indivíduos infetados com COVID-19 e saudáveis (idealmente incluindo também participantes com problemas respiratórios diferentes da COVID-19, como gripe, constipação, asma, etc.). Estes dados serão essenciais para o desenvolvimento e sucesso do projeto, e por isso a participação de todos os elementos da comunidade do Técnico é imprescindível e preciosa. O desafio de participação neste estudo estende-se a toda a sociedade.
Para participar no estudo, basta seguir este link – onde poderá encontrar o formulário de consentimento informado, ou então usar o código QR, disponível na página do projeto.
Os participantes do estudo terão que ceder registos áudio que deverão incluir o som de tosse ou ressonar simulados, e também de fala – vogal sustentada, leitura de um texto curto, descrição livre duma imagem. Para além disso, apenas precisam facultar alguns dados pessoais, mais especificamente: dados demográficos- idade, sexo, língua materna; dados de saúde- data e resultado do teste de COVID (no caso de já ter feito algum), sintomas nos últimos 15 dias, doenças ou condições médicas crónicas, se é portador de doenças que afetem a voz. Serão tomadas todas as medidas necessárias para garantir a segurança e o anonimato dos dados recolhidos.
De forma a construir modelos robustos, a recolha deverá ter uma representação equilibrada de indivíduos recentemente diagnosticados como saudáveis ou infetados com COVID-19 (sintomáticos e assintomáticos). Quanto mais dados forem recolhidos, mais robusto será o modelo gerado. Em face das novas variantes, adiantar desde já a dimensão mínima para a recolha é arriscado.
Recolhidos os dados necessários, a equipa de investigadores recorrerá a técnicas de processamento de sinais e de aprendizagem automática para avaliar a presença de biomarcadores indicativos de COVID-19 na tosse e na fala, desenvolvendo sistemas robustos para a deteção da infeção por SARS-Cov-2. Depois de devidamente testados estes sistemas poderão ser facilmente implementados como uma ferramenta web ou incorporados em aplicações móveis.
Uma importante ferramenta de rastreio
Com este projeto a equipa de investigadores do Técnico e do INESC-ID não pretende desenvolver um teste de diagnóstico clínico, mas sim um teste complementar, de baixo custo, uma ferramenta de triagem simples, que recorre a técnicas não intrusivas e cuja utilização não depende de profissionais de saúde. No futuro, a implementação eficaz desta ferramenta de rastreio pode ser fulcral na contenção da propagação da pandemia se, por exemplo, for usada à entrada das escolas ou das empresas/instituições.
Os dados recolhidos neste estudo permitirão também continuar a estudar pistas de outras doenças que afetam o aparelho respiratório. “Ter um volume de dados que permita fazer esse estudo é importantíssimo”, sublinha a professora Isabel Trancoso.
Realçando novamente que a fala não revela apenas pistas sobre doenças do aparelho respiratório, a investigadora do INESC- ID antevê o dia “em que análises de fala serão quase tão comuns como análises ao sangue, como auxiliar de diagnóstico e de monitorização de várias doenças”. “É um sinal ubíquo e pode ser recolhido de uma forma não invasiva, tanto em consultas presenciais como em teleconsultas”, frisa.