Dos sete projetos vencedores da edição de 2019 do concurso para Projetos Exploratórios no âmbito do Programa Carnegie Mellon Portugal, cinco são liderados por docentes do Técnico e investigadores do Instituto de Engenharia de Sistemas e Computadores – Investigação e Desenvolvimento (INESC-ID). O anúncio das propostas que irão receber o financiamento de 435 mil euros atribuídos pela Fundação para a Ciência e a Tecnologia (FCT) foi feito esta quarta-feira, 22 de abril. Concorreram ao programa um total de 38 propostas.
Pautados por um carácter exploratório, os projetos vencedores permitem aos investigadores lançar as sementes para projetos futuros. De acordo com o professor Nuno Nunes, co- diretor nacional do Programa CMU Portugal, espera-se “que estes projetos, sirvam para explorar ideias nascidas a partir de necessidades identificadas pela comunidade científica, de uma forma bottom-up, que possam no futuro ser a base para outros de maiores dimensões”. “Espera-se que o impacto destes projetos exploratórios vá além da publicação de artigos e outras métricas. Esperamos que acima de tudo estes projetos conduzam à construção de sistemas que respondam a problemas reais” acrescenta o também co- diretor nacional do Programa CMU Portugal, professor Rodrigo Rodrigues.
Os projetos selecionados vão desde a Robótica Social à Segurança Informática e são liderados pelos professores/as Ana Paiva, Isabel Trancoso, João Ferreira, Luís Pedrosa e Rui Maranhão.
O Humor nos Robôs sociais
Entre as propostas do INESC-ID/ Técnico selecionadas pela CMU Portugal está o projeto liderado pela professora Ana Paiva, docente do Departamento de Engenharia Informática (DEI) do Técnico, intitulado “Geração automática de humor para robôs sociais (AGENTS). O projeto pretende trazer um toque humano aos sistemas robóticos conferindo-lhes nada mais, nada menos do que humor. “Ao conferir ao sistema uma componente social, o humor constitui uma porção circunscrita da linguagem natural e, por este motivo, é uma tarefa com um objetivo bem definido para a engenharia”, salienta a responsável pelo AGENTS. “No entanto, o humor é um fenómeno que emerge naturalmente nas interações entre humanos no dia-a-dia, e a sua complexidade é difícil de captar através de piadas pré-definidas e fora de contexto”, contextualiza ainda.
Ciente desta importância do humor na comunicação humana, a equipa do AGENTS pretende criar robôs ou agentes virtuais capazes de interagir de forma mais natural e humorística com os seus utilizadores, de modo a aumentar a sua competência social. “Prevêem-se efeitos positivos na interação entre humanos e robôs sociais através de um humor personalizado. No projeto propõe-se a utilização de modelos de psicologia sobre o humor com o intuito de criar uma abordagem computacional de humor ‘top-down’, em que o humor pode ser modelado de acordo com as preferências do utilizador”, explica a docente. “Por outro lado, e usando esta conceptualização, o projeto irá criar um dataset de piadas anotadas, e depois através da aplicação de técnicas supervisionadas de machine learning será extraída e automatizada a produção multimodal de interações humorísticas de acordo com o estilo de humor do participante”, acrescenta. O objetivo final passa pela implementação de interações humorísticas personalizadas tendo como contexto um jogo de cartas em grupo, contando com mais do que um humano e mais do que um robô ou agente virtual.
O projeto combina competências de três equipas de investigação do INESC-ID na área de Inteligência Artificial e Robótica Social através do conhecimento da professora Ana Paiva, do ISCTE-IUL na área da Psicologia através do contributo da professora Patrícia Arriaga, e do Language Technology Institute (LTI) da CMU, com competências em aprendizagem automática e interação multimodal e representado no projeto pelo professor Louis-Philippe Morency.
A privacidade nos métodos de diarização do orador
O uso alargado de dispositivos de acesso à internet, conjuntamente com a crescente disponibilidade de plataformas de computação na “cloud” e os recentes progressos em Inteligência Artificial, deram origem a uma panóplia de aplicações de aprendizagem automática como serviço (MLaS – Machine Learning as a Service) baseadas na cloud. Esta popularidade crescente trouxe consigo uma maior consciencialização de que estas aplicações podem também potencialmente comprometer a privacidade dos utilizadores. “Os serviços podem agora gravar a interação com os seus clientes e extrair informação não autorizada a partir dos dados, utilizando-a a seu favor”, partilha a professora Isabel Trancoso, líder de outro dos projetos selecionados pela CMU. A questão tem sido alvo de um intenso debate público e culminou com a criação do Regulamento Geral de Protecção de Dados da União Europeia.
Também na comunidade científica o tema desperta preocupação como mostra o crescimento de trabalhos de investigação relacionados com este problema. “A fala destaca-se entre outros tipos de dados devido às suas potenciais aplicações e natureza privada”, realça a investigadora do INESC-ID. “Existem atualmente modelos de ML [Machine Learning] que são capazes de, entre muitas outras aplicações, realizar transcrições automáticas (Reconhecimento de Fala), identificar oradores e realizar diarização automática de oradores (DAO),o problema de determinar ‘quem fala quando’ numa gravação”, partilha a docente.
O projeto intitulado “Privacidade em diarização do orador: deteção segura de «quem fala quando»”, outro dos selecionados pela CMU Portugal, aborda estes problemas de privacidade, ao tentar combinar o estado da arte de métodos de diarização com técnicas criptográficas. “Atualmente, os métodos mais promissores de diarização baseiam-se em ‘speaker embeddings’, obtidos a partir de camadas internas de redes neuronais profundas. A combinação destas técnicas com métodos criptográficos como a Encriptação Homomórfica e a Computação Segura, levanta a necessidade de criar compromissos entre custos computacionais e interações servidor-cliente”, atesta a professora Isabel Trancoso, docente do Departamento de Engenharia Electrotécnica e de Computadores (DEEC). “Apesar da comunidade que trabalha em segurança e privacidade em fala e áudio se estar a expandir e de estarem a ser criadas colaborações entre investigadores de processamento da fala, criptógrafos e juristas, o conjunto de soluções privadas para aplicações de fala não inclui DAO, tanto quanto é do nosso conhecimento, e não obstante a importância deste problema”, salienta a também investigadora do INESC-ID.
As equipas proponentes do projeto selecionado provenientes do Técnico / INESC-ID e CMU / LTI têm estado na fronteira do processamento de fala privado, tendo desenvolvido em conjunto de vários projetos, teses, palestras e também publicações. “Este projeto aborda o problema, até agora inexplorado, da realização de DAO de forma privada, tendo como base a experiência das duas equipas na área, e o objetivo de contribuir para o futuro desenvolvimento de sistemas privados de processamento de fala na cloud”, sublinha a professora Isabel Trancoso. “A atualidade do tópico é cada vez mais premente numa altura em que fala e a informação que dela pode ser extraída é legalmente considerada como ‘Personable Identifiable Information’”, vinca ainda, assegurando que o projeto “tem um enorme potencial para ser escalado”.
Um gestor de passwords que garante um maior nível de segurança
Nos últimos anos, os ataques a organizações como o LinkedIn, Yahoo!, Dropbox, Lastpass e eBay resultaram no roubo de milhões de passwords, deixando os utilizadores expostos a sérios problemas de segurança e privacidade. O projeto “PassCert: Investigação do Impacto de Verificação Formal na Adoção de Software para Segurança de Passwords”, liderado pelo professor João Ferreira, docente do DEI, é outro dos apurados pelo programa da CMU Portugal e pretende, antes de tudo, minimizar o impacto deste tipo de ataques através do desenvolvimento de um gestor de passwords que garanta um maior nível de segurança.
Este projeto é uma sinergia entre dois tópicos de investigação: verificação formal de programas, onde o objetivo é verificar matematicamente que um determinado programa de computador satisfaz certas propriedades; e a segurança de passwords, em que o objetivo é investigar métodos e ferramentas que previnam problemas resultantes do uso de palavras-passe fracas. “Apesar dos anos de procura por alternativas viáveis, as passwords ainda são o mecanismo de controlo de acesso mais utilizado para proteger dados privados”, realça o professor João Ferreira.
“Vários estudos demonstram que os utilizadores de sistemas protegidos por passwords continuam a escolher passwords fracas, facilmente reveladas por programas especializados”, alerta o docente do Técnico. Por isso mesmo os especialistas em segurança informática recomendam a utilização de gestores de passwords que combinam o armazenamento seguro com a geração aleatória de passwords fortes. Um conselho que apesar de importante ainda não é seguido por muitos, em grande medida devido à desconfiança por parte dos utilizadores nos mecanismos de armazenamento e na qualidade das palavras-passse geradas.
A resposta para estes problemas está no PassCert que tem como objetivo “conceber um gestor de passwords que, através do uso de verificação formal, garanta propriedades de segurança sobre o armazenamento de dados e geração de passwords”, como evidencia o investigador responsável pelo projeto. “Neste projeto pretende-se determinar se a verificação formal pode aumentar a confiança dos utilizadores nos gestores de passwords e, assim, aumentar a sua adoção”, frisa o docente. “O trabalho desenvolvido neste projeto resultará de uma colaboração próxima entre investigadores do INESC-ID Lisboa, do INESC TEC e da Universidade Carnegie Mellon”, destaca o docente. A equipa tem vindo a colaborar em outros projetos comprovando que é possível melhorar o software existente neste domínio.
O financiamento concedido pelo programa CMU Portugal “permitirá executar a visão a curto prazo do projeto PassCert: conceber um gestor de passwords com componentes verificados que nos ajudará a determinar se a verificação formal pode aumentar a confiança dos utilizadores nos gestores de passwords e, assim, aumentar a sua adoção”, adianta o professor João Ferreira. Por outro lado, a aprovação da candidatura a este programa abre portas ao desenvolvimento de competências e à formação de recursos humanos nas áreas de investigação relacionadas com este projeto, como destaca o investigador, “contribuindo para o investimento e para o trabalho notável que o Instituto Superior Técnico e o INESC-ID têm feito nestas áreas”.
A solução para o problema de sintetizar funções de rede em diversas plataformas
“Operadores de redes como a Altice, a Vodafone, e a NOS usam uma variedade de funções de redes para beneficiar os seus clientes incluindo barreiras de proteção para prevenir ataques e caches inteligentes para acelerar o acesso às imagens e ficheiros mais comuns. Funções de redes são a componente principal das redes 4G e serão também uma componente principal do 5G”, começa por explicar o professor Luís Pedrosa, docente do DEI e responsável pelo projeto intitulado “Síntese de Aceleradores de Rede Utilizando Equipamento de Comuntação Programável” (SyNAPSE).
A procura por uma maior flexibilidade na implementação de novas funções de rede tem levado a uma revolução no mundo das redes. “Desde as redes definidas em software, as chamadas SDN, à virtualização das funções em rede e a criação de equipamentos de rede programáveis, começa a haver uma enorme variedade de ferramentas para facilitar a criação de novas funções de rede, cada uma com os seus prós e contras”, aponta o docente. Toda esta diversidade de plataformas disponíveis introduz um novo desafio que levanta uma questão importantíssima que está na origem do SyNAPSE: “Como pode um engenheiro informático escrever o seu código para uma função de rede apenas uma vez e tirar partido de uma ou várias plataformas de hardware?”. Através deste projeto o programador “poderá escrever este código apenas uma vez, permitindo depois a um sintetizador gerar o código que pode correr num servidor convencional, num switch programável P4, numa FPGA ou num switch OpenFlow”, esclarece o docente do Técnico. “Além disso, o nosso sintetizador poderá também particionar a função de rede entre múltiplas plataformas de forma a tirar partido das vantagens e mascarar as limitações de todas”, acrescenta.
A proposta aprovada reúne numa só equipa especialistas conceituados nas diversas áreas relevantes para o sucesso da ideia. “O Prof. Ramos, co-IR Português nesta proposta, especializa-se nas áreas das redes definidas por software OpenFlow e P4. O Dr. Martins e a Prof. Sherry, ambos de CMU, têm perícia respetivamente em síntese de programas e desenvolvimento de funções de rede para FPGAs”, indica o investigador do INESC-ID. Por sua vez, o docente do Técnico traz ao projeto a sua experiência nas áreas de análise e de programas e de funções de rede em software. “Esta é a nossa primeira aproximação em síntese para estes fins, mas vários dos componentes do protótipo serão baseados em trabalho anterior e continuado nosso”, veicula ainda o docente.
Para o professor Luís Pedrosa este projeto exploratório é apenas o começo de um trabalho com “potencial para começar um novo ramo de investigação com utilidade fora das aplicações imediatas”, vinca. “Temos já em vista o uso deste tipo de síntese para geração funções de rede em ambientes ainda mais complexos. Também temos planos para explorar outras aplicações fora das funções de redes, particularmente em sistemas distribuídos e na Internet das Coisas”, adianta o investigador do INESC-ID. Da mesma forma que a tecnologia dos compiladores revolucionou o desenvolvimento de software há 60 anos atrás, este projeto é o princípio do caminho para “um futuro onde sintetizadores poderão ter um impacto semelhante”, como destaca o docente do Técnico.
Uma framework inovadora que pretende dar mais confiança aos engenheiros de software
Intitulado “SecurityAware: Abordagem refinada para detetar e corrigir vulnerabilidades”, o projeto liderado pelo professor Rui Maranhão procura melhorar a produtividade dos engenheiros de software bem como a qualidade dos artefactos produzidos. Para tal, e como explica o docente do Técnico, “irá ser desenvolvida uma framework inovadora para deteção automática e eficiente de vulnerabilidades seguindo uma abordagem de baixa granularidade para a monitorização e alertas durante o desenvolvimento de software, e de fácil integração na pipeline de desenvolvimento do mesmo”. A SecurityAware pretender dar, assim “mais confiança aos engenheiros de software na implementação e utilização de abordagens de analise estática nas pipelines de integração e desenvolvimento contínuo de software”, acrescenta o docente.
Esta é uma área na qual a equipa de investigação do professor Rui Maranhão já vem trabalhando há algum tempo, e cujos resultados já deram origem a vários trabalhos académicos. Neste projeto a equipa do INESC-ID/Técnico irá colaborar com uma equipa do Department of Electrical and Computer Engineering da Carnegie Mellon University.
Como a conquista deste financiamento, procurar-se-á “avançar os estudos preliminares que já foram feitos no âmbito do projeto e começar a preparar o caminho para um projeto de maior dimensão”. “Pretendemos também envolver investigadores juniores de forma a convencê-los a enveredar por um doutoramento e uma careira científica”, salienta ainda o investigador do INESC-ID.
Acerca desta percentagem tão simbólica de projetos do INESC-ID/ Técnico selecionados pelo programa CMU Portugal numa “chamada tão competitiva”, o professor Rui Maranhão assume que “demonstra bem a qualidade da investigação que se faz no Técnico, neste caso específico na área das ICT [Tecnologias da Informação e Comunicação, na sigla em Inglês] . “Demonstra ainda a internacionalização dos investigadores do INESC-ID/Técnico, bem como que a investigação que se faz pode vir a ter real impacto”, frisa ainda.