Ciência e Tecnologia

Investigadores do Técnico integram equipa que criará o large language model português AMALIA

Sistema de inteligência artificial anunciado pelo primeiro-ministro na abertura da Web Summit deverá ter primeira versão pronta no final do primeiro trimestre de 2025.

Há investigadores do Instituto Superior Técnico na equipa que irá desenvolver AMALIA, o large language model (LLM) português anunciado por Luís Montenegro, primeiro-ministro, a 11 de novembro, durante a Web Summit em Lisboa. Este modelo de linguagem de grande escala concebido em Portugal será treinado com dados na língua portuguesa em supercomputadores nacionais e europeus.

Um LLM é um modelo que emprega inteligência artificial para processar, compreender e gerar texto em linguagem natural. Pode ser utilizado como um componente em vários tipos de sistemas, tais como sistemas de diálogo e chatbots, sistemas de pesquisa e sistemas automáticos de resposta a perguntas, entre outros.

AMALIA (Assistente Multimodal Automático de Linguagem com Inteligência Artificial) partirá de um modelo com cerca de 9 mil milhões de parâmetros (pré-treinado em 4 biliões de palavras) e afinado num conjunto de dados em português extraídos e filtrados a partir do Arquivo.PT.

O projeto terá um tempo total de execução de 18 meses, estando previsto que a primeira versão do modelo esteja pronta no final do primeiro trimestre de 2025.

No discurso que fez durante a abertura da Web Summit, o primeiro-ministro elencou futuras aplicações deste LLM na educação (com “um tutor educativo de inteligência artificial” para cada aluno), no acesso aos serviços da Administração Pública (“mais simples, mais direta e mais personalizada”) e no crescimento das empresas (que poderão “projetar os seus serviços numa era de inteligência artificial também em português”).

A equipa responsável pelo desenvolvimento do AMALIA conta com elementos do Instituto de Telecomunicações, centro de investigação associado ao Técnico, da Unbabel, empresa spin-off do Técnico, da Universidade NOVA de Lisboa e da Fundação para a Ciência e Tecnologia.

Nos media: