Há investigadores do Instituto Superior Técnico na equipa que irá desenvolver AMALIA, o large language model (LLM) português anunciado por Luís Montenegro, primeiro-ministro, a 11 de novembro, durante a Web Summit em Lisboa. Este modelo de linguagem de grande escala concebido em Portugal será treinado com dados na língua portuguesa em supercomputadores nacionais e europeus.
Um LLM é um modelo que emprega inteligência artificial para processar, compreender e gerar texto em linguagem natural. Pode ser utilizado como um componente em vários tipos de sistemas, tais como sistemas de diálogo e chatbots, sistemas de pesquisa e sistemas automáticos de resposta a perguntas, entre outros.
AMALIA (Assistente Multimodal Automático de Linguagem com Inteligência Artificial) partirá de um modelo com cerca de 9 mil milhões de parâmetros (pré-treinado em 4 biliões de palavras) e afinado num conjunto de dados em português extraídos e filtrados a partir do Arquivo.PT.
O projeto terá um tempo total de execução de 18 meses, estando previsto que a primeira versão do modelo esteja pronta no final do primeiro trimestre de 2025.
No discurso que fez durante a abertura da Web Summit, o primeiro-ministro elencou futuras aplicações deste LLM na educação (com “um tutor educativo de inteligência artificial” para cada aluno), no acesso aos serviços da Administração Pública (“mais simples, mais direta e mais personalizada”) e no crescimento das empresas (que poderão “projetar os seus serviços numa era de inteligência artificial também em português”).
A equipa responsável pelo desenvolvimento do AMALIA conta com elementos do Instituto de Telecomunicações, centro de investigação associado ao Técnico, da Unbabel, empresa spin-off do Técnico, da Universidade NOVA de Lisboa e da Fundação para a Ciência e Tecnologia.
Nos media:
- «Chega ao fim mais uma edição da Web Summit, que bateu vários recordes» – Com Pedro Amaral (SIC Notícias)
- «ChatGPT português pode custar “entre 10 e 20 milhões de euros”» – Com Arlindo Oliveira (Rádio Renascença)
- «“O ChatGPT português vai ser feito perfeitamente a tempo e não será pequeno”» (ECO)
- «De Lisboa a Luanda, há quem acredite que o ChatGPT “à portuguesa” vai ajudar mulheres e escolas» – Com Pedro Amaral (Rádio Renascença)
- «Prioridade do novo LLM português é respeitar e preservar a “soberania da língua portuguesa”» (Sapo TEK)
- «Programa de IA em português será da responsabilidade da Nova e do Técnico» (Executive Digest)
- «Programa de IA em português fica nas mãos da Nova e do Técnico» (Público)