Ciência e Tecnologia

Professor Peter Stone aponta o caminho para uma aprendizagem cada vez mais eficiente dos robôs

Através da vasta experiência do docente da University of Texas em Austin foi possível perceber como se processam os vários tipos de aprendizagem na robótica e as melhorias que podem ainda ser feitas neste sentido.

O professor Peter Stone, docente da University of Texas , diretor-executivo da Sony AI America e ainda presidente da International RoboCup Federation, foi o orador convidado de mais uma “IST Distinguished Lecture”. A palestra teve lugar esta segunda-feira, 2 de novembro, e inseriu-se como um dos eventos do American Corner@Técnico, sendo também uma “DEEC Talk” e uma “ISR-Lisboa Distinguished Lecture”, refletindo a importância da matéria a abordar e do orador convidado.

A palestra teve como palco a plataforma Zoom, reunindo docentes, investigadores e alunos aficionados pela área da robótica, e tendo como guião a diversa experiência do docente da University of Texas. As diversas formas como os robôs podem aprender as suas habilidades através de uma experiência relativamente pequena foi o ponto de partida de uma robusta explicação que o professor Peter Stone coloriu com vídeos das diversas atividades em que a sua equipa de investigação está envolvida.

Antes de partir para a apresentação propriamente dita, o orador dava a conhecer um pouco do trabalho desenvolvido na University of Texas, a diversidade de profissionais ligados à robótica, dando também uma visão geral do trabalho feito pelo seu grupo. Só através desta introdução, e dos dados facultados na mesma, ficaríamos a perceber que o tempo seria pouco para mergulhar no conhecimento e diversidade de projetos em que o docente está envolvido. Ligado à Inteligência Artificial (IA) há mais de um quarto de século, Peter Stone explicava que há uma questão unificadora em torno de todas as coisas em que tem trabalhado: “Até que ponto podem os agentes autónomos aprendem na presença de colegas de equipa e adversários, em domínios dinâmicos e em tempo real?”.

Ao longo da apresentação foi possível perceber a paixão e o envolvimento do docente no RoboCup, o campeonato do Mundo de Futebol Robótico, sendo um dos projetos evocados para ilustrar os desafios e alguns dos objetivos a atingir na área. “Neste campeonato é necessário que os robôs sejam totalmente autónomos e consigam agir por si próprios”, apontou.

Através de vários vídeos, o orador ia demonstrando os avanços sentidos na área, as habilidades de alguns robôs, e sublinhando o caminho que ainda falta trilhar. Foi enquanto mostrava um desses vídeos que falou dos robôs assistentes, relatando o quão frequente é os visitantes do seu laboratório encontrarem um desses agentes autónomos no edifício, a vaguear pelos corredores. “O objetivo é que façam parte do tecido social do edifício”, explicava o investigador, adiantando alguns dos aspetos que a equipa deseja melhorar neste tipo de robôs.

Voltando ao Robocup e à forma como este é uma motivação na sua investigação, o docente apontava os enormes progressos dos últimos anos nesta competição, as diferentes ligas em que a mesma se divide, e revelava um dos objetivos futuros: “temos um objetivo muito ambicioso, que é, até ao ano 2050, criar uma equipa de jogadores de futebol robôs humanoides que consigam vencer os campeões do mundo de futebol”.

O docente da University of Texas passaria depois para um mergulho um pouco mais técnico nas metodologias de “Sim2Real” e aprendizagem de imitação a partir da observação. Apontando alguns aspetos que impedem a modelização perfeita do mundo real no simulador, o investigador sublinhava que é preciso tentar “colmatar de alguma forma esta lacuna”. Para o investigador de IA é fulcral  “que a aprendizagem que acontece no simulador possa ser aplicada ao contexto real e este é o principal desafio do Sim2real”, vincava.

O professor Peter Stone apontava a injeção de ruído no simulador como uma das possíveis soluções para este equilibro, destacando que existe uma série de pesquisas que corroboram esta linha. “O outro tipo de abordagem que existe é colocar dados do mundo real e tentar usar isso para melhorar a aproximação à realidade”, acrescentava.

Ainda no seguimento desta ideia o docente da Universit of Texas apresentava o método que está a ser trabalhado pela sua equipa e que pode ajudar colmatar esse fosso: Aprendizagem baseada na simulação. Haveria ainda tempo para conhecer dois novos algoritmos para a aprendizagem por imitação a partir da observação que permitem a um robô imitar habilidades demonstradas.

No fim da intervenção, foi imensa a curiosidade refletida em muitas questões que tentaram sorver mais algum do conhecimento do orador.