Root NationNotíciasnotícias de TIA Figure AI mostrou as novas habilidades de seu robô humanóide AI

A Figure AI mostrou as novas habilidades de seu robô humanóide AI

-

O desenvolvimento de robôs humanóides avançou a um ritmo lento durante quase duas décadas, mas recentemente temos visto cada vez mais avanços neste campo. Como escrevemos recentemente, um robô AI foi apresentado no MWC 2024 Américae outro desenvolvimento, Unidade H1, quebrou o recorde de velocidade entre os robôs humanóides. E agora um resultado espetacular da colaboração entre as empresas Figure AI e OpenAI apareceu na Internet - um vídeo impressionante de um robô humanóide que agora pode conversar com pessoas.

Figure AI e OpenAI introduziram um novo robô humanóide com IA

A Startup Figure AI lançou um vídeo mostrando o robô Figura 01 trabalhando com o novo Modelo de Linguagem Visual (VLM). Nele, a Figura 01 está diante de uma mesa sobre a qual há um prato, uma maçã e uma xícara. Há uma secadora à esquerda. E à pergunta de uma pessoa, o que o robô vê à sua frente, ela responde descrevendo detalhadamente tudo o que está sobre a mesa.

E então o homem pergunta se ele pode comer alguma coisa, e o robô responde: "Claro", e então com um movimento hábil e suave ele pega a maçã e a entrega ao homem. Depois vem outra demonstração impressionante - um homem despeja lixo amassado de uma cesta na frente da Figura 01 e pede ao robô que explique por que fez isso, e ao mesmo tempo recolhe o lixo da cesta. E ele explica seu “pensamento” enquanto coloca o papel de volta no lixo. “Então eu te dei uma maçã porque é o único item comestível que eu poderia te dar fora da mesa”, disse o robô.

Representantes da empresa explicaram que a Figura 01 utiliza um modelo multimodal pré-treinado OpenAI, VLM, para compreender imagens e textos, e depende de comandos de voz para gerar suas respostas. Isso é diferente, digamos, do GPT-4 da OpenAI, que se concentra em prompts escritos.

Ele também usa o que a empresa chama de “manipulações bimanuais aprendidas de baixo nível”. O sistema coordena a calibração precisa da imagem (até o nível do pixel) com sua rede neural para controle de movimento. “Essas redes recebem imagens a 10 Hz e geram ações de 24 DOF (poses do pulso e ângulos das articulações dos dedos) a 200 Hz”, disse a Figure AI em um comunicado.

A empresa afirma que todo comportamento no vídeo é baseado no aprendizado do sistema, então ninguém nos bastidores está mexendo os pauzinhos da Figura 01. Claro, há uma nuance - não se sabe quantas vezes o robô passou por esse procedimento. Talvez tenha sido a centésima vez, o que explica seus movimentos precisos. Mas em qualquer caso, esta conquista parece espetacular e um pouco fantástica.

Leia também:

Inscrever-se
Notificar sobre
convidado

0 Comentários
Avaliações incorporadas
Ver todos os comentários