Figure AI e OpenAI mostraram um novo robô humanóide

O desenvolvimento de robôs humanóides avançou a um ritmo lento durante quase duas décadas, mas recentemente temos visto cada vez mais avanços neste campo. Como escrevemos recentemente, um robô AI foi apresentado no MWC 2024 Américae outro desenvolvimento, Unidade H1, quebrou o recorde de velocidade entre os robôs humanóides. E agora um resultado espetacular da colaboração entre as empresas Figure AI e OpenAI apareceu na Internet - um vídeo impressionante de um robô humanóide que agora pode conversar com pessoas.

A Startup Figure AI lançou um vídeo mostrando o robô Figura 01 trabalhando com o novo Modelo de Linguagem Visual (VLM). Nele, a Figura 01 está diante de uma mesa sobre a qual há um prato, uma maçã e uma xícara. Há uma secadora à esquerda. E à pergunta de uma pessoa, o que o robô vê à sua frente, ela responde descrevendo detalhadamente tudo o que está sobre a mesa.

E então o homem pergunta se ele pode comer alguma coisa, e o robô responde: "Claro", e então com um movimento hábil e suave ele pega a maçã e a entrega ao homem. Depois vem outra demonstração impressionante - um homem despeja lixo amassado de uma cesta na frente da Figura 01 e pede ao robô que explique por que fez isso, e ao mesmo tempo recolhe o lixo da cesta. E ele explica seu “pensamento” enquanto coloca o papel de volta no lixo. “Então eu te dei uma maçã porque é o único item comestível que eu poderia te dar fora da mesa”, disse o robô.

Representantes da empresa explicaram que a Figura 01 utiliza um modelo multimodal pré-treinado OpenAI, VLM, para compreender imagens e textos, e depende de comandos de voz para gerar suas respostas. Isso é diferente, digamos, do GPT-4 da OpenAI, que se concentra em prompts escritos.

Ele também usa o que a empresa chama de “manipulações bimanuais aprendidas de baixo nível”. O sistema coordena a calibração precisa da imagem (até o nível do pixel) com sua rede neural para controle de movimento. “Essas redes recebem imagens a 10 Hz e geram ações de 24 DOF (poses do pulso e ângulos das articulações dos dedos) a 200 Hz”, disse a Figure AI em um comunicado.

A empresa afirma que todo comportamento no vídeo é baseado no aprendizado do sistema, então ninguém nos bastidores está mexendo os pauzinhos da Figura 01. Claro, há uma nuance - não se sabe quantas vezes o robô passou por esse procedimento. Talvez tenha sido a centésima vez, o que explica seus movimentos precisos. Mas em qualquer caso, esta conquista parece espetacular e um pouco fantástica.

A Figura 01 agora está completando tarefas do mundo real

Tudo é autônomo:

-Navegação autônoma e manipulação baseada em força
- Modelo de visão aprendido para detecção e priorização de compartimentos
-Manipulação de compartimento reativo (robusto para representar variação)
-Generalizável para outras tarefas de seleção/localização foto.twitter.com/0wFmYnq0GC

- Figura (@Figure_robot) 26 de fevereiro de 2024

Leia também:

Fontetechradar

Inscrever-se

0 Comentários

Avaliações incorporadas

Ver todos os comentários

Outros artigos

A Figure AI mostrou as novas habilidades de seu robô humanóide AI

Comentários recentes