O laboratório de pesquisa de inteligência artificial OpenAI anunciou detalhes de sua tecnologia mais recente que melhorará drasticamente a renderização 3D. OpenAI é a empresa por trás do gerador de texto para imagem DALL-E, que agora voltou sua atenção para a tradução de pistas de texto em nuvens de pontos 3D, que chamará de POINT-E.
De acordo com documento, publicado pela OpenAI, o POINT-E "cria modelos 3D em apenas 1-2 minutos em uma única GPU", em comparação com outras soluções existentes que podem levar horas e exigir várias GPUs.
Um trecho do relatório detalha o lugar atual do POINT-E no mundo da modelagem 3D: "Embora nosso método ainda esteja aquém do estado da arte em termos de qualidade de amostra, é uma a duas ordens de magnitude mais rápido, oferecendo um compromisso prático para alguns casos de uso."
Ele funciona criando uma única imagem sintética com um modelo de difusão de texto-imagem. Gera-se então uma nuvem de pontos 3D mais fácil de sintetizar, reduzindo a carga nas GPUs, embora não capture detalhes finos, uma compensação mencionada no artigo.
Uma IA secundária foi treinada para aliviar alguns desses problemas, mas o artigo explica que ela pode “às vezes perder partes sutis/esparsas de objetos”, como caules de plantas, criando a ilusão de flores flutuantes.
O OpenAI promete treinar inteligência artificial em vários milhões de modelos 3D e seus metadados, embora seu escopo permaneça bastante limitado até o momento.
Um exemplo é a renderização de objetos reais para impressão 3D, embora à medida que a tecnologia se desenvolva e melhore, é provável que a vejamos usada em aplicações mais complexas, como jogos e até televisão.
Projeto de código aberto disponível no GitHub.
Você pode ajudar a Ucrânia a lutar contra os invasores russos. A melhor maneira de fazer isso é doar fundos para as Forças Armadas da Ucrânia através Salva vida ou através da página oficial NBU.