Root NationNotíciasnotícias de TIComo nos filmes: a nova IA de processamento de fotos do Google torna o dimensionamento e aprimorá-los uma realidade

Como nos filmes: a nova IA de processamento de fotos do Google torna o dimensionamento e aprimorá-los uma realidade

-

Você provavelmente já viu filmes de fantasia ou programas de TV em que o personagem principal pede para ampliar a imagem e melhorar o resultado - para mostrar um rosto, uma placa de carro ou qualquer outro detalhe importante. Os mais recentes sistemas de inteligência artificial (IA) do Google, baseados nos chamados modelos de difusão, são capazes de realizar este truque.

É um processo complicado de dominar porque está essencialmente adicionando detalhes a uma imagem que a câmera não capturou originalmente, usando suposições super inteligentes baseadas em outras imagens semelhantes.

Google

No Google, essa técnica é chamada de síntese de imagem natural e, nesse cenário específico, resolução de imagem ultra-alta. Você começa com uma foto pequena e pixelizada e termina com algo nítido, claro e natural. Pode não ser exatamente o original, mas é próximo o suficiente para parecer real ao olho humano.

O Google introduziu duas novas ferramentas de IA para este trabalho. O primeiro é chamado de SR3, ou Super-Resolution via Repeated Refinement, e funciona adicionando ruído a uma imagem e removendo-o. Por meio de uma série de cálculos probabilísticos baseados em um grande banco de dados de imagens e alguma mágica de aprendizado de máquina, o SR3 pode imaginar como é uma versão de resolução super alta de uma imagem de pixel de baixa resolução.

A segunda ferramenta é o CDM, ou Modelos de Difusão em Cascata. O Google os descreve como "pipelines" ao longo dos quais os modelos de difusão - incluindo SR3 - podem ser direcionados para upscaling de imagem de alta qualidade. Ele pega modelos de melhoria e os transforma em imagens maiores.

Google

Ao usar diferentes modelos de aprimoramento em diferentes resoluções, a abordagem CDM é capaz de superar os métodos alternativos de upscaling de imagem, de acordo com o Google. O novo mecanismo de IA foi testado no ImageNet, um banco de dados gigante de imagens de treinamento comumente usado para pesquisa em reconhecimento visual de objetos.

Os resultados finais do SR3 e do CDM são impressionantes. Em um teste padrão com 50 voluntários humanos, imagens de rostos humanos geradas pelo SR3 foram confundidas com fotos reais cerca de 50% das vezes – e considerando que um algoritmo ideal deve atingir 50%, isso é impressionante. Vale repetir que essas imagens aprimoradas não são correspondências exatas das originais, são simulações cuidadosamente calculadas com base na matemática da probabilidade.

Google

O Google promete muito mais com seus novos mecanismos de IA e tecnologias relacionadas – não apenas em termos de aumento de imagens de rostos e outros objetos naturais, mas também em outras áreas de modelagem probabilística.

Leia também:

Inscrever-se
Notificar sobre
convidado

0 Comentários
Avaliações incorporadas
Ver todos os comentários