Um novo sistema do Google apresenta uma tecnologia inovadora que faz parte de uma tendência crescente no mundo da inteligência artificial (IA). O Imagen, ferramenta ainda não disponível para uso do público, é capaz de ilustrar perfeitamente uma descrição qualquer.
O usuário que quiser uma imagem específica pode descrevê-la. Por exemplo: "um cérebro pilotando um foguete em direção à lua". Dessa forma, a plataforma gera uma imagem exatamente como foi pedida.
Os resultados foram apresentados pela Google Research, grupo de pesquisa que impulsiona ferramentas e busca soluções de problemas da plataforma. Em resumo, é uma espécie de braço direito do Google.
O sistema possui capacidade de combinar uma ampla variedade de estilos, sejam fotografias, pinturas, ou até mesmo figuras "viajadas", que nem fazem sentido.
A intenção do Google neste projeto é aprofundar um modelo de difusão de texto para imagem com um grau de fotorrealismo sem precedentes, além de um profundo nível de compreensão da linguagem.
Há alguns modelos como o Imagen já presentes no mercado, mas a ideia do Google é utilizar sua ferramenta para aumentar o tamanho do modelo da linguagem, abrangendo a fidelidade da amostra e o alinhamento da imagem-texto em relação aos modelos genéricos atuais. Esses métodos já existentes no mercado, incorporam somente texto, mesmo sendo eficazes na codificação da síntese de imagem.
Por que o Imagen não veio a público ainda?
O Google avalia que o protótipo apresenta aplicações problemáticas que podem comprometer o uso público. A ferramenta é capaz de "codificar estereótipos e preconceitos sociais, incluindo um viés geral para gerar imagens de pessoas com tons de pele mais claros e uma tendência para imagens retratando diferentes profissões para se alinhar com os estereótipos de gênero ocidentais".
Fomentando esse comunicado da empresa, é possível notar o cuidado com imagens humanas nos exemplos divulgados: Se tratam de animais, objetos, comidas, no máximo um órgão.
Um dos objetivos da companhia é justamente, desenvolver uma maneira de lidar com o viés social, quase iminente, que a ferramenta pode gerar na sociedade.