Emocionando uns e revoltando outros, uma campanha publicitária da Volkswagen, que começou a ser veiculada na madrugada desta terça-feira (4), tem chamado atenção do público. O vídeo, criado com inteligência artificial (IA), coloca Maria Rita cantando com a mãe, Elis Regina, morta em 1982, aos 36 anos.
Na peça, Maria Rita aparece cantando Como Nossos Pais, de Belchior, enquanto dirige uma ID.Buzz, versão atual e elétrica da Kombi. Segundo a Volkswagen, a tecnologia conhecida como deepfake foi utilizada para montar o comercial. Uma dublê gravou as cenas dirigindo a Kombi e o rosto de Elis foi inserido posteriormente, com uso de IA.
De acordo com a equipe de criação, o processo de edição ainda contou com a ajuda de uma tecnologia de redes neurais artificiais, responsável por fazer uma mistura entre o rosto da dublê e da imagem recriada de Elis Regina. Já a voz da cantora no filme é de uma gravação original.
A peça é da agência AlmapBBDO, com produção da Boiler Filmes e pós-produção de uma empresa americana especializada. Já a direção da produção é de Dulcídio Caldeira, nome por trás de outro comercial que obteve grande repercussão nas redes sociais: o filme que juntou a atriz Fernanda Montenegro com a bebê Alice, conhecida por falar palavras difíceis, para uma campanha de fim de ano do Itaú Unibanco.
O que é deepfake?
Usada inicialmente para a produção de vídeos humorísticos, a técnica conhecida como deepfake tem ganhado cada vez mais espaço entre os produtores de desinformação. No período eleitoral de 2022, por exemplo, vídeos foram manipulados e seus conteúdos distorcidos a partir dessa prática, que usa inteligência artificial para copiar vozes e rostos. Por meio da tecnologia é possível produzir vídeos realistas em que pessoas aparecem fazendo e falando coisas que nunca fizeram ou disseram.
O termo deepfake denomina uma técnica que consiste na criação de conteúdos sintéticos (não reais), que podem ser áudios e imagens, produzidos com auxílio de inteligência artificial (IA). Na prática, são mídias artificiais geradas a partir de uma grande quantidade de arquivos reais de determinada pessoa e com uso de um algoritmo de aprendizado de máquina (machine learning). Os rastros que eventualmente denunciam a manipulação dos vídeos estão cada vez mais sutis e, portanto, podem passar despercebidos, especialmente para o público leigo.
O deepfake ocorre quando a inteligência artificial (IA) funde, combina, substitui ou sobrepõe áudios e imagens para criar arquivos falsos em que pessoas podem ser colocadas em qualquer situação, dizendo frases nunca ditas ou assumindo atitudes jamais tomadas. O conteúdo pode ser de caráter cultural, humorístico, político ou mesmo pornográfico. São inúmeras as possibilidades: troca de rostos, clonagem de voz, sincronização labial a uma faixa de áudio diferente da original, entre outras. A técnica comumente distorce a percepção a respeito de um indivíduo em uma determinada situação.
Para criar esse tipo de material, é preciso ter acesso a arquivos verdadeiros — fotos, vídeos ou áudios — da pessoa-alvo da manipulação, que servem para alimentar o sistema da inteligência artificial. Quanto mais material à disposição, maior é a chance de um bom resultado. Isso ocorre porque a inteligência artificial aprende com o conteúdo-modelo fornecido e, com isso, consegue reproduzir padrões, como movimentos, expressões, vozes e outras características do indivíduo.