
O mímico é a figura mais antiga do engano amável. A palavra tem origem no grego antigo mimikós, derivada de mimos, que significa "imitador" ou "ator que imita". Sem dizer uma palavra, ele faz o público acreditar que existe uma parede onde não há nada ou que segura uma corda invisível.
A inteligência artificial (IA) generativa levou esse jogo de ilusão a outro patamar: as deepfakes. O termo nasce da combinação entre deep learning, o aprendizado profundo das máquinas, e fake, a falsificação. O resultado é um "mímico digital" capaz de reproduzir rostos, vozes e gestos com uma precisão que desafia o olhar humano.
Hoje, identificar uma deepfake apenas olhando para a tela se tornou cada vez mais difícil. Especialistas afirmam que a verificação depende menos da percepção visual e mais da análise de contexto, da checagem de fontes e de ferramentas técnicas capazes de detectar padrões invisíveis ao olho humano.
Gabriel Barbabela, líder de produto da Veriff, empresa de origem estoniana especializada em verificação de identidade digital, reforça que o estágio atual da tecnologia é apenas o piso da curva.
— A partir de agora, elas (as deepfakes) só tendem a melhorar. Há cada vez mais investimento, empresas abrindo capital, captação crescente de recursos e chips com capacidade computacional cada vez maior. Essas nuances vão se tornar ainda mais difíceis de identificar — pondera.
O que é uma deepfake e quais são os riscos

Deepfake é um conteúdo sintético, seja imagem, vídeo ou áudio, produzido por inteligência artificial para simular que uma pessoa fez ou disse algo que, na realidade, não fez.
A tecnologia se apoia em modelos generativos, em que dois sistemas de IA competem entre si: um cria o conteúdo falso e o outro tenta identificá-lo. A cara rodada, o material se torna mais difícil de distinguir do real.
Os riscos se espalham por vários campos. Em segurança digital, deepfakes já alimentam fraudes financeiras, golpes telefônicos com clonagem de voz, abertura de contas com vídeos sintéticos e tentativas de burlar sistemas de reconhecimento facial.
No campo político, circulam em períodos eleitorais simulando declarações falsas. No ambiente pessoal, mulheres têm sido o principal alvo de pornografia não consentida produzida por IA.
Há ainda um efeito colateral: a desconfiança crescente sobre qualquer vídeo ou gravação, inclusive os verdadeiros.
Por que os sinais visuais deixaram de funcionar?

Rafael Kunst, doutor em Ciência da Computação e professor do Lato Sensu da Universidade do Vale do Rio dos Sinos (Unisinos), explica que a dificuldade crescente de identificar deepfakes está diretamente ligada à evolução dos modelos generativos que sustentam ferramentas como OpenAI ChatGPT e Anthropic Claude.
— O deepfake é um conteúdo sintético, manipulado por inteligência artificial. O que a IA tenta fazer é reproduzir da forma mais próxima possível o que um humano utilizaria para falar aquela mesma frase ou fazer aquela mesma coisa. Está muito relacionado aos modelos generativos. Eles estão evoluindo, e naturalmente as ferramentas usadas para criar deepfakes evoluem na mesma cadência — afirma.
O professor lembra ainda que, nos primeiros anos da popularização das deepfakes, era comum identificar conteúdos falsos por pequenas falhas visuais. As inteligências artificiais tinham dificuldade para reproduzir detalhes anatômicos e sincronizações complexas do corpo humano.
Hoje, porém, esses erros aparecem apenas em deepfakes mal feitas, produzidas com modelos pouco treinados ou prompts mal ajustados.
— Se o trabalho de geração for bem feito, é muito difícil identificar olhando simplesmente para a imagem. A questão da boca, da mão, ainda pode acontecer, mas é cada vez menos visível ao olho humano — observa.
Como humanos e máquinas erram ao detectar deepfakes
A dificuldade humana para identificar deepfakes foi reforçada por um estudo da University of Florida publicado em janeiro deste ano na revista Cognitive Research: Principles and Implications.
Em testes com imagens falsas geradas por IA, participantes tiveram desempenho próximo ao acaso, enquanto softwares especializados alcançaram índices muito mais altos de acerto.
Já em vídeos, o resultado foi diferente: humanos superaram alguns dos programas de detecção avaliados pelos pesquisadores.
O estudo também identificou padrões distintos de erro. Pessoas tendem a acreditar que imagens falsas são verdadeiras, enquanto alguns sistemas automatizados acabam classificando vídeos reais como manipulados.
Segundo os pesquisadores, usuários com perfil mais analítico, mais familiaridade com tecnologia e maior calma na hora de avaliar conteúdos tiveram melhor desempenho na identificação de deepfakes.
Detectores automáticos também erram

Se o olho humano falha, a solução mais óbvia parece ser recorrer à própria IA. Especialistas alertam, porém, que esses detectores também têm limitações.
Kunst lembra que a própria OpenAI retirou do ar sua ferramenta de detecção de textos gerados por IA por reconhecer que a ferramenta não era confiável o suficiente. Segundo ele, um resultado com 95% de chance de um conteúdo ter sido criado por IA não significa certeza, pois os sistemas também cometem erros.
O problema se agrava porque os detectores também penalizam padrões humanos. Textos objetivos, escritos em linguagem simples ou em idiomas diferentes do inglês tendem a ser classificados com mais frequência como produzidos por inteligência artificial.
Barbabela explica que ferramentas de detecção funcionam de maneira diferente dos sistemas usados para criar deepfakes. Enquanto modelos generativos produzem imagens, vídeos e vozes artificiais, os detectores buscam padrões incomuns, inconsistências e sinais de manipulação.
Ainda assim, ele afirma que se trata de uma corrida permanente: cada nova de geração de conteúdos artificiais exige detectores mais sofisticados.
Como identificar uma deepfake na prática?

Diante das limitações da inspeção visual e dos detectores automáticos, especialistas convergem para uma estratégia em camadas. Não existe um único sinal definitivo. Existe um conjunto de verificações que, somadas, reduzem a chance de cair em conteúdo falso.
A primeira camada é o contexto. Kunst sugere um paralelo com a forma como a sociedade já aprendeu a lidar com golpes de WhatsApp.
— É importante analisar todo o contexto. Verificar de onde vem a mensagem e em que contexto ela se enquadra. A identificação depende da capacidade de questionar o conteúdo, avaliá-lo com senso crítico e verificar se aquilo realmente faz sentido. Também é fundamental buscar confirmação em fontes confiáveis. Se o conteúdo for falso, dificilmente aparecerá em veículos confiáveis — orienta.
A segunda camada é o histórico de quem publica. Barbabela detalha o processo:
— É necessário analisar inconsistências em diferentes camadas. Quem está emitindo aquela mensagem? Qual é o histórico da conta? Em que momento esse perfil passou a publicar esse tipo de conteúdo? O comportamento é compatível com a evolução recente das inteligências artificiais? A partir de 2024 e 2025, esse tipo de material começou a aparecer com mais frequência em determinados canais — sugere.
A terceira camada é a coerência interna do material. Em vídeo, é mais fácil perceber inconsistências do que em foto. Áudio metalizado, movimento labial desalinhado, transições estranhas entre quadros e aparição irregular da língua ainda podem denunciar manipulação. Quanto maior o tempo de exposição ao conteúdo, maior a chance de perceber inconsistências.
Por isso, o especialista ressalta que imagens estáticas são as mais difíceis de identificar, seguidas por vídeos sem áudio e, por último, vídeos com áudio, nos quais a sincronização entre fala e movimento labial oferece uma camada adicional de verificação.
A quarta camada é comportamental. Andrea Rozenberg, diretora de mercados emergentes da Veriff, alerta que conteúdos com forte apelo emocional, senso de urgência ou que confirmem crenças prévias merecem suspeita redobrada.
— Em períodos eleitorais como neste ano, os ânimos costumam ficar mais exaltados. As pessoas possuem convicções fortes e, diante de conteúdos extremos ou aparentemente absurdos, podem deixar de questionar a autenticidade do material. Em um contexto de deepfakes, até mesmo declarações completamente absurdas atribuídas a um candidato podem ser falsas — pondera Andrea.
A executiva acrescenta uma dica prática para o cotidiano: combinar uma palavra-chave de confiança com pessoas próximas, capaz de validar identidades em situações de urgência. O cuidado vale especialmente para golpes em que criminosos clonam voz ou imagem de familiares.
Se identificar deepfakes é difícil, parte da solução pode estar na origem do conteúdo.
a detecção é difícil, parte da solução pode estar na origem. Empresas como OpenAI, Meta e Microsoft integram iniciativas que propõem selos de procedência para indicar se um material foi capturado por humanos, gerado por IA ou editado digitalmente.
Andrea afirma que alguns profissionais já adotam mecanismos capazes de validar vídeos no momento da captura, garantindo que o conteúdo não foi manipulado depois.
Ainda assim, especialistas reconhecem limites importantes: conteúdos falsos dificilmente se identificam como falsos. Para Kunst, a educação digital segue sendo a principal ferramenta de proteção.
A disseminação de deepfakes também provoca um efeito colateral preocupante: a desconfiança generalizada. Se qualquer vídeo pode ser falso, até conteúdos reais passam a ser questionados.
Nesse cenário, Barbabela afirma que o jornalismo profissional ganha ainda mais importância como referência de credibilidade e verificação.
Como se proteger?

A pergunta inicial, "dá para identificar uma deepfake hoje?", tem uma resposta dupla. Pela inspeção visual isolada, não. Os modelos generativos atuais produzem conteúdos indistinguíveis do real para o olho humano não treinado, e ferramentas automáticas erram em proporções que tornam inviável tratá-las como veredito final.
Mas, pela combinação entre contexto, fonte, histórico de quem publica, plausibilidade do conteúdo e verificação cruzada em veículos confiáveis, ainda é possível identificar a maioria das fraudes que circulam em redes sociais e aplicativos de mensagem.
Para Andrea, a lição prática vale tanto para empresas quanto para indivíduos: abandonar a ideia de uma única barreira de proteção:
— As empresas estão aprendendo que não basta ter apenas um cadeado na porta. É preciso trabalhar com camadas de proteção.
A próxima geração de deepfakes, segundo Barbabela, já está em produção. Ela exigirá mais ceticismo, mais paciência para checar fontes e mais distância da impulsividade que leva ao compartilhamento antes da verificação.
O que não muda é o princípio: em um ambiente em que qualquer imagem pode ser fabricada, a credibilidade deixa de estar no conteúdo em si e passa a depender de quem o publica, valida e contextualiza.



