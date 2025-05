Mesmo as mentes humanas mais brilhantes que desenvolvem a inteligência artificial (IA) generativa que está prestes a mudar o mundo admitem que não compreendem como pensam os cérebros digitais.

"Os que não atuam no setor costumam se surpreender e alarmar-se ao descobrir que não entendemos como funcionam nossas próprias criações de IA", escreveu Dario Amodei, cofundador da Anthropic, em um ensaio publicado na internet em abril.

Em um recente episódio de podcast, Chris Olah, que fez parte da OpenAI (criadora do ChatGPT) antes de se juntar à Anthropic, descreveu a IA generativa como um "andaime" sobre o qual crescem os circuitos.

"Compreender a totalidade de um modelo de linguagem extensivo é uma tarefa incrivelmente ambiciosa", disse à AFP Neel Nanda, principal pesquisador do laboratório de IA DeepMind do Google.

Explorar as mentes digitais para compreender seu funcionamento transformou-se em um campo acadêmico de grande interesse, entre outros motivos, por seu potencial de tornar a IA mais poderosa.

Segundo Crovella, a interpretabilidade mecanicista envolve estudar não apenas os resultados fornecidos pela IA, mas também analisar os cálculos realizados quando a tecnologia examina as consultas.

A ferramenta também está desenhada para evitar que os modelos de IA sejam utilizados com fins maliciosos ou que decidam por si mesmos enganar os humanos sobre o que estão fazendo.

"Parece uma corrida contra o tempo para chegar antes que sejam implementados modelos de IA extremamente inteligentes no mundo sem a compreensão de omo funcionam", afirmou Eric Ho, diretor executivo da Goodfire.

"Concordo que para 2027, poderíamos ter uma interpretabilidade que detecte de forma confiável os vieses e as intenções prejudiciais dos modelos", apontou Anh Nguyen, professor associado da Universidade de Auburn.

De acordo com Crovella, da Universidade de Boston, "ao contrário do cérebro humano", no caso da IA os pesquisadores têm "o equivalente a cada neurônio instrumentado dentro desses modelos".