O AlphaGenome, ferramenta de Inteligência Artificial (IA) do Google divulgada na quarta-feira (28), dá mais um passo na compreensão do genoma humano ao analisar como determinadas partes do DNA regulam a atividade dos genes na célula.

A decodificação do conjunto do genoma humano em 2003 "nos deu o livro da vida, mas lê-lo continua sendo um desafio", destacou Pushmeet Kohli, vice-presidente de pesquisas da Google DeepMind, na apresentação do AlphaGenome na revista Nature.

"Temos o texto" - a sucessão de 3 bilhões de pares de nucleotídeos A, T, C e G que compõem o DNA -, mas "compreender a gramática e a forma como ela governa a vida constitui a próxima grande fronteira da pesquisa", ressaltou à imprensa.

Apenas 2% das sequências de DNA "codificam" diretamente proteínas, indispensáveis ao funcionamento dos organismos vivos. Os 98% restantes desempenham o papel de "maestro": coordenam, protegem e regulam a expressão da informação genética em cada uma de nossas células.

Estas sequências, chamadas "não codificantes", contêm numerosas variantes associadas a doenças.

É justamento isto que o AlphaGenome estuda, complementando outros modelos desenvolvidos pelo laboratório de IA do Google: AlphaMissense (análise das sequências codificantes do DNA), AlphaProteo (design de proteínas) e AlphaFold (predição da estrutura de proteínas, que recebeu o Prêmio Nobel de Química em 2024).

O modelo de aprendizagem profunda (em que uma rede neural aprende a reconhecer automaticamente padrões complexos) foi treinado com dados procedentes de grandes consórcios públicos, que mediram experimentalmente essas propriedades em centenas de tipos de células e tecidos em humanos e ratos.

Ele é capaz de analisar uma longa sequência de DNA e "prever" a influência de cada par de nucleotídeos em diferentes processos biológicos da célula.

- Eficaz, mas não perfeito -

Já existiam outros modelos, mas precisavam adotar um compromisso entre o comprimento das sequências analisadas e a precisão da resolução.

Uma sequência longa, de até um milhão de pares de nucleotídeos, é "necessária para compreender o ambiente regulatório completo de um único gene", explica Ziga Avsec, um dos coautores do projeto.

A precisão da resolução permite estudar o efeito de variantes genéticas comparando as previsões de sequências mutadas com as de sequências não mutadas.

Outro avanço é que o AlphaGenome modela simultaneamente a influência da sequência em 11 processos biológicos, enquanto até agora os cientistas precisavam utilizar vários modelos.

Esta ferramenta "pode acelerar a nossa compreensão do genoma ao ajudar a cartografar a localização dos elementos funcionais e a determinar seus papéis a nível molecular", estima Natasha Latysheva, também coautora.

"Esperamos que os pesquisadores o enriqueçam com mais dados e modalidades", assinala Kohli sobre o modelo, que já foi testado por 3.000 cientistas de 160 países e que agora está disponível em código aberto para pesquisa não comercial.

"Identificar com precisão as diferenças em nos nossos genomas que nos tornam mais ou menos suscetíveis a desenvolver milhares de doenças é um passo crucial rumo a melhores tratamentos", observa Ben Lehner, responsável pela genômica generativa e sintética no Wellcome Sanger Institute, em Cambridge.

O pesquisador, que não participou no projeto mas testou o modelo, considera-o "muito eficaz", embora ainda "longe de ser perfeito".

"Os modelos de IA são tão bons quanto os dados usados para treiná-los", e a maioria dos conjuntos de dados existentes "são muito pequenos e não estão suficientemente padronizados", explica ao britânico Science Media Center (SMC).

O AlphaGenome não é uma "solução milagrosa para todas as questões biológicas", já que a expressão dos genes "é influenciada por fatores ambientais complexos, mas constitui uma ferramenta fundamental", concorda Robert Goldstone, responsável pela genômica no Francis Crick Institute, citado no mesmo texto.

Segundo ele, esta nova ferramenta permitirá aos cientistas "estudar e simular de maneira programática as bases genéticas das doenças complexas".