El modelo de IA de DeepMind de Google lee la receta de la vida en el ADN

Un modelo de IA desarrollado por DeepMind de Google podría transformar nuestra comprensión del ADN (la receta completa para construir y funcionar el cuerpo humano) y su impacto en el descubrimiento de enfermedades y medicamentos, según los investigadores.

El genoma humano está formado por tres mil millones de letras de código de ADN, representadas por las letras A, C, G y T.

Alrededor del 2% son genes que codifican todas las proteínas que el cuerpo necesita para crecer y funcionar. El 98% restante, menos comprendido, se denomina «genoma oscuro». Desempeña un papel crucial en la organización del uso de los genes en el cuerpo y es donde se encuentran muchas mutaciones asociadas con enfermedades.

AlphaGenome puede analizar un millón de letras de código a la vez, lo que ayuda a desentrañar el «genoma oscuro».

Puede predecir la ubicación de los genes, pero también la influencia del «genoma oscuro». Por ejemplo, cómo afecta la expresión génica (si un gen está altamente activo o se encuentra suprimido) y el empalme génico (la herramienta que el cuerpo utiliza para producir diferentes proteínas a partir de un solo gen).

‘Gran salto’

Latysheva dijo que estaba «realmente entusiasmada» por el potencial del modelo de IA para comprender qué mutaciones causan enfermedades y ayudar a identificar la causa de enfermedades genéticas raras.

El modelo de IA podría utilizarse para «agregar otra pieza al rompecabezas para el descubrimiento de objetivos farmacológicos y, en última instancia, el desarrollo de nuevos fármacos», añadió.

En última instancia, también podría utilizarse en biología sintética y en el diseño de nuevas secuencias de ADN que podrían emplearse en terapias genéticas.

AlphaGenome ha sido descrito en la revista Nature , pero se puso a disposición para uso no comercial el año pasado y desde entonces 3.000 científicos han utilizado la herramienta.

Estudios que secuenciaron el código genético completo de decenas de miles de personas han identificado variantes vinculadas a las enfermedades, pero a menudo se encuentran en el genoma oscuro.

«Están afectando directamente una parte importante de la biología que realmente no entendemos», dijo Hawkes a la BBC.

El uso de AlphaGenome permite a los investigadores predecir rápidamente qué son esas variantes para que puedan probarse en el laboratorio.

Hawkes afirmó: «Esas predicciones ayudarán a determinar qué procesos biológicos podrían verse afectados por esas variantes genéticas y, potencialmente, conducir al desarrollo de fármacos.

«No diría que AlphaGenome ha resuelto el lado oscuro del genoma, pero es un gran avance. Estoy muy entusiasmado».

El cáncer es otro campo en el que el modelo de IA podría acelerar la investigación.

AlphaGenome se ha utilizado para predecir qué mutaciones están alimentando el cáncer y también son objetivos potenciales del tratamiento, y qué mutaciones son incidentales.

El Dr. Robert Goldstone, director de genómica del Instituto Francis Crick, dijo que el modelo era «un hito importante en el campo de la IA genómica» y que el avance era «una hazaña técnica increíble» por su «capacidad de predecir la expresión genética solo a partir de la secuencia de ADN».

El profesor Ben Lehner, director de genómica generativa y sintética del Instituto Wellcome Sanger, dijo que habían probado AlphaGenome en más de medio millón de experimentos y que estaba funcionando muy bien.

Pero dijo que «estaba lejos de ser perfecto» y que todavía quedaba mucho trabajo por hacer.

«Es un momento realmente emocionante en el que tres áreas en las que el Reino Unido es líder mundial (genómica, investigación biomédica e inteligencia artificial) se combinan para transformar la biología y la medicina», afirmó el profesor Lehner.

El equipo de DeepMind ganó el Premio Nobel de Química en 2024 por su trabajo en AlphaFold, un sistema de IA que predice la estructura 3D de las proteínas del cuerpo.

«Creo que estamos al comienzo de una nueva era de progreso científico, y la IA permitirá una serie de avances diferentes», afirma Pushmeet Kohli, vicepresidente de ciencia e iniciativas estratégicas de Google DeepMind.

¿Cómo funciona?

AlphaGenome no funciona como grandes modelos lingüísticos (como ChatGPT) que predicen la siguiente palabra en una secuencia. En cambio, es un modelo de secuencia a función que analiza cómo los cambios en el texto afectan el significado final.

Se entrenó en bases de datos disponibles públicamente de experimentos con células humanas y de ratón.

Existe consenso general en que el modelo de IA necesita mejoras. Es menos preciso en algunas áreas, como la predicción de cómo se regulan los genes a largas distancias (más de 100.000 letras de código de distancia).

El equipo también busca mejorar la precisión del modelo en diferentes tejidos. Una neurona cerebral, por ejemplo, tiene el mismo código genético que una célula cardíaca, pero cada una presenta propiedades diferentes según cómo se utilizan las instrucciones genéticas en cada tipo celular.