Un nuevo modelo de inteligencia artificial desarrollado por Stanford ha logrado algo extraordinario: generar proteínas completamente funcionales que nunca antes habían existido en la naturaleza, basándose únicamente en el entrenamiento con genomas bacterianos.

El modelo Evo: un breakthrough en biología computacional

Los investigadores de la Universidad de Stanford han desarrollado Evo, un «modelo de lenguaje genómico» que representa un enfoque revolucionario para la generación de proteínas. A diferencia de los sistemas de IA previos que se enfocan en las estructuras proteicas, Evo trabaja directamente a nivel de ácidos nucleicos, el mismo nivel donde la evolución natural opera.

El sistema se entrenó con una enorme colección de genomas bacterianos, aprovechando una característica única de estas estructuras genéticas: la agrupación de genes con funciones relacionadas. En las bacterias, todos los genes necesarios para una función específica (como importar y digerir un azúcar o sintetizar un aminoácido) suelen estar ubicados uno junto al otro en el genoma.

Cómo funciona la magia genética

El entrenamiento de Evo siguió principios similares a los modelos de lenguaje grandes: se le pidió predecir la siguiente base en una secuencia, siendo recompensado cuando acertaba. Esta metodología permite que Evo «vincule patrones a nivel de nucleótidos con contexto genómico de escala kilobase», según explican los investigadores.

La capacidad generativa del sistema significa que puede tomar una consulta genética y producir secuencias novedosas con cierto grado de aleatoriedad, de manera que la misma consulta puede generar diferentes salidas.

Resultados extraordinarios: proteínas completamente nuevas

Las pruebas iniciales demostraron que cuando se le proporcionaba solo el 30% de la secuencia de un gen conocido, Evo podía completar el 85% restante. Con el 80% de la secuencia, podía restaurar completamente la información faltante.

Pero lo verdaderamente revolucionario llegó cuando los investigadores probaron las capacidades creativas del sistema:

Antitoxinas funcionales

Utilizando toxinas bacterianas como prompt, Evo generó antitoxinas funcionales que solo tenían un 25% de similitud con las conocidas. De 10 outputs probados, la mitad logró rescatar cierta toxicidad, y dos de ellos restauraron completamente el crecimiento en bacterias que producían la toxina.

Inhibidores CRISPR únicos

En pruebas con inhibidores del sistema CRISPR, el 17% de las proteínas generadas logró inhibir la función CRISPR. Dos de estas fueron especialmente notables: no tenían similitud con ninguna proteína conocida y confundieron completamente a los software de predicción de estructura tridimensional de proteínas.

Una biblioteca masiva de ADN artificial

Los investigadores decidieron ampliar su experimento y promovieron el sistema con 1.7 millones de genes individuales de bacterias y los virus que las atacan. El resultado: 120 mil millones de pares de bases de ADN generado por IA, conteniendo tanto genes conocidos como material completamente novedoso.

Limitaciones y perspectivas futuras

No está claro si este enfoque funcionará con genomas más complejos, como el humano. Los organismos vertebrados generalmente no agrupan genes con funciones relacionadas, y sus genes tienen estructuras mucho más intrincadas que podrían confundir un sistema diseñado para aprender reglas estadísticas de frecuencias de bases.

Sin embargo, conceptualmente es fascinante porque lleva el problema de encontrar proteínas funcionales al nivel de ácidos nucleicos, donde la evolución normalmente hace su trabajo.

Un salto cuántico en biotecnología

Este avance representa algo más que una mejora incremental en biología computacional. Evo ha demostrado que es posible generar proteínas completamente funcionales que no existen en la naturaleza, sin considerar siquiera la estructura tridimensional de las proteínas.

La investigación, publicada en Nature (DOI: 10.1038/s41586-025-09749-7), abre nuevas posibilidades para el diseño de enzimas, medicamentos y herramientas biotecnológicas que podrían revolucionar campos desde la medicina hasta la sostenibilidad ambiental.

El hecho de que esto funcione es asombroso por sí mismo, y marca un hito en nuestra capacidad de utilizar IA para crear vida sintética funcional a partir de datos genómicos puros.

DEJA UNA RESPUESTA

Por favor ingrese su comentario!
Por favor ingrese su nombre aquí