Lluís Montoliu
Investigador en el Centro Nacional de Biotecnología (CNB-CSIC) y en el CIBERER-ISCIII
Un ratón, un rodaballo y una persona tiene el mismo número de genes aproximadamente, alrededor de 20.000 genes cada una de estas especies. Sin embargo, todo el mundo comprende que somos muy diferentes a un ratón y a un rodaballo. Por lo tanto, de alguna manera, el número de genes que tenemos no nos informa de la complejidad o de cómo vamos a ser. La solución a esta paradoja la tenemos que buscar en el genoma no codificante, el que no contiene información que codifica proteínas.
Recordemos que, en todos estos animales, y en particular en nosotros, esos 20.000 genes apenas ocupan un 2 % de todo nuestro genoma. Esto causó durante muchos años una sorpresa a los genetistas. ¿Qué hay en el 98 % restante del genoma? (es decir, ¡en la mayor parte del genoma!). La respuesta es que esa parte oscura y desconocida del genoma alberga muchas secuencias repetitivas, muchos elementos móviles (transposones y retrotransposones) y, lo que es más relevante, las secuencias de ADN reguladoras (a las que se pegan proteínas específicas) que le indican a un gen cuándo y dónde debe empezar a funcionar, o cuándo y dónde debe apagarse. En otras palabras, la complejidad y diversidad morfológica que tenemos un ratón, un rodaballo y una persona no se consigue aumentando o disminuyendo el número de genes, sino alterando precisamente esas secuencias reguladoras, las que harán que los mismos genes se activen o desactiven en momentos distintos del desarrollo o en células diferentes, según la especie. Esencialmente, si cambiamos el programa de activación y desactivación con los mismos genes generaremos animales muy diferentes. Y eso es lo que finalmente produce animales tan dispares como esos tres, a pesar de que tengan un número de genes similar.
Durante años se han desarrollado algoritmos y programas informáticos que analizaban esta parte del genoma no codificante, sin sentido, a la búsqueda de secuencias precisas que supiéramos, por otras investigaciones, que son elementos reguladores. Los hay de muchos tipos, los hay que están asociados a fenómenos de activación génica, otros a fenómenos de silenciamiento o hasta algunos se comportan como aisladores, y separan lo que ocurre en un gen de lo que le vaya a pasar al gen vecino. Estos programas predictivos se basan en la comparación sistemática de secuencias que sabemos operan como activadores, silenciadores o aisladores (entre otros muchos tipos de elementos reguladores) en una determinada secuencia problema de ADN, que normalmente no puede ser demasiado larga, de unos pocos miles de nucleótidos. Normalmente cada uno de esos programas se especializa en la detección de cada uno de estos tipos de elementos reguladores.
Todo lo anterior ha saltado por los aires con la aparición de AlphaGenome, cuya presentación en sociedad acaba de publicar la revista Nature. Una nueva inteligencia artificial de Google, otra más, que es capaz de realizar todas esas inspecciones y deducciones sobre prácticamente todos los tipos de elementos reguladores, todos a la vez, y es capaz de hacerlo sobre enormes segmentos de ADN, de hasta un millón de letras, algo que no sabíamos hacer.
Google ya sorprendió a la profesión científica hace unos pocos años con AlphaFold y su impresionante capacidad de predecir la estructura y plegamiento de las proteínas a partir solamente de la secuencia de ADN. Ahora nos vuelve a dejar boquiabiertos con AlphaGenome y su capacidad de interpretar y predecir todas aquellas secuencias del genoma sin sentido, del genoma no codificante, que se hallan en un segmento enorme de nuestro genoma. Para desarrollar esta IA los investigadores la han entrenado analizando el genoma humano y el del ratón.
Naturalmente esto tendrá un impacto significativo no solamente en investigación básica, para entender cómo funcionan los genes, sino también en aspectos más prácticos, aplicados. Por ejemplo, cómo identificar nuevas secuencias de ADN que sean relevantes en esas zonas del genoma que habitualmente se desdeñan o no se tenían en cuenta. La información que proporcionará AlphaGenome habrá que tenerla muy en cuenta para analizarla cuidadosamente cuando abordemos los diagnósticos genéticos.
Una alteración en alguno de estos elementos reguladores, que impida la activación o el silenciamiento de un gen cuando debería ocurrir, puede tener como consecuencia un cambio en el patrón de desarrollo embrionario o la aparición de síntomas de alguna patología asociada precisamente al funcionamiento anómalo de ese gen (sin que la secuencia del propio gen haya cambiado en absoluto). En este caso, la mutación no estaría dentro del gen sino fuera, en secuencias más o menos alejadas, en las secuencias de ADN que ocultan estos elementos reguladores y que ahora esta IA llamada AlphaGenome descubrirá eficazmente en cualquier segmento del genoma que queramos analizar, especialmente, en el genoma no codificante, el genoma que llamábamos sin sentido (cuando no lo entendíamos) y que ahora, gracias a AlphaGenome, podremos empezar a descifrar con mucha mayor precisión y detalle del que hasta ahora conocíamos.