La exploración de las profundidades marinas siempre ha sido menos atractiva que la exploración espacial, a pesar de su innegable interés científico e industrial. Algo parecido sucede con la exploración de la parte más compleja del genoma humano.
La versión actual de la secuencia del genoma humano —catalogada como GRCh38— cubre el 92 % del genoma; todos los avances de la genómica hasta ahora se han basado en esta versión incompleta. La nueva versión que ahora se publica completa el 8 % restante, incluyendo partes difíciles de ordenar por contener secuencias duplicadas o con muchas repeticiones. Entre estas partes están las regiones centroméricas —con un papel importante en la división celular y en los procesos de reproducción— o los brazos cortos de algunos cromosomas.
Como en otras exploraciones, el éxito depende de combinar los medios técnicos adecuados con el entusiasmo y capacidad de un equipo humano. En este caso, el proyecto no ha sido posible hasta que la tecnología de secuenciación de fragmentos grandes de ADN no ha alcanzado un grado de calidad suficiente.
En el presente trabajo se alcanza un 99 % de fiabilidad secuenciando fragmentos que pueden ser de hasta 200 MB, equivalentes a un cromosoma humano de principio a fin o, lo que es lo mismo, de telómero a telómero. Los telómeros son los extremos de los cromosomas, de ahí que los autores del trabajo se integren en un consorcio internacional llamado Telomere-to-Telomere (T2T).
Es la primera vez que tenemos la información completa de un genoma humano
También es importante el hecho de que la tecnología de secuenciación se ha podido aplicar a una línea celular con una sola copia de cada cromosoma —lo habitual es que las células contengan dos copias de cada cromosoma, una del padre y otra de la madre—, facilitando así la interpretación de los resultados.
El equipo humano del consorcio T2T, financiado por el National Human Genome Research Institute de los Institutos Nacionales de Salud estadounidenses (NIH), ha sido capaz de abordar las múltiples facetas del problema, desde la propia secuenciación a la interpretación de los datos, reflejada ahora en una larga serie de publicaciones.
La secuenciación de un genoma 'completo' es por tanto una gesta: es la primera vez que tenemos la información completa de un genoma humano 20 años después de la finalización del primer borrador.
Esta nueva versión —catalogada como T2T-CHM13— ya ha permitido localizar mutaciones y cambios asociados a condiciones y enfermedades que hasta ahora no conocíamos. Es una información particularmente relevante en el caso de enfermedades neurológicas relacionadas con duplicaciones de segmentos de cromosomas.
La nueva secuencia permite estudiar genes en regiones potencialmente implicadas en los procesos de especiación que dieron lugar a los humanos actuales
T2T-CHM13 también introduce elementos fundamentales para el estudio de la generación y evolución de nuevos genes en regiones centroméricas asociadas a la reorganización del genoma durante el apareamiento de los cromosomas materno y paterno.
Estas regiones están potencialmente implicadas en los procesos de creación de variabilidad entre individuos, y podrían tener interés para ayudar a entender la historia evolutiva misma de nuestra especie: las repeticiones de los centrómeros son específicas de los humanos y podrían estar asociadas al proceso de especiación de primates que acabó dando lugar al Homo sapiens. Mas allá de la tecnología, esto último es quizás lo mas impactante de este trabajo.
Adicionalmente, esta nueva versión del genoma completo representa el marco de referencia que faltaba para poder estudiar y cuantificar con técnicas menos costosas la variabilidad interpersonal en regiones complejas, presumiblemente relacionada con propensión a enfermedades.
Sabemos que esta nueva versión vendrá seguida de revisiones, actualizaciones. Una nueva situación que a su vez demandará nuevos algoritmos capaces de representar y analizar una información cada vez más compleja. El genoma humano aún continuará sorprendiéndonos durante mucho tiempo.