En una serie de tres artículos y uno complementario –recogido en Nature Biotechonology–, la revista Nature publica el primer borrador del pangenoma humano de referencia, que contiene datos detalladísimos de 47 personas genéticamente diversas. El primer genoma humano se publicó hace más de dos décadas pero, al ser de una sola persona, no representa la diversidad humana, mientras que el pangenoma hace referencia al conjunto de genes de toda nuestra especie. La meta final del proyecto del Human Pangenome Reference Consortium es incluir material genético de 350 personas en 2024. Se espera que estos datos permitan identificar más variantes genéticas con relevancia clínica.
Representación gráfica del primer borrador del pangeoma humano. Autores: Darryl Leja, NHGRI.
Gemma Marfany - pangenoma
Gemma Marfany
Catedrática de Genética de la Universitat de Barcelona (UB) y miembro de CIBERER
Este estudio es sólido y de excelente calidad técnica y de análisis. Los investigadores complementan trabajos anteriores que establecieron el genoma humano de referencia (el llamado GRCh38), que hemos utilizado todos los investigadores de genética humana en los últimos años.
[Previamente] Un trabajo enorme de secuenciación masiva había producido un genoma humano básico de referencia, utilizado tanto para el diagnóstico genético como para la comparativa con otros genomas de animales. Sin embargo, este genoma de referencia tenía “huecos” sin cubrir, no era suficientemente preciso en detectar variantes estructurales y, al haberse obtenido a partir de muy pocos genomas humanos, no podía ser referencia de la gran diversidad de las poblaciones humanas.
Este nuevo genoma es más global, ya que contiene información de 47 humanos de poblaciones humanas muy diversas genéticamente, complementando la información de referencia. Además, los avances en secuenciación masiva han permitido contrastar y completar muchas regiones que habían quedado poco cubiertas o incluso eran desconocidas. Se sabía que una gran parte de la diversidad genética humana reside en las variantes estructurales (grandes duplicaciones y deleciones), más que en las variantes puntuales. Este nuevo pangenoma ha descubierto hasta 1.115 nuevas duplicaciones añadiendo cerca de 119 millones de bases al genoma humano (que contiene 3.300 millones de bases), lo que supone una mejora sustancial en cantidad y en calidad.
Además, hay que tener en cuenta que los autores han intentado obtener y mapear lecturas de secuencia más largas de lo habitual (gracias a técnicas novedosas de secuenciación masiva de longut larga), lo que permite identificar mejor las regiones del genoma secuenciadas.
¿Hay limitaciones importantes que haya que tener en cuenta?
Solo han podido secuenciar el genoma completo de 47 personas de muy distintos orígenes (el 51 %, africanos (que son los más diversos genéticamente), 34 % de genomas americanos, 13 %, asiáticos y solo un 2% de europeos –los menos porque son los más representados en datos genómicos–). Aunque es un gran avance, no pueden representar toda la variabilidad genética humana. Los investigadores proponen secuenciar 350 genomas más, para incrementar representatividad y diversidad genética. Por otra parte, existe todavía un error relativamente alto en la secuenciación. Aunque este error es de una base cada 200.000 bases, como se secuencian miles de millones de bases por individuo, existe todavía un error asociado que hay que tener en cuenta y mejorar en el futuro.
Este nuevo pangenoma va a devenir en el nuevo genoma humano de referencia que los investigadores utilizaremos en nuestra actividad diaria. Mejorará sustancialmente el diagnóstico genético, tanto el de las enfermedades raras como, especialmente, de las enfermedades complejas, en que las variantes estructurales han sido un caballo de batalla, ya que no eran fácilmente detectables con el genoma de referencia actual y las técnicas usadas hasta el momento. Se desarrollarán nuevos algoritmos que permitirán una mayor precisión en el diagnóstico.
No se trata de un salto conceptual, sino de un avance sustancial en precisión. Cuanto mayor conocimiento tengamos sobre nuestro genoma, mayor precisión en las inferencias genéticas derivadas del análisis de nuestro genoma, particularmente, en referencia a la medicina de precisión, también llamada medicina personalizada.
Marc Martí-Renom - pangenoma
Marc Martí-Renom
Profesor de Investigación ICREA en el Centro de Regulación Genómica y el Centro Nacional de Análisis Genómico
Este estudio está liderado por un equipo internacional de investigadores del proyecto PanGenoma Humano del NIH de Estados Unidos. Su objetivo final es caracterizar la variabilidad genómica de la población humana a partir de secuenciar y reensamblar el genoma de 350 individuos de diferente origen.
Hace más de 20 años, el proyecto Genoma Humano nos presentó una visión del genoma humano de un solo individuo. Este genoma se completó solo hace un año con la secuenciación de las partes repetitivas del genoma.
Sin embargo, en poblaciones humanas existe mucha variabilidad génica que, conjuntamente con el ambiente, nos hace distintos. Con el trabajo presentado hoy se ha logrado reensamblar el genoma de 47 humanos que representan diversas zonas geográficas del planeta. En otras palabras, se han hecho 47 proyectos como el original del Genoma Humano.
Aunque cada uno de estos genomas reensamblados puede aún contener errores y solo representan a un número limitado de individuos, este trabajo nos aplana el camino hacia una medicina personalizada más precisa para cualquier paciente independientemente de su origen geográfico.
- Artículo de investigación
- Revisado por pares
- Humanos
Wen-Wei Liao et al.
- Artículo de investigación
- Revisado por pares
- Humanos
- Artículo de investigación
- Revisado por pares
- Humanos
Mitchell R. Vollger et al.
- Artículo de investigación
- Revisado por pares
- Humanos
- Artículo de investigación
- Revisado por pares
- Humanos
Andrea Guarracino et al.
- Artículo de investigación
- Revisado por pares
- Humanos
- Artículo de investigación
- Revisado por pares
- Modelización
Glenn Hickey et al.
- Artículo de investigación
- Revisado por pares
- Modelización