El genoma de referencia de nuestra especie ha sido la columna vertebral de la genómica humana desde que se publicara su primer borrador en el año 2021 en dos de las revistas científicas más prestigiosas de Estados Unidos, Nature y Science. Tan solo dos años después, en abril de 2003, se anunciaba la secuenciación del primer genoma humano completo. 

La secuencia, de 3.000 millones de bases de ADN, denominada genoma de referencia, se compuso principalmente de ADN donado por personas de la ciudad de Buffalo, Nueva York. Hasta ahora, cuando los médicos y los investigadores estudian el genoma de un individuo lo comparan con el genoma de referencia para identificar las diferencias. Pero, ¿es posible comparar a toda la humanidad con un solo genoma? No, porque un genoma de referencia no transmite la diversidad genómica de la especie humana. 

Ahora, no obstante, un equipo de investigadores dirigido por el Instituto Nacional de Investigación del Genoma Humano -NHGRI- acaba de publicar una nueva secuenciación actualizada que ofrece una imagen mucho más compleja de la diversidad genética humana. La nueva referencia del "pangenoma humano" se ha dado a conocer esta semana en 3 artículos publicados en la propia revista Nature, e incluye las secuencias de genómicas 47 individuos diferentes. Los científicos, sin embargo, esperan aumentar ese número a 350 para mediados de 2024.

Una imagen más completa de la esencia genética humana

Un genoma es el conjunto de instrucciones de ADN que ayuda a cada ser vivo a desarrollarse y funcionar. Las secuencias del genoma difieren ligeramente entre los individuos. En el caso de los humanos, los genomas de dos personas son, en promedio, idénticos en más del 99% . Pero son las pequeñas diferencias las que contribuyen a la singularidad de cada persona y las pueden brindar una información muy valiosa sobre su salud, lo que ayuda a diagnosticar enfermedades, predecir resultados y guiar tratamientos médicos.

En el caso de los humanos, los genomas de dos personas son, en promedio, idénticos en más del 99%

Para comprender estas diferencias genómicas, los científicos crean secuencias del genoma humano de referencia para usarlas como estándar: una fusión digital de secuencias del genoma humano que se puede usar como comparación para alinear, ensamblar y estudiar otras secuencias del genoma humano.

"Todo el mundo tiene un genoma único, por lo que el uso de una única secuencia genómica de referencia puede generar inequidades en los análisis genómicos", expresa Adam Phillippy, investigador del departamento de Genómica Computacional y Estadística del NHGRI y coautor del estudio principal. “Por ejemplo, predecir una enfermedad genética podría no funcionar tan bien para alguien cuyo genoma es más diferente del genoma de referencia”, continúa. 

Lagunas y ramificaciones 

La secuencia del genoma humano de referencia actual tiene lagunas que reflejan información no disponible, especialmente en áreas que eran repetitivas y difíciles de leer. Los avances tecnológicos recientes, como la secuenciación de ADN de lectura larga, que lee tramos más largos del ADN a la vez, ayudaron a los investigadores a llenar esos vacíos para crear la primera secuencia completa del genoma humano.

Diferencias entre la penútima y la nueva versión del pangenoma humano
Darryl Leja, NHGR

Diferencias entre la penútima y la nueva versión actual del pangenoma humano

Además, mientras que la secuencia del genoma de referencia anterior era única y lineal, el nuevo pangenoma representa diversas versiones de la secuencia del genoma humano al mismo tiempo. Esto brinda a los investigadores una gama más amplia de opciones para usar el pangenoma en el análisis de nuevas secuencias. 

“Al usar la referencia del pangenoma, podemos identificar con mayor precisión variantes genómicas más grandes llamadas variantes estructurales”, explica Mobin Asri, estudiante de la Universidad de California Santa Cruz y coautora del artículo. "Ahora podemos encontrar variantes que no se identificaron con métodos anteriores. 

“Esta nueva versión del pangenoma humano nos permitirá representar decenas de miles de variantes genómicas novedosas en regiones del genoma que antes eran inaccesibles”, añade por su parte el estudiante de la Universidad de Yale y también coautor del artículo, Wen-Wei Liao. “Con ella, al mejorar nuestra comprensión del vínculo entre los genes y las enfermedades, esperamos mejorar la investigación clínica y hacer que los nuevos avances de la medicina puedan llegar a muchas más personas", concluye.