Cuando un grupo de científicos anunció en 2001 que había secuenciado el genoma humano, en realidad lo que decían era un pelín mentira. Bueno, en honor a la verdad ellos no mintieron, pues en el estudio que se publicó en su día en Nature dejaban claro que solo habían descifrado un 92% del mismo. Sin embargo, ya sabemos cómo funciona esto a veces: que el rigor científico no te arruine un buen titular. Se difundió como que se había secuenciado todo el genoma, pero hubo un 8% que continuó siendo un misterio para la ciencia. Al menos hasta ahora, pues por fin podemos decir con todas las letras que, esta vez sí, se ha secuenciado por completo el genoma humano.

Lo han logrado los científicos de Telomere-2-Telomere (T2T), una colaboración mundial dirigida a completar las secciones que faltaban en el ensamblaje original del genoma humano.

El hallazgo ha dado para la publicación de seis estudios en Science y otros doce en otros medios de comunicación. En cada uno de ellos ahondan de un modo u otro en los métodos empleados y en lo que implica estar en posesión de todo el genoma humano. Y es que descifrar ese 8% no solo era una espinita clavada para los científicos. También es de gran utilidad, pues en esa parte misteriosa de nuestro material genético se encuentran algunas estructuras de gran importancia que nos pueden dar datos muy importantes, tanto en medicina como para el estudio de nuestra variabilidad y evolución como especie.

Las piezas que faltaban en el puzle del genoma humano

Lo que lograron en 2001 los científicos del Proyecto Genoma Humano fue un gran hito. Por primera vez, estábamos en disposición de un mapa casi completo de nuestro material genético. Este se ha usado desde entonces en medicina para buscar posibles mutaciones causantes de enfermedades. Y también en genética para estudiar la variabilidad de nuestra especie.

Fue un gran hito y, básicamente, lo único que se pudo conseguir con las herramientas de las que disponían en ese momento. A grandes rasgos, lo que se hizo entonces fue tomar los 23 pares de cromosomas que componen el ADN de un ser humano y trocear este material genético en piezas muy pequeñas, ya que era lo único que podían leer los sistemas de secuenciación de la época. En total el genoma humano tiene algo más de 6.000 millones de letras y los fragmentos que se realizaron tenían entre cientos y miles de letras. 

Estos hallazgos pueden ser muy útiles para estudiar la variabilidad genética de la especie humana, así como las mutaciones causantes de enfermedades

Una vez obtenidas estas piezas, lo que se hacía con las herramientas disponibles era leerlas a medida que se volvían a ensamblar en el orden correcto. El problema es que el genoma humano contiene lo que se conoce como fragmentos de secuencias repetidas. Es decir, trozos largos de ADN en los que se repite todo el tiempo la misma letra. A la hora de procesar eso, ocurre algo así como cuando armamos un puzle con mucho cielo. En este caso es peor aún, porque había piezas exactamente iguales. Por eso, ese 8% sin descifrar se corresponde en buena parte con secuencias repetidas. Pero, por suerte, las herramientas de secuenciación genética han evolucionado mucho en estos 20 años y ya sí es posible colocar todas las piezas.

Randy Carnell/UW Medicina

El problema de mezclar el ADN de papá y mamá

Hoy en día, la nueva tecnología de ADN de lectura larga puede leer fragmentos más largos que los que se pudieron leer en 2001. Volviendo al símil del puzle, si se divide el cielo en fragmentos muy pequeños es imposible saber dónde va cada uno. Pero si se usan piezas más grandes es posible encontrar las sutiles diferencias entre unas y otras que indican dónde deben colocarse.

Pero ese no fue el único reto al que tuvieron que enfrentarse cuando se hizo aquella primera gran secuenciación del genoma humano. Y es que tampoco es fácil lidiar con una mezcla de dos genomas: el materno y el paterno. La combinación de ambos en las células de un individuo daba lugar a ciertas incógnitas a la hora de realizar la secuenciación.

Por eso, esta vez trabajaron con una línea celular fuera de lo común. Procede de un tumor no canceroso, llamado mola hidatidiforme, que consiste básicamente en un embrión humano que ha rechazado el ADN materno y duplicado el paterno. Por lo tanto, se evitan los problemas derivados de la mezcla de dos genomas.

Las lagunas del genoma humano al descubierto

El ADN es el libro de instrucciones de un organismo. Contiene todas las instrucciones para que este funcione correctamente. Pero esas instrucciones están en un idioma que las células no pueden leer. 

Para que se ejecuten es necesario que el ADN se transcriba a ARN y que después este se traduzca a proteínas. Esta traducción se lleva a cabo siguiendo algo conocido como código genético. Es una especie de lenguaje en el que cada grupo de tres letras de ARN significa lo mismo que uno de los aminoácidos que componen las proteínas. Es importante tener esto en cuenta, porque muchas veces se usan indistintamente por error los términos “código genético” y “genoma humano”, a pesar de que no son lo mismo.

No debemos confundir los términos 'código genético' y 'genoma humano', pues no son lo mismo

Pero volviendo a las proteínas, no todo el ADN acaba traduciéndose para dar lugar a una de ellas. Hay fragmentos que en realidad tienen otras funciones. Suelen conocerse como “ADN basura” a pesar de que no son para nada algo inútil. Una parte de ese 8% del genoma humano que no se pudo secuenciar contiene de ese ADN basura. Aunque también hay ADN codificante.

Concretamente, de los 19.969 genes codificantes de proteínas que hay en el genoma humano, 2.000 se han descubierto en esta última tanda. La mayoría de ellos están discapacitados, pero hay 115 que aún pueden expresarse y llegar a traducirse. 

Otro dato interesante de esta nueva y exhaustiva lectura es que encontraron alrededor de 2 millones de variantes adicionales en el genoma humano. De todas ellas, 622 están relacionadas con genes médicamente relevantes.

Y, por si todo eso fuera poco, resulta que buena parte de esos nuevos hallazgos están relacionados con dos estructuras muy importantes de los cromosomas: los telómeros y los centrómeros.

Se tardó casi el doble de tiempo en terminar el último 8% del genoma humano que en secuenciar el primer 92%. Crédito: NHGRI

Los primeros son una especie de capuchón que se encuentra en los extremos de los cromosomas para protegerlos de la degeneración de ADN que se va produciendo a medida que las células se dividen. Esta estructura está estrechamente vinculada al envejecimiento, por lo que su estudio y conocimiento son esenciales.

En cuanto a los centrómeros, se trata de la estructura central del cromosoma por la que se unen los dos brazos del cromosoma cuando el ADN se duplica. Tienen un papel esencial en la división celular, para asegurar que el material genético se reparte equitativamente y, por lo tanto, no hay células con más o menos cromosomas de lo normal.

Nuevas pistas sobre la evolución de nuestra especie

Conocer a fondo el genoma humano también puede ser muy útil para comprender por qué la especie humana evolucionó como lo hizo y se distanció tanto de otros primates.

En ese 8% oculto había también información de interés para comprender este asunto. Por ejemplo, según ha explicado en un comunicado uno de los miembros de T2T, Evan Eichler, “la secuencia completa del genoma revela que algunos genes asociados con cerebros más grandes son muy variables”. De hecho, “una persona puede tener 10 copias de un gen en particular, mientras que otras pueden tener solo una o dos”. Esto puede darnos muchas pistas.

En definitiva, lo que hoy se anuncia es un hito inmenso. No solo porque demuestra que la ciencia ha avanzado tanto como para terminar lo que hace 20 años se abandonó como un imposible. También porque esa nueva lectura nos ha dado información de gran interés sobre quiénes somos, por qué enfermamos o cómo envejecemos. Son preguntas vitales para el ser humano. Ahora tenemos nueva información para responderlas, aunque quizás haya que indagar un poco para encontrar todas las respuestas.