Un equipo internacional de científicos dice que ha secuenciado la totalidad del genoma humano, incluidas las partes que se perdieron en la secuenciación del primer genoma humano hace dos décadas.
La afirmación, si se confirma, supera el logro presentado por los líderes del Proyecto Genoma Humano y Celera Genomics, cuando anunciaron la secuenciación del primer borrador del genoma humano. Ese borrador histórico, y las subsecuentes secuencias de ADN humano, han perdido alrededor del 8% del genoma.
La secuenciación del nuevo genoma llena estos vacíos utilizando nueva tecnología. Sin embargo, tiene diferentes limitaciones, incluido el tipo de línea celular que usaron los investigadores para acelerar su esfuerzo.
"Estamos tratando de profundizar en esta última incógnita del genoma humano", dijo Karen Miga, investigadora de la Universidad de California en Santa Cruz, quien codirigió el consorcio internacional que creó la secuencia. "Nunca se ha hecho antes y la razón por la que no se ha hecho antes es porque es difícil".
Miga enfatizó que no considerará oficial el anuncio hasta que el artículo sea revisado por pares y publicado en una revista médica.
El nuevo genoma es un salto adelante, dicen los investigadores, que fue posible gracias a las nuevas tecnologías de secuenciación de ADN desarrolladas por dos empresas del sector privado: Pacific Biosciences de Menlo Park, California, también conocida como PacBio, y Oxford Nanopore, de Oxford Science Park. Reino unido. Sus tecnologías para leer el ADN tienen ventajas muy específicas sobre las herramientas que durante mucho tiempo se han considerado los estándares de oro de los investigadores.
Ewan Birney, subdirector general del Laboratorio Europeo de Biología Molecular, calificó el resultado de "un tour de force técnico". Los artículos originales sobre el genoma fueron redactados cuidadosamente porque no secuenciaron cada molécula de ADN de un extremo al otro, anotó. "Lo que ha hecho este grupo es demostrar que pueden hacerlo de principio a fin". Eso es importante para la investigación futura, dijo, porque muestra lo que es posible.
George Church, biólogo de Harvard y pionero de la secuenciación, calificó el trabajo de "muy importante". Dijo que le gusta señalar en sus charlas que hasta ahora nadie ha secuenciado todo el genoma de un vertebrado, algo que ya no es cierto, si se confirma el nuevo trabajo.
Una pregunta importante y sin respuesta: ¿Qué importancia tienen estas piezas faltantes del rompecabezas humano? El consorcio dijo que aumentó el número de bases de ADN de 2,92 mil millones a 3,05 mil millones, un aumento del 4,5%. Pero el recuento de genes aumentó solo un 0,4%, a 19.969. Eso no significa, enfatizaron los investigadores, que el trabajo no pueda conducir también a otros nuevos conocimientos, incluidos los relacionados con la forma en que se regulan los genes.
La secuencia de ADN utilizada no era de una persona, sino de una mola hidatiforme, un crecimiento en el útero de una mujer causado cuando los espermatozoides fertilizan un óvulo que no tiene núcleo. Esto significaba que contenía 23 cromosomas, como un espermatozoide o un óvulo, no 46.
Los investigadores eligieron estas células, que se habían mantenido en un laboratorio, porque esto simplificó el esfuerzo computacional de crear la secuencia de ADN. El borrador original del genoma creado en 2003 también contenía solo 23 cromosomas, pero a medida que las tecnologías para la secuenciación de ADN se han vuelto más baratas y simples, los investigadores han tendido a secuenciar los 46 cromosomas.
Elaine Mardis, codirectora ejecutiva del Instituto de Medicina Genómica del Nationwide Children's Hospital, le preocupaba que debido a que estas líneas celulares se mantuvieran en el laboratorio, potencialmente mutando, la nueva información genética “ puede ser en gran parte los detritos que se acumulan cuando una línea celular es propagado durante muchos años en la cultura ".
Miga dijo que los estudios de la línea celular habían demostrado que era similar a las células humanas, y que los investigadores usaron células que se habían mantenido congeladas, no propagadas durante muchos años. Estuvo de acuerdo en que el siguiente paso era que el grupo intentara secuenciar los 46 cromosomas, conocido como genoma diploide.
¿Por qué se necesitaron 20 años para secuenciar este último 8% del genoma, incluso cuando el costo de secuenciar el resto del genoma se redujo? La respuesta tiene que ver con la forma en que funcionan las tecnologías de secuenciación de ADN.
Los secuenciadores de ADN de caballos de batalla actuales, fabricados por Illumina, toman pequeños fragmentos de ADN, los decodifican y vuelven a ensamblar el rompecabezas resultante. Esto funciona bien para la mayor parte del genoma, pero no en áreas donde el código de ADN es el resultado de patrones repetidos prolongados. Si una supercomputadora solo tuviera fragmentos pequeños, ¿cómo podría ensamblar una secuencia de ADN que repitiera "AGAGAGA" para bases sobre bases? Así se veía el 8% faltante del genoma.
Entre estas regiones "imposibles de cartografiar" se encontraba una de las estructuras más reconocibles en biología. Si alguna vez ha mirado los cromosomas (piense en la biología de la escuela secundaria), parecen hilos que se han anudado. Esos nudos son centrómeros, haces de ADN que mantienen unidos los cromosomas. Desempeñan un papel clave en la división celular. Y están llenos de repeticiones.
Fueron los centrómeros, de hecho, los que llevaron a Miga a querer ver estas regiones perdidas.
"¿Por qué las regiones que son tan fundamentales para la vida, tan fundamentales para el funcionamiento de la célula, están ubicadas sobre partes de nuestro genoma que son estos mares gigantes de repeticiones en tándem?" recuerda haber preguntado cuando era estudiante de posgrado. Fue esa pregunta la que la llevó, en discusión con Adam Phillippy, investigador de los Institutos Nacionales de Salud, a proponer iniciar su iniciativa actual, denominada Telomere 2 Telomere Consortium, después de los telómeros, que son los extremos del cromosoma, en 2019. Contrataron a Evan Eichler, un biólogo de la Universidad de Washington que había estado preocupado por las partes faltantes del genoma durante años, como coautor.
El trabajo fue posible porque las tecnologías Oxford Nanopore y PacBio no cortan el ADN en pequeñas piezas de rompecabezas. La tecnología Oxford Nanopore pasa una molécula de ADN a través de un pequeño orificio, lo que da como resultado una secuencia muy larga. La tecnología PacBio utiliza láseres para examinar la misma secuencia de ADN una y otra vez, creando una lectura que puede ser muy precisa. Ambos son más costosos que la tecnología Illumina existente.
Las empresas están en una carrera acalorada. Para este proyecto, dicen los investigadores, la precisión de la tecnología PacBio resultó invaluable y utilizaron Oxford Nanopore para terminar algunas áreas. Pero Oxford Nanopore ya ha prometido tecnología nueva y más utilizable. "En el aquí y ahora, PacBio tiene la ventaja, pero no está claro cuánto tiempo podrán mantenerla", dijo Michael Schatz, profesor asociado de la Universidad Johns Hopkins. Todos los investigadores hablaron de una visión del futuro en la que, en lugar de utilizar un único genoma de referencia, ensamblarían cientos de genomas completos diferentes que están interconectados y son étnicamente diversos, y pueden usarse como referencias. Miga también está ayudando a dirigir ese trabajo. Y esto es solo un paso en esa dirección.
Pero hasta ahora, dice Schatz, siempre ha habido preguntas sobre lo que faltaba. Ahora finalmente tenemos los datos correctos ”, dijo. "Tenemos la tecnología adecuada".