La secuenciación de ARN con lecturas largas permite detectar modificaciones sutiles en las moléculas, fundamentales para su función, algo que no era posible con tecnologías anteriores.
Investigadores del Instituto de Biología Integrativa de Sistemas (I2SysBio) – centro mixto del Consejo Superior de Investigaciones Científicas (CSIC) y la Universitat de València – han publicado una revisión sobre la tecnología de secuenciación transcriptómica de lectura larga. Esta técnica posibilita un análisis más preciso, en comparación con los métodos tradicionales, de las moléculas de ARN presentes en las células, las cuales contienen información genética esencial para la vida.
El estudio de la expresión génica en los diferentes organismos es fundamental para avanzar en la comprensión de procesos como el envejecimiento, el desarrollo de enfermedades neurodegenerativas y el cáncer, entre otros. Según informa el centro de investigación en un comunicado, el artículo ha sido publicado en la revista Nature Reviews Genetics.
Como lo señala el portal Infosalus, la transcriptómica abarca el análisis de todas las moléculas de ARN presentes en una célula o tejido.
El ARN actúa como intermediario entre el ADN y las proteínas, permitiendo la síntesis proteica y la transmisión de la información genética necesaria para el funcionamiento celular. Esta área de estudio facilita la identificación de los genes activos en un momento determinado, así como la medición de su grado de activación en diversos organismos, contribuyendo así a dilucidar el origen y la evolución de múltiples enfermedades.
"Con esta investigación, hemos provisto a la comunidad científica de una guía esencial para comprender la tecnología de secuenciación transcriptómica de lectura larga, tanto los flujos de trabajo experimentales como los análisis computacionales. Presentamos una visión integral de las técnicas de secuenciación de ARN de lectura larga y abarcamos desde el diseño experimental hasta el procesamiento de datos, la identificación de las diferentes moléculas de ARN y los análisis posteriores", explicó Ana Conesa, profesora de investigación del CSIC en el I2SysBio.
"Además, en el artículo se discuten los desafíos actuales y las direcciones futuras de esta tecnología, con el fin de facilitar de manera eficaz su uso en estudios transcriptómicos. Asimismo, se explora el enorme potencial de la secuenciación de ARN de lectura larga", añade.
Hasta hace pocos años, la transcriptómica se estudiaba mediante técnicas de secuenciación con lecturas cortas, que implicaban fragmentar las moléculas de ARN en segmentos de entre 50 y 300 nucleótidos, las unidades básicas de los ácidos nucleicos ADN y ARN (representadas por las letras A, T, C y G). Este procedimiento requería reconstruir posteriormente la molécula original a partir de los fragmentos, un proceso que generaba un alto margen de error debido a la similitud entre secuencias de ARN.
Como señala Carolina Monzó, investigadora del CSIC en el I2SysBio, "la secuenciación con lecturas largas lee fragmentos de miles de nucleótidos, lo que permite secuenciar moléculas completas y estudiar el ARN sin necesidad de hacer puzles. Además, al secuenciar moléculas de ARN una a una, las lecturas largas posibilitan identificar sus pequeñas modificaciones, lo que se denomina epitranscriptómica, que son fundamentales para su función. Esto no era posible con las tecnologías anteriores".
La posibilidad de obtener secuencias completas de moléculas de ARN mediante tecnologías de lectura larga amplía significativamente las aplicaciones en el estudio del transcriptoma.
Esta precisión resulta clave para analizar aspectos como la expresión de isoformas —distintas formas de ARN derivadas de un mismo gen—, la identificación de nuevas variantes de ARN, la anotación de genes en especies poco estudiadas o el análisis de la expresión diferencial de ARN entre los cromosomas heredados del padre y de la madre.
Según detalla Carolina Monzó, "estos estudios tienen interés porque podrían contribuir al avance en la comprensión de enfermedades neuropsiquiátricas y neurodegenerativas. En estos momentos, se sabe que existen diferencias en la isoforma expresada en diversas regiones del cerebro y que están asociadas con múltiples complicaciones neuronales".
Asimismo, indica que "también es sencillo encontrar fusiones entre genes en células cancerosas e identificar pequeñas diferencias al comienzo de la secuencia de moléculas de ARN, lo cual es importante en el desarrollo del sistema inmunitario y en diversos estadíos de cáncer".
La investigadora añade que la formación adecuada del extremo final de muchas moléculas de ARN —proceso conocido como "final de la transcripción"— es fundamental para la maduración celular, especialmente en el desarrollo neuronal. En este sentido, la secuenciación de lectura larga abre nuevas líneas de investigación, como el estudio de la relación entre la síntesis de ARN y el envejecimiento, un fenómeno reconocido pero aún escasamente caracterizado.
La tecnología analizada por el equipo del I2SysBio (CSIC - Universitat de València) no solo representa un avance en el estudio de enfermedades neurodegenerativas y del cáncer, sino que también tiene aplicaciones amplias en organismos de todo tipo. Puede emplearse para investigar plantas, examinar microorganismos poco explorados como virus y bacterias, e incluso ha sido utilizada por personal científico del CSIC en una reciente expedición a la Antártida para estudiar la gripe aviar.
El artículo, titulado Transcriptomics in the era of long-read sequencing, cuenta también con la participación de Tianyuan Liu, estudiante predoctoral del Grupo de Genómica de la Expresión Génica en el I2SysBio (CSIC - Universitat de València). Actualmente, Liu desarrolla su investigación en el marco de un contrato predoctoral financiado por la beca Marie Sklodowska-Curie Actions Doctoral Network LongTREC, de la Unión Europea.