¿Cómo se predicen / caracterizan las estructuras de ARN?

Es desafortunado que haya una excelente respuesta que haya estado aquí y que se haya colapsado. Para proporcionar a las personas esta información muy informativa, copiaré mi tesis que se puede encontrar en la inferencia de la estructura secundaria de ARN y en partículas funcionalizadas similares a virus para la detección y enumeración de células tumorales


La estructura del ARN se determina principalmente mediante RMN o cristalografía. Sin embargo, en ausencia de esas técnicas, hay varias sondas de mapeo químico y métodos enzimáticos que pueden usarse para examinar las estructuras de ARN en solución. Estas sondas interrogan las estructuras de ARN en un rango más amplio de condiciones basadas en soluciones que incluyen condiciones in vivo . Al utilizar la especificidad química y enzimática de un residuo apareado o no apareado, se puede inferir el estado de la solución de ese residuo. Además, estos experimentos requieren cantidades más pequeñas de ARN a diferencia de los enfoques estructurales mencionados anteriormente. Combinados con algoritmos de predicción de estructura secundaria de ARN, estos métodos de sondeo pueden sugerir hipótesis poderosas de la estructura secundaria y terciaria de un ARN dado.

Las sondas químicas de ARN se han desarrollado durante los últimos 40 años para estudios de una variedad de interacciones residuo-residuo. Estas sondas cortan químicamente el ARN o forman un aducto covalente que puede usarse para detener la extensión del cebador de la transcriptasa inversa. Estas sondas químicas se pueden dividir en gran medida en 4 clases:

  1. Reactivos que modifican la nucleobase para medir la accesibilidad química.
  2. Reactivos que modifican el esqueleto de ARN para estimar la flexibilidad de nucleótidos
  3. Reactivos que escinden los residuos expuestos para indicar la accesibilidad del solvente.
  4. Reactivos bifuncionales que reticulan residuos para identificar compañeros de interacción [1].

En la primera clase, los reactivos modificarán las nucleobases expuestas a solventes y el alcance de la reacción puede usarse para inferir la accesibilidad química y el ambiente del residuo.

  • El sulfato de dimetilo (DMS) alquila el borde de Watson-Crick de la posición N1 de las adenosinas y la posición N3 de las citosinas [2], [3].
  • La 1,1-dihidroxi-3-etoxi-2-butanona ( Kethoxal ) se une covalentemente a las guaninas [4].
  • El 1-ciclohexil- (2- 2-morfolinoetil) carbodiimida meto-p-toluenosulfonato ( CMCT ) modificará la posición N3 de la uridina y la posición N1 de las guaninas [5].

La presencia de estos aductos puede detectarse mediante la extensión del cebador mediante transcripción inversa y los productos de ADNc resultantes pueden detectarse utilizando protocolos de separación de gel o técnicas de secuenciación estándar.

La segunda clase de reactivos químicos modifica la estructura del ARN como medida de la flexibilidad de los nucleótidos. La acilación selectiva de 2′-hidroxilo analizada por Primer Extension ( SHAPE ) utiliza reactivos que reaccionan con el hidroxilo lábil 2 ‘de las cadenas principales de ácido nucleico flexible de una manera independiente de la nucleobase. Los aductos resultantes pueden detectarse mediante la extensión del cebador [6], [7]. Desde el desarrollo del reactivo SHAPE original anhídrido N -metil-isatoico (NMIA), otros reactivos de acción rápida como el anhídrido 1-metil-7-nitroisatoico (1M7) [8] y el anhídrido 1-metil-6-nitroisatoico (1M6) [9] se han desarrollado para permitir el sondeo de fluctuaciones con diferentes dinámicas en la resolución de nucleótidos. Los reactivos como el imidazolide del ácido 2-metil-3-furoico (FAI) y el imidazolide del ácido 2-metilnicotínico (NAI) con una mejor estabilidad del agua y una menor reactividad cruzada con otros nucleófilos celulares permiten estudios in vivo usando SHAPE [10]. El sondeo en línea utiliza la autoescisión espontánea dependiente de la estructura del enlace fosfodiéster de ARN mediante un ataque nucleofílico interno por el 2’OH que ocurre en condiciones básicas. Los productos hidrolizados resultantes pueden analizarse usando gel o electroforesis capilar [11].

La tercera clase de reactivos de modificación de ARN utiliza radicales hidroxilo para escindir oxidativamente el azúcar ribosa que causa roturas de cadena. ∙ Los radicales OH se producen más comúnmente por la reducción de Fenton de Fe (II) – (EDTA) por peróxido de hidrógeno. El pequeño tamaño del químico altamente reactivo lo hace independiente de la secuencia y de la estructura secundaria. Estas propiedades permiten que los radicales ∙ OH sirvan como una sonda de la accesibilidad al solvente del esqueleto de ARN [12], [13]. La capacidad de generar rápidamente sondas altamente reactivas también permite que la técnica se use en huellas de pies resueltas en el tiempo. La radiolisis del agua usando rayos X sincrotrón permite la recolección de datos resueltos en el tiempo en milisegundos [14]. La radiólisis también se puede utilizar para generar radicales ∙ OH en las células, lo que permite el sondeo de estructuras in vivo [15].
La cuarta clase de reactivos de modificación de ARN consiste en reticuladores que pueden usarse para estudiar la estructura terciaria de los ARN. Estos reactivos permiten a los científicos no solo examinar las propiedades químicas de un nucleótido específico, sino también inferir directamente las parejas de interacción de esos nucleótidos. Fe (II) – (EDTA) puede estar atado a un nucleótido específico incorporado en el ARN; A medida que la velocidad de reacción supera la velocidad de difusión de los radicales OH, la escisión oxidativa solo se producirá en los residuos cerca del sitio de incorporación [16]. El análisis de división de OH multiplexado (MOHCA) utiliza la separación de gel en 2D para permitir el mapeo de contactos de alto rendimiento al examinar simultáneamente múltiples sitios de incorporación [17].

Los métodos enzimáticos también se han utilizado para determinar la estructura del ARN en combinación con los enfoques de base química. El ARN se somete a digestión con RNasa y la longitud del producto escindido se puede determinar mediante el etiquetado final o la extensión del cebador seguido de la separación o secuenciación del gel. Idealmente, estas RNasas se cortan en una secuencia de manera independiente. RNase V1 escinde ARN bicatenarios y RNasa S1 escinde ARN monocatenarios dejando un 5 ‘fosfato. La Nuclease P1 escindirá tanto ARN como ADN de cadena sencilla. También hay RNasas que son específicas de ciertos nucleótidos; RNase T1 escindirá guanosinas no apareadas, RNase U2 escindirá adenosinas no apareadas, RNase CL3 escindirá citosinas no apareadas y RNase A escindirá pirimidinas. RNase E y J1 dividirán preferentemente regiones ricas AU no emparejadas. La variedad de nucleasas opera a diferentes condiciones de pH y sal que limitan su uso en ciertos entornos, incluidas las condiciones in vivo , pero estas restricciones también proporcionan un parámetro adicional para controlar la especificidad. [18], [19]

Estos métodos se han adaptado para usarse con secuenciación de alto rendimiento que ahora permite el estudio de la estructura de transcriptomos completos. Los primeros métodos estudiaron ARN estructurados in vitro tratando un grupo con RNase V1 y otro con RNase S1 o RNase P1. Los productos de escisión 3 ‘fueron capturados y sometidos a una secuenciación profunda. Al comparar la proporción de escisión de la RNasa V1 (división de regiones emparejadas con bases) y de la RNasa S1 / P1 (división de regiones no emparejadas), se puede determinar una puntuación PARS (análisis paralelo de la estructura de ARN) y utilizarla para guiar el modelado de la estructura secundaria [20], [21]. El uso de métodos de secuenciación profunda se extendió a lecturas de extensión de cebador como SHAPE-seq [22], [23] y DMS-seq [13]. En combinación con reactivos in vivo como ∙ OH [24], DMS [13] y FAI [10], estos métodos permiten una amplia investigación de estructuras en una variedad de ARN en una variedad de condiciones. Las aplicaciones de estos métodos de alto rendimiento en Arabidopsis [25], levadura [13] y genomas humanos [26] han revelado que la estructura del transcriptoma difiere entre estudios in vitro e in vivo , lo que sugiere que el entorno celular es importante al examinar el papel de la estructura del ARN en biología. El uso de nuevas químicas y métodos de alto rendimiento permiten una comparación fácil y vigorosa de estudios in vitro con datos in vivo .


Usando una variedad de métodos experimentales, puede identificar qué residuos se describen en la sección anterior que se pueden incorporar en métodos computacionales para mejorar la precisión y la confianza detrás de esas predicciones. Además de la predicción de estructura comparativa que se resume por Gardner y Giegerich [27], la predicción de estructura de secuencia única se puede realizar mediante métodos de minimización de energía libre. Estos algoritmos calculan la diferencia de energía libre de Gibbs entre el estado no estructurado y el estructurado utilizando el modelo vecino más cercano. Para calcular de manera eficiente y exhaustiva los cambios de energía libre de las estructuras de ARN, se utiliza un enfoque de programación dinámica para examinar las estructuras secundarias no anudadas en el tiempo O (N3) donde N es la longitud de la secuencia de ARN [28]. Cuando se consideran pares de pares no anidados, seudonudos, no se puede aplicar el enfoque de programación dinámica y el cálculo se vuelve NP-duro; El problema no puede resolverse de manera determinista [29]. Las predicciones mínimas de energía libre proporcionarán una descripción del paisaje plegable e identificarán estructuras alternativas subóptimas con energías libres similares. A medida que se acumulan muchos estados alternativos con energía similar, la sensibilidad y el valor predictivo positivo de estas predicciones disminuyen.

Los datos ricos en información de los métodos de mapeo químico pueden usarse para inferir si los nucleótidos específicos son pares de bases o no en función de su reactividad. A su vez, esta información se puede combinar con algoritmos de minimización de energía libre para determinar estructuras secundarias de ARN con gran precisión. Para distinguir estos estados alternativos, los datos experimentales se pueden incorporar restringiendo los cálculos o traduciendo los datos de sondeo en un parámetro de pseudoenergía para incluirlos en los cálculos de energía. La combinación de la información experimental con estos métodos de predicción de estructura de ARN de energía libre se ha demostrado mediante la incorporación de DMS, CMCT y reactividad Kethoxal como grandes energías libres positivas [28]. El modelado dirigido por SHAPE utilizando un parámetro de psuedoenergía se comparó con los rRNA de 16 y 23 y se extendió a los tRNA, estructuras de IRES de VHC y los intrones del grupo I [6].

La predicción de la estructura terciaria es un desafío igualmente difícil que se beneficia del modelado guiado experimentalmente. El MC-Sym / MC-Fold estima una estructura secundaria utilizando un enfoque basado en el conocimiento y construye una predicción en 3D mediante la identificación de motivos recurrentes de estructuras previamente determinadas experimentalmente [30]. iFoldRNA utiliza un enfoque de dinámica molecular discreta de grano grueso para realizar predicciones rápidas de la estructura de ARN [31]. Los métodos de minimización de energía de novo como el ensamblaje de fragmentos de ARN (FARNA) [32] y el ensamblaje de fragmentos de ARN con refinamiento de átomo completo (FARFAR) [33] utilizan muestreo conformacional para permitir una predicción de alta resolución más completa utilizando la función de energía Rosetta. Para todos estos algoritmos, el conocimiento previo sobre los socios de interacción y los nucleótidos accesibles con solventes ayudan a definir y restringir el espacio conformacional de las predicciones. Además, tener estructuras secundarias validadas bien definidas mejorará la precisión de los algoritmos de predicción de estructuras terciarias.

La mejora y la convergencia de los métodos de sondeo con algoritmos de predicción de estructura más confiables proporcionan una tubería rápida y económica para generar predicciones para complementar la cristalografía de rayos X y los enfoques basados ​​en RMN. A medida que se resuelvan más estructuras de ARN y aumenten nuestro conocimiento de los motivos de ARN, el poder predictivo de los métodos computacionales mejorará. Mientras tanto, a medida que mejoran la confiabilidad y la reproducibilidad de los métodos de sondeo de estructura de ARN y de inferencia estructural, se puede lograr una mejor respuesta. Con la mejora de los métodos de determinación de la estructura, se puede obtener una comprensión más completa del creciente mundo de ARN.

[1] KM Weeks, “Avances en el análisis de la estructura del ARN mediante sondeo químico”, Curr. Opin. Estructura Biol. vol. 20, no. 3, págs. 295–304, junio de 2010.
[2] PD Lawley y SA Shah, “Metilación del ácido ribonucleico por los carcinógenos dimetil sulfato, N-metil-N-nitrosourea y N-metil-N’-nitro-N-nitrosoguanidina. Comparaciones de análisis químicos a nivel de nucleósidos y bases. ” Biochem. J. , vol. 128, no. 1, págs. 117–32, junio de 1972.
[3] DA Peattie y W. Gilbert, “Sondas químicas para estructura de orden superior en ARN”, Proc. Natl. Acad. Sci. Estados Unidos , vol. 77, no. 8, págs. 4679-82, agosto de 1980.
[4] HF Noller y JB Chaires, “Modificación funcional del ARN ribosómico 16S por kethoxal.”, Proc. Natl. Acad. Sci. Estados Unidos , vol. 69, no. 11, págs. 3115–8, noviembre de 1972.
[5] PTP Gilham, “Una reacción de adición específica para nucleótidos de uridina y guanosina y su aplicación a la modificación de la acción de la ribonucleasa”, J. Am. Chem Soc. vol. 84, no. 4, págs. 687–688, 1962.
[6] KE Deigan, TW Li, DH Mathews y KM Weeks, “Determinación precisa de la estructura de ARN dirigida por SHAPE”, Proc. Natl. Acad. Sci. Estados Unidos , vol. 106, no. 1, págs. 97-102, enero de 2009.
[7] EJ Merino, KA Wilkinson, JL Coughlan y KM Weeks, “Análisis de la estructura de ARN a resolución de un solo nucleótido mediante acilación selectiva de 2′-hidroxilo y extensión del cebador (SHAPE)”, J. Am. Chem Soc. vol. 127, no. 12, págs. 4223–31, 2005.
[8] SA Mortimer y KM Weeks, “Un reactivo de acción rápida para el análisis preciso de la estructura secundaria y terciaria de ARN por la química SHAPE”, J. Am. Chem Soc. vol. 129, no. 14, págs. 4144–5, abril de 2007.
[9] K.-A. Steen, GM Rice y KM Weeks, “Estructuras de ARN no canónicas y terciarias de huellas dactilares por reactividad de forma diferencial”, J. Am. Chem Soc. vol. 134, no. 32, p. 120801102048009, agosto de 2012.
[10] RC Spitale, P. Crisalli, RA Flynn, EA Torre, ET Kool y HY Chang, “Análisis de la forma de ARN en células vivas”, Nat. Chem Biol. , No. NOVEDAD, noviembre de 2012.
[11] EE Regulski y RR Breaker, “Análisis de sondeo en línea de riboswitches.”, Métodos Mol. Biol. vol. 419, no. 5, págs. 53-67, 2008.
[12] TD Tullius y BA Dombroski, “Huella de radicales hidroxilo: información de alta resolución sobre contactos de ADN-proteína y aplicación al represor lambda y proteína Cro”, Proc. Natl. Acad. Sci. Estados Unidos , vol. 83, no. 15, págs. 5469–73, agosto de 1986.
[13] JA Latham y TR Cech, “Definición del interior y el exterior de una molécula de ARN catalítico”, Science , vol. 245, no. 4915, pp. 276–82, julio de 1989.
[14] B. Sclavi, M. Sullivan, MR Chance, M. Brenowitz y SA Woodson, “plegamiento de ARN a intervalos de milisegundos por huella de radicales hidroxilo sincrotrónicos”, Science , vol. 279, no. 5358, pp. 1940–3, marzo de 1998.
[15] M. Brenowitz, MR Chance, G. Dhavan y K. Takamoto, “Sondeo de la dinámica estructural de los ácidos nucleicos mediante ‘huella’ radical radical de hidroxilo de equilibrio temporal y de resolución cuantitativa” . Opin. Estructura Biol. vol. 12, no. 5, págs. 648–53, octubre de 2002.
[16] H. Han y PB Dervan, “Visualización de la estructura terciaria de ARN por ARN-EDTA.Fe (II) autocleavage: análisis de tRNA (Phe) con uridina-EDTA.Fe (II) en la posición 47.” Proc. Natl. Acad. Sci. Estados Unidos , vol. 91, no. 11, págs. 4955-9, mayo de 1994.
[17] R. Das, M. Kudaravalli, M. Jonikas, A. Laederach, R. Fong, JP Schwans, D. Baker, J. a Piccirilli, RB Altman y D. Herschlag, “Inferencia estructural de nativos y parcialmente ARN plegado por mapeo de contactos de alto rendimiento “, Proc. Natl. Acad. Sci. Estados Unidos , vol. 105, no. 11, págs. 4144–9, marzo de 2008.
[18] C. Ehresmann, F. Baudin, M. Mougel, P. Romby, J. Ebel y B. Ehresmann, “Sondeo de la estructura de los ARN en solución”, Nucleic Acids Res. vol. 15, no. 22, págs. 9109–9128, noviembre de 1987.
[19] R. Daou-Chabo y C. Condon, “Actividad de endonucleasa RNasa J1 como una sonda de estructura secundaria de ARN”, ” ARN , vol. 15, no. 7, págs. 1417–25, julio de 2009.
[20] M. Kertesz, Y. Wan, E. Mazor, JL Rinn, RC Nutter, HY Chang y E. Segal, “Medición de la estructura secundaria de ARN en levadura en todo el genoma”, Nature , vol. 467, no. 7311, págs. 103-107, septiembre de 2010.
[21] JG Underwood, A. V Uzilov, S. Katzman, CS Onodera, JE Mainzer, DH Mathews, TM Lowe, SR Salama y D. Haussler, “FragSeq: sondeo de estructura de ARN de todo el transcriptoma usando secuenciación de alto rendimiento. , ” Nat. Métodos , vol. 7, no. 12, págs. 995–1001, diciembre de 2010.
[22] JB Lucks, SA Mortimer, C. Trapnell, S. Luo, S. Aviran, GP Schroth, L. Pachter, JA Doudna y AP Arkin, “Caracterización de la estructura de ARN multiplexada con acilación selectiva de 2′-hidroxilo analizada por cebador secuenciación de extensión (SHAPE-Seq) “, Proc. Natl. Acad. Sci. Estados Unidos , junio de 2011.
[23] S. Aviran, C. Trapnell, JB Lucks, SA Mortimer, S. Luo, GP Schroth, JA Doudna, AP Arkin y L. Pachter, “Modelado y automatización de la caracterización basada en secuencia de la estructura del ARN”. Proc. Natl. Acad. Sci. Estados Unidos , vol. 108, no. 27, pp. 11069–74, junio de 2011.
[24] T. Adilakshmi, RA Lease y SA Woodson, “Huella radical hidroxilo in vivo: mapeo de estructuras macromoleculares con radiación sincrotrón”, Nucleic Acids Res. vol. 34, no. 8, p. e64, enero de 2006.
[25] Y. Ding, Y. Tang, CK Kwok, Y. Zhang, PC Bevilacqua y SM Assmann, “El perfil in vivo de la estructura secundaria de ARN del genoma revela nuevas características reguladoras”, Nature , vol. avance en noviembre de 2013.
[26] Y. Wan, K. Qu, QC Zhang, RA Flynn, O. Manor, Z. Ouyang, J. Zhang, RC Spitale, MP Snyder, E. Segal y HY Chang, “Paisaje y variación del ARN secundario estructura a través del transcriptoma humano, ” Nature , vol. 505, no. 7485, pp. 706–709, enero de 2014.
[27] PP Gardner y R. Giegerich, “Una comparación exhaustiva de los enfoques comparativos de predicción de la estructura de ARN”, BMC Bioinformatics , vol. 5, no. 1, p. 140, septiembre de 2004.
[28] DH Mathews, MD Disney, JL Childs, SJ Schroeder, M. Zuker y DH Turner, “Incorporando restricciones de modificación química en un algoritmo de programación dinámica para la predicción de la estructura secundaria de ARN”, Proc. Natl. Acad. Sci. Estados Unidos , vol. 101, no. 19, págs. 7287–92, mayo de 2004.
[29] MG Seetin y DH Mathews, “Predicción de la estructura del ARN: una visión general de los métodos”, en Métodos en biología molecular (Clifton, NJ) , vol. 905, KC Keiler, Ed. Totowa, Nueva Jersey: Humana Press, 2012, págs. 99-122.
[30] M. Parisien y F. Major, “La tubería MC-Fold y MC-Sym infiere estructura de ARN a partir de datos de secuencia”, Nature , vol. 452, no. 7183, pp. 51-5, 2008.
[31] S. Sharma, F. Ding y NV Dokholyan, “iFoldRNA: predicción y plegamiento de la estructura de ARN tridimensional”, Bioinformatics , vol. 24, no. 17, págs. 1951–2, 2008.
[32] R. Das y D. Baker, “Predicción automatizada de novo de estructuras terciarias de ARN de tipo nativo”, Proc. Natl. Acad. Sci. Estados Unidos , vol. 104, no. 37, págs. 14664–9, septiembre de 2007.
[33] R. Das, J. Karanicolas y D. Baker, “Precisión atómica en la predicción y diseño de estructuras de ARN no canónicas”, Nat. Métodos , vol. 7, no. 4, págs. 291–4, abril de 2010.