Información

¿Qué dominios o motivos son capaces de unirse tanto al ADN como al ARN?

¿Qué dominios o motivos son capaces de unirse tanto al ADN como al ARN?


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Los dominios o motivos de factores de transcripción son catalíticamente activos para unirse al ácido nucleico de cualquier tipo. ¿Dónde puedo encontrar una lista de dominios o motivos que puedan unirse tanto al ADN como al ARN? por ejemplo, los dominios KH se unen al ARN o al ADN monocatenario.


Prion

Priones son proteínas mal plegadas con la capacidad de transmitir su forma mal plegada a variantes normales de la misma proteína. Caracterizan varias enfermedades neurodegenerativas mortales y transmisibles en humanos y muchos otros animales. [3] No se sabe qué causa que la proteína normal se pliegue incorrectamente, pero se sospecha que la estructura tridimensional anormal confiere propiedades infecciosas, colapsando moléculas de proteínas cercanas en la misma forma. La palabra prion deriva de "partícula infecciosa proteica". [4] [5] [6] El papel hipotético de una proteína como agente infeccioso contrasta con todos los demás agentes infecciosos conocidos, como viroides, virus, bacterias, hongos y parásitos, todos los cuales contienen ácidos nucleicos (ADN, ARN, o ambos).

Se plantea la hipótesis de que las isoformas priónicas de la proteína priónica (PrP), cuya función específica es incierta, son la causa de las encefalopatías espongiformes transmisibles (EET), [7] incluida la tembladera en las ovejas, la emaciación crónica (CWD) en los ciervos, la encefalopatía espongiforme bovina ( EEB) en bovinos (comúnmente conocida como "enfermedad de las vacas locas") y enfermedad de Creutzfeldt-Jakob (CJD) en humanos. Todas las enfermedades priónicas conocidas en los mamíferos afectan la estructura del cerebro u otro tejido neural, todas son progresivas, no tienen un tratamiento eficaz conocido y siempre son fatales. [8] Hasta 2015, se consideraba que todas las enfermedades priónicas de mamíferos conocidas eran causadas por la proteína priónica (PrP); sin embargo, en 2015 se planteó la hipótesis de que la atrofia multisistémica (MSA) era causada por una forma priónica de alfa-sinucleína. [9]

Los priones forman agregados anormales de proteínas llamadas amiloides, que se acumulan en el tejido infectado y se asocian con daño tisular y muerte celular. [10] Los amiloides también son responsables de varias otras enfermedades neurodegenerativas como la enfermedad de Alzheimer y la enfermedad de Parkinson. [11] [12] Los agregados de priones son estables, y esta estabilidad estructural significa que los priones son resistentes a la desnaturalización por agentes químicos y físicos: no pueden ser destruidos por la desinfección o cocción ordinarias. Esto dificulta la eliminación y la contención de estas partículas.

Una enfermedad priónica es un tipo de proteopatía o enfermedad de proteínas estructuralmente anormales. En los seres humanos, se cree que los priones son la causa de la enfermedad de Creutzfeldt-Jakob (CJD), su variante (vCJD), el síndrome de Gerstmann-Sträussler-Scheinker (GSS), el insomnio familiar fatal (FFI) y el kuru. [4] También hay evidencia que sugiere que los priones pueden desempeñar un papel en el proceso de la enfermedad de Alzheimer, la enfermedad de Parkinson y la esclerosis lateral amiotrófica (ELA). enfermedades similares a priones. [13] [14] [15] [16] Varias proteínas de levadura también han sido identificadas por tener propiedades prionogénicas. [17] [18] La replicación de los priones está sujeta a la epimutación y la selección natural al igual que otras formas de replicación, y su estructura varía ligeramente entre especies. [19]


Contenido

Las RdRps virales se descubrieron a principios de la década de 1960 a partir de estudios sobre mengovirus y poliovirus cuando se observó que estos virus no eran sensibles a la actinomicina D, un fármaco que inhibe la síntesis de ARN dirigida por ADN celular. Esta falta de sensibilidad sugirió que existe una enzima específica de virus que podría copiar ARN de una plantilla de ARN y no de una plantilla de ADN.

Las RdRps están altamente conservadas en todos los virus e incluso están relacionadas con la telomerasa, aunque la razón de esto es una pregunta en curso desde 2009. [3] La similitud ha llevado a la especulación de que las RdRps virales son ancestrales de la telomerasa humana.

El ejemplo más famoso de RdRp es el del virus de la polio. El genoma viral está compuesto de ARN, que ingresa a la célula a través de endocitosis mediada por receptores. A partir de ahí, el ARN puede actuar como plantilla para la síntesis de ARN complementario, de forma inmediata. La hebra complementaria es entonces, por sí misma, capaz de actuar como plantilla para la producción de nuevos genomas virales que se empaquetan y liberan aún más de la célula, listos para infectar más células huésped. La ventaja de este método de replicación es que no hay etapa de ADN. La replicación es rápida y sencilla. La desventaja es que no hay una copia de ADN "de respaldo".

Muchas RdRps están estrechamente asociadas con membranas y, por lo tanto, son difíciles de estudiar. Los RdRps más conocidos son el polioviral 3Dpol, el virus de la estomatitis vesicular L, [4] y la proteína NS5B del virus de la hepatitis C.

Muchos eucariotas también tienen RdRps involucrados en la interferencia de ARN, estos amplifican microARN y ARN temporales pequeños y producen ARN bicatenario utilizando ARN de interferencia pequeños como cebadores. [5] De hecho, estos mismos RdRps que se utilizan en los mecanismos de defensa pueden ser usurpados por virus de ARN para su beneficio. [6] Se ha revisado su historia evolutiva. [7]

RdRp se diferencia de la ARN polimerasa porque actúa para catalizar la síntesis de una hebra de ARN complementaria a una plantilla de ARN determinada, en lugar de utilizar una plantilla de ADN. El proceso de replicación del ARN es un mecanismo de cuatro pasos, como se describe.

  1. Unión de nucleótido trifosfato (NTP): inicialmente, el RdRp presenta un sitio activo vacante en el que se une el NTP. La unión correcta de NTP hace que RdRp experimente un cambio conformacional. [8]
  2. Cierre del sitio activo: el cambio conformacional iniciado por la unión correcta de NTP, da como resultado la restricción del acceso al sitio activo y produce un estado catalíticamente competente. [8]
  3. Formación de enlaces fosfodiéster: dos iones Mg 2+ están presentes en el estado catalíticamente activo y se organizan de tal manera alrededor del cebador de ARN que el sustrato NTP puede someterse a una transferencia de fosfatidilo y formar un enlace fosfodiéster con la cadena de nucleótidos existente. [9] Con el uso de estos iones Mg 2+, el sitio activo ya no tiene la estabilidad catalítica y el complejo RdRp cambia a una conformación abierta. [9]
  4. Translocación: una vez que el sitio activo está abierto, la cadena de ARN puede moverse a través del complejo proteico RdRp y unirse a un nuevo NTP y continuar el alargamiento de la cadena, a menos que la plantilla especifique lo contrario. [8]

La síntesis de ARN se puede realizar mediante un cebador independiente (de novo) o un mecanismo dependiente del cebador que utiliza un cebador ligado al genoma de proteína viral (VPg). [10] El de novo La iniciación consiste en la adición de un nucleósido trifosfato (NTP) al 3'-OH del primer NTP iniciador. [10] Durante la siguiente fase de elongación, esta reacción de transferencia de nucleotidilo se repite con los NTP posteriores para generar el producto de ARN complementario. La terminación de la cadena de ARN naciente producida por RdRp no se conoce completamente, sin embargo, se ha demostrado que la terminación de RdRp es independiente de la secuencia. [11]

Un gran inconveniente de la replicación de la ARN polimerasa dependiente de ARN es la inmensa tasa de error durante la transcripción. [10] Se sabe que las RdRps tienen una falta de fidelidad del orden de 104 nucleótidos, lo que se cree que es un resultado directo de su insuficiente capacidad de corrección de pruebas. [10] Esta alta tasa de variación se ve favorecida en los genomas virales, ya que permite que el patógeno supere las defensas desarrolladas por los huéspedes que intentan evitar la infección permitiendo el crecimiento evolutivo.

Las ARN polimerasas virales / procarióticas dirigidas por ARN, junto con muchas polimerasas dirigidas por ADN de una sola subunidad, emplean un pliegue cuya organización se ha relacionado con la forma de una mano derecha con tres subdominios denominados dedos, palma y pulgar. [12] Sólo el subdominio de la palma, compuesto por una hoja beta antiparalela de cuatro hebras con dos hélices alfa, está bien conservado entre todas estas enzimas. En RdRp, el subdominio de la palma comprende tres motivos bien conservados (A, B y C). El motivo A (D-x (4,5) -D) y el motivo C (GDD) están yuxtapuestos espacialmente, los residuos de ácido aspártico de estos motivos están implicados en la unión de Mg 2+ y / o Mn 2+. El residuo de asparagina del motivo B está involucrado en la selección de trifosfatos de ribonucleósido sobre dNTP y, por lo tanto, determina si se sintetiza ARN en lugar de ADN. [13] La organización del dominio [14] y la estructura 3D del centro catalítico de una amplia gama de RdRps, incluso aquellos con una homología de secuencia general baja, se conservan. El centro catalítico está formado por varios motivos que contienen varios residuos de aminoácidos conservados.

La interferencia de ARN eucariota requiere una ARN polimerasa celular dependiente de ARN (c RdRp). A diferencia de las polimerasas "manuales", se asemejan a las ARN polimerasas simplificadas de múltiples subunidades dependientes de ADN (DdRP), específicamente en las subunidades catalíticas β / β ', en el sentido de que utilizan dos conjuntos de barriles β de doble psi en el sitio activo. QDE1 (Q9Y7G6) en Neurospora crassa, que tiene ambos cilindros en la misma cadena, [15] es un ejemplo de dicha enzima. [16] Los homólogos de bacteriófagos, incluido el DdRp yonO de cadena sencilla similar (O31945), parecen estar más cerca de las c RdRps que las DdRP. [5] [17]

Hay 4 superfamilias de virus que cubren todos los virus que contienen ARN sin etapa de ADN:

  • Virus que contienen ARN de cadena positiva o ARN de doble cadena, excepto retrovirus y Birnaviridae
    • Todos los virus eucariotas de ARN de cadena positiva sin etapa de ADN
    • Todos los bacteriófagos que contienen ARN hay dos familias de bacteriófagos que contienen ARN: Leviviridae (fagos de ssRNA positivos) y Cystoviridae (fagos de dsRNA)
    • familia de virus dsRNA Reoviridae, Totiviridae, Hypoviridae, Partitiviridae

    La transcripción de ARN es similar a [ ¿Cómo? ] pero no lo mismo que la replicación del ADN.

    Los flavivirus producen una poliproteína del genoma del ssRNA. La poliproteína se escinde en varios productos, uno de los cuales es NS5, una ARN polimerasa dependiente de ARN. Esta ARN polimerasa dirigida por ARN posee varias regiones cortas y motivos homólogos a otras ARN polimerasas dirigidas por ARN. [18]

    La RNA replicasa que se encuentra en los virus ssRNA de hebra positiva están relacionados entre sí, formando tres grandes superfamilias. [19] La RNA replicasa de Birnaviral es única porque carece del motivo C (GDD) en la palma. [20] RdRp mononegaviral (PDB 5A22) se ha clasificado automáticamente como similar a (+) - ssRNA RdRps, específicamente uno de Pestivirus y uno de Leviviridae. [21] El monómero Bunyaviral RdRp (PDB 5AMQ) se asemeja al complejo heterotrimérico de Ortomyxoviral (Influenza PDB 4WSB) RdRp. [22]

    Dado que es una proteína universal para los virus que contienen ARN, RdRp es un marcador útil para comprender su evolución. [23] Se ha revisado la evolución estructural general de las RdRps virales. [24]

    Recombinación Editar

    Al replicar su genoma (+) ssRNA, el poliovirus RdRp es capaz de llevar a cabo la recombinación. La recombinación parece ocurrir por un mecanismo de elección de copia en el que RdRp cambia las plantillas de ARNm (+) durante la síntesis de la hebra negativa. [25] La frecuencia de recombinación está determinada en parte por la fidelidad de la replicación de RdRp. [26] Las variantes de RdRp con alta fidelidad de replicación muestran una recombinación reducida, y las RdRps de baja fidelidad exhiben una mayor recombinación. [26] La recombinación por cambio de hebra de RdRp también ocurre con frecuencia durante la replicación en los carmovirus de plantas (+) ssRNA y tombusvirus. [27]

    Complementación intragénica Editar

    Virus Sendai (familia Paramyxoviridae) tiene un genoma de ARN lineal, monocatenario, de sentido negativo y no segmentado. La RdRp viral consta de dos subunidades codificadas por virus, una P más pequeña y una L más grande. Cuando se probaron diferentes mutantes RdRp inactivos con defectos en toda la longitud de la subunidad L en combinaciones por pares, se observó restauración de la síntesis de ARN viral en algunos casos. combinaciones. [28] Esta interacción positiva L-L se conoce como complementación intragénica e indica que la proteína L es un oligómero en el complejo de ARN polimerasa viral.

    Las RdRps pueden usarse como dianas farmacológicas para patógenos virales ya que su función no es necesaria para la supervivencia eucariota. Al inhibir la función de la ARN polimerasa dependiente de ARN, los ARN nuevos no se pueden replicar a partir de una hebra molde de ARN; sin embargo, la ARN polimerasa dependiente de ADN seguirá siendo funcional.

    Actualmente existen medicamentos antivirales contra la hepatitis C y COVID-19 que se dirigen específicamente a RdRp. Estos incluyen sofosbuvir y ribavirina contra la hepatitis C [29] y Remdesivir, el único fármaco aprobado por la FDA contra COVID-19.

    El trifosfato GS-441524 es un sustrato para RdRp, pero no polimerasas de mamíferos. Da como resultado la terminación prematura de la cadena y la inhibición de la replicación viral. El trifosfato GS-441524 es la forma biológicamente activa del profármaco de fosfato Remdesivir. Remdesivir se clasifica como un análogo de nucleótidos en el que actúa para inhibir la función de RdRp uniéndose covalentemente e interrumpiendo la terminación del ARN naciente a través de la terminación temprana o retrasada o previniendo una mayor elongación del polinucleótido de ARN. [30] [31] Esta terminación temprana conduce a un ARN no funcional que se degradará a través de los procesos celulares normales.

    El uso de ARN polimerasa dependiente de ARN juega un papel importante en la interferencia de ARN en eucariotas, un proceso utilizado para silenciar la expresión génica a través de pequeños ARN interferentes (ARNip) que se unen al ARNm volviéndolos inactivos. [32] La RdRp eucariota se activa en presencia de dsRNA, sin embargo, RdRp solo está presente en un subconjunto selecto de eucariotas, incluyendo C. elegans y P. tetraurelia. [33] Esta presencia de dsRNA desencadena la activación de los procesos RdRp y RNAi al cebar el inicio de la transcripción del RNA mediante la introducción de siRNA en el sistema. [33] En C. elegans, los ARNip se integran en el complejo de silenciamiento inducido por ARN, RISC, que trabaja junto con los ARNm dirigidos a la interferencia para reclutar más RdRps para sintetizar más ARNip secundarios y reprimir la expresión génica. [34]


    Métodos

    Los sistemas ssDNA-ssDBPs y ssRNA-ssRBPs estudiados

    Para un análisis completo de una variedad de interacciones entre proteínas y ácidos nucleicos monocatenarios, estudiamos 12 complejos: seis complejos ssDNA-ssDBP y seis complejos ssRNA-ssRBP cuyas estructuras tridimensionales son conocidas (resumidas en la Tabla 1). Los conjuntos de complejos proteína-ADN y proteína-ARN incluyen proteínas que tienen diferentes funciones, con pliegues de diferentes tamaños y con ssDNA / ssRNA heterogéneos que tienen diferentes longitudes y secuencias. Las proteínas en estos complejos ssDNA-ssDBP pertenecen a diferentes dominios estructurales: el pliegue de unión de oligonucleótido / oligosacárido (OB), el dominio del motivo de reconocimiento de ARN (RRM) y el dominio de homología K (KH). Observamos que los cuatro complejos con pliegues OB difieren en sus estructuras (I.mi., longitud de la proteína) y secuencias. Asimismo, los seis complejos ssRNA-ssRBP también se seleccionaron para cubrir diferentes dominios estructurales, a saber, el pliegue OB, RRM, dominio PUF, dominio de dedo de zinc, proteína RAMP y un Fab. En general, cubrimos diferentes pliegues en los que las contribuciones de energía de apilamiento electrostática y aromática varían desde una fracción de energía de apilamiento muy alta (el pliegue OB) hasta una fracción de energía electrostática alta (dominio KH y RAMP). A juzgar por las estructuras disponibles de los 12 complejos estudiados aquí y basándose en las estructuras libres disponibles, parece poco probable que las proteínas experimenten un cambio conformacional considerable para unirse a sus ligandos de ssDNA / ssRNA. Las moléculas de ssDNA y ssRNA son mucho más flexibles en solución que las proteínas plegadas. Por consiguiente, se puede concluir que las superficies de unión en ssDBP y ssRBP están predefinidas y se produce un gran cambio conformacional para ssDNA / ssRNA solamente.


    Título: ARN dependiente de ARN dirigido por CRISPR-Cas9

    La unión y la escisión del ADN bicatenario (dsDNA) por Cas9 es un sello distintivo de la inmunidad adaptativa bacteriana CRISPR-Cas tipo II. Se cree que todas las enzimas Cas9 conocidas reconocen el ADN exclusivamente como sustrato natural, lo que proporciona protección contra los fagos y los plásmidos del ADN. Aquí, mostramos que las enzimas Cas9 de ambos subtipos II-A y II-C pueden reconocer y escindir ARN monocatenario (ssRNA) mediante un mecanismo guiado por ARN que es independiente de una secuencia de motivo adyacente a protoespaciador (PAM) en la diana. ARN. La escisión de ARN guiada por ARN es programable y específica del sitio, y encontramos que esta actividad puede aprovecharse para reducir la infección por fagos de ARN monocatenario in vivo. También demostramos que Cas9 puede dirigir la represión independiente de PAM de la expresión génica en bacterias. En conclusión, estos resultados indican que un subconjunto de enzimas Cas9 tienen la capacidad de actuar tanto en secuencias diana de ADN como de ARN, y sugieren el potencial de uso en aplicaciones programables de orientación de ARN.


    Repeticiones ricas en RG: la navaja suiza de las interacciones proteína-ARN

    Un motivo de unión de ARN desordenado que ocurre comúnmente en las RBP consiste en repeticiones de arginina y glicina, denominadas cajas RGG o repeticiones GAR. Estas secuencias son heterogéneas tanto en número de repeticiones como en su espaciado. Un análisis reciente dividió estas regiones ricas en RG en cajas di- y tri-RG y -RGG, e identificó instancias de tales repeticiones en orden de decenas (di- y tri-RGG) a cientos (tri-RG) y casi dos mil. proteínas (di-RG) [47]. Las proteínas que contienen este tipo de repeticiones se enriquecen en funciones metabólicas de ARN [47]. Sin embargo, actualmente no está claro si las diferentes arquitecturas repetidas proporcionan firmas funcionales distintas.

    La caja RGG se identificó por primera vez en la proteína U de ribonucleoproteína nuclear heterogénea (hnRNP-U, también conocida como SAF-A) como una región suficiente y necesaria para la unión del ARN (Tabla 1, Fig. 1). hnRNP-U carece de RBD canónicos, pero tiene un dominio SAP semiestructurado involucrado en la unión al ADN [48-50]. Se ha descubierto que el hnRNP-U se dirige a cientos de ARN no codificantes, incluidos los ARN nucleares pequeños (sn) implicados en el empalme de ARN, y varios ARN largos no codificantes (lnc), de una manera dependiente de la caja RGG [51 ]. La interacción mediada por RGG de hnRNP-U con lncRNAs Xist [52] y PANDA [53] se ha implicado en la regulación epigenética.

    La unión de ARN mediada por RG [G] también juega un papel en la exportación de ARN nuclear, como lo ilustra el factor de exportación de ARN nuclear 1 (NXF1). Mientras que NXF1 alberga un RRM capaz de unirse al ARN [54], la mayor parte de la capacidad de unión al ARN in vivo se atribuye a la región N-terminal que contiene RGG [55] (Tabla 1). Las argininas en este motivo juegan un papel clave en la interacción con el ARN, que se ha demostrado que es independiente de la secuencia, pero necesario para la exportación de ARN [55]. La afinidad general de NXF1 por el ARN es baja [55, 56] y requiere la cooperación con el adaptador de exportación ALY / REF [57]. ALY / REF también tiene una región rica en arginina desordenada N-terminal que se asemeja a una caja RGG [57] y media tanto en la unión del ARN [54, 58, 59] como en la interacción con NXF1 [60]. Se propone que la activación de NXF1 sea desencadenada por la formación de un complejo ternario entre ALY / REF y NXF1, en el que sus regiones desordenadas ricas en RG juegan un papel central. Se han identificado secuencias análogas en proteínas virales y también facilitan la exportación de ARN viral evitando las rutas canónicas de exportación nuclear (Tabla 1).

    La proteína de retraso mental X frágil (FMRP) es otra RBP con una caja RGG de unión a ARN bien caracterizada (Fig. 1). Involucrada en la represión de la traducción en el cerebro [61], la pérdida de actividad de FMRP conduce a cambios en la conectividad sináptica [62], retraso mental [63-65] y también puede promover la aparición de enfermedades neurodegenerativas [66]. Además de su caja RGG, FMRP contiene dos dominios KH que contribuyen a la unión del ARN. Se ha demostrado que la caja RGG de FMRP interactúa con alta afinidad con las estructuras de ARN G-quadruplex [67-77]. La caja RGG no está estructurada en su estado libre [70, 78], pero se pliega al unirse a un G-quadruplex estructurado rico en guanina en el ARN diana [78] (Fig. 2). Tanto las argininas como las glicinas juegan un papel clave en la función de la caja RGG y el reemplazo de estos aminoácidos deteriora la unión del ARN [78]. Los residuos de arginina utilizados para interactuar con el ARN varían según el ARN objetivo [70, 76, 78]. El FMRP RGG-box se dirige a su propio ARNm en una estructura G-quadruplex que codifica el RGG-box [69]. Esta unión regula el empalme alternativo de ARNm de FMRP proximal al cuarteto G, lo que sugiere que puede autorregular el equilibrio de las isoformas de FRMP [74]. Sorprendentemente, un estudio reciente de todo el transcriptoma de FMRP asociado a polisomas no encontró enriquecimiento para las estructuras G-cuádruplex predichas en los 842 ARNm diana de alta confianza [79]. Otro estudio identificó sitios de unión de FMRP enriquecidos en motivos de secuencia específicos, donde los dominios KH2 emergieron como los principales determinantes de la especificidad [80]. Estos resultados sugieren que el papel de RGG-box en este RBP podría limitarse a aumentar la afinidad de unión global de la proteína, apoyando las interacciones específicas de secuencia mediadas por los dominios KH2. Sin embargo, no podemos excluir la posibilidad de una eficiencia de reticulación UV diferencial de los dominios KH2 y la caja RGG, que podría resultar en firmas de unión sesgadas en los estudios CLIP.

    Ejemplos estructurales Regiones desordenadas unidas a ARN. a El péptido RGG del FMRP humano unido a un in vitro-ARN sc1 rico en guanina seleccionado determinado por RMN (PDB 2LA5) [78] B Parche básico del virus de inmunodeficiencia bovina desordenado (BIV) Tat forma un giro β cuando interactúa con su ARN objetivo, TAR. Estructura determinada por RMN (PDB 1MNB) [91] C Dímero del parche básico que contiene la proteína Rev del virus de la inmunodeficiencia humana (VIH) en complejo con el ARN diana, RRE, determinado por cristalografía [102] (PDB 4PMI). Rojo, péptido amarillo, ARN. Las ilustraciones fueron creadas usando PyMol

    Varias otras RBP utilizan una región de repetición RGG para apuntar a dianas de ARN estructuradas y ricas en G y están implicadas en enfermedades neurológicas así como en cáncer (Tabla 1). Estas regiones ricas en RG pueden mediar interacciones tanto no selectivas como específicas con el ARN y pueden participar en diversos procesos metabólicos del ARN.


    ¿Qué dominios o motivos son capaces de unirse tanto al ADN como al ARN? - biología

    Los sistemas CRISPR / Cas proporcionan a las bacterias y arqueas inmunidad adaptativa contra virus y plásmidos mediante el uso de crRNA para guiar el silenciamiento de los ácidos nucleicos invasores. Mostramos aquí que en un subconjunto de estos sistemas, el crRNA maduro emparejado con trans-activar tracrRNA forma una estructura de dos ARN que dirige a la proteína Cas9 asociada a CRISPR para introducir roturas de doble hebra (ds) en el ADN diana. En los sitios complementarios a la secuencia guía de crRNA, el dominio de nucleasa Cas9 HNH escinde la hebra complementaria mientras que el dominio similar a Cas9 RuvC escinde la hebra no complementaria. El doble-tracrRNA: crRNA, cuando se diseña como una única quimera de ARN, también dirige la escisión de ADN bicatenario Cas9 específica de secuencia. Nuestro estudio revela una familia de endonucleasas que utilizan ARN duales para la escisión de ADN específica de un sitio y destaca el potencial de explotar el sistema para la edición del genoma programable por ARN.

    Las bacterias y arqueas han desarrollado sistemas de defensa adaptativos mediados por ARN llamados CRISPR (repeticiones palindrómicas cortas agrupadas regularmente interespaciadas) / Cas (asociadas a CRISPR) que protegen a los organismos de los virus y plásmidos invasores (13). Estos sistemas de defensa se basan en pequeños ARN para la detección de secuencias específicas y el silenciamiento de ácidos nucleicos extraños. Los sistemas CRISPR / Cas se componen de cas genes organizados en operón (s) y una matriz CRISPR que consta de secuencias únicas de orientación al genoma (llamadas espaciadores) intercaladas con repeticiones idénticas (13). La inmunidad mediada por CRISPR / Cas ocurre en tres pasos. En la fase adaptativa, las bacterias y arqueas que albergan uno o más loci CRISPR responden al desafío viral y plásmido integrando fragmentos cortos de secuencia extraña (protoespaciadores) en el cromosoma del huésped en el extremo proximal de la matriz CRISPR (13). En las fases de expresión e interferencia, la transcripción del elemento espaciador repetido en moléculas precursoras de ARN CRISPR (pre-crRNA) seguido de escisión enzimática produce los crRNA cortos que pueden emparejarse con secuencias complementarias protoespaciadoras de dianas virales o plásmidas invasoras (411). El reconocimiento de la diana por crRNAs dirige el silenciamiento de las secuencias extrañas por medio de proteínas Cas que funcionan en complejo con los crRNAs (10, 1220).

    Hay tres tipos de sistemas CRISPR / Cas (2123). Los sistemas de Tipo I y III comparten algunas características generales: las endonucleasas Cas especializadas procesan los pre-crRNA y, una vez maduros, cada crRNA se ensambla en un gran complejo de proteínas multi-Cas capaz de reconocer y escindir ácidos nucleicos complementarios al crRNA. Por el contrario, los sistemas de tipo II procesan pre-crRNA mediante un mecanismo diferente en el que un crRNA trans-activador (tracrRNA) complementario a las secuencias repetidas en pre-crRNA desencadena el procesamiento por parte de la ribonucleasa III específica de ARN bicatenario en presencia de la proteína Cas9 (antes Csn1) (4, 24) (fig. S1). Se cree que Cas9 es la única proteína responsable del silenciamiento guiado por crRNA de ADN extraño (2527).

    Mostramos aquí que en los sistemas de Tipo II, las proteínas Cas9 constituyen una familia de enzimas que requieren una estructura de pares de bases formada entre el ARNtra de activación y el ARNr de diana para escindir el ADN de doble hebra (ds) diana. La escisión específica del sitio ocurre en ubicaciones determinadas por la complementariedad de emparejamiento de bases entre el crRNA y el ADN del protoespaciador diana y un motivo corto (denominado motivo adyacente al protoespaciador, o PAM) yuxtapuesto a la región complementaria en el ADN diana. Nuestro estudio demuestra además que la familia de endonucleasas Cas9 puede programarse con moléculas de ARN individuales para escindir sitios de ADN específicos, lo que aumenta la emocionante posibilidad de desarrollar un sistema dirigido por ARN simple y versátil para generar rupturas de ADN bicatenario (DSB) para la selección y edición del genoma.

    Cas9 es una endonucleasa de ADN guiada por dos ARN. Se ha planteado la hipótesis de que Cas9, la proteína distintiva de los sistemas de tipo II, está involucrada tanto en la maduración del crRNA como en la interferencia del ADN guiada por crRNA (fig. S1) (4, 2527). Cas9 está involucrado en la maduración del crRNA (4), pero no se ha investigado su participación directa en la destrucción del ADN diana. Para probar si Cas9 podría ser capaz de segmentar el ADN diana y cómo, utilizamos un sistema de sobreexpresión para purificar la proteína Cas9 derivada del patógeno. Streptococcus pyogenes (fig. S2) y probó su capacidad para escindir un ADN plasmídico o un dúplex de oligonucleótidos que lleva una secuencia protoespaciadora complementaria a un ARNcr maduro y un PAM genuino. Encontramos que el crRNA maduro solo era incapaz de dirigir la escisión del DNA plasmídico catalizado por Cas9 (Fig. 1A y Fig. S3A). Sin embargo, la adición de tracrRNA, que puede emparejarse con la secuencia repetida de crRNA y es esencial para la maduración del crRNA en este sistema, provocó que Cas9 escindiera el ADN plasmídico (Fig. 1A y Fig. S3A). La reacción de escisión requirió tanto magnesio como la presencia de una secuencia de crRNA complementaria al DNA, un crRNA capaz de emparejar bases de tracrRNA pero que contenía una secuencia de unión al DNA diana no afín no apoyó la escisión del plásmido catalizada por Cas9 (Fig. 1A y fig. . S3A, compare crRNA-sp2 con crRNA-sp1 y la figura S4A). Se obtuvieron resultados similares con un sustrato de dsDNA lineal corto (Fig. 1B y Fig. S3, B y C). los trans-activar tracrRNA es, por tanto, un pequeño RNA no codificante con dos funciones críticas: desencadenar el procesamiento de pre-crRNA por la enzima RNasa III (4) y posteriormente activando la escisión de ADN guiada por crRNA por Cas9.

    Cas9 es una endonucleasa de ADN guiada por dos moléculas de ARN. (A) Cas9 se programó con un crRNA-sp2 de 42 nucleótidos (crRNA que contiene la secuencia del espaciador 2) en presencia o ausencia de tracrRNA de 75 nucleótidos. El complejo se añadió a ADN plasmídico circular o linealizado con XhoI que lleva una secuencia complementaria al espaciador 2 y un PAM funcional. crRNA-sp1, control de especificidad M, marcador de ADN se refieren a la fig. S3A. (B) Cas9 se programó con crRNA-sp2 y tracrRNA (nucleótidos 4-89). El complejo se incubó con ADN bicatenarios o monocatenarios que albergan una secuencia complementaria al espaciador 2 y un PAM funcional (4). Las hebras complementarias o no complementarias del ADN se marcaron radiactivamente en 5 'y se hibridaron con una hebra asociada no marcada. Consulte la fig. S3, B y C. (C) Análisis de secuenciación de productos de escisión de la Fig. 1A. La terminación de la extensión del cebador en la reacción de secuenciación indica la posición del sitio de escisión. El saliente A del terminal 3 '(asterisco) es un artefacto de la reacción de secuenciación. Consulte la fig. S5, A y C. (D) Los productos de escisión de la Fig. 1B se analizaron junto con los marcadores de tamaño marcados en el extremo 5 'derivados de las hebras complementarias y no complementarias del dúplex de ADN diana. M, marcador P, producto de escisión. Consulte la fig. S5, B y C. (mi) Representación esquemática de las secuencias de ADN tracrRNA, crRNA-sp2 y protoespaciador 2 regiones de complementariedad de crRNA con tracrRNA (naranja) y el ADN protoespaciador (amarillo) están representadas en la secuencia de PAM, los sitios de escisión grises mapeados en (C) y (D) están representados por flechas azules (C), una flecha roja (D, hebra complementaria) y una línea roja (D, hebra no complementaria).

    Escisión tanto del plásmido como del dsDNA lineal corto por tracrRNA: Cas9 guiado por crRNA es específico del sitio (Fig. 1, C a E, y Fig. S5, A y B). La escisión del ADN plasmídico produjo extremos romos en una posición tres pares de bases corriente arriba de la secuencia PAM (Fig. 1, C y E, y fig. S5, A y C) (26). De manera similar, dentro de los dúplex de dsDNA cortos, la hebra de ADN que es complementaria a la secuencia de unión a la diana en el crRNA (la hebra complementaria) se escinde en un sitio tres pares de bases aguas arriba de la PAM (Fig.1, D y E, y fig. . S5, B y C). La hebra de ADN no complementaria se escinde en uno o más sitios dentro de 3 a 8 pares de bases corriente arriba del PAM. Una investigación adicional reveló que la hebra no complementaria se escinde primero endonucleolíticamente y posteriormente se recorta mediante una actividad exonucleasa 3'-5 '(figura S4B). Las tasas de escisión por Cas9 en condiciones de recambio único oscilaron entre 0,3 y 1 min -1, comparables a las de las endonucleasas de restricción (fig. S6A), mientras que la incubación del complejo Cas9-tracrRNA: crRNA de tipo salvaje con un exceso molar de 5 veces de el ADN del sustrato proporcionó evidencia de que la Cas9 guiada por ARN dual es una enzima de recambio múltiple (fig. S6B). En contraste con el complejo CRISPR Tipo I Cascade (18), Cas9 escinde plásmidos linealizados y superenrollados (Figs. 1A y 2A). Por lo tanto, un plásmido invasor puede, en principio, ser escindido varias veces por proteínas Cas9 programadas con diferentes crRNA.

    Cas9 usa dos dominios de nucleasa para escindir las dos hebras en el ADN diana. (A) Arriba: Representación esquemática de la estructura del dominio Cas9 que muestra las posiciones de las mutaciones del dominio. Abajo: Los complejos de proteínas Cas9 mutantes de nucleasa o de tipo salvaje con tracrRNA: crRNA-sp2 se ensayaron para determinar la actividad endonucleasa como en la Fig. 1A. (B) Se ensayó la actividad de complejos de Cas9 de tipo salvaje o mutantes de dominio nucleasa con ARNtracr y ARNcr-sp2 como en la Fig. 1B.

    Cada dominio de nucleasa Cas9 escinde una hebra de ADN. Cas9 contiene dominios homólogos a las endonucleasas HNH y RuvC (Fig. 2A y Fig. S7) (2123, 27, 28). Diseñamos y purificamos variantes de Cas9 que contenían mutaciones puntuales inactivantes en los residuos catalíticos de los dominios HNH o similares a RuvC (Fig. 2A y Fig. S7) (23, 27). Incubation of these variant Cas9 proteins with native plasmid DNA showed that dual-RNA–guided mutant Cas9 proteins yielded nicked open circular plasmids, while the wild-type Cas9 protein-tracrRNA:crRNA complex produced a linear DNA product (Figs. 1A and 2A and figs. S3A and S8A). This result indicates that the Cas9 HNH and RuvC-like domains each cleave one plasmid DNA strand. To determine which strand of the target DNA is cleaved by each Cas9 catalytic domain, we incubated the mutant Cas9-tracrRNA:crRNA complexes with short dsDNA substrates in which either the complementary or the noncomplementary strand was radiolabeled at its 5′ end. The resulting cleavage products indicated that the Cas9 HNH domain cleaves the complementary DNA strand, while the Cas9 RuvC-like domain cleaves the noncomplementary DNA strand (Fig. 2B and fig. S8B).

    Dual-RNA requirements for target DNA binding and cleavage. tracrRNA might be required for target DNA binding and/or to stimulate the nuclease activity of Cas9 downstream of target recognition. To distinguish between these possibilities, we used an electrophoretic mobility shift assay to monitor target DNA binding by catalytically inactive Cas9 in the presence or absence of crRNA and/or tracrRNA. Addition of tracrRNA substantially enhanced target DNA binding by Cas9, whereas little specific DNA binding was observed with Cas9 alone or Cas9-crRNA (fig. S9). This indicates that tracrRNA is required for target DNA recognition, possibly by properly orienting the crRNA for interaction with the complementary strand of target DNA. The predicted tracrRNA:crRNA secondary structure includes base-pairing between the 3′-terminal 22-nucleotides of the crRNA and a segment near the 5′ end of the mature tracrRNA (Fig. 1E). This interaction creates a structure in which the 5′-terminal 20 nucleotides of the crRNA, which vary in sequence in different crRNAs, are available for target DNA binding. The bulk of the tracrRNA downstream of the crRNA base-pairing region is free to form additional RNA structure(s) and/or to interact with Cas9 or the target DNA site. To determine whether the entire length of the tracrRNA is necessary for site-specific Cas9-catalyzed DNA cleavage, we tested Cas9-tracrRNA:crRNA complexes reconstituted using full-length mature (42-nt) crRNA and various truncated forms of tracrRNA lacking sequences at their 5′ or 3′ ends. These complexes were tested for cleavage using a short target dsDNA. A substantially truncated version of the tracrRNA retaining nucleotides 23-48 of the native sequence was capable of supporting robust dual-RNA–guided Cas9-catalyzed DNA cleavage (Fig. 3, A and C, and fig. S10, A and B). Truncation of the crRNA from either end showed that Cas9-catalyzed cleavage in the presence of tracrRNA could be triggered with crRNAs missing the 3′-terminal 10 nucleotides (Fig. 3, B and C). In contrast, a 10-nucleotide deletion from the 5′ end of crRNA abolished DNA cleavage by Cas9 (Fig. 3B). We also analyzed Cas9 orthologs from various bacterial species for their ability to support S. pyogenes tracrRNA:crRNA-guided DNA cleavage. In contrast to closely related S. pyogenes Cas9 orthologs, more distantly related orthologs were not functional in the cleavage reaction (fig. S11). Similar, S. pyogenes Cas9 guided by tracrRNA:crRNA pairs originating from more distant systems were unable to cleave DNA efficiently (fig. S11). Species specificity of dual-RNA–guided cleavage of DNA indicates co-evolution of Cas9, tracrRNA and the crRNA repeat, as well as the existence of a still unknown structure and/or sequence in the dual-RNA that is critical for the formation of the ternary complex with specific Cas9 orthologs.

    Cas9-catalyzed cleavage of target DNA requires an activating domain in tracrRNA and is governed by a seed sequence in the crRNA. (A) Cas9-tracrRNA:crRNA complexes were reconstituted using 42-nucleotide crRNA-sp2 and truncated tracrRNA constructs and assayed for cleavage activity as in Fig. 1B. (B) Cas9 programmed with full-length tracrRNA and crRNA-sp2 truncations was assayed for activity as in (A). (C) Minimal regions of tracrRNA and crRNA capable of guiding Cas9-mediated DNA cleavage (blue box). (D) Plasmids containing wild-type or mutant protospacer 2 sequences with indicated point mutations (right) were cleaved in vitro by programmed Cas9 as in Fig. 1A (left top) and used for transformation assays of wild-type or pre-crRNA-deficient S. pyogenes (left bottom). The transformation efficiency was calculated as CFU per μg of plasmid DNA error bars represent standard deviations for three biological replicates. (mi) Plasmids containing wild-type and mutant protospacer 2 inserts with varying extent of crRNA-target DNA mismatches (right) were cleaved in vitro by programmed Cas9 (left). The cleavage reactions were further digested with XmnI. The 1880 bp and 800 bp fragments are Cas9-generated cleavage products.

    To investigate the protospacer sequence requirements for Type II CRISPR/Cas immunity in bacterial cells, a series of protospacer-containing plasmid DNAs harboring single-nucleotide mutations were analyzed for their maintenance following transformation in S. pyogenes and their ability to be cleaved by Cas9 in vitro. In contrast to point mutations introduced at the 5′ end of the protospacer, mutations in the region close to the PAM and the Cas9 cleavage sites were not tolerated in vivo and resulted in decreased plasmid cleavage efficiency in vitro (Fig. 3D). Our results are in agreement with a previous report of protospacer escape mutants selected in the Type II CRISPR system from S. thermophilus in vivo (27, 29). Furthermore, the plasmid maintenance and cleavage results hint at the existence of a “seed” region located at the 3′ end of the protospacer sequence that is crucial for the interaction with crRNA and subsequent cleavage by Cas9. In support of this notion, Cas9 enhanced complementary DNA strand hybridization to the crRNA and this enhancement was the strongest in the 3′-terminal region of the crRNA targeting sequence (fig. S12). Corroborating this, a contiguous stretch of at least 13 base pairs between the crRNA and the target DNA site proximal to the PAM is required for efficient target cleavage, while up to six contiguous mismatches in the 5′-terminal region of the protospacer are tolerated (Fig. 3E). These findings are reminiscent of the previously observed seed sequence requirements for target nucleic acid recognition in Argonaute proteins (30, 31) and the Cascade and Csy CRISPR complexes (13, 14).

    A short sequence motif dictates R-loop formation. In multiple CRISPR/Cas systems, recognition of self versus non-self has been shown to involve a short sequence motif that is preserved in the foreign genome, referred to as the PAM (27, 29, 3234). PAM motifs are only a few base pairs in length, and their precise sequence and position vary according to the CRISPR/Cas system type (32). En el S. pyogenes Type II system, the PAM conforms to an NGG consensus sequence, containing two G:C base pairs that occur one base pair downstream of the crRNA binding sequence, within the target DNA (4). Transformation assays demonstrated that the GG motif is essential for protospacer plasmid DNA elimination by CRISPR/Cas in bacterial cells (fig. S13A), consistent with previous observations in S. thermophilus (27). The motif is also essential for in vitro protospacer plasmid cleavage by tracrRNA:crRNA-guided Cas9 (fig. S13B). To determine the role of the PAM in target DNA cleavage by the Cas9-tracrRNA:crRNA complex, we tested a series of dsDNA duplexes containing mutations in the PAM sequence on the complementary or noncomplementary strands, or both (Fig. 4A). Cleavage assays using these substrates showed that Cas9-catalyzed DNA cleavage was particularly sensitive to mutations in the PAM sequence on the noncomplementary strand of the DNA, in contrast to complementary strand PAM recognition by Type I CRISPR/Cas systems (18, 34). Cleavage of target single-stranded DNAs was unaffected by mutations of the PAM motif. This observation suggests that the PAM motif is required only in the context of target dsDNA and may thus be required to license duplex unwinding, strand invasion, and the formation of an R-loop structure. Using a different crRNA-target DNA pair (crRNA-sp4 and protospacer 4 DNA), selected due to the presence of a canonical PAM not present in the protospacer 2 target DNA, we found that both G nucleotides of the PAM were required for efficient Cas9-catalyzed DNA cleavage (Fig. 4B and fig. S13C). To determine whether the PAM plays a direct role in recruiting the Cas9-tracrRNA:crRNA complex to the correct target DNA site, binding affinities of the complex for target DNA sequences were analyzed by native gel mobility shift assays (Fig. 4C). Mutation of either G in the PAM sequence substantially reduced the affinity of Cas9-tracrRNA:crRNA for the target DNA. This finding argues for specific recognition of the PAM sequence by Cas9 as a prerequisite for target DNA binding and possibly strand separation to allow strand invasion and R-loop formation, which would be analogous to the PAM sequence recognition by CasA/Cse1 implicated in a Type I CRISPR/Cas system (34).

    A PAM is required to license target DNA cleavage by the Cas9-tracrRNA:crRNA complex. (A) Dual RNA-programmed Cas9 was tested for activity as in Fig. 1B. Wild-type and mutant PAM sequences in target DNAs are indicated (right). (B) Protospacer 4 target DNA duplexes (labeled at both 5′ ends) containing wild-type and mutant PAM motifs were incubated with Cas9 programmed with tracrRNA (nt 23-89):crRNA-sp4. At indicated time points (min), aliquots of the cleavage reaction were taken and analyzed as in Fig. 1B. (C) Electrophoretic mobility shift assays were performed using RNA-programmed Cas9 (D10A/H840A) and protospacer 4 target DNA duplexes [same as in (B)] containing wild-type and mutated PAM motifs. Cas9 (D10A/H840A)-RNA complex was titrated from 100 pM to 1 μM.

    Cas9 can be programmed with a single chimeric RNA. Examination of the likely secondary structure of the tracrRNA:crRNA duplex (Figs. 1E and 3C) suggested the possibility that the features required for site-specific Cas9-catalyzed DNA cleavage could be captured in a single chimeric RNA. Although the tracrRNA:crRNA target selection mechanism works efficiently in nature, the possibility of a single RNA-guided Cas9 is appealing due to its potential utility for programmed DNA cleavage and genome editing (Fig. 5A). We designed two versions of a chimeric RNA containing a target recognition sequence at the 5′ end followed by a hairpin structure retaining the base-pairing interactions that occur between the tracrRNA and the crRNA (Fig. 5B). This single transcript effectively fuses the 3′end of crRNA to the 5′ end of tracrRNA, thereby mimicking the dual-RNA structure required to guide site-specific DNA cleavage by Cas9. In cleavage assays using plasmid DNA, we observed that the longer chimeric RNA was able to guide Cas9-catalyzed DNA cleavage in a manner similar to that observed for the truncated tracrRNA:crRNA duplex (Fig. 5B and fig. S14, A and C). The shorter chimeric RNA did not work efficiently in this assay, confirming that nucleotides 5-12 positions beyond the tracrRNA:crRNA base-pairing interaction are important for efficient Cas9 binding and/or target recognition. Similar results were observed in cleavage assays using short dsDNA as a substrate, which further indicate that the position of the cleavage site in target DNA is identical to that observed using the dual tracrRNA:crRNA as a guide (Fig. 5C and fig. S14, B and C). Finally, to establish whether the design of chimeric RNA might be universally applicable, we engineered five different chimeric guide RNAs to target a portion of the gene encoding the green-fluorescent protein (GFP) (fig. S15, A to C), and tested their efficacy against a plasmid carrying the GFP coding sequence in vitro. In all five cases, Cas9 programmed with these chimeric RNAs efficiently cleaved the plasmid at the correct target site (Fig. 5D and fig. S15D), indicating that rational design of chimeric RNAs is robust and could in principle enable targeting of any DNA sequence of interest with few constraints beyond the presence of a GG dinucleotide adjacent to the targeted sequence.

    Cas9 can be programmed using a single engineered RNA molecule combining tracrRNA and crRNA features. (A) Top: In Type II CRISPR/Cas systems, Cas9 is guided by a two-RNA structure formed by activating tracrRNA and targeting crRNA to cleave site-specifically target dsDNA (refer to fig. S1). Bottom: A chimeric RNA generated by fusing the 3′ end of crRNA to the 5′ end of tracrRNA. (B) A plasmid harboring protospacer 4 target sequence and a wild-type PAM was subjected to cleavage by Cas9 programmed with tracrRNA(4-89):crRNA-sp4 duplex or in vitro-transcribed chimeric RNAs constructed by joining the 3′ end of crRNA to the 5′ end of tracrRNA with a GAAA tetraloop. Cleavage reactions were analyzed by restriction mapping with XmnI. Sequences of chimeric RNAs A and B are shown with DNA-targeting (yellow), crRNA repeat-derived (orange) and tracrRNA-derived (light blue) sequences. (C) Protospacer 4 DNA duplex cleavage reactions were performed as in Fig. 1B. (D) Five chimeric RNAs designed to target the GFP gene were used to program Cas9 to cleave a GFP gene-containing plasmid. Plasmid cleavage reactions were performed as in Fig. 3E, except that the plasmid DNA was restriction mapped with AvrII following Cas9 cleavage.

    Conclusions. In summary, we identify a DNA interference mechanism involving a dual-RNA structure that directs a Cas9 endonuclease to introduce site-specific double-stranded breaks in target DNA. The tracrRNA:crRNA-guided Cas9 protein utilizes distinct endonuclease domains, HNH and RuvC-like, to cleave the two strands in the target DNA. Target recognition by Cas9 requires both a seed sequence in the crRNA and a GG dinucleotide-containing PAM sequence adjacent to the crRNA-binding region in the DNA target. We further show that the Cas9 endonuclease can be programmed with guide RNA engineered as a single transcript to target and cleave any dsDNA sequence of interest. The system is efficient, versatile and programmable by changing the DNA target-binding sequence in the guide chimeric RNA. Zinc-Finger Nucleases (ZFNs) and Transcription-Activator Like Effector Nucleases (TALENs) have attracted considerable interest as artificial enzymes engineered to manipulate genomes (3538). We propose an alternative methodology based on RNA-programmed Cas9 that could offer considerable potential for gene targeting and genome editing applications.


    Kink-turns in RNA

    The kink-turn (usually abbreviated to k-turn) is a widespread structural motif in RNA, first noted as a repeated structural element in the large ribosomal subunit by the Steitz lab (1). It introduces a very tight kink into the axis of helical RNA. It clearly plays an important structural role in RNA, and is significant in many aspects of RNA function including translation, modification and splicing, as well as genetic regulation.

    The sequence of Kt-7, an almost canonical k-turn found in the 50S subunit of the Haloarcula marismortui ribosome.

    The standard k-turn comprises a three-nucleotide bulge flanked on its 3 side by A G and G A basepairs (N-C stem), and on its 5 side by a section of regular basepairing (C stem) (1).

    The structure of a generic k-turn. A schematic of the structure is shown on the left, and the structure of Kt-7 in the H. marismortui ribosome is shown on the right.

    Kt-7 of the 23S rRNA of the H. marismortui ribosome is close to the consensus sequence for k-turns. The structure introduces a pronounced kink in the RNA (from whence its name), with an included angle between the axes of

    50 . The minor grooves of the two helices are juxtaposed, and the conformation is stabilized by interactions between the stacked adenosines of the A G basepairs and the C stem, and by stacking of the 5 and central bases of the bulge on the ends of the C and N-C stems respectively.

    The two A G basepairs at the center of the k-turn. The A G pairs of Kt-7 are shown in the molecular graphics.

    The A G basepairs are highly conserved. Both are trans sugar edge (G) to Hoogsteen edge (A) pairs, linked by potential hydrogen bonds G-N2 to A-N7 and A-N6 to G-N3. The 1b 1n pair is strongly buckled, while the bases of the 2n 2b pair are much closer to coplanarity. In some k-turns, the A-N6 to G-N3 hydrogen bond is not formed in the 2b 2n pair (see below). In the folded structure the minor groove edges of the two A G pairs are juxtaposed with the minor groove of the opposing C helix to participate in A-minor interactions (2). The structural principles of k-turn geometry have been analyzed using isostericity matrices (3).

    Many k-turns are bound by proteins in their natural state, at least some of which stabilize the kinked geometry. This is discussed further below.

    A general nucleotide numbering system for k-turns

    We have devised a universal nomenclature for the nucleotide positions in k-turns (4), thus avoiding the confusion that could arise from the many different numbering systems used in various crystal structures.

    A systematic nomenclature for the nucleotides of a k-turn.

    In this system, the unpaired bulge nucleotides are labelled Lj, where the index j is numbered sequentially from the 5 side. Unpaired nucleotides on the opposite strand (found in a small fraction of k-turns) are designated Lnj, with j increasing 5 to 3 . For all the remaining nucleotides, the two strands are differentiated by the suffix of b for the Bulge-containing strand or n for the norteon-bulged strand. The nucleotides of the non-canonical stem are positively numbered from the first G A mismatch in the 5 to 3 direction relative to the bulged strand, while those of the canonical stem are negatively numbered in the 3 to 5 direction. The numbering system can accommodate loops of different sizes.

    Where are k-turns found ?

    Some k-turns have been identified unequivocally, from their structure en el lugar within crystal structures of larger RNA structures or complexes. Others are assumed by virtue of their sequence, and perhaps their homology with known k-turns in related species. The pronounced kink of the k-turn can also be observed using a variety of biophysical methods, such as FRET (5).

    The k-turn was first identified as a novel motif occurring multiple times in the ribosome (1,6,7). Further examples have been found in mRNA (8-11), and in riboswitches (12-16). They are very commonly found in C/D and H/ACA guide snoRNAs, and U3 snoRNA species (17-25). There is also a near-canonical k-turn in a stem-loop of the human U4 snRNA (26,27).

    Metal ion-induced folding of k-turns

    In order to adopt the tightly-kinked geometry, k-turn motifs require the presence of metal ions (5,27,28), or the binding of proteins (29). In the absence of either of these factors the RNA adopts a conformation that is more extended, like that of any three-nucleotide bulge in a duplex (30). The kinked conformation can be stabilized by addition of either divalent or monovalent metal ions (5), and folding can be treated as a two-state process.

    Ion-induced folding of Kt-7 observed by the increase in fluorescence resonance energy transfer between terminally-attached fluorophores that become closer when the RNA adopts the kink turn conformation.

    Folding is induced by micromolar concentrations of divalent ions, or millimolar concentrations of monovalent ions. For example, FRET analysis reveals that the folding of Kt-7 is achieved with a [Mg 2+ ]1/2 = 80 M, and a [Na + ]1/2 = 30 mM (4).

    There is no evidence for site-specific binding of metal ions to k-turns. It is likely that electrostatic interactions must be screened to allow the folded structure to achieve stability, and this is achieved by an ion atmosphere of loosely bound metal ions.

    This suggests a dynamic character for k-turn structures, where they sample both the kinked and a more extended geometry, consistent with fluorescent lifetime measurements (31). Computer modelling studies have suggested that k-turns undergo hinge-like motions on a fast timescale (32-34).

    Protein binding by k-turn RNA

    The majority of k-turns are known to bind one or more proteins. A few are not, including that found in the SAM riboswitch (12), although it remains possible that in the cellular environment even that too is bound by proteins.

    The archetypal k-turn binding protein is the ribosomal L7Ae and related proteins. These form a family of RNA-binding proteins including the eukaryotic and archaeal proteins L7Ae, L30e and S12e (35), the yeast Nhp2 and Snu13p proteins, and the human 15.5 kDa protein (36). Each of these proteins binds k-turn motifs in RNA, and some functional substitutions are tolerated (21). The assembly of the RNA methylation (box C/D) and pseudouridylation (box H/ACA) nucleoproteins are initiated by the binding of L7Ae-type proteins to k-turns contained within the guide RNA (37,38). The 15.5 kDa protein binds a k-turn of the U4 stem-loop in the U4-U6.U5 tri-snRNP (36). Crystal structures are available for the complexes of Archaeoglobus fulgidus L7Ae and box C/D RNA (22), Methanococcus jannaschii L7Ae and box H/ACA RNA (23) and the human 15.5 kDa protein and the U4 snRNA (26). In each case, the k-turn adopts the tightly-kinked conformation in the complex with the protein.

    Crystal structure of the L7Ae protein complexed with the box C/D k-turn (22).

    Even in the absence of added metal ions, the kinked conformation is induced by the binding of the protein. Moreover, the binding occurs with extremely high affinity. We have measured a dissociation constant of KD = 10 pM for Archeoglobus fulgidus L7Ae binding to Kt-7 (39).

    The binding of L7Ae to Kt-7 observed by FRET. The k-turn becomes folded into the kinked geometry on binding L7Ae, and thus adopting the structure that exhibits high FRET efficiency. Thus the position of equilibrium can be followed in this manner. The data are fitted to a two-state model. However, the binding is so tight that only an upper limit can be measured for the KD. An accurate value was measured using kinetic measurements of association and dissociation rates (39).

    In principle it could be imagined that k-turn folding could be promoted by protein binding in one of two ways, by passive selection of the kinked structure (conformational selection), or a more active process in which the protein manipulates the RNA structure (induced fit). The former requires an equilibrium between extended and folded k-turn structure in solution, as indicated in our measurement of fluorescent lifetimes (40). Real-time binding single-molecule experiments provide no evidence for a more extended intermediate down to a time resolution of 16 ms, supporting the conformational selection model (41).

    Stabilization of k-turn structure by tertiary interactions

    There is a third mechanism of stabilization, arising from longer-range tertiary interactions within the RNA. The k-turn introduces an abrupt transition in helical trajectory in the RNA helix that can be an important element in building the large-scale architecture of large RNA species. This is exemplified by the SAM-I riboswitch, where a long helix (P2) is kinked by a standard k-turn to allow the terminal loop to dock into a receptor in helix P4 (12,14).

    Schematic of the secondary structure of the SAM-I riboswitch. The k-turn is colored in our conventional manner. Note the loop-receptor interaction with the terminal loop of helix P2B.

    This stabilizes the global fold of the riboswitch that creates the binding pocket for its ligand S-adenosyl methionine (SAM - shown in red above), and removal of the k-turn completely prevents SAM binding. Conversely though, the tertiary structure of the RNA stabilizes the local structure of the k-turn. We observed that a G2nA substitution prevented the k-turn from folding as an isolated duplex, yet allowed the riboswitch to retain full function indicative of unperturbed folding (42). Solving the crystal structure of the modified SAM-I riboswitch showed that the k-turn was folded completely normally, despite the presence of an A A pair at the 2b 2n position.

    Crystal structure of the SAM-I riboswitch containing a k-turn that has been modified by a G2nA substitution. A. The 3D structure of the complete riboswitch. B. The structure of the k-turn (colored) superimposed with that of the unmodified sequence (grey).

    We conclude that the free energy of the tertiary interactions in the riboswitch is coupled to the folding of the k-turn so that an intrinsically unstable k-turn can fold normally.

    Thus we see that the folded structure of the k-turn can be stabilized in three ways : 1. By neutralization of charge on addition of metal ions. 2. By the binding of proteins, including members of the L7Ae family. 3. By tertiary interactions within larger RNA species. There is likely to be an interplay between these different processes in larger RNA-protein assemblies.

    Hydrogen bonding interactions that stabilize the kinked geometry

    The majority of k-turns have a G A pair at the 1b 1n position, and an A G pair at the 2b 2n position. Sequence substitution of any of the four nucleotides is usually highly detrimental to folding (5). Both are trans sugar edge (G) to Hoogsteen edge (A) pairs, linked by potential hydrogen bonds G-N2 to A-N7 and A-N6 to G-N3. We have found experimentally that all four hydrogen bonds are important to the stability of the kinked form of the RNA. But the G-N2 to A-N7 hydrogen bonds of the two G A pairs are the most critical to the stability of kinked form of Kt-7 in Mg 2+ ions, so that folding is completely prevented by G to inosine substitutions at either position (39).

    A cartoon summarizing the important hydrogen-bonding interactions involving O2 groups that stabilize the kinked geometry of the k-turn. Hydrogen bonds are indicated by the cyan arrows, with a thickness that reflects their conservation and importance in stabilizing the structure.

    In addition to the bonds linking the G A pairs, a number of critical hydrogen bonds involving O2 groups play a key role in stabilizing the kinked structure. These are summarized in the figure above. The most important are those in the core of the turn, and ribose-phosphate interactions around the bulge. These are strongly conserved in all k-turns, and critical to folding. Of these the single-most important hydrogen bond is one donated from the O2 of L1 ribose to the N1 of the A1n in the kink-proximal A G pair.

    The critical hydrogen bond formed between the O2 of L1 ribose to the N1 of the A1n.

    This is present in all known k-turn structures, and removal of the O2 from L1 completely prevents metal ion-induced folding (4). Another important hydrogen bond stabilizes the tight turn made at the loop of the k-turn. An interaction between the O2 of L3 and the ProS non-bridging O of the phosphate between L1 and L2 bridges the neck of the turn, and is observed in most k-turn crystal structures. Removal of the O2 from L3 ribose in Kt-7 led to marked impairment of ion-induced folding (4).

    Two important hydrogen bonds in the loop, seen here in Kt-7. One is donated from the O2 of L3 to the ProS non-bridging O of the phosphate between L1 and L2. The other is between the O2 of L2 and the ProS O of the L2/L3 phosphate group.

    There is a further key hydrogen bond in the A-minor interaction between the C and NC helices, from the O2' of -1n to the nucleobase of the conserved adenine 2b. However, the acceptor can be N3 or N1, and this divides most of the known k-turn structures into two structural classes (31) . This is also true for the k-turns with an A A pair at the 2b 2n position. The rotation of the adenine nucleobase required to present either N3 or N1 as acceptor affects the basepairing with the base at the 2n position. For example, where this is guanine, the G A pair is bonded by two hydrogen bonds for the N3 class however in the N1 class the A2b N6 to G2n N3 is too long to be considered hydrogen bonded.

    Examples of the N3 and N1 classes of k-turn, showing the A-minor interaction between A2b and the O2' at the -1n position, and the hydrogen bonding between A2b and G2n. The red broken line in Kt-38 indicates an N-N distance of 4.7 , too long to be bonded.

    K-turns that depart from the consensus sequence

    Some k-turns break the rules of the standard motif. We divide these into two classes :
    1. The simple k-turns. These retain the same ordering of key nucleotides with respect to the primary sequence.
    2. The complex k-turns. In these k-turns the key nucleotides do not map onto the primary sequence in a linear way.

    Some of the simple k-turns have sequence changes that alter the seemingly essential G A pairs. This is well exemplified by Kt-23 of the small ribosomal subunit, that exhibits frequent changes from the consensus in the 2n position.

    WebLogo (43) summary of Kt-23 sequences

    In Kt-23 of Thermus thermophilus (6), the 2n nucleotide is uridine, forming a non-Watson-Crick A U pair with A2b. Although making the same change in Kt-7 totally prevents folding from occurring, Kt-23 folds efficiently on addition of magnesium ions, and its structure in the 30S ribosomal subunit is superimposable with that of Kt-7 (44).

    Overlay of the crystal structures of Kt-7 (blue) and Kt-23 (red), showing the closely similar positions of the adenine nucleobases at the 1n and 2b positions.

    A relatively rare subset of Kt-23 sequences have adenine at the 2n position, giving a potential A A pair at the 2b 2n position. One such example is found in Thelohania solenopsae. This can be folded into the k-turn conformation by the binding of L7Ae, or by tertiary interactions in the SAM-I riboswitch (45). The crystal structure of the latter construct shows that the RNA adopts standard k-turn geometry, with the 1n and 2b adenine nucleobases directed into the C helix minor groove as normal, and preservation of the standard hydrogen bonding pattern (45). This is an N1 structure, and consequently there is no hydrogen bond between A2b N6 and A2n N3 (N-N distance 4.7 ).

    The structure of the A2b A2n pair observed in the crystal structure of T. solenopsae Kt-23 (45). The electron density is the calculated composite omit map.

    The complex k-turns exhibit more radical departure from the simple k-turns such as H. marismortui Kt-7, where the key nucleotides appear to be out of order (as in T. thermophilus Kt-11), and can even pass between strands (as in H. marismortui Kt-15).

    The connectivity of the nucleotides in the structures of H. marismortui Kt-15, and T. thermophilus Kt-11.

    Despite the major departures of the sequences from the conventional k-turn, both form standard k-turn structures in the ribosome. We recommend naming the nucleotides according to their location in the structure, rather than their position in the linear sequence. Thus the adenine paired with G2n in Kt-15 is best termed 2b, even though it is covalently located on the non-bulged strand.

    In some species k-turns are functionally replaced by structures that are strongly kinked, yet not k-turns (if we define k-turns by the A G pairs and the juxtaposition of the N and NC helix minor grooves). Por ejemplo, el B. subtilis lysine riboswitch contains a probable k-turn that introduces a kink into the structure required for the tertiary structure (13), yet in Thermatoga maritima this is replaced by a sequence that is plainly not a k-turn (40). The latter may well be a point of flexibility rather than an intrinsic kink, but it functions in a similar manner en el lugar. In another example, RNase P of T. maritima contains a sequence (termed a pk turn) that is kinked similarly to a k-turn (47) , but lacks the G A pairs and cross-strand hydrogen bonding. However the pk-turn and the k-turn are functionally exchangeable between the SAM-I riboswitch and RNase P (40). In the crystal structure of the group I intron ribozyme of Azoarcus, Strobel and colleagues found a sequence that they termed the reverse k-turn (48). This motif has an A A pair at the putative 1b 1n position, and bends in the opposite direction compared to conventional k-turns, so that the major grooves become juxtaposed. We feel that this should not be classified as a k-turn because it lacks all the key elements that define a k-turn.

    A role for k-turns in building complex RNA structures ?

    Kink turns could play a key role in RNA architecture and the biogenesis of large assemblies. This includes the formation of functional RNA-protein complexes such as the box C/D in guided methylation, where the first even is the binding of an L7Ae-related protein to a k-turn. On a larger scale, the ribosome has many k-turns that are bound by a variety of different proteins. The dynamic character of the k-turn should provide opportunity for RNA to explore conformational space, but once folded the tight kink can provide long-range organization of the structure in a delicate interplay between the local structure and tertiary interactions. This may provide flexibility during the assembly of the structure, with subsequent fixation by the high-affinity binding of specific proteins to k-turns.


    Agradecimientos

    We thank K. Makarova for assistance with the PSIBLAST search and S. Gottesman, S. Melamed, M. Raina, T. Updegrove, J. Vogel, and Z. Wroblewska for comments. Research in the M.O. lab is supported by the National Science Centre in Poland (grant no. 2014/15/B/NZ1/03330), KNOW RNA Research Centre in Poznań (grant no. 01/KNOW2/2014), and the Foundation for Polish Science (grant no. TEAM/2011-8/5), co-financed by the European Union Regional Development Fund. Research in the G.S. lab is supported by the Intramural Research Program of the Eunice Kennedy Shriver National Institute of Child Health and Human Development. Los autores declaran no tener ningún conflicto de intereses.

    Tenga en cuenta: El editor no es responsable del contenido o la funcionalidad de la información de apoyo proporcionada por los autores. Cualquier consulta (que no sea contenido faltante) debe dirigirse al autor correspondiente del artículo.


    Ver el vídeo: Clase4b. Motivos, Dominios y estructura terciaria (Diciembre 2022).