Información

¿Cómo se pueden verificar computacionalmente las predicciones informáticas del plegamiento de proteínas?

¿Cómo se pueden verificar computacionalmente las predicciones informáticas del plegamiento de proteínas?


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Actualmente, hay mucha investigación enfocada en resolver los patrones de plegamiento de proteínas utilizando computadoras (Folding @ Home, https://fold.it/portal/, etc.).

La pregunta que tengo es: ¿Cómo sabes cuándo lo haces bien? ¿Hay alguna forma de verificar? en silico, que ha encontrado una estructura legítima / correcta para una proteína?


Visión general

El modelado ha avanzado a pasos agigantados durante la última década y, en muchos casos, ha actuado como un sustituto a veces viable y económico de las estructuras experimentales.

¿Cómo sabes cuando lo haces bien?

En última instancia, uno todavía necesita evidencia experimental para saber cuando un modelo generó en silico es correcto. Pero hay formas de calificar un modelo de cómo probable es tener razón.

¿Existe alguna forma de verificar, in silico, que ha encontrado una estructura legítima / correcta para una proteína?

Hay muchas formas de puntuar y verificar sus modelos. Cada método le dice algo ligeramente diferente sobre los méritos, o la falta de ellos, de su modelo estructural. Algunos están diseñados para eliminar los modelos obviamente horribles y otros le permiten detectar exactamente dónde parece que su modelo es preciso o inexacto.

MODELLER Verificación de salida de modelado de homología sobre la marcha.

Estoy más familiarizado con el modelador para el modelado de homología. Hay otros softwares disponibles y cada uno de ellos es evaluado por CASP cada dos años desde 1994.

En el modelado de homología hay 3 sistemas de puntuación comunes que se pueden usar para evaluar la viabilidad bioquímica de un modelo. Este correo electrónico cubre cuándo usar cada uno. Mi respuesta se expande y explica un poco más.

molpdf es la función objetivo de Modeller. GA341, discutido aquí se deriva de la puntuación Z (calculada con una función potencial estadística), que es una identidad de secuencia de plantilla objetivo y una medida de compacidad estructural. DROGA es un método más actualizado, publicado por primera vez en 2006, y es más fiel a la "viabilidad biológica". De la publicación:

DOPE se basa en un estado de referencia mejorado que corresponde a átomos que no interactúan en una esfera homogénea con el radio dependiente de una estructura nativa de muestra; por lo tanto, explica la forma esférica y finita de las estructuras nativas.

Cuál usar depende de lo que quiera hacer con el modelo, pero de esos tres puntajes, DOPE es el más confiable para separar los modelos nativos de los "señuelos". DOPE suele ser el punto de partida para averiguar qué modelos pueden ser los correctos y qué modelos son simplemente basura.

Nota: Si usa Rosetta, habrá equivalentes a estos, o puede ejecutar sus modelos generados a través de estas técnicas. Si está utilizando SWISS MODEL que viene con sus propias técnicas de verificación de caja negra, pero aún puede exportar el modelo para una verificación adicional.

Verificación general del modelo con datos experimentales.

Una validación adicional de los métodos de modelado de homología u otros modelos estructurales es ProSA. ProSA proporciona una excelente representación visual de dónde se encuentra la puntuación z entre las estructuras cristalinas y de RMN reales. Probablemente hay otros que hacen funciones similares, pero este es mi recurso personal para tener una idea de dónde se encuentra mi estructura entre las estructuras reunidas experimentalmente.

Residuos sensibles mediante verificación de residuos.

Aunque los métodos antes mencionados examinan cada residuo, generalmente dan como resultado una puntuación general. Las puntuaciones de residuos por residuo también están disponibles y requieren mucha interpretación cuidadosa. Por ejemplo, si está analizando la actividad catalítica, es posible que una región de bucle de superficie que puntúe mal no sea un problema, pero un residuo catalítico central que puntúe mal hace que el modelo sea inútil. Esto significa que el hecho de que su modelo tenga una puntuación DOPE general buena (más baja) que otro modelo, no significa que sea necesariamente un modelo más preciso para lo que le interesa.

Hay muchos sistemas de puntuación de modelado sensibles. Algunos de los cuales son XdVal, MTZdump, el famoso aunque de la vieja escuela Trazado de Ramachandran método, pdbU, pdbSNAFU, PROCHECK, Verify3D, y ERRAT para nombrar unos pocos. Cada uno tiene un lugar al comprobar cómo correcto tu modelo es.


En este punto, debe verificarse experimentalmente.

En este trabajo de investigación de foldit, utilizan software y la información del usuario para diseñar esencialmente una versión mejorada de una proteína natural, pero luego fabrican físicamente su nueva proteína y determinan su estructura experimentalmente, utilizando cristalografía de rayos X. En general, utilizan muchas pruebas y errores http://homes.cs.washington.edu/~zoran/foldit-nbt-2012.pdf

Proyectos como este están orientados hacia el objetivo de poder determinar la estructura de una proteína a partir de su secuencia de aminoácidos. en silico. Una vez que logremos esta habilidad, será revolucionaria. Sin embargo, es muy difícil, porque hacer tales predicciones con precisión requeriría el uso de la mecánica cuántica de una manera que es extremadamente difícil de modelar computacionalmente. Estos proyectos utilizan atajos para solucionar este problema, por lo que sus resultados no son muy precisos, pero pueden ser lo suficientemente precisos como para ser útiles, como se muestra en ese documento.


Rediseño por computadora de una vía de plegamiento de proteínas

Una prueba fundamental de nuestra comprensión actual del plegamiento de proteínas es rediseñar racionalmente las vías de plegamiento de proteínas. Usamos una estrategia de diseño basada en computadora para cambiar la vía de plegamiento de la proteína G, que normalmente implica la formación del segundo, pero no del primero, giro β en el paso de limitación de la velocidad en el plegado. Se identificaron las conformaciones de la columna vertebral y las secuencias de aminoácidos que maximizan la densidad de interacción en la primera horquilla β, y se encontró que dos variantes que contienen 11 reemplazos de aminoácidos son ∼ 4 kcal mol -1 más estables que la proteína G de tipo salvaje. Los estudios cinéticos muestran que las proteínas rediseñadas se pliegan ∼ 100 veces más rápido que la proteína de tipo salvaje y que se forma el primer giro β y se rompe el segundo en el paso de limitación de velocidad en el plegamiento.


Abstracto

La predicción de las tasas de plegamiento de proteínas a partir de secuencias de aminoácidos es uno de los desafíos más importantes en biología molecular. En este trabajo, he relacionado las tasas de plegamiento de proteínas con las propiedades físico-químicas, energéticas y conformacionales de los residuos de aminoácidos. Encontré que la clasificación de proteínas en diferentes clases estructurales muestra una excelente correlación entre las propiedades de los aminoácidos y las tasas de plegamiento de las proteínas de dos y tres estados, lo que indica la importancia de la topología del estado nativo para determinar las tasas de plegamiento de las proteínas. He formulado un modelo de regresión lineal simple para predecir las tasas de plegamiento de proteínas a partir de secuencias de aminoácidos junto con información de clase estructural y obtuve una excelente concordancia entre las tasas de plegamiento de proteínas predichas y observadas experimentalmente; los coeficientes de correlación son 0,99, 0,96 y 0,95, respectivamente, para proteínas de clase todo-α, todo-β y mixtas. Este es el primer método disponible, que es capaz de predecir las tasas de plegamiento de proteínas solo a partir de la secuencia de aminoácidos con la ayuda de las propiedades genéricas de los aminoácidos y la información de clases estructurales.

Teléfono del autor para correspondencia: + 81-3-3599-8046 fax: + 81-3-3599-8081 correo electrónico: [email & # 160protected]


EL CÓDIGO PLEGABLE: ¿QUÉ EQUILIBRIO DE FUERZAS CODIFICA LAS ESTRUCTURAS NATIVAS?

Hipótesis termodinámica de Anfinsen & # x02019s

Un hito importante en la ciencia de las proteínas fue la hipótesis termodinámica de Christian Anfinsen y colegas (3, 92). A partir de sus ahora famosos experimentos sobre ribonucleasa, Anfinsen postuló que la estructura nativa de una proteína es la estructura termodinámicamente estable; depende solo de la secuencia de aminoácidos y de las condiciones de la solución, y no de la ruta de plegamiento cinético. Se apreció ampliamente que la estructura nativa no depende de si la proteína se sintetizó biológicamente en un ribosoma o con la ayuda de moléculas chaperonas, o si, en cambio, la proteína simplemente se replegó como una molécula aislada en un tubo de ensayo. [Sin embargo, existen raras excepciones, como la insulina, la proteasa lítica & # x003b1 (203) y las serpinas (227), en las que la forma biológicamente activa queda atrapada cinéticamente]. Se siguen dos conclusiones poderosas del trabajo de Anfinsen & # x02019. Primero, permitió la gran empresa de investigación del plegamiento de proteínas in vitro que ha llegado a comprender las estructuras nativas mediante experimentos dentro de tubos de ensayo en lugar de dentro de las células. En segundo lugar, el principio de Anfinsen implica una especie de división del trabajo: la evolución puede actuar para cambiar una secuencia de aminoácidos, pero el equilibrio de plegamiento y la cinética de una secuencia dada son entonces cuestiones de química física.

¿Una fuerza impulsora dominante o muchas pequeñas?

Antes de mediados de la década de 1980, el código de plegamiento de proteínas era una suma de muchas interacciones pequeñas diferentes, como enlaces de hidrógeno, pares de iones, atracciones de van der Waals e interacciones hidrófobas mediadas por agua. Una idea clave fue que la secuencia primaria codificaba estructuras secundarias, que luego codificaban estructuras terciarias (4). Sin embargo, a través del modelado mecánico estadístico, surgió una visión diferente en la década de 1980, a saber, que hay un componente dominante en el código de plegado, que es la interacción hidrofóbica, que el código de plegado se distribuye tanto local como no localmente en la secuencia, y que la estructura secundaria de una proteína es tanto una consecuencia de la estructura terciaria como una causa de ella (48, 49).

Debido a que las proteínas nativas son solo 5 & # x0201310 kcal / mol más estables que sus estados desnaturalizados, está claro que ningún tipo de fuerza intermolecular puede despreciarse en la predicción de plegamiento y estructura (238). Aunque sigue siendo un desafío separar de una manera limpia y rigurosa algunos tipos de interacciones de otros, estas son algunas de las principales observaciones. No es probable que el plegamiento esté dominado por interacciones electrostáticas entre cadenas laterales cargadas porque la mayoría de las proteínas tienen relativamente pocos residuos cargados y se concentran en regiones de alto dieléctrico en la superficie de la proteína. Las estabilidades de las proteínas tienden a ser independientes del pH (casi neutro) y la concentración de sal, y las mutaciones de carga típicamente conducen a pequeños efectos sobre la estructura y la estabilidad. Las interacciones de enlaces de hidrógeno son importantes, porque esencialmente todas las posibles interacciones de enlaces de hidrógeno generalmente se satisfacen en estructuras nativas. Los enlaces de hidrógeno entre los grupos amida y carbonilo de la cadena principal son componentes clave de todas las estructuras secundarias, y los estudios de mutaciones en diferentes disolventes estiman que su fuerza es de alrededor de 1 & # x020134 kcal / mol (21, 72) o más fuerte (5, 46). De manera similar, el empaquetamiento estrecho en las proteínas implica que las interacciones de van der Waals son importantes (28).

Sin embargo, la cuestión del código de plegamiento es si existe un factor dominante que explique por qué dos proteínas cualesquiera, por ejemplo, lisozima y ribonucleasa, tienen estructuras nativas diferentes. Este código debe escribirse en las cadenas laterales, no en el enlace de hidrógeno de la columna vertebral, porque es a través de las cadenas laterales que una proteína se diferencia de otra. Existe evidencia considerable de que las interacciones hidrofóbicas deben desempeñar un papel importante en el plegamiento de proteínas. (a) Las proteínas tienen núcleos hidrófobos, lo que implica que los aminoácidos apolares se secuestran del agua. (B) Los estudios de compuestos modelo muestran 1 & # x020132 kcal / mol para transferir una cadena lateral hidrófoba del agua a un medio similar al aceite (234), y hay muchos de ellos. (C) Las proteínas se desnaturalizan fácilmente en disolventes apolares. (D) Las secuencias que se mezclan y conservan solo su patrón hidrofóbico y polar correcto se pliegan a sus estados nativos esperados (39, 98, 112, 118), en ausencia de esfuerzos para diseñar empaquetamiento, cargas o enlaces de hidrógeno. Los patrones hidrófobos y polares también parecen ser una clave para la codificación de estructuras fibrilares de tipo amiloide (236).

¿Qué estabiliza las estructuras secundarias? Antes de que se conociera la estructura de una proteína, Linus Pauling y sus colegas (180, 181) dedujeron de los modelos de enlaces de hidrógeno que las proteínas podrían tener hélices & # x003b1. Sin embargo, las estructuras secundarias rara vez son estables por sí solas en solución. Aunque diferentes aminoácidos tienen diferentes propensiones energéticas a estar en estructuras secundarias (6, 41, 55, 100), también hay muchas secuencias de & # x0201cchameleon & # x0201d en proteínas naturales, que son segmentos de péptidos que pueden asumir tanto helicoidales como & # x003b2 conformaciones dependiendo de su contexto terciario (158, 162). Los estudios de modelos de celosía (25, 29, 51) y modelos de tubo (11, 12, 159) han demostrado que las estructuras secundarias en las proteínas se estabilizan sustancialmente por la compacidad de la cadena, una consecuencia indirecta de la fuerza hidrófoba para colapsar (Figura 1). Al igual que las líneas de seguridad de los aeropuertos, las configuraciones helicoidales y de láminas son las únicas formas regulares de empaquetar una cadena lineal (de personas o monómeros) en un espacio reducido.

(a) Código binario. Los experimentos muestran que un código polar hidrófobo principalmente binario es suficiente para plegar las proteínas del haz de hélice (112). Reimpreso de la Referencia 112 con permiso de AAAS.

(B) La compacidad estabiliza la estructura secundaria, en proteínas, a partir de modelos de celosía. (C) Panel de soporte de experimentos B, mostrando que la compacidad se correlaciona con el contenido de estructura secundaria en estados no nativos de muchas proteínas diferentes (218). Reimpreso de la Referencia 218 con permiso.

Diseño de nuevas proteínas y foldameros no biológicos

Aunque nuestro conocimiento de las fuerzas de plegamiento sigue siendo incompleto, no ha obstaculizado la aparición de un diseño práctico de proteínas exitoso. Las nuevas proteínas ahora se diseñan como variantes de proteínas existentes (43, 94, 99, 145, 173, 243), o de alfabetos ampliados de aminoácidos no naturales (226), o de novo (129) (Figura 2). Además, los códigos de plegado se utilizan para diseñar nuevos materiales poliméricos denominados plegables (76, 86, 120). Los paquetes de hélice plegados ahora se han diseñado utilizando columnas vertebrales no biológicas (134). Los foldamers están encontrando aplicaciones en biomedicina como antimicrobianos (179, 185), reemplazos de surfactantes pulmonares (235), inhibidores de citomegalovirus (62) y agentes de administración de ARNip (217). Por lo tanto, las cuestiones de principios profundos ya no son cuellos de botella para diseñar polímeros plegables para aplicaciones prácticas y nuevos materiales.

(a) Un nuevo pliegue de proteína, llamado Top7, diseñado por Kuhlman et al. (129). Molécula diseñada (azul) y la estructura experimental determinada posteriormente (rojo). De la Referencia 129 reimpresa con permiso de AAAS. (B) Se han fabricado foldadores de haz de tres hélices utilizando cadenas principales no biológicas (peptoides, es decir, glicinas N-sustituidas).

(C) Su desnaturalización por alcoholes indica que tienen núcleos hidrófobos característicos de una molécula plegada (134).


No, DeepMind no ha resuelto el plegamiento de proteínas

Esta semana DeepMind ha anunciado que, utilizando inteligencia artificial (IA), ha resuelto el problema de 50 años del "plegamiento de proteínas". El anuncio se realizó cuando se publicaron los resultados del 14º y último concurso sobre la Evaluación crítica de técnicas para la predicción de la estructura de proteínas (CASP14). La competencia enfrenta a equipos de científicos computacionales entre sí para ver cuál es el mejor método para predecir las estructuras de las moléculas de proteínas, y la solución de DeepMind, "AlphaFold 2", surgió como el claro ganador.

No crea todo lo que lee en los medios

Siguieron muchos informes sin aliento en los medios de comunicación de que la IA ahora se puede usar para predecir con precisión las estructuras de las proteínas, la maquinaria molecular de todos los seres vivos. Anteriormente, el laborioso trabajo experimental de resolver estructuras de proteínas era el dominio de los cristalógrafos de proteínas, los espectroscopistas de RMN y los microscopistas crioelectrónicos, que trabajaron durante meses y, a veces, años para elaborar cada nueva estructura.

¿Debería el experimentalista ahora abandonar el laboratorio y dejar el campo a Deep Mind?

No, no deberían, por varias razones.

En primer lugar, no hay duda de que DeepMind ha dado un gran paso adelante. De todos los equipos que compiten entre sí, están tan por delante del resto que los demás modeladores computacionales pueden estar pensando en darse por vencidos. Pero todavía no estamos en el punto en el que podamos decir que el plegamiento de proteínas está "resuelto". Por un lado, solo dos tercios de las soluciones de DeepMind eran comparables a la estructura de la proteína determinada experimentalmente. Esto es impresionante, pero debe tener en cuenta que no sabían exactamente qué dos tercios de sus predicciones estaban más cerca de ser correctas hasta que se realizó la comparación con las soluciones experimentales. * ¿Compraría un navegador con solo un 67% de precisión?

Por eso se requiere una dosis de realismo. También es difícil ver en este momento, a pesar del impresionante desempeño de DeepMind & # 8217, que esto transformará inmediatamente la biología.

Impresionantes predicciones & # 8211 pero ¿cómo sabes que & # 8217 son correctas?

Alphafold 2 sin duda ayudará a avance biología. Por ejemplo, como ya se informó, puede generar predicciones de estructura plegada que luego se pueden utilizar para resolver estructuras experimentales mediante cristalografía (y probablemente otras técnicas). Así que esto ayudará a que la ciencia de la determinación de estructuras vaya un poco más rápido en algunos casos.

Sin embargo, a pesar de algunas de las afirmaciones que se hacen, no estamos en el punto en el que esta herramienta de inteligencia artificial pueda utilizarse para el descubrimiento de fármacos. Para las predicciones de estructura de DeepMind & # 8217s (111 en total), el promedio o la diferencia cuadrática media (RMSD) en las posiciones atómicas entre la predicción y la estructura real es 1.6 Å (0.16 nm). Eso es aproximadamente del tamaño de un enlace.

Eso suena bastante bien, pero no está claro en el anuncio de DeepMind cómo se calcula ese número. Eso podría calcularse únicamente comparando las posiciones de los átomos de carbono alfa en la estructura de la proteína, una forma razonable de estimar la precisión del pliegue total de la proteína. O podría calcularse sobre todas las posiciones atómicas, una prueba mucho más rigurosa. Si es lo último, entonces un RMSD de 1.6 Å es un resultado aún más impresionante.

Pero todavía no es lo suficientemente bueno como para brindar información confiable sobre la química de las proteínas o el diseño de fármacos. Para hacer eso, queremos tener confianza en las posiciones atómicas dentro de un margen de alrededor de 0,3 Å. La mejor predicción de AlphaFold 2 & # 8217s tiene un RMSD para todos los átomos de 0,9 Å. Muchas de las predicciones que contribuyen a su promedio de 1,6 Å tendrán desviaciones en las posiciones atómicas incluso mayores que eso. Entonces, a pesar de las afirmaciones, aún no estamos listos para usar Alphafold 2 para crear nuevos medicamentos.

Hay otras razones para no creer que el problema del plegamiento de proteínas esté "resuelto" # 8217. Los métodos de IA se basan en aprender las reglas del plegamiento de proteínas a partir de estructuras proteicas existentes. Esto significa que puede resultar más difícil predecir las estructuras de proteínas con pliegues que no están bien representados en la base de datos de estructuras resueltas.

Además, como se informó en Nature, el método aún no puede abordar de manera confiable las predicciones de proteínas que son componentes de complejos de múltiples proteínas. Estas se encuentran entre las entidades biológicas más interesantes de los seres vivos (por ejemplo, ribosomas, canales iónicos, polimerasas). Así que queda un territorio bastante grande donde AlphaFold 2 no puede llevarnos. Los experimentadores, que han logrado delinear las estructuras de complejos de creciente complejidad, aún tienen mucho trabajo valioso por hacer.

Si bien se supone que todo lo anterior suena como una nota de precaución para contrarrestar algunas de las afirmaciones más hiperbólicas que se han escuchado en los medios de comunicación en los últimos días, todavía quiero enfatizar mi admiración por los logros del equipo AlphaFold. Claramente, han logrado un avance muy significativo.

Ese avance será mucho más claro una vez que se publique su artículo revisado por pares (no debemos juzgar la ciencia por comunicados de prensa), y una vez que la herramienta esté abiertamente disponible para la comunidad académica, o incluso para cualquier persona que quiera estudiar la estructura de las proteínas.

Actualización (02 de diciembre, 18:43): Esta publicación se actualizó para proporcionar una explicación más clara de las medidas de RMSD utilizadas para comparar estructuras de proteínas predichas y determinadas experimentalmente. Estoy muy agradecido con el profesor Leonid Sazanov, quien señaló algunas correcciones y adiciones necesarias en Twitter.

* Actualización (12 de diciembre, 15:35): Estrictamente esto es cierto, pero pasa por alto el punto más importante de que la puntuación otorgada a cada predicción de estructura (GDT_TS) se correlaciona ampliamente con la cercanía de su coincidencia con la estructura experimental. Como resultado, he eliminado mi crack de SatNav.

Para una evaluación profundamente informada y muy mesurada de lo que DeepMind realmente ha logrado en CASP14, lea esta publicación de blog del Prof. Mohammed AlQuraishi, quien conoce este territorio mucho mejor que yo. Su publicación es bastante larga, pero puede omitir los bits técnicos que explican cómo funciona AlphaFold 2. Da una muy buena explicación de la naturaleza del avance de DeepMind en el punto de vista de AlQuraishi, AlphaFold 2 representa una solución al problema de predicción de la estructura de la proteína, aunque tiene cuidado de definir lo que quiere decir con una solución. También reconoce que aún quedan algunas mejoras significativas por hacer en el programa, pero las considera más un desafío de ingeniería que científico. Está de acuerdo en que AlphaFold 2 no se utilizará pronto para trabajos de diseño de fármacos. AlQuraishi también ofrece una excelente descripción general de las implicaciones de este trabajo para las carpetas de proteínas, los biólogos estructurales y los biotecnólogos en general, y ofrece algunas ideas muy interesantes sobre las diferencias entre el enfoque de investigación de DeepMind & # 8217 y el de los grupos académicos más tradicionales.


Tocado de villin

Uno de los ejemplos mejor estudiados de proteínas de plegado rápido, se sabe que el casco de villina de tipo salvaje se pliega en 4-5 microsegundos, además, existe un mutante de plegado rápido que se pliega en menos de un microsegundo. El casco de villin ha sido el objetivo de una amplia variedad de esfuerzos experimentales y computacionales para caracterizar su plegado, sin embargo, en la actualidad, ninguna predicción a escala atómica con respecto al mecanismo de plegado del casco de villin ha sobrevivido al escrutinio experimental y, por lo tanto, los detalles del plegado de este sistema modelo aparentemente simple sigue siendo desconocido. Parte del desafío en el estudio computacional del plegamiento de villines es sin duda una cuestión de recursos, incluso para este sistema bastante pequeño, hasta hace poco no se habían obtenido trayectorias de plegado de longitud completa.

Hemos realizado una serie de simulaciones MD del plegado del casco de villin en disolvente explícito para estudiar el mecanismo de plegado de villin y comprender cómo se acelera el plegado en el mutante de plegado rápido. En tres trayectorias separadas (películas: 1, 2, 3) se encontró que la villina de tipo salvaje se pliega después de 5-8 microsegundos, estas trayectorias representan las primeras simulaciones MD de solvente explícito de todos los átomos de plegamiento de villina en escalas de tiempo realistas. Las primeras etapas del plegamiento fueron muy diferentes entre las trayectorias, explorando una variedad de diferentes conformaciones no nativas en cada caso. Cerca del final, sin embargo, todas las trayectorias llegan a un camino común: todos los elementos de la estructura secundaria de la forma de la proteína, pero llegan a una conformación en la que una de las hélices se voltea en relación con el resto de la proteína (pasos clave en la transición se muestran a continuación). El plegado solo puede ocurrir después de que las hélices se disocian completamente entre sí y luego se vuelven a unir en las orientaciones correctas (es decir, plegadas). Los resultados de una trayectoria de ejemplo, que se muestra a la derecha, ilustran el plegado a un estado nativo en 5,5 microsegundos. La trayectoria de plegamiento constante seguida por las trayectorias de villin al final del plegamiento concuerda con los hallazgos experimentales de que una sola transición limitante de velocidad domina el plegamiento de la proteína y proporciona información sobre la naturaleza de esta transición que es imposible de obtener por otros medios. Basándonos en las simulaciones, pudimos identificar un conjunto de mutaciones en la hélice volteada que desestabilizaría el intermedio de plegado atrapado y, por lo tanto, se espera que acelere el plegado.

Pasos clave en la transición de la estructura volteada a la doblada en una simulación de plegado de villin WT. Haga clic para obtener una imagen a tamaño completo.

Un mutante de villina de plegado rápido


La IA hace un sorprendente avance en el plegamiento de proteínas & # 8212, pero no todos los investigadores están convencidos

Dentro de cada cuerpo biológico, hay miles de proteínas, cada una retorcida y doblada en una forma única. La formación de estas formas es crucial para su función, y los investigadores han luchado durante décadas para predecir exactamente cómo se producirá este plegado.

Ahora, AlphaFold (la misma IA que dominó los juegos de ajedrez y Go) parece haber resuelto este problema, esencialmente allanando el camino para una nueva revolución en biología. Pero no todo el mundo lo está comprando.

Una predicción de AlphaFold frente a la realidad.

Cual es el gran problema

Las proteínas son esenciales para la vida y respaldan prácticamente todas sus funciones, se lee en una publicación del blog de DeepMind. La investigación de inteligencia artificial (IA) británica del laboratorio propiedad de Google se hizo famosa en los últimos años cuando su algoritmo se convirtió en el mejor jugador de ajedrez del planeta, e incluso superó a los humanos en Go & # 8212, una hazaña que antes se creía imposible. Después de jugar con algunos juegos más, el equipo de DeepMind puso sus ojos en una tarea de la vida real: el plegamiento de proteínas.

En 2018, el equipo anunció que AlphaFold 2 (la segunda versión del algoritmo de plegamiento de proteínas) se ha vuelto bastante bueno para predecir las formas 3D de las proteínas, superando a todos los demás algoritmos. Ahora, dos años después, el algoritmo parece haberse perfeccionado aún más.

En una competencia global llamada Evaluación crítica de la predicción de la estructura de las proteínas, o CASP, AlphaFold 2 y otros sistemas reciben las cadenas de aminoácidos de las proteínas y se les pide que predigan su forma. Los organizadores del concurso ya conocen la forma real de la proteína, pero, por supuesto, la mantienen en secreto. Luego, la predicción se compara con los resultados del mundo real. El CEO de DeepMind, Demis Hassabis, llama a esto las “Olimpiadas del plegamiento de proteínas” en un video.

AlphaFold lo clavó. No todas sus predicciones fueron acertadas, pero todas estuvieron muy cerca & # 8212 fue lo más cercano a la perfección jamás visto desde el lanzamiento de CASP.

"Los modelos asombrosamente precisos de AlphaFold nos han permitido resolver una estructura de proteína en la que estuvimos atrapados durante casi una década", dijo Andrei Lupas, director del Instituto Max Planck de Biología del Desarrollo y evaluador de CASP, en el blog DeepMind.

CASP utiliza la métrica "Prueba de distancia global (GDT)", que evalúa la precisión de 0 a 100. AlphaFold 2 logró una puntuación media de 92,4 en todos los objetivos, lo que se traduce en un error medio de aproximadamente 1,6 Angstroms, o aproximadamente el ancho de un átomo. .

Las mejoras han sido lentas en la competencia de plegamiento de proteínas. Créditos de imagen: DeepMind.

No es perfecto. Incluso un Angstrom puede ser un gran error y hacer que la proteína sea inútil, o incluso peor. Pero el hecho de que esté tan cerca sugiere que hay una solución a la vista. El problema ha parecido irresoluble durante tanto tiempo que los investigadores estaban comprensiblemente entusiasmados.

& # 8220 Hemos estado estancados en este único problema, cómo se pliegan las proteínas, durante casi 50 años. Ver a DeepMind producir una solución para esto, después de haber trabajado personalmente en este problema durante tanto tiempo y después de tantas paradas y arranques, preguntándonos si alguna vez llegaríamos allí, es un momento muy especial. & # 8221

Por qué el plegamiento de proteínas es tan importante

Un equipo de investigación puede tardar años en identificar la forma de las proteínas individuales & # 8212 y estas formas son cruciales para la investigación biológica y el desarrollo de fármacos.

La forma de una proteína está estrechamente relacionada con la forma en que funciona. Si comprende su forma, también tendrá una idea bastante clara de cómo funciona.

Tener un método para predecir esto rápidamente y sin un trabajo arduo y extenso podría marcar el comienzo de una revolución en la biología. No es solo el desarrollo de nuevos medicamentos y tratamientos, aunque eso sería suficiente motivación. El desarrollo de enzimas que podrían descomponer el plástico, la producción de biocombustibles e incluso el desarrollo de vacunas podrían acelerarse drásticamente mediante algoritmos de predicción de plegamiento de proteínas.

Esencialmente, el plegamiento de proteínas se ha convertido en un cuello de botella para la investigación biológica, y es exactamente el tipo de campo en el que la IA podría marcar una gran diferencia, abriendo nuevas posibilidades que parecían imposibles incluso hace unos años.

En un nivel más fundamental, dominar el plegamiento de proteínas puede incluso acercarnos a comprender los bloques de construcción biológicos que componen el mundo. El profesor Andrei Lupas, director del Instituto Max Planck de Biología del Desarrollo y evaluador del CASP, comentó que:

"Los modelos asombrosamente precisos de AlphaFold nos han permitido resolver una estructura de proteína en la que estuvimos atrapados durante casi una década, relanzando nuestro esfuerzo por comprender cómo se transmiten las señales a través de las membranas celulares".

Por que no todo el mundo esta convencido

Francamente, el bombo publicitario no le sirve a nadie. DeepMind ahora nunca podrá cumplir la promesa que se hizo y que ha arrastrado a los experimentadores por el barro en el proceso. Además, hasta que DeepMind comparta su código, a nadie en el campo le importa y solo ellos se dan palmaditas en la espalda.

& mdash Mike Thompson (@mctucsf) 1 de diciembre de 2020

El anuncio de los logros de DeepMind & # 8217 envió ondas en el mundo de la ciencia, pero no todos estaban emocionados. Un puñado de investigadores planteó el hecho de que el hecho de que funcione en el entorno CASP no significa realmente que funcionará en la vida real, donde las posibilidades son mucho más variadas.

En declaraciones a Business Insider, Max Little, profesor asociado y conferencista principal de informática en la Universidad de Birmingham, expresó su escepticismo sobre las aplicaciones del mundo real. El profesor Michael Thompson, un experto en biología estructural de la Universidad de California, recurrió a Twitter para expresar lo que considera una exageración injustificada (ver más arriba), señalando que el equipo de DeepMind no ha & # 8217t compartido su código, y no ha & # 8217t incluso publicó un artículo científico con los resultados. Thompson dijo & # 8220el avance en la predicción es impresionante & # 8221. Añadió: & # 8220 Sin embargo, dar un gran paso adelante no es lo mismo que & # 8216solver & # 8217 un problema de décadas en biología y física química & #. 8221

Lior Pachter, profesor de biología computacional en el Instituto de Tecnología de California, se hizo eco de estos sentimientos. Es un paso importante, argumentó, pero el plegamiento de proteínas no se resuelve de ninguna manera.

Un amigo (que no trabaja en ciencias) me preguntó hoy si es cierto que "se ha resuelto el plegamiento de proteínas". Mi respuesta corta:

El método AlphaFold produjo resultados muy impresionantes en CASP14. El plegamiento de proteínas no es un problema resuelto. pic.twitter.com/ZMc4grC5iP

& mdash Lior Pachter (@lpachter) 1 de diciembre de 2020

Queda por ver qué tan grande es este logro, pero es importante sin importar cómo se mire. No está del todo claro en este momento si se trata de un trampolín o de un verdadero avance, pero los investigadores seguramente ayudarán a aclarar esto lo más rápido posible.

Mientras tanto, si desea tener una visión más profunda de cómo nació y se desarrolló AlphaFold, aquí tiene un video que seguramente lo hará sentir bien:


Computer simulation explains folding in cellular protein

Athens, Ga. – Most parts of living organisms come packaged with ribbons. The ribbons are proteins-chains of amino acids that must fold into three-dimensional structures to work properly. But when for any reason the ribbons fold incorrectly, bad things can happen, and in humans misfolded-protein disorders include Alzheimer’s and Parkinson’s diseases.

Scientists have for the past three decades tried to understand what makes proteins fold into functional units and why it happens, and several breakthroughs have occurred through computer modeling-a field that dramatically increases analytical speed.

Now, scientists at the University of Georgia have created a two-step computer simulation (using an important process called the Wang-Landau algorithm) that sheds light on how a crucial protein-glycophorin A-becomes an active part of living cells. The new use of Wang-Landau could lead to a better understanding of the controlling mechanisms behind protein folding.

“Our goal is to present the methodology in a clear, self-consistent way, accessible to any scientist with knowledge of Monte Carlo simulations,” said David Landau, distinguished research professor of physics at the University of Georgia and director of the Center for Simulational Physics.

The research was just published in La Revista de Física Química. Authors of the paper are Clare Gervais and Thomas Wüst, formerly of UGA and now employed in Switzerland Landau, and Ying Xu, Regents-Georgia Research Alliance Eminent Scholar and professor of bioinformatics and computational biology, also at UGA. The research was supported by grants from the National Institutes of Health and the National Science Foundation. Landau and Xu are in UGA’s Franklin College of Arts and Sciences.

“This work demonstrates the power and potential of combining expertise from computational physics and computational biology in solving challenging biological problems,” said Xu.

Monte Carlo simulations-the use of algorithms with repeated random samplings to produce reliable predictions-have been around for some decades but have been steadily refined. These simulations are useful for extremely complex problems with multiple variables, and though they often require considerable computer “brain power,” they are able to give scientists startlingly accurate predictions of how biological processes work.

In the current paper, the research team developed a two-step Monte Carlo procedure to investigate, for glycophorin A (GpA), an important biochemical process called dimerization. (A dimer in biology or chemistry consists of two structurally similar units that are held together by intra- or intermolecular forces.)

“One particularly promising approach is to investigate the thermodynamics of protein folding through examining the energy landscape,” Landau explained. “By doing this, we can learn about the characteristics of proteins including possible folding pathways and folding intermediates. Thus, it allows us to bridge the gap between statistical and experimental results.”

Unfortunately, so much is happening physically and biochemically as proteins fold into their functional shapes (called the native state) that the problems must be broken down one by one and studied. That led the team to a question: Could they use a Monte Carlo Simulation along with the Wang-Landau algorithm to discover an efficient simulation method capable of sampling the energy density states that allow such folding?

Perhaps remarkably, they did. The first step in studying the dimerization process was to estimate those states in GpA using Wang-Landau. The second step was to sample various energy and structural “observables” of the system to provide insights into the thermodynamics of the entire system.

The results could be broadly applied to many fields of protein-folding studies that are important to understanding-and treating-certain diseases. (Wang-Landau, named for David Landau and Fugao Wang, is a Monte Carlo algorithm that has proved to be useful in studying a variety of physical systems. Wang was a doctoral student at UGA and now works for the Intel Corp.)

GpA is a 131-amino acid protein that spans the human red-blood cell membrane and is crucial in cell procedures. Because it has been studied in depth for many years, it also serves as an important model system for how similar systems work. That’s why the new simulation may open doors in many other areas of inquiry.

“The main advantage of this two-step approach lies in its flexibility as well as its generality,” said Landau. “This method is widely applicable to any study of biological systems, such as the folding process of soluble proteins, polymers, DNA or protein complexes. Therefore, it is an excellent alternative to other simulation methods used traditionally in the field of protein-folding thermodynamics.”

In the current study, the team discovered something generally important about membrane proteins in general, too. They found that unlike some proteins for which folding is mainly governed by their attraction to or repulsion by water, the process in GpA is driven by a subtle interplay between multiple types of interactions.


Part B: How to (almost) Fold (almost) Anything

In this part you will be folding protein sequences into 3D structures. The goal is to get an understanding on how computational protein modeling works as well as to see first hand the great computing power needed for molecular simulations in biology.

For questions 1 and 2 you will be using the Python version of the Rosetta protein structure prediction software, while for question 3 (extra credit) you can use any of the available software listed in the resources.

The files for this exercise are available to clone or download from the followign GitHub repository: https://github.com/thrakar9/protein_folding_workshop.

Preguntas

Folding a small (30 aa) peptide. Follow the "Setting up PyRosetta" instructions below and make sure you have a working PyRosetta installation.

una. Open the "Protein Folding with Pyrosetta" Jupyter notebook. Execute interactively the code in the notebook and answer the questions therein. When you are done, save the notebook (with the answers and all outputs) to an HTML file, and link it to your class page.

B. Pick the lowest energy model and structurally (visually) compare it to the native. How close is it to the native? If its different, what parts did the computer program get wrong? Nota: To compare the structures you have first to align them to the native. You can do that very easily in PyMOL. Here is a short video tutorial on aligning structures with PyMOL

C. Pick the lowest RMSD model and structurally compare it to the native. How close is it to the native? If its different than the lowest energy model, how is it different? Remember that in a blind case, we will not have the benefit of an RMSD column.

Fold your own sequence! In question 1 we used the sequence from a human protein as input to the folding algorithm. Yet, in principle, you can give any arbitrary sequence of amino acids as an input.

una. Use any process to create a sequence of 30-50 amino acids, and predict it's 3D structure using the notebook from Q1. You can try to run the script with multiple parameter combinations and compare the results. Log the parameters that had the best outcome.

B. Compare the resulting structures of 2(a) with those from question 1. Do the structures in both cases look protein-like ? If not, can you think of an explanation?

C. Try folding multiple sequences to come up with the most protein-looking structure!

Folding protein homologs (extra credit) For this exercise you will be running multiple protein folding simulations. If you don't have access to a powerful machine, use any of the folding servers listed in the resources.

una. Take the protein sequence from question 1 and randomly change 5 letters to any other amino acid. Predict the protein structure of the unedited (probably done already in Q.1) and edited protein and compare the results. Did the changes you introduced changed the structure significantly?

B. Take again the original sequence from Q.1 and now change 5 letters to favorable alternatives according to the BLOSUM matriz. Predict the protein structure for the new sequence and compare with the results of 3(a). Did the new changes have the same effect to the structure?

C. Usando el BLOSUM matrix as a guide, try to introduce as many changes as possible to the protein sequence, without significantly changing it's structure.


How can computer predictions of protein folding be verified computationally? - biología

Interplay between accurate protein structure prediction and successful de novo protein design.

Reviews current state-of-the-art structural protein prediction methods and challenges.

Reviews features of successful de novo protein designs.

Biotechnology applications in therapeutics, biocatalysts, and nanomaterials are summarized.

In the postgenomic era, the medical/biological fields are advancing faster than ever. However, before the power of full-genome sequencing can be fully realized, the connection between amino acid sequence and protein structure, known as the protein folding problem, needs to be elucidated. The protein folding problem remains elusive, with significant difficulties still arising when modeling amino acid sequences lacking an identifiable template. Understanding protein folding will allow for unforeseen advances in protein design often referred to as the inverse protein folding problem. Despite challenges in protein folding, de novo protein design has recently demonstrated significant success via computational techniques. We review advances and challenges in protein structure prediction and de novo protein design, and highlight their interplay in successful biotechnological applications.



Comentarios:

  1. Riddoc

    Considero, que estás equivocado. Propongo discutirlo.

  2. Chicahua

    Soy finito, pido disculpas, pero en mi opinión este tema ya está desactualizado.

  3. Mukhwana

    genial todo

  4. Malakus

    El blog es genial, ¡se lo recomendaré a todos los que conozco!



Escribe un mensaje