¿Por qué es tan difícil predecir el plegamiento de proteínas?

Hay dos problemas fundamentales que está preguntando al mismo tiempo.

Estructura de predicción de proteínas : es la tarea de predecir la forma de la estructura final plegada (utilizando la estructura de rayos X / RMN como punto de referencia). Estos enfoques suelen utilizar algún tipo de alineación heurística / estructural. Rosetta (Baker Lab) utiliza un enfoque basado en fragmentos que, para resumir, trata de reconstruir una estructura de proteínas utilizando una biblioteca masiva de fragmentos de péptidos. Por lo general, a las personas en este campo realmente no les importa cómo una proteína llega a su estado final.

Simulación de plegamiento de proteínas : es un problema muy diferente y, en cierto sentido, puede verse como un superconjunto del problema anterior. Es decir, si uno puede plegar por completo una proteína en un tiempo razonable, entonces obviamente puede derivar su estructura. Sin embargo, en el plegamiento de proteínas nos importa mucho más que solo la estructura. Nos preocupamos por la dinámica subyacente del sistema. Para lograr esta comprensión, los científicos generalmente simulamos (usando física) el sistema de interés en escalas de tiempo insanas. Los problemas son:

1. Los campos de fuerza son “malos”, pero están mejorando. “Validación sistemática de campos de fuerza de proteínas contra datos experimentales” es un buen artículo para leer. Los parámetros del campo de fuerza son

2. Lleva mucho tiempo generar las trayectorias (los caminos que emprende una proteína). Se han sugerido numerosos enfoques, incluido el muestreo de cientos de miles de trayectorias a la vez (Folding @ Home) o la simulación de una sola trayectoria extremadamente larga (Anton). Tienen diferentes usos. En general, el cuello de botella más grande en la simulación MD es la evaluación de las interacciones electrostáticas por pares. Las implementaciones ingenuas requieren tiempo O (N ^ 2), los métodos basados ​​en malla de partículas pueden lograr esto en tiempo O (N log N). Todos los demás pasos en MD (integración numérica, actualizaciones de posición, actualizaciones de restricciones, todo se puede lograr en aproximadamente el tiempo O (N)).

3. Análisis e interpretación de los datos. Esta es realmente muy delicada. Hay muchas formas diferentes de diseccionar y analizar una trayectoria. La definición de una forma “mínima” o “convexa”, según su terminología, no se generaliza fácilmente a un espacio dimensional superior. (Considere la matriz de Hesse de una función definida en un espacio de 1000 dimensiones versus 2 dimensiones). Editar: Debería elaborar más sobre este aspecto. Actualmente, estimaría que aproximadamente el 50% de toda la investigación de simulación moderna se centra en el análisis. Algunos ejemplos son la agrupación (kcenters, kmeans, etc.) como un medio para el espacio de estado de grano grueso, la construcción de modelos de estado de Markov para determinar las estadísticas de población, etc. Recomiendo mirar MSMBuilder para ver un ejemplo de lo complicado que puede ser.

La premisa de esta pregunta supone que no conocemos ninguna de las reglas del plegamiento de proteínas y, sin embargo, usted enumera correctamente varias de las reglas que conocemos en su explicación. Si bien entendemos muchas de las interacciones involucradas en el plegamiento de una proteína, e incluso las hemos medido cuantitativamente, los enlaces de hidrógeno, las interacciones no covalentes y electrostáticas, e incluso los enlaces disulfuro no son “estáticos” como las tuercas y tornillos que utilizamos para asegurar las cosas juntas en nuestro mundo macroscópico Más bien, estas interacciones podrían verse más como gelatinosas. Las estructuras de proteínas ahora ampliamente disponibles en la literatura son solo instantáneas de una miríada de estados potenciales en los que una proteína puede estar en una fracción de segundo dada (parte del desafío de la biología estructural: una proteína puede tener diferencias sutiles, o en ocasiones profundas, en conformación como resultado de las condiciones variables bajo las cuales se mide).

Las “reglas” que determinan el plegamiento de proteínas nos permiten determinar computacionalmente un subconjunto de las conformaciones más probables para que una proteína asuma. Si este subconjunto se calcula con precisión, ninguna conformación particular será la “respuesta correcta”. Por el contrario, se espera que la proteína “muestree” cada una de estas conformaciones; algunos con mayor frecuencia que otros, dependiendo de las condiciones del solvente, la presencia de un sustrato, etc. De hecho, hemos encontrado que tales predicciones son sorprendentemente similares a las estructuras cristalográficas medidas y, en un ciclo constante, estas mediciones informan aún más nuestra capacidad para hacer cálculos y viceversa. Si está especialmente interesado en este tema, le recomiendo que analice Cryo-EM y los documentos que utilizan esta técnica para ver cómo los científicos toman un mapa de densidad de electrones y luego ajustan los modelos existentes, las conformaciones teóricas y las estructuras cristalinas resueltas en una versión final altamente probable estructura tridimensional de alta resolución de una proteína.

El problema con los métodos computacionales en décadas pasadas e incluso ahora es la capacidad de calcular las innumerables posibilidades de conformaciones que una proteína puede asumir. La paradoja de Levinthal fue una simple muestra de la hazaña astronómica que sería calcular cada posibilidad. De hecho, no deberíamos tratar de hacerlo, ya que la escala de tiempo de un plegamiento de proteínas es mucho más corta de lo que sería necesario para muestrear cada estado posible al azar, antes de establecer su conformación deseada. Tengo una respuesta a una pregunta que resume la forma en que comúnmente se cree que ocurre el proceso de plegamiento de proteínas: la respuesta de Alex Bradley a ¿Las proteínas mal plegadas tienen mayor entropía que las proteínas plegadas regularmente? Esto debería ayudarlo a ver cómo podemos eliminar algunas posibilidades que son estéricamente inviables, etc.

Por último, para representar qué tan bien entendemos esas cosas, ¿me creerías si te dijera que pudimos diseñar una enzima funcional desde cero? Ya en 2008, eso es exactamente lo que hemos hecho.

Descargo de responsabilidad: no soy un experto en este tema. Sin embargo, creo que el plegamiento de proteínas es difícil porque es un problema combinatorio; cada enlace en la secuencia de aminoácidos de una proteína podría tomar una de muchas configuraciones espaciales en la forma final. La función de energía para un patrón de plegado general no es convexa, por lo que no parece haber un atajo computacional para caminar cuesta abajo hacia la solución óptima.

Sin embargo, las simulaciones por computadora están mejorando rápidamente. Vi a David Shaw (de DE Shaw) hablar la semana pasada sobre Anton, su supercomputadora personalizada para resolver este tipo de problemas, y su grupo ha logrado simulaciones que modelan el comportamiento de la molécula por 100 veces más que cualquier otra persona. Y en realidad simulan todas las moléculas de agua individuales alrededor de la molécula de interés. Mostró videos fascinantes de moléculas simuladas alternando naturalmente entre diferentes configuraciones a lo largo del tiempo.

Un comentario rápido sobre los campos de fuerza. El término dominante para determinar la estructura resulta ser la repulsiva “esfera dura” (esque) parte del potencial. Esto es relativamente fácil de determinar. La cuestión dinámica del plegamiento depende de la determinación precisa no solo de la energía de las estructuras estables y metaestables, sino también de la energía de la (s) barrera (s) entre esas estructuras. Si considera cuántos términos entran en la energía en las diferentes barreras, entonces queda claro que incluso pequeños errores en el potencial pueden hacer una gran diferencia en la cinética.

Nosotros los conocemos.

“Las leyes físicas subyacentes necesarias para la teoría matemática de una gran parte de la física y toda la química son, por lo tanto, completamente conocidas, y la dificultad radica solo en el hecho de que la aplicación exacta de estas leyes conduce a ecuaciones demasiado complicadas para ser solubles “.
– PAM Dirac (1929)

Conocemos las reglas. La razón por la cual el plegamiento de proteínas sigue siendo difícil es que en el mundo real estas reglas no se aplican una tras otra, sino todas al mismo tiempo. Es ese “al mismo tiempo” que hace que muchos problemas del mundo real sean difíciles de calcular. No puede encontrar una fórmula porque hay demasiadas variables, por lo que debe recurrir a otros medios para encontrar una solución a su problema.