¿Qué piensa sobre el artículo ‘Un modelo computacional de célula completa predice el fenotipo a partir del genotipo’ (Karr et al. 2012)?

Como conozco a todos los autores bastante bien, sé que han sido muy cuidadosos con este cuerpo de trabajo. El modelo de celda completa no fue algo que se apresuraron a obtener para la prensa (aunque tiene un impacto significativo en la situación de tenencia de Markus).

Es muy importante entender por qué se requiere un modelo de célula completa. Existían varios otros modelos celulares y proyectos de predicción de computación, pero eran rígidos con sus predicciones o dependían demasiado de la necesidad de requerir múltiples parámetros. Los modelos ODE requerían que los sistemas estuvieran sobreparamizados y los modelos FBA o booleanos no podían capturar todos los fenómenos biológicos relevantes. Para proporcionar contexto, el modelo iJE660a contenía solo 660 de los 4200 genes de E. coli .

La visión que Markus tenía con todo el modelo celular era desarrollar estrategias y herramientas computacionales para incorporar todos los genes y organismos, pero hacer que el modelo fuera lo suficientemente robusto como para no necesitar toda la información que faltaba para capturar el ciclo de vida. de la celda. A continuación se muestra la complejidad contenida en los modelos anteriores y hasta qué punto el modelo de celda completo integró todos los módulos. Cada modelo contiene una descripción detallada sobre varios aspectos de los diferentes elementos en la celda, pero fue increíblemente difícil hacer que todos los módulos se comuniquen entre sí.


De: WholeCellKB: bases de datos de organismos modelo para modelos integrales de células enteras

La ventaja que crea un modelo de celda completo es que realmente puede usar el modelo como modelo. Es decir, puede usar y perturbar el modelo para hacer predicciones significativas que sean comprobables en el laboratorio.


Uno de los mayores desafíos fue encontrar formas eficientes de extraer datos de 900 publicaciones para extraer los parámetros importantes para crear el modelo.

El modelo celular completo es esencialmente una simulación de MD gigante. Calcule el estado actual de todos los parámetros en el modelo. Dado el estado actual, determine el nuevo estado de todos los parámetros dado el estado anterior. Toma un paso de tiempo. Repetir.

La decisión más importante detrás del documento fue la elección de elegir diferentes métodos de modelado para calcular los módulos individuales. A partir de ahí, se trataba de hacer que los módulos se unieran y se comunicaran. Esta es la verdadera belleza de la figura 1b.

La estrategia fue dividir los estados en las 16 clases variables, cada una de las cuales contiene información que es fácil de parametrizar. Estos parámetros luego se introducen en los 28 procesos. Los procesos se eligen en gran medida porque podrían modelarse individualmente utilizando la mejor herramienta matemática sin depender de la información de los otros procesos para el paso de tiempo corto. De esta manera, un modelo de FBA podría usarse para el metabolismo y los métodos de Poisson podrían usarse para la descomposición.

Las entradas comunes se dividieron entre los 28 subprocesos dependiendo de la demanda de recursos y luego se combinaron para sus salidas. Finalmente tuvieron que encontrar una forma de resolver conflictos con parámetros experimentales. Las restricciones se identificaron y se utilizaron para definir límites mediante el análisis de equilibrio de flujo.

Todo el ejercicio estableció los procedimientos para construir un modelo integrado de E. coli en el que el laboratorio encubierto está trabajando actualmente. El gran desafío es determinar cómo escalar los pasos actuales utilizados para generar el modelo de Mycoplasma para el modelo de E. coli . Los parámetros de minería de datos para 4200 genes y muchas más proteínas, metabolitos y ácidos nucleicos no serán fáciles. Además, ahora se les presentan problemas espaciales donde las concentraciones en el citoplasma son distintas de las del periplasma. Por lo que escuché por última vez, el modelo está en el orden de 50-70 subprocesos.

Entonces … en realidad, improvisaron un montón de modelos diferentes:


Hasta que estemos dispuestos a pasar literalmente y verificar la validez / precisión de todos estos modelos, no podemos decir mucho.

Soy escépticamente optimista sobre esto. Markus Covert proviene del linaje de investigadores Bernhard Ørn Palsson que hicieron un trabajo excepcional con el modelado del metabolismo mediante el análisis de equilibrio de flujo. Entonces tiene una buena reputación, al menos conmigo.

Deberíamos esperar para ver cómo les va con el modelado de E. coli (es cierto, lo están haciendo ahora) antes de emitir un juicio sobre esto. Es un golpe de brillo o un caso de “oooooh, los resultados se ven bien, publiquemos publiquemos publiquemos”.

Pero esos son solo mis dos centavos.