¿Sería útil crear una base de datos de todos los resultados que provienen de simulaciones de química computacional (como DFT y dinámica molecular)?

Creo que en realidad hay dos cosas diferentes aquí: resultados de cálculos de química cuántica y resultados de simulaciones de dinámica molecular.

A nivel mundial, estoy de acuerdo con el usuario de Quora en que los resultados de MD ( trayectorias , esencialmente) serían difíciles de poner a disposición debido a las diferencias en el formato y al gran tamaño de los archivos. Sin embargo, todavía me interesaría. Por ejemplo, MD es en gran parte estocástico debido a la naturaleza caótica de las ecuaciones, dos simulaciones iniciadas desde las mismas coordenadas iniciales con los mismos parámetros pueden no dar trayectorias idénticas. Esto es especialmente cierto si está interesado en eventos raros y espontáneos (como las transiciones conformacionales en proteínas) que básicamente suceden si tiene suerte (siempre que use MD simple y no un método de muestreo mejorado) y puede ocurrir en una réplica y no el otro. Por lo tanto, si está intentando reproducir dicho resultado de un documento y no puede, no significa automáticamente que los autores hayan mentido. En este caso, tener un repositorio con la trayectoria original disponible sería genial para ver lo que otros observaron.

Para la química cuántica, la situación es IMO totalmente diferente. Estamos tratando con cálculos que son mucho más reproducibles que MD y generalmente estamos interesados ​​en valores de energía, geometrías óptimas y quizás algunas propiedades físicas que pueden deducirse de la función de onda como multipolares electrostáticos.

La cuestión es que los métodos de control de calidad generalmente son computacionalmente caros y no veo el punto de ejecutar una optimización de geometría en una molécula si otros ya lo han hecho. Especialmente si es una molécula grande y / o un método muy pesado como CCSD (T). Para darle un ejemplo, un amigo en mi laboratorio está tratando de comparar la precisión de diferentes métodos para calcular las energías de interacción, basadas en la mecánica molecular o el control de calidad semiempírico. Él utiliza un conjunto de referencia de complejos que se han optimizado en el nivel CCSD (T) como referencia. Está alojado allí: @Page en begdb.com
Le habría llevado toneladas de CPU horas hacerlo él mismo, y habría reinventado la rueda.

Entonces sí, creo que es una buena idea tener tales bases de datos. Es útil y en realidad ya existe.

Sería muy útil ya que las comparaciones a menudo se realizan con el fin de analizar los resultados de los documentos, pero la reproducibilidad es importante a medida que se actualiza el software y se realizan cambios. Si bien una base de datos podría ser útil, en realidad, construir una es casi imposible en la práctica a menos que solo se busque un único tipo de cálculo / sistema.

Probablemente no, porque la mayoría de las simulaciones de DFT y MD que se ejecutan y publican se realizan sin las verificaciones adecuadas en cuanto a precisión, precisión y razonabilidad. La gente pone mucha fe en la infalibilidad de los programas de computadora, que después de todo se basan en teorías limitadas y escritos por programadores humanos (falibles).