¿Cómo debe redactarse una simulación Monte Carlo para su publicación cuando se utiliza para evaluar la solidez estadística de una conclusión extraída de un conjunto de datos?

Tome lo siguiente con un grano de sal, ya que no he escrito ninguna simulación de Monte Carlo directamente (pero estoy más que feliz de tratar de ayudar, y volver a visitar y ver si alguien que sabe más que yo tiene un mejor responder).

Y tenga en cuenta que las simulaciones de Monte Carlo se definen de manera ligeramente diferente, dependiendo del campo en el que se encuentre (no estoy seguro si, por ejemplo, es un físico, un científico social, un economista, un ingeniero, etc.)

En términos generales, cuando se escriben resultados estadísticos, lo siguiente tiende a ser parte de la redacción:

  • la justificación para usar su método: ¿por qué Monte Carlo es el más adecuado para usar en su análisis? ¿Qué le ofrece que otras pruebas no ofrecen? ¿Por qué razón es útil?
  • Los criterios de robustez: ¿en qué sentido son robustos los resultados de Monte Carlo en su conjunto de datos?
  • el dominio del análisis, dado que el método Monte Carlo se basa en muestreos repetidos en un dominio, comprender los resultados implica conocer el dominio.
  • la cantidad y el tipo de muestreo: algunos usos de Monte Carlo solo muestrean unas pocas veces, otros prueban cientos de miles. Un revisor con conocimientos en la prueba probablemente querrá saber qué tipo de resultados está viendo.
  • el tipo de números al azar psuedo utilizados para estimar el resultado de Monte Carlo: solo he visto trabajos de informática y estadística o matemáticas que estaban interesados ​​en esto, pero dependiendo de su campo, es posible que desee saber esto.
  • la distribución de los datos de los cuales se extrae su muestra, ¿se distribuye normalmente? ¿Es logarítmico en su distribución o está distribuido exponencialmente? Dado que la distribución de los datos (particularmente la cantidad de varianza) afecta la relación entre los datos, la probabilidad y los métodos utilizados para calcularlos, es importante tener en cuenta esa distribución. Los tipos de cambios descritos en el conjunto de datos también están indicados por la distribución (es el efecto aditivo, multiplicativo, exponencial, etc.). La robustez también puede verse afectada por los tipos de distribuciones que está examinando (particularmente en el sentido de que los indicadores se consideran más robustos para su resultado cuando se extraen de distribuciones múltiples no normales).
  • las probabilidades (por supuesto): las probabilidades de los datos que se están modelando, las probabilidades de los resultados que encuentran sus simulaciones de Monte Carlo, las probabilidades en la distribución (para que pueda discutir las diferencias entre los resultados de su simulación de Monte Carlo y los resultados reclamados en su conjunto de datos, presumiblemente, está evaluando los resultados de otras personas o los suyos).
  • el tipo de error que cree que puede haber influido en la diferencia entre su conclusión anterior y los resultados de Monte Carlo (debo tener en cuenta que esto es algo que solo he visto en algunos documentos que usan una distribución de Monte Carlo).

Presumiblemente, si esto es parte de un documento más grande, ya ha mencionado el tipo de datos, su distribución, probabilidades y tendencias, y está utilizando esto específicamente para probar la probabilidad de su conclusión. La mayor parte de esto probablemente podría aclararse en una página más o menos.

En cuanto a la vinculación de ejemplos, revisé un puñado de documentos, pero generalmente estaban sujetos a análisis dentro de un tipo particular de datos: incluiré una referencia de papel bien citada para algunos de los campos para que pueda ver qué campos son haciendo. Lamento no poder vincular los documentos directamente. Lo bueno siempre está detrás de un muro de pago.

Para econometría, citado 30 veces en Scopus:

Bollerslev, Gibson y Zhao (1996) “Estimación dinámica de primas de riesgo de volatilidad y aversión al riesgo de los inversores a partir de volatilidades implícitas y realizadas”

Utiliza una prueba de Monte Carlo a pequeña escala (150-600 muestras) para confirmar la solidez de un índice de aversión al riesgo de los inversores.

Para ingeniería (modelado de fallas catastróficas del sistema usando la explosión del Challenger), citado 48 veces en Scopus:

Kelly y Smith (2008) “Inferencia bayesiana en la evaluación probabilística de riesgos: el estado actual del arte”

Utiliza Monte Carlo para estimar la robustez de los modelos bayesanos para la falla del sistema (y específicamente los posteriores de las estimaciones del modelo probadas contra la probabilidad de falla (según lo estimado por la temperatura de lanzamiento)).

Para la biología teórica, citada 52 veces en Scopus:

Lee et al (2009) “Modelado de la evolución de la secuencia en la infección aguda por VIH-1”

Utiliza Monte Carlo para comparar un modelo matemático de infección y una simulación de Monte Carlo de la evolución del virus durante el proceso de infección, observando la probabilidad de infectar nuevos huéspedes con una cepa adaptada o la cepa original, y estima los vínculos entre ancestro más reciente del virus y sus formas en evolución.

Espero no haber hecho el ridículo y haber sido útil. Gracias por una tarde agradable leyendo documentos estadísticos en múltiples campos.