¿Cuándo se debe preferir un modelo estocástico a un modelo determinista? ¿O viceversa?

En ciencia política, hay personas que prefieren modelos estocásticos (la mayoría, diría yo), y personas que prefieren modelos deterministas. A menudo, estos métodos están asociados con temas particulares, por ejemplo, la política estadounidense está más asociada con los métodos de tipo de regresión, mientras que los métodos como QCA http://www.u.arizona.edu/~cragin… son utilizados principalmente por académicos de Relaciones Internacionales y Política Comparada. . (Muchos académicos de IR y CP también usan regresiones).

Cada uno como ventajas.

  • Los modelos deterministas hacen un mejor trabajo al identificar condiciones “necesarias” versus “suficientes”. En una regresión logística, por ejemplo, una variable que es verdaderamente “suficiente” y “necesaria” se eliminaría del modelo, ya que predice perfectamente el resultado. Se basa en la lógica booleana para clasificar todos los casos en una celda en una tabla, y si las causas son realmente claramente deterministas, un modelo determinista hace un buen trabajo al detectarlo.
  • Para un conjunto de datos muy pequeño, los modelos deterministas a menudo se usan junto con estudios de casos. La idea es mostrar qué variables en los casos estudiados fueron más importantes y por qué. Es una forma de ilustrar un argumento lógico. Si no tiene una muestra lo suficientemente grande, no llegará lejos con una regresión. Muchos conjuntos de datos políticos son pequeños.
  • Los modelos deterministas tienden a basarse en una variable dependiente categórica. A veces esto tiene sentido. (Va a la guerra, o no; vota o no vota; pertenece al partido A o al partido B.) Pero cuando el DV es continuo (cambio del PIB, empleo, etc.) los modelos deterministas no funcionan tan bien. Estás obligado a hacer cubos artificialmente. Los politólogos están realmente interesados ​​en las distribuciones.
  • Los modelos deterministas utilizados en ciencias políticas tienden a ser más difíciles de calcular la incertidumbre, mientras que nos sentimos muy cómodos calculando errores y puntajes z a partir de regresiones. En Ciencias Políticas, las personas también tienden a estar más interesadas en la prueba de hipótesis que la predicción directa (en la mayoría de las circunstancias; personalmente estoy muy interesado en la predicción). Entonces la importancia se vuelve muy importante.
  • También existe la tentación de seguir agregando variables a un modelo determinista hasta que todo se clasifique correctamente. Esto puede acercarse bastante a la minería de datos (en sentido negativo) y fomentar modelos demasiado complejos. La ciencia política, por cualquier razón, no le gusta realizar entrenamientos / pruebas de validación, por lo que un mejor ajuste del modelo es mejor, incluso si se trata de un sobreajuste. Creo que esto es más fácil de hacer con modelos deterministas. Siempre puede encontrar algo que diferencie A de B, incluso si realmente no se aplica a otras observaciones.
  • Un conjunto de datos muy grande tenderá a modelar estocástico. Los modelos deterministas se vuelven difíciles de manejar. El modelado estocástico permite una mayor variedad de variables (y acepta más las variables dependientes e independientes continuas). Hay más literatura sobre cómo abordar los problemas que son endémicos para la ciencia política (por ejemplo, sesgo de selección). Pero los modelos estocásticos simplemente no van a funcionar muy bien con muy pocas observaciones.
  • Probablemente voy a obtener un golpe para esto, pero diría que las personas que usan modelos deterministas para grandes conjuntos de datos en ciencias políticas tienden a ser aquellos que no están terriblemente familiarizados con las estadísticas, o lo desaprueban en general por uno razón u otra.

Buenas respuestas aquí, especialmente las de Kenneth Moore.

Usted elige un enfoque determinista cuando la naturaleza del sistema y los datos disponibles tienen salidas exactas, repetibles y fijas para las mismas entradas. Esto significa que tienen una relación precisa de causa y efecto .

Hay muchos escenarios de la vida real que se ajustan a esto. Algunos ejemplos:

  • Mecánica newtoniana
  • Cantidad demandada comportamiento
  • Determinación de ganancias y pérdidas de una empresa.

Por el contrario, uno prefiere un enfoque de modelado estocástico cuando un sistema tiene una aleatoriedad inherente y debe estimar los posibles resultados con su probabilidad de ocurrencia para definir su comportamiento. Algunos ejemplos de modelado estocástico son:

  • Previsión del mercado de valores
  • Procesamiento de la señal
  • Modelos de trafico

La mayoría de las veces, los datos y la naturaleza del sistema serán lo suficientemente obvios para saber cuándo usar uno u otro.

En la práctica (ingeniería de sistemas espaciales), veo que se elige un enfoque de modelado basado en el (tipo de) datos de entrada disponibles. Si resulta ser estocástico (por ejemplo, tasas de falla, tasas de espera), entonces la elección de un modelo estocástico se hace fácilmente.

También puede suceder que se espere un resultado de análisis particular del modelo. Si la expectativa es un número probabilístico, generalmente se recopilan datos de entrada amplios para que el modelo sea factible.

Tenga en cuenta que la incertidumbre tiene muchos aspectos. También se puede ver como no determinismo, donde difiere la decisión de un comportamiento de modelo en particular al tener en cuenta los posibles comportamientos. Para algunos casos, uno quiere explicar tanto la incertidumbre / comportamiento estocástico como el comportamiento no determinista. Un proceso de decisión de Markov o una cadena de Markov interactiva son modelos fundamentales típicos para esos casos.

Vamos a cortar por lo sano.

Los modelos deterministas son más apropiados cuando la estructura del sistema y los límites del sistema son bien conocidos. Por ejemplo, una fábrica de automóviles. La entrada es clara, la salida es clara y todos los procesos que cambian la entrada en salida son claros. Por supuesto, habrá algunas cosas impredecibles que podrían suceder y algunas influencias externas, pero en su mayor parte, el sistema en cuestión se entiende bien y las reglas de gobierno del sistema son muy importantes.

Los modelos estocásticos, o modelos basados ​​en agentes, son más apropiados cuando la estructura del sistema y los límites del sistema son menos conocidos, y esperamos grados de incertidumbre en la entrada, salida o ambas. Del mismo modo, es más apropiado cuando las reglas de gobierno del sistema son más ascendentes, lo que produce un comportamiento macro emergente y menos predecible. Esto es muy común en biología. Por ejemplo, difícilmente podría modelar la evolución con un enfoque determinista.

Un modelo estocástico se usa típicamente cuando el espacio de fase de un problema es demasiado grande para muestrear exhaustivamente.

Puedo citar un ejemplo en finanzas. Cuando está comprando un cupón fijo que paga un bono con rendimiento garantizado (digamos 6% efectivo por año), si invierte $ 100 ahora, crecerá a $ 100 * (1.06) ^ 10 después de 10 años. Este es un modelo determinista que siguen los enlaces con retornos garantizados.

Pero si compra una acción con rendimiento variable (digamos 4% pa efectivo con probabilidad 0.6 y 7% pa efectivo con probabilidad 0.4) entonces no puede calcular el valor acumulado de $ 100 después de 10 años con certeza. Puede calcular el rendimiento esperado como 0.04 * 0.6 + 0.07 * 0.4 = 0.052 y aplicando este valor puede obtener el valor acumulado esperado después de 10 años como $ 100 * (1.052) ^ 10. Pero esto es solo el “valor acumulado esperado” y no el garantizado. Este es un modelo estocástico que siguen las acciones con rendimientos variables.

Mi perspectiva es la de un científico social / conductual. Estoy particularmente interesado en modelos de cómo las personas realizan tareas particulares (por ejemplo, integrar pronósticos de dos expertos).
Algunas de las entradas a los modelos en las ciencias sociales / conductuales se conocen a priori. Por ejemplo, las propiedades de estímulo en un experimento de psicología.
Otras entradas dependen del operador humano, por ejemplo, la atención del operador a la tarea. Estos a menudo son difíciles de cuantificar.
La atención del operador (como ejemplo) a menudo se trata como una variable molesta y forma el componente estocástico del modelo.