Paul King dio una buena respuesta que introdujo el tratamiento de causalidad de Judea Pearl. Voy a elaborar.
Pearl y muchos científicos sociales codifican las relaciones causales utilizando ecuaciones estructurales. Una ecuación estructural es una función determinista que determina el resultado de una variable a partir de sus causas directas. Entonces, si X causa Y, entonces Y = f (X, U). U representa todos los demás factores que tienen un efecto en Y no a través de X (Ver capítulos 1 y 7 del libro Causality de Pearl). La implicación aquí es que si supiéramos fy los valores de todas las causas directas de Y, necesariamente sabríamos Y.
Si bien estas funciones son deterministas, para fines prácticos nunca podemos observar todas las causas directas de una variable en particular. En un modelo de ecuación estructural, representamos los valores de las variables no observadas probabilísticamente, y sus probabilidades junto con las ecuaciones estructurales dictan una distribución de probabilidad entre todas las variables. El resultado de cada variable en el modelo es aleatorio por la misma razón que el resultado de una moneda es aleatorio: no sabemos la velocidad a la que gira la moneda y la velocidad inicial con la que está saliendo de la mano de alguien. Si bien la correlación no implica causalidad, generalmente es la causalidad la que genera correlación (y la distribución de probabilidad conjunta). Por ejemplo, todos sabemos que las ventas de helados no causan ahogamientos, aunque los dos pueden estar correlacionados. Sin embargo, son las relaciones causales entre las actividades acuáticas y las ventas de helados y las actividades acuáticas y los ahogamientos los que generan esta correlación.
- ¿Cómo puede el Teorema del mono infinito hacer que un mono escriba toda la poesía de Shakespeare en las matemáticas modernas?
- Biología Evolutiva: ¿Qué piensan los biólogos evolutivos de VHEM?
- ¿Por qué los condicionales en la lógica proposicional no reflejan la causalidad?
- ¿Por qué la informática es ciencia y arte?
- ¿Es posible diseñar una prueba de Turing que pueda distinguir entre Dios y un alienígena o tecnología avanzada?
Paul discutió el papel de las intervenciones en la causalidad y definió una relación causal en términos del efecto de las intervenciones. Creo que Pearl argumentaría que los resultados de todas las variables (excepto quizás en mecánica cuántica) están dictados por leyes causales que pueden representarse mediante las funciones estructurales antes mencionadas. En otras palabras, el resultado de cada variable es una función determinista de sus causas directas. Como resultado, la implicación de comprender la función estructural es que no solo podemos predecir el efecto de las intervenciones (por ejemplo, P (Y | do (X) – la distribución de probabilidad de Y dado que intervenimos y establecemos el valor de X ) pero también la probabilidad de declaraciones contrafácticas. Dado que entendemos la forma en que Y obtuvo el valor que obtuvo, también podemos estimar el valor que Y habría tomado si las circunstancias hubieran sido diferentes. De esta manera, los contrafactuales, no las intervenciones, son el esencia de la causalidad.
———————————————————————————————–
Algunas notas adicionales sobre Pearl:
Si bien parte de la discusión anterior es de naturaleza filosófica, una de las principales contribuciones de Pearl a la causalidad es tomar nuestra comprensión intuitiva de los conceptos causales y formalizarla, primero con redes bayesianas causales y luego con modelos de ecuaciones estructurales. Él y otros desarrollaron axiomas para ambos marcos que condujeron a muchas ideas. Un ejemplo es el cálculo. Do-calculus consta de tres reglas que permiten convertir una expresión do a una expresión estadística equivalente. La belleza del cálculo do reside en el hecho de que una expresión probabilística con operadores do implica los efectos de las intervenciones (o acciones), mientras que una expresión probabilística puramente estadística se puede estimar a partir de los datos observados. Por lo tanto, do-calculus nos proporciona el mecanismo no solo para predecir las observaciones futuras dadas, sino también para predecir los efectos de las intervenciones solo a partir de los datos observados. (Do-calculus, sin embargo, requiere conocimiento de la estructura causal). Además, se demostró que do-calculus estaba completo (de forma independiente por Shpitser y Pearl y Huang y Valtorta) en modelos causales no parámetros, lo que significa si es posible identificar un efecto causal a partir de datos de observación para una estructura causal dada, luego el cálculo proporcionará los medios para una estimación imparcial de ese efecto. Tenga en cuenta que no siempre es posible identificar los efectos causales de los datos puramente observacionales. Por ejemplo, si hay un factor de confusión no observado que causa X e Y, entonces no podemos identificar el efecto en Y de intervenir en X sin recurrir a un experimento.
Finalmente, me gustaría agregar que el cálculo del do puede derivarse de una concepción puramente intervencionista de la causalidad (como la descrita por Paul). Se deriva utilizando redes bayesianas causales y no ecuaciones estructurales. Como tal, no es necesario aceptar la concepción contrafáctica de la causalidad y la filosofía de Pearl sobre la naturaleza causal del universo para aceptar su validez. Otros resultados de Pearl, como la identificación de efectos directos versus indirectos, requieren suposiciones contrafácticas.
Página de inicio de Pearl: http://bayes.cs.ucla.edu/jp_home…
Libro de texto de Pearl sobre causalidad: http://bayes.cs.ucla.edu/BOOK-2K/
Blog de Pearl: http://www.mii.ucla.edu/causality/