Esta pregunta es muy importante en las finanzas, como puedes imaginar. Entonces, abróchense, esta es una respuesta larga …
En primer lugar, hay realmente tres niveles en este tema (al menos como lo vemos en las finanzas):
- Correlación
- Cointegracion
- Causal
El primer nivel (correlación) es simplemente una medida de la frecuencia con la que dos cosas tienden a moverse juntas o separadas.
Por ejemplo, los ahogamientos aumentan a medida que aumenta la temperatura y viceversa. Los “ahogamientos” y la “temperatura” están correlacionados, pero solo porque tienden a moverse en la misma dirección: cuando uno sube, el otro sube, cuando uno baja, el otro baja. No tenemos idea de cuán lejos se mueven juntos o separados. Sabemos con qué frecuencia , pero no qué tan lejos.
Matemáticamente, la correlación es simplemente la distancia que dos puntos de datos se mueven de sus respectivos promedios, normalizados por sus desviaciones estándar (razón por la cual las correlaciones siempre están entre -1 y +1):
[matemáticas] \ frac {(x_i- \ mu_x) (y_i- \ mu_y)} {\ sigma_x \ sigma_y} [/ matemáticas]
donde xey son puntos de observación, y [math] \ mu_x [/ math] es el promedio de todas las observaciones para x , [math] \ sigma_x [/ math] es la desviación estándar de x.
Es importante destacar que esto solo detecta relaciones lineales . Si dos cosas están relacionadas exponencialmente o son onduladas, esta medida le brinda poca información (a menos que primero convierta los datos).
La correlación también puede ser engañosa porque las variables no relacionadas a veces se correlacionarán. Por ejemplo, si camina por una calle concurrida de la ciudad, es probable que haya personas caminando en la misma dirección que usted durante un tiempo. Si los “observamos” a usted y a otra persona caminando juntos, podemos suponer incorrectamente que ustedes dos están vinculados de alguna manera, a pesar de que nunca se han visto antes y nunca se volverán a ver. Estás correlacionado para ese momento, pero solo ese momento.
Esto sucede todo el tiempo y se llama correlación espuria . Cosas como la venta de helados y los ahogamientos están correlacionados, pero esa es una correlación espuria. Su caminata con un extraño total es espuria, y así sucesivamente.
El segundo nivel es una medida de si dos cosas están unidas de alguna manera significativa. No solo con qué frecuencia , sino hasta qué punto .
Aquí está el ejemplo clásico para ilustrar la diferencia entre correlación y cointegración:
Un hombre borracho y su perro salen del pub después de una larga noche. El hombre se olvida de poner a su perro con una correa y comienza a tropezar en casa. Finalmente, el hombre necesita cruzar una calle, por lo que ata a su perro por el resto del camino a casa.
Durante la primera parte de su camino a casa, el hombre y el perro están correlacionados: generalmente se dirigen en la misma dirección, dan los mismos giros, etc., pero se mueven a diferentes velocidades y se tropiezan con bastante frecuencia. Sin embargo, después de que el perro es atado, se cointegran . Ahora, la distancia entre el hombre y el perro puede variar, pero solo hasta cierto punto . La correa les impide moverse demasiado lejos.
Esta es una distinción muy importante en las finanzas. La correlación es útil para crear carteras porque determina los beneficios de la diversificación, pero la cointegración puede intercambiarse . Además, los puntos de datos cointegrados tienen propiedades estadísticas no estándar, por lo que no se les pueden aplicar métodos económicos tradicionales, ¡lo cual es importante saber!
Existen algunos métodos para estimar matemáticamente la cointegración, pero el más fácil de implementar en mi mente es el método de dos pasos de Engle-Granger. Su intuición es simple: si el hombre y su perro se mueven (algo al azar) pero están cointegrados, aunque cada una de sus posiciones se mueva, alguna combinación de sus observaciones de posición debería ser estacionaria (porque la distancia entre ellos, en promedio, es lo mismo):
[matemáticas] a_i- \ beta b_i = c_i [/ matemáticas]
donde a es una observación para una cosa, b es una observación (en el mismo momento) de una cosa diferente, c es el resultado que no se supone que se mueva, y [math] \ beta [/ math] es el factor que estabiliza c . Este es un proceso de dos pasos porque primero tiene que estimar [math] \ beta [/ math] yc , ejecutar una prueba de estacionariedad en la c estimada, luego ejecutar una segunda regresión en los residuos rezagados desde el primero … Entonces, eso suena peor de lo que realmente es …
El tercer nivel es la causalidad, que es una relación mucho más importante. Una relación de esta magnitud es predictiva de alguna manera, es decir, el conocimiento de la causa te da conocimiento de la causa.
De acuerdo con nuestro ejemplo de hombre y su perro:
El hombre borracho y su perro se acercan a su piedra rojiza, pero el hombre se cansa y frena su caminata. Ansioso por estar en casa, el perro comienza a tirar fuertemente de la correa, y el hombre, demasiado cansado para luchar, es empujado hacia la puerta de su casa.
En este ejemplo, el hombre y el perro tienen una relación causal . Puede explicar completamente el camino del hombre si conoce el camino del perro, porque el movimiento del perro está causando el movimiento del hombre borracho.
La causalidad es algo mucho más difícil de demostrar matemáticamente, ya que es más que una simple relación, es una unión firme de dos cosas. Sin embargo, tenemos una herramienta para usar: la prueba de causalidad Granger. El principio subyacente es simple: 1) la causa ocurre antes del efecto, y 2) la causa lleva información sobre su efecto. La matemática es esencialmente un análisis multivariante sobre los efectos rezagados (consulte el Tutorial electrónico 8: Causalidad de Granger)
La causalidad, en esencia, le brinda información sobre algo futuro, que es importante en las finanzas. Si puede encontrar, y probar, una relación causal, puede comerciar de manera bastante rentable.
Ahora, confundiendo estas cosas Se hace fácilmente. Nuestros cerebros están conectados para encontrar patrones, por lo que obtienes muchos falsos positivos. ¡Es importante comprender las diferencias matizadas entre correlación, cointegración y causalidad porque no son lo mismo! La correlación está tan lejos de la causalidad que están, esencialmente, en universos diferentes. La cointegración está más cerca (ya que las relaciones causales también se cointegrarán) a la causal, pero aún así no es lo mismo.
Las relaciones causales están muy relacionadas. Intento hacer una comprobación mental rápida cuando miro dos conjuntos de datos: ¿puedo explicar por qué son causales? Si la respuesta es “no”, ¡entonces probablemente no sean causales! Además, utilizo esta prueba mental rápida para incluso determinar si una correlación es significativa. ¿Existe, por ejemplo, alguna razón racional para vincular los patrones de migración de elefantes con el rendimiento de las poblaciones? ¿O si un equipo de NFC o AFC gana el Super Bowl? Si la respuesta es “no”, entonces la correlación es incesante y no se puede confiar en ella.
Siempre compruébalo tú mismo. Busca por qué estás equivocado: esta habilidad es más importante cuando quieres tener razón.