¿Por qué se usa d de Cohen en el análisis estadístico? La Ciencia y la Tecnología mejoran el futuro

La d de Cohen es un ejemplo del tamaño de un efecto. Otros tamaños de efectos comunes y más familiares incluyen el r de Pearson.

El tamaño del efecto nos dice algo sobre la fuerza de asociación entre variables, independientemente del tamaño de la muestra (N).

Los tamaños de efecto generalmente no tienen unidades y, por lo tanto, son fáciles de comparar entre las variables que se miden en diferentes escalas.

¿Cuáles son los pros y los contras de hacer un segundo doctorado más aplicado después de un doctorado en matemática pura si quiero ser científico en la industria o en la academia?
Cómo tratar con un técnico de laboratorio que es irrespetuoso y no hará su trabajo
¿Es el índice h un índice adecuado para evaluar la productividad y el impacto de citas de un científico?
¿Cuál es el protocolo para contactar a un autor de un artículo científico para preguntar sobre sus resultados?
¿Cuáles son los medios ingeniosos de descubrimiento geológico?

Los siguientes gráficos ilustran diferentes valores de d de Cohen.

La d de Cohen es la diferencia entre las medias de dos grupos (M1, M2) divididas por la desviación estándar dentro del grupo:

d = (M1 – M2) / SD

Primero consideremos este ejemplo hipotético. Suponga que la distribución rosa a la derecha representa la altura masculina, y la distribución azul a la izquierda representa la altura femenina; d = 1.00, y por lo tanto, la altura media para los hombres es 1 desviación estándar mayor que la altura media para las mujeres.

Incluso con esta clara diferencia de altura, existe una superposición entre las distribuciones (por ejemplo, algunas mujeres son más altas que el hombre promedio). Usando las pautas de Jacob Cohen, d = 1.00 se consideraría un efecto de gran tamaño.

Ahora consideremos una diferencia mucho menor, d = .31, en el segundo gráfico.

Muchas diferencias sexuales en la vida real en realidad tienen valores d mucho más pequeños (y muchas más superposiciones) que d = .31. Por ejemplo, la diferencia entre hombres y mujeres en la autoestima media es probablemente del orden de d = .10.

A continuación se muestra un ejemplo empírico de las diferencias de sexo en altura. El siguiente gráfico se presentó en otra parte de Quora: ¿Qué son las curvas de campana superpuestas y cómo afectan las preguntas y respuestas de Quora?

Jacob Cohen sugirió pautas para las etiquetas verbales para los tamaños del efecto que se resumen en esta tabla:

Es útil pensar en la forma en que la relación, que se usa para hacer una prueba de significación estadística, combina la información del tamaño del efecto (como la d de Cohen) y el tamaño de la muestra (para una prueba t de muestras independientes, df = N – 2) .

Esta fórmula para t no es la forma computacional familiar proporcionada en los libros introductorios de estadística, pero es lógica y empíricamente equivalente. Esta versión de la fórmula muestra conceptualmente cómo d y df contribuyen al valor de t.

Esta fórmula dice: a medida que el tamaño del efecto (d de Cohen) aumenta, si mantenemos df constante, t aumenta. Si df se agranda y mantenemos el tamaño del efecto constante, t se agranda.

La desventaja de comparar las pruebas t entre los estudios es que la relación t en un estudio puede ser mayor debido principalmente al mayor tamaño de la muestra (o df).

Cuando nos centramos en la d de Cohen en lugar de en la relación t, tenemos una idea de si la asociación entre variables (sexo y altura, por ejemplo) fue pequeña, mediana o grande (independiente del tamaño de la muestra). Los estándares de Cohen se basan en los tamaños de efectos típicos de la investigación conductual; En algunos dominios de investigación, se pueden requerir valores d o r mucho mayores antes de que un investigador lo considere un efecto grande.

Los defensores de la Introducción a las Nuevas Estadísticas argumentan que deberíamos dejar de enfatizar las pruebas de significación estadística y los valores de p (en parte porque estos son ampliamente malentendidos) y centrarnos en cambio en los tamaños de los efectos, como el d de Cohen, y en los intervalos de confianza.

El uso de d de Cohen como tamaño del efecto se limita a la comparación de las medias grupales. Eta cuadrado se usa a menudo con ANOVA. La r de Pearson es más útil como tamaño del efecto para la asociación entre dos variables cuantitativas. Existen otros tamaños de efectos.

Excepto por el gráfico identificado como proveniente de otra página de Quora, todas las demás figuras y tablas provienen de: R. Warner, (2012), Estadísticas aplicadas: desde técnicas bivariadas hasta técnicas multivariadas. Thousand Oaks, CA: Sage Publications, Inc. Este material proviene de los capítulos 3 y 5.

científicaestadísticaInvestigación