Por lo general, en las pruebas de hipótesis, evaluamos dos afirmaciones mutuamente excluyentes sobre una población para determinar qué afirmación es mejor respaldada por los datos de la muestra.
¿Por qué necesitamos realizar pruebas de hipótesis?
Obtuvimos solo una muestra de datos de la población. Con base en los datos de la muestra, necesitamos hacer una inferencia para una población.
- ¿Cuándo y cómo comenzó el método científico?
- ¿Es la cosmología eléctrica pseudociencia?
- ¿Cuáles son los argumentos científicos contra la existencia de Dios?
- ¿Por qué es importante tener una hipótesis antes de hacer un experimento científico?
- Cómo probar el concepto de géneros no binarios frente al escrutinio del método científico
Ejemplos:
- El médico quiere saber que los niños que toman vitamina C tienen menos probabilidades de enfermarse.
- El fabricante desea verificar que la calidad del producto cumple con los criterios especificados previamente.
- Los científicos quieren saber que los niños pequeños no son necesariamente propensos a tener más problemas de comportamiento que las niñas.
En todos estos ejemplos anteriores, no es posible verificar a toda la población para tomar una decisión.
Si el médico quiere saber que los niños que toman vitamina C tienen menos probabilidades de enfermarse, será muy costoso analizar a todos los niños del mundo para tomar una decisión. Por lo tanto, siempre preferimos tomar una muestra de la población. Usando la muestra, necesitamos hacer una inferencia para la población.
Problema con la muestra
Ejemplo : estoy dirigiendo una empresa que fabrica bebidas. Quiero que el diámetro de mi tapa de bebida sea aproximadamente de 3 cm; de lo contrario no se ajustará a la botella.
1. Hipótesis nula ([matemática] H_0 [/ matemática]): establece que el parámetro de población es igual al valor declarado.
2. Hipótesis alternativa ([matemáticas] H_a [/ matemáticas]): existen tres posibilidades para hipótesis alternativas. El parámetro de población no es igual al valor reclamado, el parámetro de población es mayor que el valor reclamado y el parámetro de población es menor que el valor reclamado
Elegimos hipótesis alternativas que dependen de lo que queremos que concluya nuestra prueba.
Continuación del ejemplo : Mi gerente de calidad afirma que el diámetro de la tapa no es igual a 3 cm. Entonces, para nuestro caso;
[matemáticas] H_0 [/ matemáticas]: [matemáticas] \ mu [/ matemáticas] = 3 cm
[matemáticas] H_1 [/ matemáticas]: [matemáticas] \ mu [/ matemáticas] ≠ 3 cm
Variabilidad aleatoria: como dije antes, no es posible medir el diámetro de la tapa para toda la población debido a la restricción presupuestaria. Entonces, tomé una muestra de 100 cápsulas y medí su diámetro promedio que resultó ser 2.92 cm ([matemática] \ bar {\ mathbb {x}} [/ matemática]). Tomé otra muestra del mismo tamaño (100 cápsulas) y medí su diámetro promedio; resultó ser 3.12 cm. Incluso, si tomo muchas muestras con el mismo tamaño, podría obtener un valor de diámetro promedio diferente para cada muestra. La razón por la que obtenemos valores diferentes se debe a la variabilidad aleatoria.
Gracias al teorema del límite central, al usarlo, podemos definir una distribución teórica para el escenario anterior que captura la variabilidad aleatoria del diámetro.
Para entender más sobre el teorema del límite central, lea esto: la respuesta de Balaji Pitchai Kannu a ¿Cómo explica el teorema del límite central de la distribución normal?
El teorema del límite central cuenta tres datos importantes sobre la distribución teórica.
- La distribución teórica sigue aproximadamente la distribución normal.
- Media poblacional = distribución teórica media
- Desviación estándar de la población = Desviación estándar de la distribución teórica / [math] \ sqrt {n}. [/ Math]
¿Cuál es la intuición del valor P?
El valor P es la medida de la fuerza de la evidencia contra la hipótesis nula. Es la probabilidad de obtener el valor observado del estadístico de prueba, o un valor con evidencia aún mayor contra la hipótesis nula ([matemática] H_ {0} [/ matemática]), si la hipótesis nula de una pregunta de estudio es verdadera.
Significa que voy a asumir que mi distribución teórica es una distribución normal y su media es la hipótesis nula media ([matemática] \ mu [/ matemática] = 3 cm). Todo lo que necesito hacer es averiguar la probabilidad de observar la media muestral (100 muestras del diámetro de la tapa) en esa distribución. Si el valor de probabilidad (valor P) es muy alto, significa que la probabilidad de observar esa muestra en la distribución teórica es muy alta, lo que indica que [math] \ bar {\ mathbb {x}} [/ math] es de la misma distribución (distribución teórica). Obtuvimos diferentes [math] \ bar {\ mathbb {x}}, [/ math] solo debido a la variabilidad aleatoria. Si el valor de probabilidad (valor P) es bajo, significa que [math] \ bar {\ mathbb {x}} [/ math] podría provenir de otra distribución. La otra distribución podría ser otra cosa que la distribución teórica. Cuando nuestro valor P es muy bajo en las pruebas de hipótesis, la única conclusión que podemos hacer, [math] \ bar {\ mathbb {x}} [/ math] no proviene de la distribución teórica. Por eso, siempre decimos no rechazar la hipótesis nula de aceptar la hipótesis alternativa.