¿Qué fórmula matemática se puede usar para ver si la selección de un grupo es aleatoria o sesgada en función de una característica particular?

La idea básica es comparar esa característica particular dentro de la selección versus toda la población. Esto es más fácil si conoce la distribución de la característica en la población. Si no lo sabe, tendría que comparar la muestra con otra muestra seleccionada de una manera que sepa que es imparcial.

La fórmula utilizada depende de cómo se mide la característica. Por ejemplo, suponga que sabe que el 50% de los votantes en una ciudad son hombres. Alguien hace una encuesta a 1,000 votantes y 530 de ellos son hombres. Usaría una distribución binomial para determinar que las posibilidades de obtener 530 o más hombres son solo del 3,1% si el proceso de selección fuera imparcial (o podría preferir decir que solo hay un 6,2% de posibilidades de que 530 o más encuestados sean los mismo sexo) Eso podría o no ser suficiente evidencia para que usted concluya que el proceso de selección fue parcial.

Pero supongamos que, en cambio, estuvieras haciendo un estudio de la relación del coeficiente intelectual con los ingresos. El coeficiente intelectual se calibra (generalmente) para tener una distribución normal aproximada con una media de 100 y una desviación estándar de 15. Entonces, si el coeficiente intelectual promedio en su muestra de 1,000 es 105, eso es once desviaciones estándar por encima de la media, altamente improbable para cualquier distribución que es remotamente similar a la normal.