¿Cómo se utilizan los componentes principales para separar los grupos de población?

Básicamente, la separación de grupos de PCA funciona visualmente.

Los componentes principales se dibujan secuencialmente a lo largo de los ejes con las variaciones más grandes, no los ejes que proporcionan la mejor separación. El escalado multidimensional, por ejemplo, que conserva las distancias, a menudo proporciona una mejor separación.

La razón por la cual PCA funciona y es común:
1. Es fácil de hacer. Toneladas de software lo hacen. No requiere mucha experiencia.
2. Funciona No es una coincidencia que los ejes con las variaciones más grandes también tienden a ser muy similares a los mejores ejes discriminatorios.
[CAVEAT: Sin embargo, no siempre funcionan y pueden malinterpretarse. El hecho de que un grupo no se separe de otro no significa necesariamente que sea similar, es solo que esa PC en particular no proporciona separación.]

Si desea la mejor separación, use una función de discriminación (por ejemplo, análisis discriminante) o agrupamiento. Estos pueden ser supervisados ​​(es decir, grupos conocidos) o no supervisados.