Los datos genómicos, como los datos de expresión génica y los datos de variantes, tienen una dimensionalidad muy alta, es decir, hay demasiadas variables y pocos puntos de datos. Cuando tiene un conjunto de datos de expresión génica, puede estar interesado en identificar grupos de genes que muestran patrones de expresión similares.
Una de las formas de hacer esto es WGCNA o análisis ponderado de redes de coexpresión de genes. En términos simples, lo que está tratando de hacer es identificar genes que muestran patrones de expresión similares en muestras o condiciones. Estos grupos de genes se denominan módulos. WGCNA identifica módulos mediante el uso de un tipo de análisis de componentes principales (PCA). Aquí, cada módulo está representado por un valor de expresión que pertenece al módulo ‘eigengene’. Este valor se identifica desde el PCA. Ninguno de los genes reales en el módulo necesita tener realmente este valor de expresión.
Como cada gen propio representa un módulo, se puede calcular la distancia de un gen al gen propio y, por lo tanto, al centro del módulo. Esto nos dice en qué módulo se encuentra cada gen.
- Cómo identificar el peso molecular de una proteína desconocida
- ¿Cómo se replican las histonas de ADN y cómo se vincula esta replicación con la epigenética?
- En detalles. ¿Cómo se extrae el ADN de una cebolla? Explica paso a paso.
- Biología molecular: el origen del ARN de la vida. ¿Dónde y cuándo tendrá lugar el experimento? ¿Será ético?
- ¿Hay alguna forma de alargar los telómeros o al menos evitar que se acorten?