Si observa las técnicas de aprendizaje automático, existen dos categorías amplias: aprendizaje no supervisado para el descubrimiento de clases de abeto y métodos supervisados para la asignación de clases. Una clase o etiqueta es una categoría de interés.
El uso de HMM PFAM para asignar proteínas a las familias es un ejemplo de asignación de clase: conocemos las etiquetas de interés (las familias de proteínas) y deseamos etiquetar nuestras proteínas de consulta con ellas.
Con datos de perfiles de expresión de microarrays o RNA-Seq, a menudo realmente no conocemos las etiquetas apropiadas. Por lo tanto, los algoritmos de agrupación como la agrupación jerárquica nos permiten descubrir estructuras en los datos sin ideas preconcebidas de lo que son. El problema es que ahora tenemos clases, pero no entendemos la lógica biológica de esas clases. Por lo tanto, los métodos supervisados, como el análisis de enriquecimiento, se utilizan para tratar de determinar qué “significan” los grupos.
- ¿Por qué los genes blancos son recesivos?
- ¿Cuál es la probabilidad de que el bebé de dos personas de cabello rubio y ojos azules no tenga cabello rubio y ojos azules?
- ¿Es posible que un niño rubio nazca de padres no rubios (morenos o de cabello oscuro)?
- ¿Por qué las cadenas de ADN son antiparalelas?
- ¿Nuestros genes solo transmiten instrucciones evolutivas y corporales hasta la edad de los padres?