El genoma de referencia para cualquier especie es un “archivo” conveniente (dependiendo del genoma, es más como una base de datos de archivos) que contiene todos los nucleótidos en el genoma de esa especie, en el orden “correcto”. Podría ser un compuesto de los genomas de varios individuos, o puede ser el genoma de un individuo, si solo una muestra fue secuenciada y ensamblada en un genoma. El orden o las posiciones específicas de nucleótidos de ciertos tractos del genoma varían en diferentes individuos, pero esto no excluye la utilidad de los genomas de referencia.
El genoma de referencia permite una rápida alineación de secuencias . Es mucho menos computacionalmente intensivo alinear secuencias con un mapa de secuencia conocido que ensamblar todos los bits de secuencia en un genoma o un genoma parcial.
Si cada vez que secuenciara un nuevo genoma humano en mi laboratorio, tuviera que ensamblarlo de novo (desde cero) , tardaría días o semanas en hacerlo. Si alineo su genoma, que acabo de terminar de secuenciar en mi laboratorio, con el genoma de referencia humano, toma mucho más tiempo analizarlo, y puedo llamar polimorfismos de un solo nucleótido, mutaciones, reordenamientos cromosómicos, inversiones, deleciones, mucho más rápido y más fácil.
- ¿Cómo podemos saber la edad de una persona a partir del ADN?
- ¿Qué es la interferencia de ARN?
- ¿Qué propiedades magnéticas exhiben los cromosomas, particularmente en la mitosis?
- ¿Debería casarme con un primo remoto mío?
- Cómo determinar cuáles de los alelos son dominantes y cuáles son recesivos
Si se secuencian suficientes animales individuales, puede describir la variación de secuencias en esa especie, con frecuencias para las variantes de genes en una población dada. Por ejemplo, para los humanos, tenemos una base de datos bastante buena de tales variaciones, gracias a proyectos como el 1000 Genomes (Un Catálogo Profundo de Variación Genética Humana).