Estoy interpretando su pregunta como “si alguien tuviera el genoma exacto representado en la referencia, ¿estaría sano?”, En cuyo caso la respuesta es “sí”. El genoma de referencia para humanos es un intento de representar un genoma que es de tipo salvaje en todas partes. En otras palabras, la convención es que una llamada variante versus la referencia es un alelo menor en una población; los alelos de la enfermedad son siempre menores. No representa necesariamente un consenso para toda la población, lo que es esencialmente imposible para cualquier región que sea muy diversa entre individuos.
Como sospecho que sabe, la referencia en realidad no representa a un solo individuo, sino que es más bien un mosaico de datos de múltiples fuentes que han sido cuidadosamente editados para intentar proporcionar una referencia completa.
Debido a las limitaciones de un genoma de referencia único, la comunidad genómica se está moviendo a representaciones gráficas de los cromosomas. Por gráfico, quiero decir algo así como un laberinto en el que hay un comienzo y un final y muchos caminos a través del laberinto; cualquier cromosoma se puede asignar a un camino a través del laberinto. Esto resuelve el problema de regiones muy diversas al representar cada una como una ruta secundaria en el gráfico.
- Genética y herencia: entre las personas que vivían en el año 1 DC, ¿aproximadamente cuántos eran mis antepasados?
- ¿Qué organismos (si los hay) pueden reestructurar su ADN a voluntad?
- ¿Hitler realmente tiene ADN árabe y judío?
- ¿Cómo mantienen los superhéroes enmascarados sus identidades secretas a pesar del advenimiento de la tecnología forense (pruebas de ADN)?
- ¿Cuál es la diferencia entre un mosaico y una quimera?
Como analogía, mire una tabla de los sistemas de metro de Londres o Nueva York. Eso es un gráfico; las estaciones son nodos y las rutas entre ellas son bordes. A menudo hay múltiples formas de llegar entre dos puntos distantes (por ejemplo, la estación de Paddington y Tower Hill o South Ferry a Roosevelt Island) y podemos representar un consenso como una lista de las estaciones de paso más frecuentes.
El enfoque de referencia elige uno de esos caminos y dice que representa todas las formas de llegar entre los dos puntos. Puede pasar entre Paddington y la parada de Tower Hill yendo en cualquier dirección alrededor de Circle Line, ¡así que una versión consensuada de eso no incluye estaciones! Una versión de referencia simplemente elegiría uno de los caminos; el otro no está realmente representado. La versión gráfica representa todos los caminos, quizás ponderados por la frecuencia con la que se observan.
Construir y utilizar eficientemente tales representaciones de genomas es un área muy activa de investigación bioinformática.