¿Hay alguna manera de calcular la probabilidad de que ciertas mutaciones en un genoma estén vinculadas / ocurran juntas? Digamos, ¿quizás por múltiples secuencias profundas de diferentes aislados clínicos del mismo virus?

Me gustaría respaldar el comentario de Sam Sinai anterior de que la información mutua en lugar del desequilibrio de enlaces es probablemente lo que está buscando.

Reconociendo que hay similitudes conceptuales, tenga en cuenta que el término “desequilibrio de enlace” está reservado para las variantes que surgieron una vez y se comparten por descendencia. Esta suposición a menudo no es apropiada para los virus, cuya tasa de mutación es alta y para los cuales la misma mutación (beneficiosa) se observa con frecuencia y se repara independientemente en muchos pacientes. Por ejemplo, el VIH puede desarrollar resistencia a los medicamentos retrovirales dentro de los pacientes durante el tratamiento, pero solo a través de un pequeño número de mutaciones. Muchos pacientes cuyo VIH se ha vuelto resistente a los medicamentos comparten la misma mutación, aunque no estaba presente en el clon que los infectó originalmente. Bajo tales condiciones, los supuestos del desequilibrio de ligamiento, es decir, que los alelos alternativos se comparten por descendencia después de evolucionar una vez en un ancestro común, no se cumplen.

De hecho, los biólogos utilizan información mutua y covarianza para evaluar si dos mutaciones se observan más / menos a menudo de lo esperado por casualidad cuando se supone que las mutaciones son independientes, es decir, no se comparten por descendencia . Dado que está haciendo un curso de tiempo para observar las secuencias predominantes después de 1, 3 y 7 días, supongo que está buscando mutaciones novedosas durante la infección y que el MI / covarianza son las medidas apropiadas para su estudio.

Si desea ver esto en la acción biológica, consulte el trabajo de Mike Laub para identificar qué residuos de la interfaz de interacción proteína-proteína covarían en un sistema de señalización bacteriano de dos componentes:

Página en mit.edu

Y busque documentos utilizando esta técnica para la predicción de la estructura 3D (sé que Lucy Colwell es autora en algunos):

Departamento de Química

Parece que quieres decir desequilibrio de vinculación. Tome un texto genético cuantitativo y encontrará más información.


También puede usar D ‘yr, que son valores ajustados de D.

La página de Wikipedia tiene suficiente para explicar cómo probarlo estadísticamente con un chi-cuadrado.