¿Cuál es la información mutua / autocorrelación del genoma humano? ¿Por qué es distinto de cero en algún momento?

Bien podría estar equivocado, ya que solo comencé a aprender sobre estas cosas en los últimos dos meses, pero no creo que esta pregunta sea realmente responsable como es. Creo que los resultados del análisis de autocorrelación (al menos con respecto a los datos genómicos) pueden variar considerablemente dependiendo de cómo exactamente decida codificar los datos genómicos. En otras palabras, la forma en que mapeas los nucleótidos a números reales cambia los resultados y no creo que haya una sola forma aceptada de hacer esto. Diferentes estrategias de mapeo teóricamente observan diferentes características. Este documento puede ser de interés. [1]

En cuanto a por qué es distinto de cero en algún retraso, te pregunto por qué esperarías que no lo sea. El genoma humano exhibe todo tipo de características estructurales repetitivas. Por ejemplo, leí un artículo que identificaba la “periodicidad de 3 pares de bases” (también conocidos como codones) cuando Fourier transforma ciertos genes. Creo que hubo algún interés en usar esto para encontrar regiones de codificación de genes como hace una década más o menos, aunque parece que ahora no se usa mucho. De todos modos, mi punto es que esperaría que hubiera algunas autocorrelaciones solo porque el genoma humano no es solo una señal aleatoria (al menos no a menos que la mapees al azar). Tiene patrones repetitivos, que es lo que el análisis de autocorrelación es bueno para identificar. Esto es útil porque podría señalar algo interesante, como esto. [2]

* No soy un experto en esto y realmente agradecería a las personas que señalen cualquier error que pueda haber cometido.

Notas al pie

[1] http://bioinfo2.ugr.es/Publicaci…

[2] http://www.ncbi.nlm.nih.gov/pmc/…