Kevin tiene razón: estamos tratando de realizar ingeniería inversa en un sistema extremadamente complejo. Y seguimos descubriendo mecanismos completamente nuevos cuya existencia ni siquiera se sospechaba cuando estaba en la escuela de posgrado, como siRNA y microRNA. Todo el campo de la epigenética también ha explotado en los últimos años; Cuando estaba en la escuela de posgrado, pensábamos que las histonas eran básicamente pequeños carretes como un carrete de madera para almacenar hilo.
Gran parte de la dificultad en bioinformática proviene de un solo hecho sobre el genoma: ¡el código genético carece de puntuación! Puede dividir una secuencia de nucleótidos en “codones” de tres letras en múltiples formas que se conocen como “marcos de lectura”. En los genomas virales, con los que trabajo mucho, hay muchos “marcos de lectura superpuestos” en los que el mismo tramo de nucleótidos es parte de dos genes diferentes. El siguiente ejemplo proviene de la cepa HXB2 del VIH. Tenga en cuenta que ambas traducciones cubren exactamente los mismos nucleótidos, simplemente los dividen en tres de manera diferente. Ambas traducciones son proteínas reales que el virus produce en las células humanas.
El tramo de secuencia anterior proviene de la región donde “GAG” y “POL” se superponen en este mapa del genoma:
- ¿Cuáles son las diferencias entre la secuencia en la región promotora y las otras regiones del ADN?
- ¿Por qué tenemos intrones?
- ¿Cuál es la crítica de Steven Jay Goulds al gen egoísta?
- ¿Puede la genética sola explicar el desarrollo del lenguaje en humanos? ¿Cómo?
- ¿La neuropatía es genética?
Señales del genoma del VIH
Hay algunos marcos de lectura superpuestos en el genoma humano, pero son menos comunes. En los genomas virales son muy comunes.