Como bioinformático que trabaja en genómica comparativa, puedo asegurar que tenemos muy poca información de ADN en nuestras bases de datos, y que comparar genomas de diferentes especies o individuos puede brindarle información limitada. Sin más datos experimentales, es prácticamente imposible conocer las condiciones que determinan el patrón de expresión de cualquier gen; la función de un gen previamente desconocido o muchas otras preguntas biológicas muy importantes, incluso en genomas pequeños como los de las bacterias.
Esto se debe a que los mecanismos que regulan las expresiones genéticas no se entienden completamente, incluso en organismos altamente estudiados como E. coli o levadura. El sistema también es muy complejo, hasta el punto de que surgen muchas propiedades emergentes y el resultado está determinado por muchos factores que no se pueden entender simplemente mirando la secuencia de ADN. En este momento es imposible modelar adecuadamente la estructura tridimensional de una proteína promedio sin datos experimentales, e incluso si fuera posible, la función de la proteína dependerá de qué otras proteínas interactúan con ella, qué sustancia química la une, en qué condiciones la proteína se expresa, a qué niveles, durante cuánto tiempo, qué isoformas, etc., etc. Y eso es solo para un gen codificador de proteínas. Los genes no codificantes son aún más enigmáticos y difíciles de identificar, ya que están mucho menos conservados y expresados en niveles muy bajos.
Y eso supone que la secuenciación del ADN, el ensamblaje del genoma y la anotación son perfectos, lo que para un organismo no modelo es una suposición muy ingenua.
- ¿Por qué la ADN polimerasa prefiere Mg + 2 en lugar de otros iones?
- ¿Cuál es el mejor protocolo para la extracción total de ARN?
- ¿Es el ARNm o el ADN que es policistrónico o monocistrónico?
- ¿Qué tipo de brechas de conocimiento en biología molecular hacen que el cáncer sea un gran problema para los investigadores?
- ¿Puede CRISPR apuntar a los genes de Neanderthal y encenderlos para sacar al hombre de las cavernas que hay en mí?
En conclusión, la forma en que funciona el genoma depende de muchos factores que interactúan de una manera muy compleja que es imposible de modelar usando solo datos de secuenciación primaria.