A lo sumo, aproximadamente el 20% del genoma no es funcional y es estructural. La gran mayoría del 80-90% es funcional, aunque solo un pequeño porcentaje está codificando, y solo alrededor del 10% más obviamente está regulando directamente las regiones de codificación.
Los elementos estructurales son los extremos de los telómeros, un código estructural en el punto de encuentro de la X del cromosoma y elementos repetitivos que están dispersos por todas partes (aunque parece que podrían usarse para contar algo). Estos elementos repetitivos son sobreestimados por los algoritmos de Encode, pero aún así concluyen correctamente que el 90% es funcional, como John Mattick valientemente hizo una década antes.
La función de la mayoría del ARN es puramente computacional, no se usa para producir proteínas directamente ni para regularlas directamente. El ARN se transcribe, y el complemento se une con otro ARN y lo empalma y lo vuelve a empalmar, o bien se une y se une con nuevos filamentos, para formar un pequeño cerebro en la célula, un cerebro capaz de regular la función de las proteínas. La regulación viene en señales cortas de ARN que van en el citosol y regulan la expresión de proteínas, y también en otras señales que se usan para etiquetar ubicaciones, etc.
El ARN cerebral también está haciendo modificaciones “sabidas” en el ADN a través de la acción de la transcriptasa inversa. La razón por la que digo “saber” y ponerlo entre comillas es porque el cálculo es bastante pesado, pero no está cerca de un cerebro. Son unos pocos gigabytes en una célula típica, unos pocos gigabytes más en una neurona (que tiene más ARN) y unos pocos terabytes en una célula de huevo (que es más grande y aún tiene más ARN).
El propósito de este cálculo es el mismo que en el cerebro: el cálculo evoluciona por sí mismo, a fin de producir toda la inteligencia necesaria para que un eucariota sobreviva. Las células bacterianas están degeneradas y aún no han desarrollado estos cerebros de ARN o, como sospecho, simplemente los desarrollaron. Todo depende de los detalles de la evolución bacteriana que están envueltos en la niebla de la arqueología, como sucedió mucho antes de que tengamos pistas moleculares. La filogenia de las arqueas, eucariotas y bacterias podría ser capaz de resolver cuáles en algún momento.
Las bacterias no tienen ARN cerebral más allá de cierta resistencia anti-fago. Comparten plásmidos y se conjugan para formar un enorme colectivo que parece evolucionar en gran medida por los métodos modernos de síntesis. Si bien fueron los primeros organismos cuya genética se entendió, en gran parte porque era muy simple, por la misma razón no son un buen modelo para la historia principal en eucariotas.
La forma en que personalmente llegué a esta idea es simplemente comparando la capacidad de información de los procesos biológicos conocidos en proteínas y ARN mensajero, ribosómico y de transferencia con la información en el genoma crudo y con el cálculo revelado en el comportamiento de los eucariotas. Incluso aquellos que no están capacitados en genética o en los métodos de la ciencia pueden ver que la forma moderna de síntesis de la evolución no pasa la prueba del olor, las críticas fueron frecuentes y comenzaron en la década de 1950: la evolución de los sistemas informáticos no puede ser por pequeños cambios en código, es tan ridículo como afirmar que puedes desarrollar una nueva versión de firefox mutando los códigos ascii hasta que funcione mejor. Puedes, en principio, solo lleva una eternidad más que la edad del universo. Hay un grupo persistente que sigue afirmando que Dios lo hizo, escribiendo el genoma por arte de magia, porque la complejidad es demasiado grande y las redes están demasiado coordinadas. Sus críticas no son tonterías (aunque su conclusión sí lo es), es esencialmente la misma crítica formulada por Leslie Valiant en su conferencia del Premio Turing el año pasado. Un sistema informático no puede evolucionar sin los mutadores informáticos que co-evolucionan con el sistema, de lo contrario, la cosa se atasca rápidamente en una rutina, que es el código accesible optimizado al máximo.
La forma en que sucede en la vida real, fuera de los virus y ciertas bacterias, es que el mecanismo de mutación sea consciente de lo que está haciendo al modificar el genoma. La mayoría de las modificaciones están en el ADN que controla la estructura de la información, el cerebro nuclear de la célula, no en las proteínas, que son elementos estructurales que se han reparado en gran medida desde que surgieron los organismos multicelulares.
La evidencia de esto es acumulativa, porque es una idea nueva que hace predicciones. Recapitularé los principales puntos de evidencia, aunque ahora no hay diferencia, porque las máquinas de secuenciación producen tanta evidencia como sea necesario.
1. El genoma no codificante está correlacionado en tamaño con la complejidad del tejido y el programa de emriogénesis del organismo. El genoma de codificación es fijo.
Los gusanos y los humanos básicamente tienen los mismos genes de codificación, pero el programa para los humanos es enormemente más complicado, ya que necesitamos hacer un bazo, un hígado, un cerebro computacional, un cuello, estómago, vesícula biliar, etc., y gusanos. solo hace falta hacer un intestino y algunos nervios. La idea de que el programa no ha aumentado de tamaño desde entonces, excepto por un factor de 2 o menos, es ridícula, el programa requerido si intenta escribirlo colaría la mejor supercomputadora moderna.
2. El genoma no codificante está estructurado y transcrito.
Si observa el ARN en un núcleo, encontrará que la transcripción está activa en todo el genoma, o al menos en un 90%. Este es el factor decisivo: la transcripción está regulada y es metabólicamente costosa.
3. El genoma no codificante contiene regiones conservadas
Hay regiones altamente conservadas que no corresponden a proteínas, a reguladores obvios, ni a nada asociado, solo están conservadas.
4. El programa de desarrollo se basa en ARN no codificante
El ARN no codificante largo se encuentra en todas las etapas de desarrollo en posiciones críticas, por ejemplo, hay ARN no codificante largo en la región de la cabeza de un huevo de pez (creo).
Estos puntos se hicieron en el artículo de Mattick de 2001. Dado que la predicción puede hacerse únicamente por consideraciones computacionales, sin tener en cuenta los datos biológicos, todas estas cosas son sorprendentes o inesperadas en los modelos tradicionales de biología, y son obvias en la vista del ARN.
Debe considerar la evolución del empalme alternativo. No es imaginable que pueda desarrollar un mecanismo de empalme sin un cálculo de ARN ya existente, ya que necesita empalmar y responder y cuando el intrón cambia, el intrón-empalmador necesita cambiar de manera coordinada. Lo mismo es cierto para la ruptura de cromosomas y las evoluciones de unión, debe permitir que estos se reproduzcan por un tiempo con animales que no se rompen.
Esto hace reinterpretaciones de la acción de todas las partes del genoma: los retrotransposones no son “parásitos”, son simplemente datos copiados de una parte del genoma a otra en el curso de la computación. Los endoretrovirus son funcionales y endógenos, y probablemente se usan para comunicar información genética de célula a célula, en lugar de ser infecciones congeladas.
Todas estas cosas son cosas que los biólogos se equivocaron, porque iban por estúpidos dogmas. Demasiado malo para ellos. Arrestado.