Genómica: ¿el proyecto ENCODE es legítimo o incorrecto?

El proyecto ENCODE es perfectamente legítimo. Promete dar mucha información útil sobre la expresión de ARN.

Desafortunadamente, los autores decidieron que eso no era suficiente, y en sus comunicados de prensa también enviaron un mensaje completamente idiota sobre el “ADN basura”. Esa historia no fue respaldada por su ciencia, y apenas fue mencionada en su artículo revisado por pares. Y ese mensaje es lo principal que han empujado los medios de comunicación, y parece ser lo único que la gente recuerda del estudio.

Brevemente, decidieron (en su comunicado de prensa) redefinir “basura” con una definición completamente irrelevante, sin sentido y completamente nueva de “expresado”. Luego afirman que el 80% del genoma se expresa y, por lo tanto (según su propia definición personal de comunicado de prensa), no es basura.

No solo no hay razón para creer que el ADN basura no se expresaría, sino que existen todas las razones, teórica y experimentalmente, para creer que el ADN basura se expresará. Cuanto más basura sea, es más probable que se exprese, porque si es completamente inútil, hay una mínima selección natural en su contra.

Es uno de esos momentos de lanzamiento de prensa de ciencia que dejó a la gente en el campo sin palabras. Es un momento ” ni siquiera equivocado” .

Algunas lecturas: ¿Es una chatarra de ADN basura? Una crítica de ENCODE (el documento de PNAS no es totalmente accesible, pero Larry Moran tiene un resumen decente: la crítica de Ford Doolittle de ENCODE en Sandwalk).

Comentario enfurecido de Dan Graur: Sobre la inmortalidad de los televisores: “Función” en el genoma humano según el Evangelio libre de evolución de ENCODE

También hay varias otras críticas revisadas por pares de la afirmación de ADN basura ENCODE. Pero de nuevo, eso es, como el 5% de ENCODE, la parte del comunicado de prensa. El 95% de la misma, la parte que se publicó como artículos revisados ​​por pares, está bien.

El proyecto ENCODE llegó a conclusiones perfectamente válidas que fueron obvias para algunas personas durante una década antes del inicio del proyecto. De hecho, sus resultados brindan un fuerte respaldo a la tesis de que hay muy poco ADN basura, que al menos el 80% del ADN se transcribe en los núcleos celulares, aunque solo una fracción muy pequeña de este tiene un papel en la síntesis de proteínas o se conoce regulación.

A pesar de las afirmaciones de otra respuesta aquí, no hay absolutamente ninguna razón para esperar que el ADN basura se exprese en absoluto. Esto no es ruido, nadie que no tuviera una idea de lo que estaba haciendo el ADN basura predijo que el ADN basura se expresaría cuidadosamente o incluso se expresaría en absoluto, aparte de aquellos que sabían que era funcional.

La expresión genética está regulada por múltiples elementos en cada gen, requiere que las proteínas se unan, otra proteína para llevar la secuencia al ARN, y se controla cuidadosamente con moléculas chaperonas que modifican y etiquetan la transcripción en los casos en que conocemos la función. El proceso no es una unión accidental fortuita de un único factor de transcripción a un dominio aleatorio que conduce a una secuencia de ARN accidental ridícula que se degrada, requiere la activación de complejos para formarse y está estrictamente regulada.

La expresión y los datos del factor de regulación revelados por el proyecto ENCODE son una evidencia extremadamente sólida de la función relevante real completa del 80% del genoma. Hay que recordar que estos patrones de expresión del genoma no codificante son estables y reproducibles de tipo celular a tipo celular, se controlan mediante programación durante la embriogénesis, según lo establecido por Mattick, y su función se demuestra simplemente por el hecho de que la célula se preocupa por transcribirlos. en absoluto, ya que esto no sucede cuando inserta galimatías al azar en los genomas. Los eucariotas no son bacterias.

Pero los ARN no codificantes no solo se transcriben, se transcriben en niveles regulares que son estables en la embriogénesis de tipo celular a tipo celular, y cambian en el tiempo de manera que reflejan el programa de desarrollo en curso. Este tipo de transcripción regular es una pistola humeante de función, es solo que la función no es del tipo estándar.

Entonces, ¿cuál es la función de estos ARN? No está establecido en la literatura científica, pero me gustaría dar una hipótesis que creo con certeza. Sabiendo esto, ninguna de las conclusiones de ENCODE fue sorprendente en absoluto.

Los ARN se transcriben para participar en el cálculo puro de ARN-ARN, mediado por proteínas chaperonas que se unen y modifican el ARN de forma complementaria para hacer un ciclo completo de Turing de ciclo cerrado, con el único propósito de pensar qué hacer (aunque con un cálculo de gigabytes , entonces el pensamiento es limitado). Mattick propone que la red de ARN es una unión complementaria en el núcleo, pero estoy seguro de que el ARN se reescribe activamente en este proceso, las secuencias masticando los datos para producir nuevos datos de bytes de ARN. La razón para reclamar la reescritura en lugar de solo el enlace complementario es simplemente que la capacidad computacional aumenta en un factor de al menos 10-30 (dependiendo de los detalles) si permite la reimpresión y reescritura, a diferencia del enlace complementario fijo, porque el enlace es por dominios que son fijos y no cambian de longitud 10-30 bases por especificidad, mientras que la reescritura permite que el espacio de secuencia de ARN completo sea RAM. El principio de que un sistema biológico maximiza su capacidad de información es bastante preciso. Pero podría ser por lo que Mattick está pensando también, entonces es mucho más difícil de probar.

Debo señalar que en esta imagen teórica, los elementos transponibles y los endoretrovirus del genoma no son en absoluto inserciones aleatorias basura, sino inserciones deliberadas de una secuencia etiquetada en el ADN. Las etiquetas pueden modificarse mediante el cálculo de ARN, pero contienen partes conservadas para que la inserción se rastree correctamente en su red. Un transposón alu es solo una etiqueta para identificar la transcripción para que pueda identificarse en la producción, y la inserción es una especie de mutación larga y coherente, ha modificado la computación programada por el ADN en un fasion permanente. No hay evidencia de que estos elementos sean parásitos, aparte de que aparecen en muchos lugares del genoma, se replican y “Crick lo dice”. La paradoja del número C tampoco es una paradoja en este punto de vista, ya que primero no es cierto, la mayoría de los genomas se correlacionan con la complejidad ingenua, aparte de la poliploidía, y en segundo lugar, se relaciona con elementos transponibles, por lo que es solo un La manifestación de un organismo evolucionó para almacenar más o menos datos computacionales en el genoma.

La prueba firme de esto es simplemente encontrar secuencias completamente no asignables o secuencias parcialmente asignables que han sido editadas en gran medida por el cálculo. Si el cómputo almacena datos mediante la repetición y la reescritura, no puede evitar encontrar una tonelada de secuencias completamente inexplicables en la secuencia de ARN nuclear seleccionada sin poliA.

Ya sabemos que los sistemas biológicos son capaces de desarrollar computadoras de alta sofisticación, nuestro cerebro es un ejemplo. La afirmación aquí es que la célula ha desarrollado una computadora de este tipo mucho antes, aunque necesariamente de una complejidad mucho menor.

Para no repetir, vincularé otra respuesta mía aquí: la respuesta de Ron Maimon a ¿Es realmente inútil el llamado “ADN basura”? ¿Qué está haciendo?