¿Es convincente la evidencia “nueva” (página en Arxiv) de un origen cósmico de la vida en la Tierra?

Guau. Este artículo es sorprendentemente malo, desde todos los ángulos posibles. Descubriré los defectos más importantes.

La suposición injustificada de un aumento exponencial en la “complejidad” genómica es la más grande. Proporcionan un razonamiento casual y sin sentido para esto en las páginas 5-6, y es completamente incorrecto. La tasa de evolución molecular es increíblemente variable en todas las escalas. Incluso las secuencias conservadas evolutivamente experimentaron una alta tasa de evolución cuando evolucionaron por primera vez (esto es importante para más adelante, tenlo en cuenta). Los factores más importantes que influyen en la tasa de evolución molecular (y, por lo tanto, en la evolución de la “complejidad genómica”) son:

  • Tiempo de generación: cuanto más lento es, más daño de ADN se acumula y, por lo tanto, ocurren más mutaciones;
  • Tasa de metabolismo: más radicales libres conducen a un mayor daño en el ADN, lo que lleva a mayores tasas de mutación);
  • Tamaño de la población: las poblaciones pequeñas experimentan una deriva genética mucho mayor, lo que lleva a que las mutaciones nocivas se fijen en lugar de ser expulsadas, lo que daña el cálculo.
  • Aleatoriedad simple: recuerde que estas cosas bioquímicas son en gran medida estocásticas, no deterministas.

Este defecto se ha discutido hasta el infierno y de regreso en la literatura sobre el reloj molecular, donde los primeros estudios asumieron un reloj global que funcionaba a la misma velocidad para todos los genes y todos los organismos. Por ahora, sabemos que no hay un reloj global, y que cada gen en cada especie tiene una tasa de evolución diferente. Los autores ignoraron todo esto y optaron por un modelo ultra simplista que ni siquiera obtendría la tasa de divergencia correcta para una especiación de 100 años (¡eso es una estimación aproximada, pero definitivamente no para nada hace más de 1 millón de años!).

El problema con este modelo es que cuando estás tratando de encontrar un tiempo de divergencia pasado, básicamente estás extrapolando del presente, porque solo tenemos los genomas de organismos que aún están vivos hoy. El procedimiento habitual en un estudio confiable es el siguiente:

  • Elija su especie apropiada y el (los) gen (es) o proteínas que tienen la tasa de evolución más apropiada (es decir, evolucionaron de manera relativamente constante durante el período de tiempo que está viendo), o que son de interés para su pregunta de investigación.
  • Construir un árbol filogenético basado en las secuencias.
  • Calibre el árbol para introducir el eje de tiempo. La calibración se realiza utilizando fósiles o eventos geológicos conocidos (por ejemplo, si está estudiando la evolución en una isla, la formación de esa isla es el mejor momento de calibración para usar).
  • A partir de aquí, el programa calcula una tasa de sustitución, teniendo en cuenta la distancia genética y el eje del tiempo. Usando esa tasa de sustitución, extrapola en el tiempo para encontrar el tiempo de origen del gen.

Por ahora, la forma en que se realiza esta extrapolación es bastante compleja, teniendo en cuenta las tasas variables de evolución molecular, las características específicas de especies y genes y los eventos históricos. Pero no importa cuán sofisticados se vuelvan los algoritmos, todavía están tratando de compensar lo que fundamentalmente falta información, porque las moléculas (genes, proteínas) no corresponden exactamente a la morfología (calibraciones fósiles utilizadas por el tiempo), ni evolucionan de la misma manera. . Esta es la razón por la cual las fechas del reloj molecular siempre serán, sin excepción, anteriores al registro fósil (un problema que se hizo más famoso con los estudios de la Radiación Cámbrica y de las plantas terrestres). Es un problema intrínseco de mezclar necesariamente dos tipos de datos muy diferentes.

De todos modos, ¿qué tiene que ver esta experiencia práctica con este documento? Sencillo. El punto es que al hacer una reconstrucción histórica de este tipo, siempre acumulará pequeños errores que superan la verdadera fecha de origen. Cuando se estudian filogenias bien restringidas o eventos relativamente recientes, estos errores son insignificantes y de todos modos están cubiertos por las barras de error.

Pero cuando vuelves a algo tan antiguo como hace 400 millones de años y más, los errores comienzan a acumularse y se vuelven cada vez más notorios, especialmente porque la cantidad de calibraciones y sus confiabilidades disminuyen en el tiempo debido a la naturaleza intrínsecamente irregular del fósil. grabar.

Además, cuando se trata del origen de cualquier cosa , tendrá una avalancha de innovación evolutiva y una mayor tasa de evolución. Vemos esto con los ejemplos que mencioné anteriormente, el origen de los animales y las plantas terrestres, ambos eventos que involucran duplicaciones genéticas masivas, mutaciones y reordenamientos en muy poco tiempo. Debido a la falta de calibraciones para tales eventos ultrarrápidos, el error de los relojes moleculares aquí puede ser bastante masivo (por ejemplo, una vez tuve un estudiante que me mostró su resultado final de animales que se originaron hace 3 millones de años). Y los modelos matemáticos solo pueden compensar tanto.

Estos son problemas que tenemos incluso con los estudios más sofisticados que utilizan algoritmos de vanguardia que tienen en cuenta los matices biológicos y evolutivos.

Este documento deja de lado todo esto sin una explicación razonable, y simplemente traza una línea recta hacia atrás. Y espera que nos lo tomemos en serio. No puedo hacer eso

No, no es convincente, porque los genomas no siguen una línea recta en complejidad, ni los últimos puntos son correctos: la complejidad del genoma no se mide por el “genoma funcional no redundante”, probablemente se mida mejor comprimiendo el genoma usando bzip2.

La datación de la divergencia procariota está rota, porque no tenemos idea de cómo son los genomas hace 3.000 millones de años. Esto está comparando la complejidad moderna del genoma. Además, no hay un buen modelo de cómo una molécula autorreplicante puede evolucionar para hacer otra cosa que no sea convertirse en el autorreplicador más eficiente, y mucho menos alargarse, por lo que la idea de que la complejidad del genoma es lineal en el tiempo no tiene respaldo y es ridícula.

El origen de la vida en la Tierra se describe en una respuesta mía aquí: la respuesta de Ron Maimon a ¿Cómo comenzó la vida en la Tierra? . No tiene nada que ver con las moléculas autorreplicantes, es una red de proteínas junto con el recurso energético del petróleo.

Tenga en cuenta que arXiv no es una revista revisada por pares. Contiene artículos de revistas de revisión por pares, así como preimpresiones y, básicamente, cualquier cosa que alguien quiera publicar.

Dicho esto, este artículo parece tan sensible como esta pequeña joya:


Es decir, hagamos un montón de suposiciones simplificadoras que se sabe que entran en conflicto con la realidad y pretendamos que la respuesta significa algo perspicaz (no lo hace).

Ok, para darle un poco más de crédito al documento al que se hace referencia, podría tener algún sentido lo que están diciendo (muy bien podría haber componentes orgánicos de origen cósmico críticos para la historia de la vida en la Tierra, como fuentes de aminoácidos, posiblemente incluso cadenas de péptidos), pero sus datos son extremadamente pobres y no admiten un origen cósmico de la vida (tal como la conocemos).

Me refiero a ¿Es convincente la evidencia “nueva” (página en Arxiv) de un origen cósmico de la vida en la Tierra? para obtener detalles sobre todas las formas en que se queda corto.

Dicho todo esto, agradezco las especulaciones, incluso las especulaciones publicadas, pero la gente necesita (más) etiquetar claramente tales artículos como tales para evitar confusiones.