¿No son todas las secuencias homólogas?

En un sentido muy general y profundo, sí. Hasta donde sabemos, todo se remonta al origen de la vida. Pero una vez que surge un gen, y se transmite de generación en generación en un árbol de descendencia en evolución, sus copias particulares entre los descendientes, que pueden rastrearse hasta el origen del gen, se denominan homólogas. Las regiones genéticas que están demasiado distantemente relacionadas, por lo que las mutaciones posteriores han borrado cualquier rastro de similitud, no serían tratadas útilmente como ‘homólogas’. Por lo tanto, el uso habitual del término se refiere a aquellos cuya ascendencia común se puede rastrear. Las diferentes versiones de un gen dado, por ejemplo, que codifican una proteína de hemoglobina, se identifican fácilmente. Pero sus descendientes profundos de hoy pueden tener una función completamente diferente y solo ser identificados por algunos aspectos de su estructura proteica codificada, etc.

Si retrocede lo suficiente en la historia evolutiva, entonces sí técnicamente lo son. Pero, ¿qué nos dice eso realmente? Realmente no es gran cosa, solo que toda la vida proviene de un ancestro común supremo, que ya sabíamos.

Es más útil observar genes más estrechamente relacionados y buscar homologías allí. Por lo tanto, podemos observar las proteínas que transportan oxígeno en una amplia gama de especies. ¿Qué homologías hay? ¿El portador de oxígeno a base de cobre de los crustáceos tiene algo en común en secuencia con la hemoglobina de los vertebrados? ¿Qué nos dice esto cuando divergieron? ¿Qué especies dentro de un grupo más relacionado se desvían más? ¿En peces hay hemoglobinas especializadas para aguas profundas? Y así.

Cuando hay una pregunta de investigación que podría responderse buscando la homología de secuencia o la falta de ella, hay un punto para buscar y evaluar el grado de similitud.

Las secuencias no homólogas son aquellas en las que no podemos decir con certeza si están relacionadas o no, tienen muy poco en común. Es muy posible que hayan tenido un antepasado común hace millones o incluso miles de millones de años, pero mientras tanto hemos cambiado tanto que no podemos decir nada útil sobre lo que fue ese antepasado.

La homología de secuencia se define como un exceso de similitud entre dos secuencias de nucleótidos o proteínas, que refleja una ascendencia común. Es decir, la homología tiene que ser observable para ser considerada homología.

Entonces, por ejemplo, los genes que se han originado del mismo ancestro, pero que han cambiado tanto que su similitud genética está en los niveles de fondo, en la práctica no se denominarán homólogos.

Desde una perspectiva más filosófica, podríamos decir que la mayoría de las secuencias son homólogas. Sin embargo, creo que es razonable suponer que en la historia de la vida múltiples genes deben haber aparecido independientemente, en diferentes organismos y en diferentes momentos. Así que creo que sería más correcto decir que las secuencias de genes que observamos hoy son homólogas (en el sentido de que se derivan) de un número relativamente pequeño de secuencias ancestrales originadas de forma independiente.

La homología es una determinación de ascendencia compartida basada en la similitud. Tienes razón en que creemos que toda la vida tuvo un solo antepasado común, que probablemente tuvo un genoma corto. Esto significa que muchos genes tienen ascendencia común cuando regresas lo suficientemente lejos. Sin embargo, puede ver esto como un piso sobre homología, incluso si la mayoría de los genes tienen alguna homología distinta de cero entre sí, algunos genes tienen una ascendencia compartida mucho más reciente. Es posible que prefiera decir que la homología es un juicio binario, pero esto lo convertiría en un concepto bastante inútil. Después de miles de millones de años de tiempo evolutivo, es imposible descartar positivamente la homología entre dos secuencias, incluso aquellas que tienen identidad de secuencia cero.

Dicho esto, es poco probable que realmente todas las secuencias tengan homología, a menos que el primer genoma sea absolutamente pequeño. Es probable que el primer organismo completamente funcional y “vivo” del que descendió toda la vida requiriera una cantidad de genes que desempeñaran diferentes roles. ¿Como llegaron ahi? Una pregunta muy abierta. Pero las familias genéticas modernas descendieron de genes ancestrales que no eran necesariamente todos homólogos entre sí. La única forma en que la homología sería universal es si descendiéramos de un organismo de un solo gen más o menos.

En la práctica, es más una definición funcional. Cuando decimos que dos genes no son homólogos, queremos decir que no hay evidencia de que lo sean. Para genes importantes bajo una presión selectiva sustancial, podemos estar bastante seguros de que esto se remonta mucho tiempo atrás: las proteínas críticas como las histonas tienen una alta conservación de secuencia entre especies que están separadas por más de dos mil millones de años de tiempo evolutivo. Tal vez las histonas y la actina tienen un ancestro común muy, muy antiguo, pero han cambiado tanto que no podemos decirlo. Las secuencias no conservadas podrían tener un ancestro común mucho más reciente pero no una identidad de secuencia común, y en este caso no podríamos decirlo, pero este es el tipo de situación en la que probablemente tampoco nos importaría mucho.

editar: ¡Es importante no mezclar identidad y homología! La identidad de secuencia es evidencia de homología, pero las dos no son lo mismo.

Sí, en cierto sentido, pero si usa una definición tan específica de la palabra, se vuelve inútil. Es un poco como “relacionado”. Tengo un apellido inusual y solo he conocido dos veces a alguien del mismo nombre con quien no estoy relacionado. Pero si retrocede lo suficiente, TODOS están relacionados.