Para estudiar la evolución de una proteína particular encontrada en diferentes especies, es imprescindible que siempre se tomen las secuencias que aparecen después de una búsqueda de explosión, o está bien tomar las secuencias de proteínas particulares de diferentes especies y construir un árbol filogenético ?

Gracias por el A2A!

Lo que intenta hacer es establecer una homología entre las proteínas que se encuentran en diferentes especies para construir su árbol. Según la teoría evolutiva estándar, las secuencias más estrechamente relacionadas son más similares entre sí y, por lo tanto, comparten un ancestro común más reciente. Las anotaciones de homología entre proteínas de diferentes especies que se informan en las diversas bases de datos probablemente se basan en la secuencia y la homología funcional, por lo que al usar búsquedas BLAST para encontrar proteínas homólogas, esencialmente está haciendo esas comparaciones para encontrar homólogos a su proteína de interés. Sin embargo, esas anotaciones suelen ser un poco más estrictas que simplemente una homología basada en BLAST, por lo que es probable que haya menos falsos positivos, pero más falsos negativos que lo que aparece en una simple búsqueda de BLAST.

Una complicación importante de la búsqueda basada en BLAST de homólogos es la duplicación de gen / genoma, que introduce múltiples copias del gen en el mismo genoma. La divergencia posterior de estas copias paralogicas conduce a árboles evolutivos bastante desordenados. Dependiendo de qué es exactamente lo que está tratando de hacer, deberá tener esto en cuenta. Una buena manera de evitar esto es usar synteny para garantizar una verdadera homología.