¿Qué significa un valor de bootstrapping de 100 en un nodo de árbol filogenético?

El análisis Bootstrap es una herramienta común en cladística y, en consecuencia, muchos autores tienden a creer que podría estar cerca de una prueba de monofilia. De hecho, es solo un procedimiento para calcular la redundancia de un cierto patrón de caracteres entre los taxones.

En el contexto estadístico, bootstrapping se refiere al uso de los datos disponibles para inferir la incertidumbre de dichos datos. Es decir, mejorar la estadística tirando de sus bootstraps. En la práctica, esto se logra muestreando o permutando los datos de entrada.

En términos de su árbol filogenético , los valores de arranque indican cuántas veces de cada 100 (en su caso) se observó la misma rama al repetir la reconstrucción filogenética en un conjunto de datos re-muestreados . Si obtiene 100 de 100 (y sus datos son lo suficientemente grandes como para admitir esto), estamos bastante seguros de que la rama observada no se debe a un único punto de datos extremos. Si obtiene 50 de cada 100, no podemos estar tan seguros.

El valor de arranque no dice nada directo sobre la conservación evolutiva: dice qué tan bien se admite este nodo en el modelo que está utilizando para generar un árbol filogenético. Bootstrapping es un procedimiento en el que se toma un subconjunto aleatorio de datos y se vuelve a ejecutar el análisis filogenético, y el valor informado es el porcentaje de réplicas de bootstrap en el que apareció el nodo. Por lo tanto, 100 significa que el nodo está bien soportado: se mostró en todas las réplicas de arranque.

¿Qué otros taxones hay en tu árbol filogenético? Eso ayudaría a interpretar el valor de arranque del 100%. Por ejemplo, si su árbol contiene un pájaro, un ratón y un ser humano, todo el valor de arranque muestra que el ratón y el ser humano son mucho más similares en este gen que un pájaro, lo que no debería sorprender a nadie. Si el tercer taxón es, por ejemplo, un perro, por otro lado, este árbol genético es compatible con el clado Euarchontoglires que se descubrió a través de la filogenética molecular. En cualquier caso, hay mejores formas de medir el conservadurismo evolutivo (p. Ej., Porcentaje de divergencia de secuencia entre el ratón y las secuencias humanas).

Los valores de arranque no paramétricos para los nodos del árbol filogenético se obtienen muestreando columnas de alineación / matix “con reemplazo” (es decir, cada columna se puede elegir una vez, más de una vez o ninguna) para crear una gran cantidad de conjuntos de datos pseudo-replicados que tienen el mismo tamaño (número de columnas) que el conjunto de datos original. El análisis (unión de vecinos, parsimonia máxima o probabilidad máxima) luego se ejecuta en cada pseudo-réplica y los árboles resultantes se usan para generar una tabla de frecuencias que nos dice con qué frecuencia una partición o “división” dada (rama que separa un grupo de taxones del resto) ocurre en el conjunto de pseudo-réplicas. Las frecuencias en la tabla que corresponden a divisiones encontradas en el árbol original (inferido del conjunto de datos original) pueden asignarse a los nodos en ese árbol, pero en realidad corresponden a la rama subyacente que “soporta” ese nodo.

El soporte de Bootstrap no nos dice nada sobre la conservación evolutiva (para eso, es posible que desee ver la distribución de tasa específica de columna si utilizó un modelo gamma (+ G) para inferir la filogenia). Más bien, el bootstrapping es un método ad hoc para determinar si la señal filogenética general es consistente dentro de un conjunto de datos y, por lo tanto, confiable.

Es importante destacar que muchas herramientas de visualización (p. Ej., FigTree) informan los valores de arranque como fracciones (p. Ej., 0.96 denota una frecuencia dividida del 96% en las pseudo-réplicas). Debe saber si su valor de “100” indica un 100% de soporte (muy alto) o una frecuencia dividida de 100 en 500 pseudo réplicas (20% de soporte; muy bajo ).

Significa que este nodo y sus descendientes se encontraron en cada iteración de submuestreo con reemplazo. Esencialmente significa que hay un fuerte soporte para ese nodo.

More Interesting

¿Qué es la adaptación conductual? ¿Cuáles son algunos ejemplos?

¿Es una coincidencia que los patrones de sueño humanos estén tan estrechamente relacionados con la duración de un día? ¿Qué pasaría si viviéramos en un planeta donde los días duraran 72 horas, tendríamos energía para permanecer despiertos todo el "día"?

Cuando Richard Dawkins dice "Soy un mono y tú también", ¿debería estar diciendo mono en lugar de mono?

Desde un punto de vista evolutivo, ¿por qué a los gatos les gusta que los acaricien?

Reptiles: Si los cocodrilos están técnicamente más relacionados con las aves que con, por ejemplo, lagartos o serpientes, ¿hay alguna característica morfológica objetiva en la que sean más similares a los lagartos o serpientes?

¿Podríamos criar personas para que se vean tan diferentes como los perros?

¿Debería la "inteligencia" del ADN tener un nombre científico importante comparable a la inteligencia en mente llamada conciencia o conciencia?

Al ritmo actual de la tecnología, ¿cuánto tiempo hasta que una cámara pueda superar al ojo humano en todos los sentidos?

¿Por qué los ciervos y otros mamíferos no se congelan en la nieve?

Si la evolución nos dice que los depredadores son los más inteligentes, ¿cómo es que los elefantes son tan inteligentes aunque no evolucionaron de un depredador?

¿Por qué la vida no evolucionó en la luna y solo en la Tierra?

¿Qué cambia exactamente en la evolución orgánica? ¿Es el rasgo o la entidad?

¿Cuál de las teorías: la selección grupal o la selección individual tiene más terreno en la biología evolutiva?

Cómo explicar la evolución del bagre al revés (Synodontis nigriventris)

Si los caucásicos europeos, de Europa, los Estados Unidos y otros lugares, continúan sin tener suficientes hijos, ¿se extinguirán?