Cómo alinear múltiples secuencias de ADN en python sin usar el módulo BioPython

No me gusta comenzar muchas de mis respuestas como esta, pero … eso depende de lo que quieras decir con “sin BioPython”.

Si desea evitar específicamente BioPython por razones de dependencia, puede instalar una utilidad de alineación de línea de comandos (Clustal, Muscle, MAFFT, etc.) y usar la función subprocess.call () en python para ejecutar el programa (importe el subproceso módulo). Esto es realmente fácil en la mayoría de los entornos Linux o Mac (menos en Windows).

Si está hablando de evitar las dependencias por completo (es decir, implementar su propio algoritmo de alineación), eso será mucho más difícil. Incluso una estrategia de “alineación progresiva” mínimamente efectiva implica la construcción de un árbol guía (para decidir el orden de construcción de la alineación) y una estrategia de alineación de programación dinámica (algoritmo Needleman-Wunsch para construir alineaciones iniciales por pares, así como un algoritmo modificado para alinear “bloques” de secuencias). Incluso si logra eso, la alineación que obtiene puede ser significativamente peor que la producida por un algoritmo de refinamiento heurístico o iterativo (Músculo o MAFFT).

More Interesting

¿Puedes encontrar a alguien en este planeta con el mismo ADN que tú? Si es así, ¿cómo?

¿Se puede reemplazar el ADN sintético basado en AEGIS por nuestro natural?

¿Qué país de Europa tiene más del Haplogrupo de ADN R1B1C?

Pregunta genética: Ser una mujer sin hermanos, ¿es posible a través de pruebas de ADN determinar si comparto a un padre con alguien que había sido dado en adopción pero con el nombre de mi padre en sus registros de nacimiento?

Parece que todo en este planeta tiene una razón y un propósito. ¿Por qué entonces (y cómo) es nuestro ADN 98% basura?

¿Qué vino primero: proteína o ADN?

¿Cuál es el simio más humano?

¿Cuáles son algunos ejemplos comunes de adenina y guanina?

¿Es posible empalmar el ADN humano con un animal de algún tipo y dar vida a una criatura híbrida viviente?

¿Cuál es el mejor documental que trata sobre el código de ADN?

¿Es el 5% en los resultados de ADN ancestral lo suficientemente significativo como para reclamar?

¿Cómo apareció el 4% del ADN neandertal en los no africanos?

¿Cómo entender los resultados de mi ADN Ancestry?

Los lenguajes de programación de computadoras tienen un umbral de error tan bajo (un carácter incorrecto puede impedir que un programa funcione). Pero el ADN biológico tiene un alto umbral de error. ¿Por qué no puede haber un lenguaje informático que funcione así, o existe?

¿Cuál es la tasa de ADN (Daily News and Analysis) para poner un anuncio en su sección de reclutamiento en Internet?