¿Qué programas se utilizan para construir una alineación de secuencia de ADN para identificar diferencias entre dos ADN?

La alineación de secuencias es un campo rico; Ciertamente, (y cualquier estudiante del campo) es una grave injusticia pensar que solo es un análisis de cadenas. Debe preguntar por qué está alineando las dos secuencias y los aspectos clave de la naturaleza de las secuencias. De lo contrario, es poco probable que obtenga la mejor respuesta a su pregunta. Las expresiones regulares generalmente no son adecuadas para estos problemas, porque las alineaciones permiten niveles desconocidos de desajustes en su consulta.

Por ejemplo, una división importante en los algoritmos de alineación es si son locales o globales. Las alineaciones locales encuentran la mejor alineación regional, mientras que las alineaciones globales requieren que se use toda la secuencia. Otra división más; podemos alinearnos localmente con respecto a uno secuenciado y globalmente con respecto al otro. Dependiendo de su problema, las alineaciones local-local, local-global o global-global pueden ser correctas. BLAST realiza alineaciones locales-locales.

Diferentes algoritmos de alineación pueden modelar cosas diferentes. Por ejemplo, puedo tener un alineador que alinee dos secuencias de ADN de una manera simple. Otro puede alinear las secuencias asumiendo que uno es un ADN genómico y el otro es un ADNc, lo que permite a los intrones como un tipo especial de brecha. Otro puede crear la mejor alineación con la posibilidad de que las secuencias lineales representen moléculas circulares. Incluso podríamos encontrar el mejor conjunto de alineaciones que permitan que una sea una permutación de bloque de la otra secuencia.

Los alineadores nunca deben tratarse como simples cajas negras. Siempre tienen parámetros libres que pueden afectar críticamente las alineaciones generadas. Por ejemplo, muchos modelos de alineación con cuatro parámetros: un puntaje de coincidencia, un puntaje de desajuste, una penalización por apertura de hueco y una penalización por cierre de hueco. Pero otros permiten una matriz de puntajes para coincidencias / desajustes. Por ejemplo, si está buscando elementos involucrados en la hibridación de ARN-ARN, no desea penalizar las alineaciones de G a T de la misma manera que penalizaría las alineaciones de C a T, ya que G puede emparejarse con T en el ARN.

La memoria y el cálculo también pueden ser importantes a tener en cuenta. La familia de programas BLAST es ampliamente utilizada, pero es un simple alineador local y utiliza la heurística para acelerar la búsqueda; no se garantiza encontrar la mejor alineación entre secuencias. Smith-Waterman, está garantizado para encontrar la mejor alineación bajo un conjunto de parámetros dado. Las implementaciones de Smith-Waterman están ampliamente disponibles (si te tomas en serio la biología computacional, te recomiendo que escribas la tuya no para usarla sino para comprender realmente el algoritmo). La implementación obvia de Smith-Waterman requiere memoria proporcional al producto de las longitudes de las dos secuencias; Esto puede ser un problema con las comparaciones a escala cromosómica. Hay una solución alternativa que intercambia memoria por tiempo de ejecución adicional.

BLASTN (BLAST para las comparaciones de nucleótidos a nucleótidos) es un programa muy útil, pero inadecuado para muchas tareas. No es bueno para encontrar motivos cortos o para comparar secuencias muy distantes. Elige tu herramienta para el trabajo

¿Qué programas se utilizan para construir una alineación de secuencia de ADN para identificar diferencias entre dos ADN?

Para secuencias relativamente cortas (no el tamaño del genoma), hay muchas opciones. Buscar “alineación por pares” encontrará muchas opciones.

Las herramientas que he usado (probablemente desactualizadas ahora) fueron:

ClustalW

Café T

Músculo

Y BLAT no es específico para la alineación de secuencia por pares, pero puede usarse de todos modos.

Si necesita comparar una secuencia con un gran número de secuencias, por ejemplo, todas las secuencias conocidas, no puede evitar BLAST.

Si necesita alinear dos genomas, también hay muchas opciones. El que más usé fue Mauve, que fue desarrollado por Aaron Darling original en UW Madison (ahora tiene su propio laboratorio).

La forma más fácil y automática de comparar dos secuencias de ADN en línea es con la herramienta BLAST de nucleótidos del Centro Nacional de Información Biotecnológica (NCBI) de los Institutos Nacionales de Salud (NIH)

Hay muchas otras formas de hacer esto, como señaló Daniel Super , pero esta es probablemente la más accesible para aquellos sin experiencia en programación.

“¿Qué programas se utilizan para consistir en una alineación mientras se intenta descubrir una diferencia genómica entre dos ADN?”

Realmente, todo lo que estás hablando es el análisis de cadenas. Cualquier cosa que pueda hacer expresiones regulares funcionará.

Hablé con una mujer que trabajaba en genómica que básicamente estaba escribiendo código Python porque Python tiene un excelente manejo de cadenas.

More Interesting

¿Son las señales eléctricas en el cerebro lo suficientemente fuertes como para romper las moléculas de ADN y volver a unirlas para formar recuerdos en el ADN?

¿Qué se crea cuando las cadenas de cromosomas se unen?

Si tomo una prueba de ADN ancestral y soy mujer, ¿puedo aprender algo del lado de mi padre o solo del lado de mi madre?

¿La telomerasa agrega secuencias para cada replicación o espera a que se exponga el cebador?

Si el ADN significa ácido desoxirribonucleico, significa que es de naturaleza ácida. ¿Podemos hacerlo neutral usando una solución básica?

¿Será posible en el futuro que podamos reencarnar a las personas de sus fragmentos de ADN?

¿Cómo se ve la estructura molecular en los extremos de una hélice de ADN?

¿La materia orgánica depende del ciclo día-noche y su descanso nocturno?

¿Es posible simular ADN?

¿Cómo una combinación de solo 4 bases en el ADN almacena toda la información de la célula desde la división hasta la muerte? ¿Cómo rRNA entiende lo que está escrito en mRNA? ¿Cómo es posible que una proteína pueda transportar información, ya que es solo una combinación de diferentes aminoácidos?

¿Cómo se originó el ADN del cloroplasto?

¿Cuáles son los genes inactivos humanos que heredamos y que están activos en otros animales?

¿Hay alguna evidencia sobre la correlación entre el lenguaje y el ADN?

¿Debería ser ley tomar un ADN de todos?

¿Algún turco tiene primos griegos de ADN? Soy griego, pero tengo unos pocos primos de ADN turco y albanés según 23andMe.