¿Cuál es la diferencia entre las secuencias de ADN a gran escala frente a las de bolsillo (MinION), aparte del tamaño de la muestra?

Gran pregunta Y se complica.

Obviamente, hay una gran diferencia en el costo inicial. También hay una cuestión de mantenimiento y habilidad requerida para operar. Los MinION son lo suficientemente baratos como para descartarlos si algo sale mal, aunque a la inversa, muy poco puede salir mal con el instrumento que no sean los pines doblados. Por el contrario, los instrumentos grandes tienen muchas partes que pueden salir mal: líneas de fluidos, láseres, etc. Esto también limita su portabilidad: a la óptica no le gusta que la muevan y dependen de tener una red eléctrica o un muy buen sustituto de la energía. MinION se puede alimentar con una batería pequeña.

No hay un flujo de trabajo más rápido o más fácil para llegar de una muestra de ADN a una secuencia que el protocolo Rapid 1D en MinION. Algunos pasos simples de pipeteo y la secuencia se pueden cargar. Realmente hay clases de primaria que lo hacen. Por el contrario, pasar de una biblioteca de muestras a una lista para secuenciar en las máquinas grandes implica muchos más pasos y un equipo auxiliar.

Los datos son muy diferentes. En general, uno puede clasificar los secuenciadores modernos como lectura corta o lectura larga. Dentro de la categoría de lectura corta hay una gran cantidad de instrumentos con variación en sus estadísticas de rendimiento, así que centrémonos en Illumina, que es el líder del mercado.

La secuenciación de Illumina genera lecturas cortas de 150 en las máquinas dominantes o hasta 300 en el MiSeq. Las lecturas son pares finalizados; obtienes dos lecturas de cada fragmento. Los tamaños de los fragmentos pueden variar hasta aproximadamente una kilobase, aunque la mayoría de los grupos usan más cortos. Los perfiles de error de lectura muestran una probabilidad de inserción / eliminación muy baja y muy buenas llamadas de desajuste, aunque existen motivos de secuencia específicos asociados con errores particulares. La mayoría de las preparaciones de la biblioteca requieren PCR, lo que puede causar que algunas regiones del genoma (en particular con un contenido de G + C extremadamente alto o bajo) se salgan. El costo por par base puede ser extremadamente bajo, particularmente en los secuenciadores de gama alta. Por ejemplo, generar 30X de cobertura del genoma humano en el NovaSeq es de aproximadamente $ 1K por genoma, siempre que pueda alimentar suficientes genomas en el instrumento (si no recuerdo mal, son 48 genomas por corrida)

Hay una variedad de preparaciones de biblioteca para Illumina, algunas de las cuales pueden brindar información adicional. Por ejemplo, las lecturas cortas de Illumina no pueden resolver variantes estructurales muy largas, pero al usar la preparación de la biblioteca 10X Genomics y la decodificación posterior es posible resolver repeticiones mucho más largas y obtener información de haplotyping a largas distancias.

Otros secuenciadores de lectura corta son 454 (ya no están en el mercado, pero hay muchos datos), Helicos (descontinuado, pero ahora reiniciado por dos compañías separadas), Ion Torrent, Complete Genomics y QIAGEN. Cada uno tiene sus propias propiedades de error (como problemas de llamadas de homopolímero en Ion Torrent y 454).

Los secuenciadores de lectura larga en el mercado son Pacific Biosciences y Oxford Nanopore. La preparación de la biblioteca tiene un gran efecto en la duración de las lecturas. Las lecturas de PacBio generalmente muestran una caída exponencial en la longitud de lectura, con bibliotecas extremadamente buenas que tienen longitudes de lectura promedio en el rango de 20 kb y algunas lecturas extremas de quizás 50 Kb. Las distribuciones de lectura de Oxford Nanopore se aproximan más a una distribución normal, aunque con algunas lecturas extremadamente largas. Se han informado bibliotecas con tamaños medios superiores a 100 Kb, con la lectura mapeable más larga de más de 890 Kb de longitud.

Para los errores, los errores de PacBio son en gran medida no correlacionados / no sistemáticos. Las tasas de error sin procesar son típicamente del 15-20%. Las llamadas de homopolímero pueden ser problemáticas, pero con una profundidad de cobertura suficiente, pueden ser muy bajas. Se han informado tasas de error de consenso muy inferiores al 1%.

Oxford Nanopore todavía está involucrado en una batalla en curso con errores sistemáticos. Las tasas de error sin procesar dependen de la preparación de la biblioteca que se use (1D frente a 1D ^ 2, esta última brinda cobertura bicatenaria para una parte de las lecturas) pero a menudo se encuentran en el rango del 10-20%. La tasa de error de consenso es difícil de superar por debajo del 1%, aunque creo que se ha logrado el 0,5%. Oxford Nanopore y los grupos académicos están desarrollando activamente mejores algoritmos de pulido de secuencia y llamada base, por lo que estos números están sujetos a revisiones frecuentes.

Tanto PacBio como Oxford Nanopore pueden detectar la metilación en el ADN sin ningún manejo especial, mientras que los otros secuenciadores requieren preparaciones especiales de la biblioteca, como el tratamiento con bisulfito.

MinION tiene algunas propiedades inusuales. En particular, cada elemento de secuenciación se puede reutilizar muchas veces, mientras que para cualquier otro cuadro, un conjunto fijo de fragmentos de ADN genera una secuencia y eso no cambia durante una ejecución. MinION incluso puede realizar una secuencia de lectura hasta, en la que el secuenciador rechaza dinámicamente fragmentos de una secuenciación posterior en función de una mirada inicial al fragmento. MinION también es el dispositivo de secuenciación más rápido, especialmente si considera la preparación de la biblioteca. Con la secuenciación rápida de 1D, es posible adquirir cientos de megabases de secuencia una hora después de recibir una muestra de ADN, mientras que ninguna de las otras plataformas se haría preparando la biblioteca en ese momento.

Para calcular el costo de los proyectos, se complica muy rápidamente. Los secuenciadores de Illumina ofrecen el mejor costo por par de bases, si puede organizar con éxito proyectos en secuencias de secuencia. Pero PacBio y Oxford Nanopore pueden proporcionar información de largo alcance que es difícil o incluso imposible de obtener con Illumina, incluso con trucos como nubes de lectura 10X. Por ejemplo, si observa algunas secuencias recientes del genoma de novo, los N50 contig para los genomas de lectura larga a menudo son similares a los N50 de andamio para los genomas de lectura corta potenciados 10X. Eso significa que los genomas de lectura larga son mucho más contiguos, aunque para cualquier par de bases dado es más probable que el genoma de lectura corta sea correcto. Y, por supuesto, muchos grupos mezclan las tecnologías para obtener lo mejor de ambos mundos, aunque a un costo mayor que quedarse con uno.

Espero que ayude. A menudo cubro estos temas en mi blog y son infinitamente interesantes, y cambian constantemente.

More Interesting

Si el ADN constituye cada cosa viviente, ¿no está toda cosa viva hecha de la misma cosa, sino en un orden diferente de las cosas que forman nuestro ADN?

¿Hay alguna nacionalidad que tenga un ADN genético único?

¿Cómo la ADN polimerasa elimina y reemplaza un cebador durante la replicación del ADN?

¿Cuánta información almacena el ADN humano?

¿Por qué solo usamos etanol en el aislamiento de ADN? ¿Podemos usar también metanol?

¿Cuánto ADN deben compartir dos especies para reproducirse con éxito?

¿Por qué el ADN tiene 2 hebras ... 2% de uno de ellos codifica proteínas ... El resto hace cosas epigenéticas ... Pero, ¿qué hace su hebra hermana?

Acabo de hacer pruebas genéticas para la ascendencia, y descubrí que mi supuesto padre biológico no es mi padre después de todo. Cuando le pregunté a mi madre sobre el desajuste, se sorprendió. ¿Realmente tengo que saber quién es mi padre?

Al secuenciar el ADN para una muestra que contiene miles de especies diferentes de bacterias (por ejemplo, fauna intestinal, agua de mar, suelo, etc.), ¿cómo separan los científicos una especie de otra?

¿Cuál es la biotecnología de las huellas digitales de ADN? ¿Cómo se usa y cuáles son algunos ejemplos?

¿Cómo trata la clonación con el ADN mitocondrial?

¿Cuáles son las posibilidades de que el ADN humano sea una fórmula matemática?

¿Qué son las secuencias palindrómicas en el ADN?

¿Cuántas guías telefónicas llenaría nuestra secuencia de ADN?

¿Cómo es que los huesos no tienen ADN? ¿No podríamos simplemente extraer el ADN de los dinosaurios de los fósiles?