¿Qué son la secuenciación 454 y la secuenciación Illumina Hi, en detalle?

454 es una plataforma de secuencia descontinuada que ahora es interesante solo para fines históricos o para comprender su espectro de error distintivo que se ve en gran parte de los datos generados con él. O para personas a las que les gusta desmontar secuenciadores antiguos. Arqueología del secuenciador

Si observa los secuenciadores modernos, existen múltiples propiedades que pueden usarse para clasificarlos y distinguirlos y comprender su evolución.

  • Molécula clonal versus molécula única: ¿el secuenciador finalmente lee una señal de un conjunto de moléculas idénticas o realmente lee una sola molécula?
  • Preparación de plantillas clonales: para sistemas clonales, cómo se convierte una molécula única en una población clonal. Los ejemplos incluyen PCR en emulsión, PCR puente, amplificación de círculo rodante
  • Formato de plantilla: plantillas gratuitas en solución, dentro de microgotas, en cuentas o simplemente en una superficie plana
  • Geometría de plantilla: para cuentas o superficies sólidas, simplemente se empaquetan al azar o se ordenan en una matriz.
  • Elementos activos de un solo uso o reutilizables. Si el secuenciador completa la lectura de una secuencia, ¿se puede reutilizar esa posición en la arquitectura del secuenciador o no durante la ejecución? En otras palabras, si hay N elementos secuenciables en el dispositivo, ¿se pueden generar más de N secuencias a partir de una ejecución?
  • Secuenciación continua, cíclica o instantánea. ¿La secuencia emerge constantemente del dispositivo o hay un conjunto definido de pasos que se ciclan, con datos adicionales que emergen solo en un paso? Lo que llamo instantánea adquiriría toda la secuencia en una sola adquisición de datos.
  • Relación entre la secuencia de lectura y el ADN dado: es la señal de leer directamente el ADN, leer el acto de hacer una copia de la plantilla (secuenciación por síntesis), o algo más (por ejemplo, secuenciación por ligadura, secuenciación por- hibridación)
  • Nucleótidos simples o agrupados: para la secuenciación por síntesis, es la polimerasa presentada con un solo nucleótido o más de uno. En el caso del grupo, generalmente se proporcionan los cuatro
  • Síntesis terminada o no terminada: para esquemas de secuenciación por síntesis, la polimerasa está limitada a agregar un nucleótido a la vez o puede agregar múltiples nucleótidos.
  • Mecanismo de detección: cómo se detecta la señal. Por ejemplo, microscopía óptica o electrónica o eléctrica.

Elegí estas dimensiones porque ilustran aspectos clave en los que difieren las plataformas de secuenciación comercializadas y anunciadas.

454 era un método clonal que usaba PCR en emulsión en perlas como preparación de la plantilla, que luego se cargaba en una matriz de micropocillos con diseño. Cada pozo contendría la misma cuenta durante la ejecución. Se utilizó un esquema de secuenciación cíclica por síntesis en el que los nucleótidos individuales no nativos terminadores fluyeron sobre las plantillas y la incorporación exitosa se detectó ópticamente. La detección se realizó mediante pirosecuenciación, utilizando una cascada enzimática para convertir el pirofosfato liberado por la incorporación de nucleótidos que se convirtió en un destello de luz.

Compare eso con la secuencia de Ion Torrent, que es esencialmente idéntica, excepto en la química y el mecanismo de detección. Ion Torrent utiliza un método eléctrico para detectar el cambio de pH causado por la incorporación de nucleótidos en lugar de la detección óptica de la liberación de pirofosfato de 454. Eso hizo que la química de Ion Torrent sea más simple y el instrumento más simple, más pequeño y menos costoso. Pero ambos instrumentos tienen dificultades para contar correctamente la longitud de las ejecuciones de homopolímeros (por ejemplo, AAAA frente a AAAAA) porque utilizan síntesis no terminada y sus señales no son lineales frente al número de nucleótidos incorporados en un solo ciclo. Por el contrario, debido a que ambos usan nucleótidos nativos, tienen tasas muy bajas de incorporación incorrecta. Las longitudes de lectura de una ejecución en 454 o Ion Torrent mostrarán una distribución, dependiendo del patrón de homopolímeros y la correlación entre el orden de los flujos y la secuencia subyacente. Por ejemplo, si los flujos están en el orden A, T, C, G, una plantilla que comience con una G no generará datos hasta el tercer flujo, mientras que una plantilla que comenzó con ATTTCG ya habría generado 6 bases de datos ( suponiendo que el TTT se midió correctamente).

Illumina es un método clonal que utiliza PCR puente o amplificación de exclusión para la preparación de plantillas. Operacionalmente, estos son mucho más simples de realizar que la PCR en emulsión. Las plantillas se preparan como una matriz aleatoria en una superficie sólida (PCR de puente) o en un microarray con diseño (amplificación de exclusión). Nuevamente, el espectro de plantillas a secuenciar se determina cuando se prepara la plantilla. La secuencia cíclica se realiza mediante el flujo de agrupaciones de terminadores reversibles marcados a través de la celda de flujo; los cuatro nucleótidos se presentan a la vez. Debido a que están terminados, la química de Illumina tiende a funcionar muy bien con los homopolímeros. La detección óptica significa instrumentos relativamente grandes. Después de obtener imágenes de la celda de flujo, los flujos adicionales eliminan el resto terminador (que incluye la etiqueta fluorescente) y se preparan para otra ronda de secuencia. Cada ronda genera exactamente un nucleótido por plantilla, por lo que las lecturas de Illumina son fijas.

Illumina también tiene un truco para generar datos finales emparejados a partir de la misma plantilla. Después de secuenciar un lado de la molécula, se usa un poco de química inteligente para eliminar la cadena de producto de la secuenciación, generar una copia completa de esa cadena y luego unir un cebador a esa copia. Ahora la secuencia puede proceder desde el otro lado. Las ejecuciones de Illumina también pueden presentar una mayor eliminación y luego secuenciación con cebadores que reconocen los códigos de barras dentro de las secuencias del adaptador, lo que permite agrupar muchas muestras en una ejecución sin sacrificar la longitud de lectura colocando los códigos de barras dentro de las lecturas principales (códigos de barras en línea). Estos sitios de códigos de barras adicionales también se prestan a esquemas de códigos de barras combinatorios en los que los códigos de barras se agregan por PCR. La combinación de códigos de barras en línea y fuera de línea puede generar esquemas de códigos de barras espectacularmente complejos, que se utilizan en algunos sistemas adicionales para Illumina.

Desde 454. Ion Torrent e Illumina (así como QIAGEN) leen la señal de las plantillas clonales, las longitudes de lectura están en última instancia limitadas por el problema de fase. Idealmente, las reacciones de secuenciación se llevarían a cabo en un bloqueo perfecto de todas las moléculas de ADN en un conjunto clonal, pero eso no sucede en la vida real. En cada ciclo, alguna fracción del ADN no se extiende o extiende un bit extra. Por ejemplo, imagine si la mezcla Illumina contenía una fracción contaminante de nucleótidos nativos al 1%; permitirían la extensión por dos bases en aproximadamente el 1% de las plantillas (peor si la polimerasa favorece al nativo sobre el terminador). La amplificación de puente en Illumina también puede ser problemática con plantillas largas, o al menos usar plantillas largas reduce el número de plantillas que pueden secuenciarse, ya que el tamaño del punto en la matriz está relacionado con la longitud de la plantilla y los puntos generalmente crecen hasta que se unen uno contra el otro. Entonces, 454 longitudes de lectura de alrededor de 1000 pb, Ion Torrent tiene 400 kits de pares de bases, pero la química más larga de Illumina es de 300 pares de bases (pero en pares, es decir, 300 de cada extremo).

Por el contrario, Illumina logró densidades mucho más altas de plantillas de secuenciación que la mayoría de los otros sistemas, dando una gran ventaja en la cantidad de datos que se pueden generar en comparación con 454 e Ion Torrent.

Illumina ha anunciado una nueva plataforma llamada Firefly que tomaría prestada gran parte de su esquema actual de secuenciación por síntesis, pero utilizaría un esquema de detección eléctrica. Se planea que los instrumentos Firefly sean mucho más pequeños que cualquiera de los instrumentos Illumina actuales y también menos sensibles al movimiento, ya que no tendrán un microscopio de alta potencia como componente clave.

Si observa otras plataformas de secuenciación, puede ver cómo algunas de mis otras dimensiones las diferencian de estas y también son similares. Por ejemplo, SOLiD fue (¿no está seguro si se ha retirado por completo?) Un método cíclico y clonal mediante PCR en emulsión con plantillas en cuentas pero empaquetadas al azar. Detección óptica, pero secuenciación por ligadura. Complete Genomics fue un esquema de secuenciación por ligadura, pero con preparación de plantilla de círculo rodante. Helicos (ahora revivido por dos compañías diferentes) fue la secuenciación cíclica de una sola molécula por síntesis con terminadores individuales que fluyeron a través de la celda de flujo. QIAGEN se parece mucho a Illumina, pero utiliza una química de círculo rodante para producir plantillas. Pacific Biosciences es una secuenciación de una sola molécula continua por síntesis con detección óptica. Oxford Nanopore es un esquema continuo de lectura directa de una sola molécula con detección eléctrica y la única de estas plataformas que puede recargar un elemento activo con una nueva plantilla durante una ejecución. La tecnología inédita Genia / Roche es la secuenciación continua de una sola molécula por síntesis con detección eléctrica. El sistema propuesto por ZS Genetics usaría microscopía electrónica para adquirir todos los datos en una sola toma. GnuBIO / BioRad es una secuenciación cíclica clonal por hibridación con preparación de plantilla en microgotas. Y muchos más.

Keith, cubre esto mejor que yo.

454 es viejo. Otras tecnologías como Illumina, o algún futuro en la secuenciación de IC es el camino del futuro.

Probablemente estamos a solo 5–8 años de un tricorder StarTrek en funcionamiento.

Añadiendo también:

La tecnología de secuenciación de hoy en día se trata de la agregación o MPS (secuenciación multiparalela) de modo que podamos eliminar el efecto por lotes de la ecuación, traer ADN / ARN / resolución epigenética.