¿Cuántas generaciones hay de secuenciación genética y qué técnicas utilizan?

Shawn ha escrito una muy buena respuesta, pero tomaré un rumbo ligeramente diferente que casi dividirá las principales tecnologías en tres generaciones. Pero varios técnicos seguirán siendo desafíos.

La característica dominante de la primera generación es la electroforesis en gel de alta resolución de ‘escaleras’ de ADN monocatenarias. Las escaleras se refieren al hecho de que las moléculas comparten un único terminal en un extremo y un rango de posiciones terminales en el otro extremo.

Los métodos de segunda generación generan secuencias a partir de puntos localizados de moléculas de ADN idénticas, con muchos (típicamente millones o miles de millones) de dichos puntos, con la secuencia generada en explosiones discretas por los reactivos que fluyen sobre la superficie sólida. Illumina (Solexa) es la tecnología dominante aquí, pero QIAGEN GeneReader, Ion Torrent, 454, Polonator, SOLiD, Complete Genomics, BGI-Seq son otros sistemas comercializados. Lynx y Manteia son dos compañías que avanzaron la tecnología pero nunca vieron el éxito.

Los sistemas de tercera generación leen moléculas de ADN individuales en tiempo real. Pacific Biosciences y Oxford Nanopore han comercializado estas tecnologías, Roche puede comercializar una tercera tecnología de este tipo en un futuro próximo, que se originó con Genia (que Roche compró). Una tecnología notable que nunca se lanzó se llamó StarLight.

De acuerdo, ahora el caso del problema.

La tecnología Helicos, ahora propiedad de SeqLL, parece un sistema de segunda generación, ya que los reactivos fluyen sobre una superficie para generar secuencias en explosiones específicas. Pero Helicos lee moléculas de ADN individuales, a diferencia de todas las tecnologías de segunda generación. Pero a diferencia de los sistemas de tercera generación, los datos no se generan continuamente.

NanoString está desarrollando un enfoque llamado Hyb-and-Seq que tiene desafíos de clasificación similares. Es un sistema de molécula única, pero los datos se generan paso a paso con flujos de reactivos. La mejor parte de este sistema, si se lanza con éxito (lo que NanoString dice que no sucederá este año). Es que la secuencia podría ejecutarse en una delgada porción de tejido, lo que permite localizar las diferencias de secuencia en una muestra (como la heterogeneidad tumoral o los miembros de una comunidad biológica).

Bio-Rad ha anunciado que (finalmente) lanzarán en 2017 una tecnología de GnuBio, que adquirió Bio-Rad. Al igual que las tecnologías de segunda generación, esto operará en conjuntos espacialmente segregados de ADN idéntico. Pero en la tecnología GnuBio, se segregan al estar en distintas gotas de escala de picolitros. La secuencia no surge en un orden definido, sino más bien mediante el procesamiento computacional de una serie de resultados (algo así como hacer veinte preguntas, con cada pregunta en forma de existencia de una subsecuencia específica en la secuencia general).

Varias compañías han intentado desarrollar sistemas para obtener imágenes de secuencias de ADN directamente con microscopía electrónica. Al igual que los sistemas de tercera generación, estos enfoques son de una sola molécula, pero esencialmente generarían secuencia de una vez en lugar de una secuencia de secuencia.

Tenga en cuenta también que algunos sistemas de segunda generación, en esta clasificación, se lanzaron después de que PacBio lanzó su sistema de tercera generación, lo que ilustra la utilidad limitada de clasificar estas tecnologías en generaciones.

Trataré de responder la parte de “cuántas generaciones” de su pregunta. La gente a menudo ha tratado de agrupar las diversas tecnologías de secuenciación en ‘generaciones’: primero, segundo, tercero. Una compañía incluso descaradamente llamó a su tecnología ‘secuenciación de última generación’. [Te estoy mirando, Genia. Por ahora, llamémoslo ‘secuenciación aún no lanzada comercialmente’ ;-)]. El problema es que no hay definiciones consistentes y útiles de las generaciones (sin mencionar el hecho de que todos ignoran por completo las diversas generaciones de secuenciación basada en Sanger). Por ejemplo, algunos consideraron que la secuenciación de una sola molécula es de ‘tercera generación’, mientras que otros ubicaron las tecnologías no ópticas en esa categoría. Cuando desglosas las diversas diferencias de las plataformas, está bastante claro que no hay una única forma de agruparlas en ‘generaciones’.

Estos son los principales atributos para clasificar las diversas plataformas de secuenciación de “próxima generación”:

1) secuenciación por síntesis vs secuenciación directa (vs ligadura vs hibridación)

2) secuenciación escalonada vs continua

3) detección óptica versus no óptica

4) lecturas cortas vs largas

5) molécula única vs amplificada

Y así es como las principales plataformas se asignan a estas categorías:

Illumina = SBS, escalonada, óptica, lectura corta, amplificada

Ion = SBS, continuo, no óptico, lectura corta, amplificado

PacBio = SBS, continuo, óptico, lectura larga, molécula única

Oxford Nanopore = molécula directa, continua, no óptica, de lectura larga, única

Helicos / SeqLL = SBS, escalonado, óptico, lectura corta, molécula única

454 = SBS, continuo, óptico, corto *, amplificado (* considerado ‘lecturas largas’ en ese momento, pero ahora al menos un orden de magnitud más corto que las tecnologías de lectura larga)

SOLID = ligadura, escalonada, óptica, lectura corta, amplificada

Como puede ver, no hay dos plataformas que caigan en el mismo cubo, por lo que es imposible definir limpiamente ‘generaciones’.