Las técnicas y mecanismos para la secuenciación del ADN han cambiado drásticamente a lo largo de los años. Después de la identificación del ADN como el vehículo molecular de la herencia y su estructura, pasarían décadas antes de que fuera posible analizar su secuencia.
Alrededor de 1970, la primera secuencia de ADN se realizó usando y marcando nucleótidos individualmente y usando ADN polimerasa para catalizar la extensión de un cebador. Esto requirió purificar grandes cantidades de ADN, crear nucleótidos radiomarcados y un proceso insoportable de realizar manualmente cada paso de extensión. Los materiales eran costosos y difíciles de conseguir, y el trabajo tedioso.
A fines de la década de 1970, un compañero llamado Sanger mejoró el método. Lo que hizo fue introducir nucleótidos modificados químicamente (ddNTPs) en sólo la proporción adecuada que iban a terminar aleatoriamente la polimerización de secuencias que se extienden por la ADN polimerasa. Si divide su muestra en 4 partes alícuotas y agrega un ddNTP diferente, las cadenas terminarían en los puntos donde se incorporó esa base. Si ejecuta esas 4 muestras a través de un gel de electroforesis y la etiqueta con radioisótopos para poder visualizarlas en una película de rayos X, obtendrá el patrón de escalera familiar que podría leerse como una secuencia. Todavía necesitabas algo de purificación de ADN a gran escala, necesitabas nucleótidos (para entonces más baratos), radioisótopos y película, y solo podías secuenciar unos cientos de bases por experimento, pero aún era mucho más eficiente que el método anterior.
Con el paso del tiempo, los materiales para la secuenciación de Sanger consiguieron más barato y el método de refinado para ser más eficiente en el tiempo. Se desarrollaron versiones de la técnica que se basaban en la fluorescencia en lugar de la autorradiografía que también aceleraron la secuenciación (reduciendo el costo laboral).
El advenimiento de métodos de reacción en cadena de la polimerasa (PCR) en la década de 1980 finalmente lo hizo posible empezar con cantidades muy pequeñas de ADN y crea un sinfín de copias disponibles para la secuenciación. Los avances en la síntesis química de cebadores de oligonucleótidos hechos más dirigidos clonación de subsecuencias mucho más barato.
Más tarde, la misma técnica de terminación se adaptó para usar nucleótidos marcados con fluorescencia, lo que le permite asignar diferentes colores a los nucleótidos y ejecutar su secuenciación de terminación de extensión en una sola reacción (en lugar de 4). Esto también se prestó a la automatización. La muestra única ahora se puede procesar a través de una columna de electroforesis capilar con un detector multiespectral que puede leer el color (y, por lo tanto, la base) a medida que se eluye de la columna con alta precisión. La automatización escalable del proceso se volvió práctica.
Debido a la automatización de diversos tipos se estaban volviendo disponibles, se hizo práctico diseñar experimentos con la secuenciación no específica o secuenciación “shotgun” donde uno simplemente secuencia de bits aleatorios de ADN. Si bien las lecturas de secuencia fueron relativamente cortas (tal vez de cientos a mil bases de calidad), se desarrollaron algoritmos informáticos que permitirían el ensamblaje de estas piezas más cortas secuenciadas al azar en trozos contiguos más grandes al encontrar dónde se superponen las secuencias. Nació la asamblea genómica.
Una mayor automatización de preparación de muestras y análisis de los costos laborales hecho bajar y métodos computacionales escala con capacidad de cálculo, cada vez más barato y más rápido. A medida que se desarrolló la industria biotecnológica, los reactivos se volvieron notablemente más baratos y los kits y protocolos más confiables.
la tecnología de secuenciación Modern utiliza microchip y nano tecnologías litográficas para implementar la microfluídica y masivamente paralelo secuenciación corto de lectura combinado con la PCR in situ. En resumen, todo el laboratorio y el flujo de trabajo se han diseñado en un dispositivo de escritorio que requiere cantidades fenomenalmente pequeñas de reactivos, tiene una precisión muy alta y se basa en un software para capturar los datos y ensamblarlos en una secuencia de ADN.
Hoy en día, los costos de reactivos y mano de obra siguen disminuyendo (aunque en cierta medida se estabilizan). Hoy, las economías de escala se abren para máquinas más rápidas que pueden funcionar más en paralelo. A medida que la secuenciación se vuelve más comercializada y el hardware comienza a bajar de precio (hay muchas patentes a considerar), nos estamos acercando rápidamente al punto en el que $ 1,000 para una secuencia de genoma completo está en el horizonte.