¿Cómo funciona la secuenciación del genoma completo de una sola célula y por qué es tan difícil?

Primero, debo decir que, aunque mi laboratorio utiliza tanto la secuenciación del genoma único como la amplificación de desplazamiento múltiple, en realidad no hacemos la secuenciación del genoma completo de una sola célula, por lo que no tengo experiencia personal con este método en particular, aunque estoy familiarizado con Todas las técnicas involucradas.

Hay dos obstáculos principales que superar para secuenciar células individuales. Primero, necesita una forma de aislar de manera confiable células individuales, y segundo, necesita una forma de amplificar el ADN de dichas células, ya que una sola célula humana contiene alrededor de 6 picogramos de ADN, alrededor de cien mil veces menos que el mínimo necesidad de secuenciación de Illumina, e incluso menos de la cantidad requerida para preparar una biblioteca de ADN para enviar para la secuenciación. Y, por supuesto, las células bacterianas tienen aproximadamente mil veces menos ADN que las células humanas. Las dificultades se derivan principalmente de la cantidad extremadamente pequeña de ADN inicial, lo que hace que la contaminación sea un gran problema.

El primer problema se puede resolver de varias maneras. El método de la vieja escuela sería simplemente hacer una dilución en serie de las celdas que desea secuenciar. Esto utiliza el principio simple de que si diluye cualquier mezcla de partículas o moléculas suficientes veces, se le dejará una sola partícula por cualquier volumen con el que esté trabajando, en promedio. Al hacer una PCR en diluciones en serie de sus células, puede usar la distribución de Poisson para determinar el número de dilución en el que puede tener, por ejemplo, un 90% de confianza de que un tubo dado tiene 1 o 0 células (puedo explicar esto en más detalles si lo desea). El problema con este enfoque es que terminará con 0 celdas aproximadamente el doble de veces que tiene una sola celda, por lo que es bastante derrochador y requiere mucho tiempo.

Es por eso que los niños geniales están usando la citometría de flujo ahora. En lugar de la dilución en serie, ejecuta sus células a través de una máquina FACS (clasificación de células asistida por fluorescencia). Todo lo que debe hacer es teñir sus células con un tinte de ADN, pasarlas a través de la máquina y, si lo pide amablemente, dividirá en alícuotas células individuales en tubos separados, tantas como desee. Si desea ver un tipo específico de célula, puede etiquetar con un anticuerpo específico para sus células de interés, o usar alguna otra forma para etiquetar específicamente sus células, y la máquina solo tomará esas células. Bastante impresionante.

Una vez que tenga sus preparaciones de células individuales, debe amplificar el ADN de esas células. Hay más de una forma de hacer esto, pero el método que utilizan básicamente todos en estos días es la amplificación de desplazamiento múltiple o MDA. Esta técnica aprovecha las notables propiedades de la ADN polimerasa phi29, una polimerasa de fago que tiene una procesividad extremadamente alta (es decir, puede producir moléculas de ADN extremadamente largas antes de caerse de la cadena parental) y tiene actividad de corrección de pruebas, lo que permite una copia más precisa de la ADN En combinación con hexamers aleatorios para el cebado, esto permite una amplificación imparcial (más o menos) de cualquier ADN que le des. También es una locura rápida, por lo que obtienes rendimientos realmente buenos (a menudo puedes ver un pequeño grupo turbio de ADN en el fondo del tubo cuando finaliza la reacción) en comparación con la PCR.

En este punto, el resto de la preparación de la biblioteca es la misma que la secuenciación profunda normal, usando el protocolo que desee y la plataforma de secuenciación más barata / disponible / su jefe le dice que use).

Como se mencionó anteriormente, la principal dificultad con esta técnica es la contaminación. Estás comenzando con una pequeña cantidad de ADN, y resulta que hay una gran cantidad de ADN flotando alrededor: constantemente arrojas ADN, hay bacterias atrapadas en cada superficie, y la mayoría de los laboratorios trabajan con muestras de ADN concentradas en diariamente. Dado que phi29 amplificará cualquier ADN que se le dé, a menos que tenga mucho cuidado, terminará secuenciando el ADN del ratón, o Pseudomonas , o bacterias del acné, además de lo que piense que está secuenciando. Odio pensar cuántas veces probablemente no he amplificado más que agua contaminada … Esto puede tratarse parcialmente de forma bioinformática, si sabes qué secuencias estás buscando. Pero si está tratando de secuenciar muestras de microbioma, donde no sabe qué especies encontrará, la contaminación podría arruinar su proyecto. Por lo tanto, todas las precauciones que tome con la PCR para evitar la contaminación deben tomarse aún más en serio con la amplificación de células individuales.

El otro problema es que MDA no es realio trulio imparcial. Inevitablemente, ciertas regiones estarán sobre representadas porque la polimerasa phi29 tiene menos problemas para copiarlas, y viceversa. Hay algunos informes de que las regiones ricas en GC son especialmente propensas a estar subrepresentadas. Esto significa que a menudo no obtendrá una cobertura completa del genoma, lo cual es molesto. Pero no el fin del mundo.

Este es uno de los primeros documentos sobre este tema, utilizando dilución en serie y MDA: secuenciación de genomas de células individuales mediante clonación de polimerasa
Otro, usando FACS y MDA: http://www.nature.com/nprot/jour…
Y aquí hay una revisión de estas y otras técnicas unicelulares: El futuro es ahora: genómica unicelular de bacterias y arqueas.

Aquí hay un gran video que puede explicar la secuenciación de células individuales mucho mejor de lo que podría en 10000000 palabras. Muestra el flujo de trabajo de la secuenciación de ARN de una sola célula, pero la secuenciación del genoma probablemente no sea tan diferente. Espero que lo disfrutes:

More Interesting

Si los científicos desarrollaron una terapia génica segura y económica que aumentó el coeficiente intelectual promedio en 50 puntos, pero tenía la limitación no deseada de que solo funcionaba en un solo grupo de población grande, ¿debería usarse ampliamente en ese grupo?

¿Cómo se utilizan los componentes principales para separar los grupos de población?

¿Qué es el teorema de Hardy-Weinberg?

¿Cómo se nombran los polimorfismos de un solo nucleótido?

Si la genética influye tanto, ¿por qué hacer algo y cómo encuentras lo que eres genéticamente bueno / talentoso?

¿El ADN define exactamente en quién nos convertimos?

¿Las discapacidades de aprendizaje son causadas por una mutación en los genes responsables de la memoria y el recuerdo?

¿Cómo podemos identificar si un gen es causalmente responsable de una enfermedad o un mayor riesgo de desarrollar una enfermedad?

Si tengo ojos marrones y mi esposa tiene ojos azules, ¿de qué color tendrán los ojos nuestro bebé?

¿Cuál es la relación entre inteligencia académica, genética y estímulos ambientales?

¿Qué se entiende cuando se dice que una mutación particular tiene un "efecto polar"?

Epigenética: ¿es posible medir los cambios a nivel de población a gran escala en los epigenomas después de eventos importantes?

Si la fuente de la inconsciencia colectiva de Jung son las experiencias de nuestros antepasados, ¿cómo pueden heredarse estas experiencias en las generaciones posteriores? ¿Es posible considerar la epigenética como un método para heredar experiencias en generaciones posteriores?

¿Podría alguien hacer un estudio de asociación de genoma completo en ratones y luego identificar variantes genéticas raras que podrían ser problemáticas en humanos de esa manera?

¿Sería posible criar chimpancés tan inteligentes como los humanos si uno aparease solo con los chimpancés más inteligentes de cada generación durante muchos años?