Al secuenciar el ADN para una muestra que contiene miles de especies diferentes de bacterias (por ejemplo, fauna intestinal, agua de mar, suelo, etc.), ¿cómo separan los científicos una especie de otra?

Hay cuatro estrategias generales para esto.

Una es usar cebadores contra genes conservados como el ARN 16S y secuenciar esos productos de PCR. Esto le dirá un nivel bruto de lo que está en su muestra y le dará una mejor visión de la diversidad de la muestra, ya que sus datos estarán muy centrados. Sin embargo, no le dice nada sobre los fenotipos: la E. coli sensible y resistente a los betalactámicos será indistinguible.

En el otro extremo está la metagenómica de escopeta. Simplemente intenta secuenciar todo el ADN de la muestra. Alimentar esas secuencias en algoritmos de ensamblaje de secuencias le permitirá reconstruir piezas o tal vez incluso el genoma completo de algunos de los organismos en su muestra. Pero dado que están en diferentes concentraciones, algunos estarán muy bien muestreados y otros mal, y otros no. Esto puede empeorar por lisis diferencial; es difícil lisar a todos los organismos por igual, excepto por métodos mecánicos violentos (“golpes de cuentas”). Si desea un ADN largo, y muchas regiones de genomas no se pueden volver a ensamblar sin él, entonces el desafío de la lisis uniforme y suave de diversas células es mortal.

Usando el enriquecimiento basado en la hibridación, uno puede obtener un intermedio entre los dos. Se pueden utilizar sondas para regiones conservadas o simplemente muchas regiones de interés diferentes para hibridar y seleccionar regiones de interés. Por el contrario, se pueden usar métodos de hibridación o enzimáticos para eliminar o destruir secuencias que no son de interés. Si está secuenciando muestras de metagenomas humanos, una gran parte de sus lecturas serán humanas. Eliminar esos fragmentos antes de la secuenciación hace que la operación sea más eficiente.

Un enfoque más: en realidad segregar organismos en masa antes de la secuenciación. Al diluir la muestra lo suficiente como para que se apliquen las estadísticas de Poisson, es posible dividir alícuotas en pocillos en placas o encapsularlas en perlas. La lisis y la amplificación del genoma completo permiten la secuenciación de cada compartimento. Si una etiqueta distinguible (“código de barras”) está unida a todos los fragmentos en cada compartimento, entonces todos pueden ejecutarse juntos en el secuenciador. La compartimentación tiene la ventaja de saber qué fragmentos van juntos, incluso si uno no puede ensamblar a través de repeticiones largas, así como asignar plásmidos a organismos específicos.

No sé mucho sobre este tema, pero muchos de mis colegas que son ecólogos microbianos o fúngicos usan QIIME, un paquete de software que ayuda a analizar los datos de secuenciación de alto rendimiento a nivel comunitario. Por ejemplo, si tiene un montón de secuencias de ARNr o ITS *, puede establecer un umbral mínimo de identidad de secuencia (por ejemplo, 95%) para definir una unidad taxonómica operativa (OTU). Luego, el software clasificará las secuencias lo mejor posible en OTU, y puede colocarlas a través de bases de datos de secuencias para que coincidan con los taxones nombrados. Estoy seguro de que el software tiene muchas otras capacidades además.

* ARNr es ARN ribosómico, que está muy conservado y, a menudo, es un estándar de oro para estudios en taxones relacionados de forma distante; SU es muy común en estudios sobre hongos y está menos conservado

1. El tipo de experimentos que está discutiendo generalmente se dirige a secuencias con cebadores bien conservados que de otro modo serían muy variables.

Afortunadamente, desde hace tiempo se sabe que solo existe una secuencia: el ARN ribosómico.

2. Experimentos más diversos requieren genomas de referencia y usan secuencia de escopeta.

Finalmente, lo que pasa con cualquier secuenciación de microbiomas es que se centran en la cuantificación. Eso significa que el ensamblaje de secuencia no es un problema, y ​​tampoco lo es la separación. Simplemente puede contar el número de lecturas que coinciden y asignarlo a la especie o taxón apropiado.

Ejemplos:
Proyecto de microbioma humano
Análisis de microbioma humano

Ellos no. Para bacterias y virus, generalmente hay una sola molécula de ADN. Imagine uno que tenga la secuencia del gen ABCDE. Obtendrá fragmentos como AB, BCD, DE, que pueden mostrarse superpuestos y, por lo tanto, estar juntos. En algún momento, reconoce que NO hay secuencias en su mezcla que se superponen en ninguno de los extremos, lo que significa que tiene la secuencia completa. Como mencionas, no tienes que purificar el organismo ni saber de qué se trata.

¿Puedes explicar más?

Cuando está juntando tantos fragmentos diferentes, ¿cómo puede saber si tiene un fragmento largo que pertenece a un solo organismo? ¿O dos fragmentos más cortos que pertenecen a dos organismos diferentes?

Por ejemplo, si tiene ABCDE, ¿cómo sabe que es un organismo con ABCDE, o dos organismos con ABC y DE, respectivamente?