¿Es la secuenciación de rRNA 16s un enfoque sólido para estudiar comunidades bacterianas?

Supongamos que la tarea consistiera en identificar en un lago todos los diferentes tipos de peces, así como su abundancia relativa. Análogamente, el ARNr 16S (ARN ribosómico 16S – Wikipedia) y la secuenciación metagenómica (Metagenómica – Wikipedia) intentan hacer lo mismo para las comunidades microbianas en diversos hábitats. 16S rRNA es similar a hacerlo con un montón de cañas de pescar, es decir, un conjunto de PCR (reacción en cadena de la polimerasa – Wikipedia) Primer (biología molecular) – Wikipedia específica para genes bacterianos 16S rRNA definidos, mientras que la secuencia metagenómica es similar a una red de arrastre, secuenciación de alto rendimiento de genes microbianos completos, incluso genomas. Ambos comienzan con el ADN extraído de una muestra seguido de un mapeo a bases de datos de referencia y anotaciones (ver más abajo de 1).

En ese sentido, 16S rRNA es más una ‘ huella digital ‘ (2) para especies bacterianas, mientras que la metagenómica analiza una muestra biológica (caca humana, hisopo de piel, etc.) o ambiental (suelo, acuífero, etc.) dada de manera más exhaustiva y completa y así genera una instantánea más precisa no solo de las bacterias (3) sino también de las arqueas, eucariotas, hongos, protistas y virus (2) presentes en ella.

Otros problemas con el análisis 16S rRNA incluyen

  • Mayor margen para introducir sesgos desde
    • Ciertas secuencias de 16S rRNA pueden amplificarse de manera más eficiente en comparación con otras, ya que las diferentes especies bacterianas transportan diferentes números de genes de 16S rRNA (4), mientras que los números de copia ni siquiera se conocen para muchas especies, especialmente aquellas encontradas durante los análisis de microbiomas humanos ya que muchas de estas especies son novedosas, no se han cultivado y es probable que sean ‘no cultivables’ utilizando técnicas bacteriológicas estándar.
    • Los productos de amplificación quimérica pueden sesgar los resultados (5), pero el campo del microbioma está plagado de una adherencia débil a soluciones técnicas relativamente fáciles que podrían evitar que tales artefactos ocurran en primer lugar (6).
  • No se puede usar para identificar a nivel de especie, ya que muchas especies bacterianas tienen genes idénticos 16S rRNA, por ejemplo, algunas especies de Anthrax (2).

El principal problema con la metagenómica es el costo, ya que todavía es bastante prohibitivo.

La secuenciación 16S rRNA y la metagenómica comparten muchos pasos críticos para introducir sesgos

Sin embargo, debatir los méritos relativos del ARNr 16S frente a la metagenómica arriesga perder el bosque para los árboles, ya que ambos enfoques comparten muchos pasos críticos de introducción de sesgo (ver más abajo de 7).

  • Estos incluyen el diseño del estudio (3), la recolección de muestras, el procesamiento, el almacenamiento, la extracción y secuenciación de ADN, todo lo cual puede introducir una variedad de sesgos y errores además de los inherentes a las dos técnicas.
    • Las diferencias en la recolección de muestras (8, 9), el procesamiento (10), el transporte, el almacenamiento (11, 12, 13) y la extracción de ADN (14, 15) pueden cambiar los resultados del microbioma.
    • Incluso diferentes plataformas de secuenciación pueden arrojar resultados diferentes de las mismas muestras (16).
    • Las bases de datos de referencia no solo son incompletas (17), sino que los modelos computacionales utilizados comúnmente varían en sensibilidad y precisión (18).
    • Tanto el 16S rRNA como la metagenómica también comparten otro error común a cualquier campo científico en rápida expansión, a saber, supuestos problemáticos que subyacen a los complejos enfoques estadísticos necesarios para el análisis de la colosal cantidad de datos generados por tales técnicas. Por ejemplo, un enfoque comúnmente utilizado, Rarefaction (ecología) – Wikipedia, tiene el potencial de sesgar dramáticamente las tasas de falsos positivos y falsos negativos (19).
  • En otras palabras, incluso cuando el campo del microbioma explota y, por lo tanto, está sujeto a una constante innovación tecnológica, las medidas críticas de control de calidad, como el desarrollo de protocolos estandarizados, no han seguido el ritmo (20, 21). Dado que diferentes estudios publicados usan diferentes métodos, los resultados tampoco se pueden comparar entre los estudios (17, 22).
  • La mayoría de los estudios de microbiomas consisten en un pequeño número de sujetos . Dichos estudios tienen un poder estadístico inherentemente pobre, lo que significa que es difícil ser concluyente sobre una hipótesis particular. Después de todo, cuando la dieta (23) y la ubicación (24) cambian drásticamente las lecturas instantáneas de la composición de microbiomas de un solo individuo, es lógico que cada estudio de microbiomas se considere un dato independiente y, sin embargo, se ha convertido en estándar extrapolar y exagerar los resultados de un estudio a pequeña escala a un campo completo o incluso a la fisiología humana misma (7).
  • Actualmente, muchos estudios de microbiomas también hacen un trabajo extremadamente pobre al explicar los factores de confusión al comparar las diferencias de microbiomas entre dos grupos de individuos, independientemente del método utilizado para evaluarlo en primer lugar.
    • Un ejemplo ilustrativo de tales errores, un estudio (25) informó que los jugadores de rugby (n = 40) tienen microbiomas más diversos en comparación con los controles de la misma edad (n = 23, 23). Los autores y la prensa popular interpretaron esta aparente diferencia como prueba de que “el ejercicio aumenta la diversidad microbiana intestinal en los humanos ” (25). De Verdad? ¿El ejercicio fue la única diferencia entre esos dos grupos? ¿No es la dieta, no un contacto más extenso con el suelo, por mencionar solo dos diferencias plausibles entre los jugadores de rugby y los controles de la misma edad (7)?
  • En otras palabras, muchos estudios de microbiomas continúan cometiendo el error fatal de combinar correlación con causalidad .
  • Las réplicas de muestras son vitales para atestiguar la solidez de los enfoques experimentales, especialmente para técnicas biológicas moleculares extremadamente sensibles como la secuenciación de ARNr 16S o la metagenómica. La sensibilidad ampliamente expandida aumenta en gran medida la carga de separar la señal del ruido (26). El paso más crucial para el control de calidad, la replicación , es decir, analizar la misma muestra varias veces, se vuelve crítico para ayudar a discriminar mejor la señal del ruido. Actualmente, la investigación de microbiomas tiende a descuidar lamentablemente las réplicas de muestras (ver la tabla a continuación de 27).

Prosser acerta con razón el problema crítico de los números de muestra y replica en su cabeza de esta manera (27),

“ Por el momento, si midiera la altura de un inglés, un estadounidense, un australiano y un africano y luego utilizara los datos para postular las formas en que el continente determinaba la altura, sería ridiculizado correctamente. Si tuviera que tomar una sola muestra fecal de cada uno de los mismos individuos y realizar una secuenciación masiva, paralela, de alto rendimiento, 454 para generar listas de secuencias, abundancias relativas de diferentes grupos filogenéticos y gráficos circulares, y usaría estos datos para postular el continente diferencias asociadas en las comunidades microbianas intestinales, es probable que el artículo se publique en una de las revistas de ciencia general de más alto perfil. Ya hay varios precedentes de esto y, como comunidad, deberíamos estar avergonzados ”.

Siete años después del comentario anterior sobre esta situación, poco ha cambiado con respecto a este status quo, incluso a medida que la investigación de microbiomas se ha expandido enormemente, ingresando a todas y cada una de las áreas de investigación sobre fisiología y enfermedad humana.

Bibliografía

1. Jonsson, Viktor. Análisis estadístico y modelado de datos de recuento de genes en metagenómica. Diss. Göteborgs universitet, 2017. https://gupea.ub.gu.se/bitstream…

2. Carlos, Nossa, Yi-Wei Tang y Zhiheng Pei. “Perlas y dificultades del análisis de microbioma basado en la genómica”. Microbios e infecciones emergentes 1 (2012): e45. https://www.researchgate.net/pro…

3. Meisel, Jacquelyn S., y col. “Las encuestas de microbioma de la piel están fuertemente influenciadas por el diseño experimental”. Journal of Investigative Dermatology 136.5 (2016): 947-956. https://www.med.upenn.edu/gricel…

4. Pei, Anna Y. y col. “Diversidad de genes 16S rRNA dentro de genomas procariotas individuales”. Microbiología aplicada y ambiental 76.12 (2010): 3886-3897. Diversidad de genes 16S rRNA dentro de genomas procariotas individuales

5. Boers, Stefan A., John P. Hays y Ruud Jansen. “La PCR de Micelle reduce la formación de quimera en el perfil de ARNr 16S de mezclas complejas de ADN microbiano”. Informes científicos 5 (2015). https://www.ncbi.nlm.nih.gov/pmc…

6. Gohl, Daryl M., y col. “Mejora sistemática de los métodos del gen marcador de amplicón para una mayor precisión en los estudios de microbioma”. Nature Biotechnology 34.9 (2016): 942-949. http://metagenome.cs.umn.edu/pub…

7. Bik, Elisabeth M. “Enfoque: Microbioma: los aros, las esperanzas y los bombo de la investigación del microbioma humano”. The Yale Journal of Biology and Medicine 89.3 (2016): 363. https://www.ncbi.nlm.nih.gov/pmc…

8. Dominianni, Christine y col. “Comparación de métodos para la recolección de muestras biológicas de microbioma fecal”. BMC microbiology 14.1 (2014): 103.

9. Sinha, Rashmi y col. “Recolección de muestras fecales para análisis de microbiomas en estudios epidemiológicos”. Epidemiología del cáncer y biomarcadores de prevención 25.2 (2016): 407-416. http://cebp.aacrjournals.org/con…

10. Hsieh, Yu-Hsin y col. “Impacto de diferentes métodos de procesamiento fecal en las evaluaciones de la diversidad bacteriana en el intestino humano”. Frontiers in Microbiology 7 (2016). https://www.ncbi.nlm.nih.gov/pmc…

11. Choo, Jocelyn M., Lex EX Leong y Geraint B. Rogers. “Las condiciones de almacenamiento de la muestra influyen significativamente en los perfiles de microbioma fecal”. Informes científicos 5 (2015): 16350. Las condiciones de almacenamiento de la muestra influyen significativamente en los perfiles de microbioma fecal

12. Klymiuk, Ingeborg, y col. “El análisis de microbioma basado en 16S de los hisopos de piel de sujetos sanos almacenados durante diferentes períodos de almacenamiento revela cambios de phylum a nivel de género”. Frontiers in Microbiology 7 (2016). https://www.ncbi.nlm.nih.gov/pmc…

13. Song, Se Jin, y col. “Los métodos de conservación difieren en la estabilidad del microbioma fecal, lo que afecta la idoneidad para los estudios de campo”. mSystems 1.3 (2016): e00021-16. http://msystems.asm.org/content/…

14. Kennedy, Nicholas A., y col. “El impacto de diferentes kits y laboratorios de extracción de ADN en la evaluación de la composición de la microbiota intestinal humana por secuenciación del gen 16S rRNA”. PloS one 9.2 (2014): e88982. http://journals.plos.org/plosone…

15. Wesolowska-Andersen, Agata, y col. “La elección del método de extracción de ADN bacteriano a partir del material fecal influye en la estructura de la comunidad según lo evaluado por análisis metagenómico”. Microbioma 2.1 (2014): 19. La elección del método de extracción de ADN bacteriano a partir del material fecal influye en la estructura de la comunidad según lo evaluado por análisis metagenómico

16. Hahn, Andrea y col. “Las diferentes plataformas de secuenciación de próxima generación producen diferentes perfiles microbianos y diversidad en el esputo de fibrosis quística”. Journal of Microbiological Methods 130 (2016): 95-99.

17. Amato, Katherine R. “Una introducción al análisis de microbiomas para aplicaciones de biología humana”. American Journal of Human Biology (2016). http://onlinelibrary.wiley.com/d…

18. Weiss, Sophie y col. “Las estrategias de detección de correlación en conjuntos de datos microbianos varían ampliamente en sensibilidad y precisión”. La revista ISME (2016). https://www.researchgate.net/pro…

19. McMurdie, Paul J. y Susan Holmes. “No desperdicies, no quieras: por qué los datos de microbioma enrarecidos son inadmisibles”. PLoS Comput Biol 10.4 (2014): e1003531. http://journals.plos.org/ploscom…

20. Salter, Susannah J., y col. “La contaminación de reactivos y de laboratorio puede tener un impacto crítico en los análisis de microbiomas basados ​​en secuencias”. BMC biology 12.1 (2014): 87. La contaminación de reactivos y de laboratorio puede tener un impacto crítico en los análisis de microbiomas basados ​​en secuencias

21. Clavel, Thomas, Ilias Lagkouvardos y Andreas Hiergeist. “Secuencia de microbiomas: desafíos y oportunidades para la medicina molecular”. Revisión experta de diagnóstico molecular 16.7 (2016): 795-805.

22. Lozupone, Catherine A., et al. “Metaanálisis de estudios de la microbiota humana”. Genome research 23.10 (2013): 1704-1714. https://www.researchgate.net/pro…

23. David, Lawrence A., y col. “La dieta altera rápida y reproduciblemente el microbioma intestinal humano”. Nature 505.7484 (2014): 559-563. https://www.researchgate.net/pro…

24. La respuesta de Tirumalai Kamala a ¿Qué efecto puede tener un cambio de ubicación en el microbioma de una persona?

25. Clarke, Siobhan F. y col. “El ejercicio y los extremos dietéticos asociados tienen un impacto en la diversidad microbiana intestinal”. Gut (2014): gutjnl-2013. https://www.researchgate.net/pro…

26. Knight, Rob y col. “Liberando el potencial de la metagenómica a través del diseño experimental replicado”. Nature biotechnology 30.6 (2012): 513-520. http://citeseerx.ist.psu.edu/vie…

27. Prosser, James I. “Replicar o mentir”. Microbiología ambiental 12.7 (2010): 1806-1810. https://www.io-warnemuende.de/tl…

Gracias por el R2A, Jai Padmakumar.

Creo que realmente necesitamos concentrarnos en avanzar hacia un tipo de escenario de “Viaje fantástico”, pero ya sabes … la realidad. Esta pregunta es astuta porque muestra una comprensión de los grandes sesgos de la secuenciación de amplicones de ADNr 16S (estoy divagando pero usted secuencia el ADNr, no el ARNr, comúnmente mal escrito en el campo).

Aquí enumero algunos de los sesgos más comunes de 16S , muchos de los cuales he visto más de 5 documentos abordando de una manera u otra (si los conoce, puede omitirlos, y la lista no es exhaustiva) . El sesgo puede ocurrir cuando: se recolecta la muestra, la alta prevalencia de contaminación, cómo se extrae el ADN, la eficacia de la amplificación por PCR que puede sesgarse según la región variable de ADNr y para algunos linajes bacterianos, la unión de adaptadores de secuenciación, la formación de secuencias quiméricas, diferentes tecnologías de secuenciación (illumina, roche 454, pacbio …), agrupación de secuencias 16S basadas en la similitud en unidades taxonómicas operativas, asignación de taxonomía con diferentes bases de datos de referencia, cobertura de secuenciación variable de muestras y muchos factores en el análisis posterior para una amplia lista aquí …

¡Entonces sí, hay mucha parcialidad! El objetivo principal es tratar de controlar todo esto dentro de un estudio lo mejor que pueda, y es por eso que debe intentar no comparar entre los estudios a pesar de lo atractivos que pueden ser los metanálisis. Sin embargo, la metagenómica puede sufrir muchos de estos sesgos. La metagenómica es menos común por algunas razones clave: 1) es muy costosa (~ 10x + más) costosa, 2) es mucho más difícil de analizar (mayor cantidad de datos y complejidad), 3) tiene algunas barreras técnicas serias como requerir mucho más ADN (los insectos solos generalmente no tienen suficiente y si de una muestra con baja carga microbiana puede obtener secuencias de ADN del huésped), y 4) es difícil obtener un perfil de comunidad de la metagenómica como del 16S, entonces pregunte si ¿Quieres saber quién está allí o qué hacen? Doi: 10.1038 / ismej.2014.157 – ¡gran resumen! En última instancia, aunque la metagenómica en sí misma también está llena de sesgos.

En resumen, no trataría de sacar demasiadas conclusiones sobre taxones microbianos individuales , ya que los falsos positivos podrían prevalecer con todo el sesgo. Sin embargo, si su objetivo es estudiar la comunidad total y las grandes diferencias, entonces 16S puede ser muy útil . Perdón por el tapón egoísta … pero, por ejemplo, en nuestro artículo reciente, donde examinamos la microbiota de 31 especies animales y mostramos que a través de diversos clados de animales (mosquitos, avispas, moscas, ratones, homínidos) que las relaciones de similitud general de microbiota entre especies paralelamente cuán genéticamente relacionadas están las especies huésped. No sacamos muchas conclusiones sobre microbios individuales o subconjuntos comunitarios, sino que nos centramos en la estructura comunitaria total. Por lo tanto, la secuencia de ADNr 16S es útil … ¡¡¡Si se usa para abordar las preguntas correctas !!!

Es útil, pero como cualquier otra técnica, debe tener cuidado en su uso y comprender las trampas de la técnica para poder confiar en sus resultados.

Es una técnica útil por un par de razones. Primero, es más barato que la secuencia completa de la escopeta de metagenoma, lo que sin duda es una preocupación para muchos investigadores que tienen que gastar cuidadosamente el dinero de la beca / beca. Puede tener una idea general de quién está en una muestra con ella, lo que puede dar una idea de lo que está sucediendo allí o cómo el medio ambiente está influyendo en la comunidad. Se ha utilizado durante muchos años, lo que, por supuesto, no significa que sea perfecto, pero significa que las personas lo entienden y podría prestarse al metanálisis, en lugar de comparar resultados de muchos métodos diferentes.

Si bien la secuencia metagenómica de escopeta proporciona (¡potencialmente!) Más información, también hay problemas con ella. Primero, todavía no hay consenso sobre cuál es la mejor manera de procesar la información. ¿Trabajas con las lecturas o intentas ensamblarlas en contigs y andamios? El ensamblaje es difícil y computacionalmente intenso, y hay muchos programas con sus pros y sus contras. Tampoco está claro cuál es el mejor método o si diferentes ensambladores / tuberías funcionan mejor para diferentes tecnologías de secuenciación, diferentes comunidades, etc. Como la mayoría de la secuencia de escopeta da como resultado lecturas cortas, puede ser difícil de ensamblar o alinear con una base de datos de referencia . Por lo tanto, realmente debe tener cuidado con sus análisis de ese tipo de conjuntos de datos, porque es muy fácil obtener resultados espurios.

Creo que la secuenciación completa de la escopeta metagenómica puede suplantar el ARNr 16s en el futuro, pero llegar allí requerirá mucho trabajo y un estudio exhaustivo e integral para asegurarse de que las herramientas funcionen y que las personas utilicen las mejores prácticas en función de sus preguntas , muestras, plataforma de secuenciación, etc.

Archer te ha dado una respuesta muy completa sobre las trampas del análisis de secuencia de ARNr 16S. La mayoría de los sesgos tienden a introducirse por la forma en que tratamos nuestras muestras, cómo se almacenan, cómo se extrae y amplifica el ADN y cómo terminamos secuenciando el ADN después.

Como con cualquier cosa, debe considerar cuidadosamente cómo los investigadores han tratado de reducir los sesgos y cómo han analizado sus resultados.

Si desea leer más sobre los sesgos de PCR y cosas como la formación de quimera y heteroduplex que pueden afectar los estudios de comunidades microbianas, escribo un blog sobre los métodos utilizados en la ecología microbiana Microbiomethod – Understanding Microbiome Research.

La secuencia de códigos de barras 16S rRNA es el método más eficiente y rentable que conozco para secuenciar datos microbianos. Sin embargo, la transición de la secuenciación a la metagenómica no es tan clara. Requiere la incorporación de una buena cantidad de modelos de aprendizaje automático y minería de datos para hacerlo más preciso. Para la transición de la secuenciación a la metagenómica, el mejor modelo con el que he trabajado es DADA2. Su capa oculta de aprendizaje automático más fuerte lo hace superior a los modelos basados ​​en clúster comúnmente utilizados como Qiime.