¿Cuáles son los campos de la ciencia en los que los grandes datos realmente marcan la diferencia?

La biología es un campo en el que los grandes datos están haciendo una gran diferencia. La biología hasta el siglo pasado a menudo se consideraba como una ciencia no cuantitativa. El punto donde los grandes datos comenzaron a entrar en biología fue con el Proyecto Genoma Humano. Este fue el proyecto más grande en biología con el objetivo de decodificar toda la secuencia del genoma humano. El 23 de noviembre de 1999, el proyecto del genoma humano celebró una celebración masiva para marcar la finalización de mil millones de pares de bases (pb), un tercio del camino hacia la secuencia completa del genoma humano. La cantidad de secuencia fue tan increíble en el momento que la celebración contó con senadores y funcionarios del gabinete de Estados Unidos. En la actualidad, la secuenciación de mil millones de pb es el trabajo de horas en cualquier laboratorio equipado con una máquina de secuenciación de alto rendimiento y la salida cada pocos minutos en un centro de secuenciación a gran escala como el Broad Institute (http://www.broadinstitute.org/ ) o el Instituto de Genómica de Beijing (http://www.big.cas.cn/).

La escala de datos generados se encuentra en un punto en el que muchos centros han dejado de guardar datos primarios ya que los costos de almacenamiento son demasiado altos. Es más barato volver a secuenciar en caso de dudas posteriores. Algunos de los principales proyectos relacionados con esto son:

1000 Genomes Project http://www.1000genomes.org/, un esfuerzo de investigación internacional para establecer un catálogo detallado de la variación genética humana. Planea secuenciar al menos mil participantes anónimos de diferentes grupos étnicos. Mientras el proyecto está en curso, ha publicado más de 200 TB de datos públicamente.

Proyecto Genome 10K http://www.genome10k.org/ – Este proyecto tiene como objetivo secuenciar los genomas completos de más de 10,000 vertebrados, aproximadamente uno para cada género de vertebrados. Esto ayudará a arrojar luz sobre cómo evolucionaron todos los vertebrados.

La iniciativa i5K http://www.arthropodgenomes.org/… – Un plan para secuenciar 5000 genomas de insectos. Su objetivo es secuenciar los genomas de todas las especies de insectos que se sabe que son importantes para la agricultura mundial, la seguridad alimentaria, la medicina y la producción de energía; todos aquellos utilizados como modelos en biología; el más abundante en los ecosistemas del mundo; y representantes en cada rama de la filogenia de los insectos para lograr una comprensión profunda de la evolución y la filogenia de los artrópodos.

Proyecto 1001 Plant Genomes http://www.onekp.com/ – Tiene como objetivo secuenciar los transcriptomes (parte transcrita del genoma) de 1000 especies de plantas.

Proyecto 1001 Genomes http://1001genomes.org/ – Su objetivo es secuenciar el genoma completo de más de mil cepas de Arabidopsis.

Hay muchos más de estos, Global Ocean Sampling http://www.jcvi.org/cms/research… que tiene como objetivo secuenciar todos los microorganismos presentes en las aguas oceánicas. Proyecto de secuencia de 10.000 microbios. Proyectos para secuenciar el metagenoma del suelo, el intestino y más.

Además de los proyectos de secuenciación, están los proyectos ENCODE y modENCODE, que son una enciclopedia de elementos de ADN en humanos y organismos modelo, respectivamente.

Como resultado de todos estos datos, tenemos una mejor comprensión de la evolución, de los orígenes humanos, el mapeo entre genotipos y fenotipos, y los mecanismos de la enfermedad. Es cierto que la exageración que sigue a la liberación del genoma humano no ha funcionado, pero la medicina personalizada está teniendo un impacto lento en el mundo médico.

La astronomía / astrofísica también se beneficiará enormemente de los “grandes datos”. Debido a la naturaleza de la ciencia (no poder tocar nuestros experimentos), una forma efectiva de aprender acerca de los objetos es encontrar una gran colección de ese tipo de objeto y estudiar el conjunto. Esto es particularmente importante para los objetos donde sus escalas temporales para el cambio son mucho más largas que las vidas humanas (por ejemplo, fusiones entre galaxias). Si puede estudiar una gran cantidad de fusiones de galaxias en diferentes etapas de las fusiones, puede aprender mucho más que estudiando un solo objeto en un solo punto en el tiempo. Por lo tanto, las muestras grandes de objetos son importantes para comprender los objetos.

Además, si desea aprender sobre física fundamental, los sistemas ‘exóticos’ también son útiles. Por ejemplo, el binario Hulst-Taylor [1] proporciona excelentes pruebas de relatividad general a pesar de ser el único sistema conocido de su tipo. Encontrar y estudiar estos sistemas exóticos es importante.

Ambos modos de estudio (muestras de gran tamaño, búsqueda de objetos exóticos) se beneficiarán enormemente de los “grandes datos”. Los telescopios de prospección actuales y futuros, como el Sloan Digital Sky Survey [2] PanStarrs [3], y el Large Synoptic Survey Telescope [4] proporcionarán grandes bases de datos de objetos celestes. Las grandes bases de datos generadas por estos proyectos permitirán a los astrónomos construir grandes muestras de objetos para estudiar. Además, al buscar en estas bases de datos, se pueden ubicar objetos exóticos que de otro modo podrían haberse perdido.

Un aspecto adicional de la astronomía que se beneficiará de esto es el estudio de los fenómenos transitorios. Si bien muchas cosas en astronomía suceden en escalas de tiempo más largas que la vida humana, muchas también suceden en escalas de tiempo más cortas. Las encuestas y los telescopios como PanStarrs, LSST y LOFAR [5] verán las mismas áreas del cielo a intervalos regulares. La comparación de imágenes tomadas en diferentes momentos / fechas puede mostrar fenómenos variables en el tiempo. Estos fenómenos variables en el tiempo no se han estudiado bien en el pasado, por lo que se producirán nuevos descubrimientos y una mejor comprensión de los fenómenos conocidos debido a este aumento en los datos.

1: https://en.wikipedia.org/wiki/PS
2: http://www.sdss.org/
3: http://pan-starrs.ifa.hawaii.edu
4: http://www.lsst.org/
5: http://www.lofar.org/

More Interesting

¿Deben aceptarse las teorías en la comunidad científica para convertirse en teoría a partir de hipótesis, o es simplemente un experimento suficiente? ¿Quién determina qué es teoría, qué no es?

¿Cómo ha modificado el descubrimiento del bosón de Higgs nuestra comprensión actual (o falta de ella) de la materia oscura?

Cómo ingresar a un campo de investigación

¿Cuál es la prueba científica de que el tiempo realmente existe?

El destacado científico del clima JamesHansen dice que necesitamos mantener el carbono en el suelo. ¿Qué vas a hacer para crear industrias de energía cero en carbono?

¿Por qué los científicos usan hipótesis nulas en sus experimentos?

No es racista observar que los cerebros judíos de Einstein a von Neumann a Witten son notables. ¿Por qué no se ha realizado ninguna investigación biológica?

¿Qué podría interrumpir y revolucionar la fabricación de aviones?

¿Cómo afectó en última instancia la recesión económica de 2008 a la producción científica (como los artículos publicados)?

¿Qué áreas de investigación están creciendo más rápidamente? ¿Y cuáles serán en 10 años?

Como investigador independiente, ¿hay un sitio donde pueda discutir su investigación como tener un asesor?

Cómo crear dibujos y diagramas científicos.

¿Cuál es el consenso científico sobre el reciente artículo de Penrose y Hameroff que afirma que su teoría Orch-OR es la mejor teoría de la conciencia propuesta hasta ahora?

¿Qué piensan los conservadores de la creciente investigación sobre la causa de ser transgénero?

Cómo acceder a un impacto científico / académico en un campo