¿Los datos de los experimentos en LHC, SLAC, CERN, etc. están disponibles públicamente? Si es así, ¿dónde se puede encontrar?

Para LHC, creo que hay un programa piloto de acceso público abierto: aproximadamente la mitad de los datos de LHC, y por razones obvias, se supone que solo aquellos datos que aún no están siendo analizados activamente por los grupos experimentales se pondrán a disposición del público a partir de la segunda mitad de 2014. Al principio incluirá solo datos de 2010, pero con el tiempo se dice que habrá más disponibles.

Los datos existen en más de un centro en todo el mundo. Hay 140 centros en 35 países. La cuadrícula del LHC, que almacena los datos de manera distribuida y también proporciona acceso a la computación distribuida, está organizada en 4 niveles: el nivel 0 está en el LHC y maneja las velocidades de datos más altas, directamente desde los propios detectores.

Hay 11 centros de datos de nivel 1, cada uno de los cuales mantiene una copia completa de los datos. En los Estados Unidos hay dos centros de Nivel 1: uno de ellos está en BNL, uno está en FNAL. El enlace de LHC a BNL consta de dos enlaces de fibra óptica de 8,5 Gbps dedicados. Aquí hay un artículo sobre la cuadrícula:

http://home.web.cern.ch/about/co…

No sé exactamente cómo funcionará el acceso público en la práctica. Se necesitan grandes centros de datos e instalaciones informáticas especializadas para hacer frente a los enormes volúmenes de datos: a intensidad máxima hay mil millones de colisiones protón-protón por segundo en CMS.

Los datos de Nivel 1 de LHC ya son públicos: es lo que se encuentra en los documentos experimentales publicados.

Habrá acceso a datos de Nivel 2 y Nivel 3, que ya tienen algunos objetos físicos reconstruidos, pero no acceso a datos de Nivel 4, que son los datos de colisión sin procesar y no reconstruidos, que consisten en millones de salidas de los detectores.

Si estuviéramos hablando de los datos completos del Nivel 4, esta es una cantidad increíblemente grande de información: aproximadamente 64 petabytes han sido generados solo por CMS. No puede simplemente descargarlo a su computadora portátil 😉

De todos modos, necesitaría tener acceso y saber mucho sobre cómo ejecutar una gran cantidad de software especializado incluso para comenzar a manejar los datos del Nivel 4.

No sé acerca de SLAC / BaBAR, FNAL / Tevatron u otros datos de alta energía, no creo que ninguno de ellos haya intentado hacer públicos los datos de bajo nivel; CERN / LHC puede ser el primero en intentarlo.