La IA está superando a nuestra mejor tecnología de pronóstico del tiempo, gracias a DeepMind

La IA de DeepMind está superando a nuestra mejor tecnología de pronóstico del tiempo

science-deepmind-2023-learning-skillful-medium-range-global-weather-forecasting-slide-9

Los datos de una simulación de varias décadas, llamada ERA5, se ingresan en la red de gráficos GraphCast como un conjunto de mediciones en un punto específico. Al recorrer el gráfico, GraphCast predice la próxima medición para ese punto y sus vecinos.

Los climatólogos han pasado décadas acumulando datos sobre cómo ha cambiado el clima en diferentes puntos alrededor del mundo. Esfuerzos como ERA5, un registro del clima desde 1950 desarrollado por el Centro Europeo para Proyecciones Meteorológicas a Plazo Medio (ECMWF), son una especie de simulación de la Tierra a lo largo del tiempo, un registro de la velocidad del viento, la temperatura, la presión atmosférica y otras variables, hora por hora.

Esta semana, DeepMind de Google está anunciando lo que llama un punto de inflexión en el uso de todos esos datos para hacer predicciones económicas del clima. Utilizando una única ficha de IA, la unidad de procesamiento de tensor de Google (TPU), los científicos de DeepMind lograron ejecutar un programa que puede predecir las condiciones climáticas con mayor precisión que un modelo tradicional en una supercomputadora.

También: Menos es más cuando se trata de IA, según DeepMind de Google

El documento de DeepMind se publica en el número de la próxima semana de la revista científica Science, acompañado de un artículo del personal que compara el documento con parte de una “revolución” en la predicción del clima.

Si bien GraphCast, como se llama el programa, no es un reemplazo de los modelos tradicionales de pronóstico, según el autor principal Remi Lam y sus colegas de DeepMind, lo consideran un “complemento” potencial para los métodos existentes. De hecho, la única razón por la que GraphCast es posible es porque los científicos del clima construyeron los algoritmos existentes que se utilizaron para “reanalizar”, es decir, retroceder en el tiempo y compilar los enormes datos diarios de ERA5. Sin ese esfuerzo preciso para crear un modelo mundial del clima, no habría GraphCast.

El desafío que asumió Lam y su equipo fue tomar una serie de registros climáticos de ERA5 y ver si su programa, GraphCast, podía predecir algunos registros invisibles mejor que el estándar de oro para el pronóstico del clima, un sistema llamado HRES, también desarrollado por ECMWF.

HRES, que significa Pronóstico de Alta Resolución, predice el clima para los próximos 10 días en todo el mundo utilizando una hora de trabajo para un área de alrededor de 10 kilómetros cuadrados. El HRES es posible gracias a modelos matemáticos desarrollados a lo largo de décadas por investigadores. El HRES es “mejorado por expertos altamente capacitados”, lo cual, aunque valioso, “puede ser un proceso que consume mucho tiempo y costoso”, escriben Lam y su equipo, y que conlleva el costo de supercomputadoras multimillonarias.

También: Por qué la visualización de IA de DeepMind es completamente inútil

La pregunta es si una forma de IA basada en aprendizaje profundo podría igualar ese modelo creado por científicos humanos con un modelo generado automáticamente.

GraphCast toma datos climáticos como la temperatura y la presión atmosférica y los representa como un solo punto para un área cuadrada en el globo. Ese punto individual está vinculado a las condiciones climáticas de áreas vecinas mediante lo que se llaman “bordes”. Piense en el gráfico social de Facebook, donde cada persona es un punto y están vinculados a amigos por una línea. La atmósfera de la Tierra se convierte en una masa de puntos, cada área cuadrada vinculada por líneas que representan cómo el clima de cada área se relaciona con su área vecina.

Eso es el “gráfico” en GraphCast. Técnicamente, es un área bien establecida de IA basada en aprendizaje profundo llamada red neuronal gráfica. Se entrena una red neuronal para determinar cómo se relacionan los puntos y las líneas, y cómo esas relaciones pueden cambiar con el tiempo.

Armado con la red neuronal GraphCast, Lam y su equipo introdujeron 39 años de datos de ERA5 sobre presión atmosférica, temperatura, velocidad del viento, etc., y luego midieron qué tan bien predecía lo que sucedería a continuación durante un período de 10 días en comparación con los programas HRES.

También: Reemplacé la aplicación meteorológica de mi teléfono con esta estación de pronóstico de $340. Aquí te explico por qué

Lleva un mes y 32 chips TPU trabajando en conjunto para entrenar a GraphCast con los datos de ERA5; ese es el proceso de entrenamiento en el que se ajustan los parámetros o “pesos” neuronales de la red para que puedan hacer predicciones confiables. Luego, un grupo de datos de ERA5 que se ha separado, conocidos como datos “reservados”, se alimenta al programa para ver si el GraphCast entrenado puede predecir cómo esos puntos de datos cambiarán en diez días, efectivamente prediciendo el clima dentro de estos datos simulados.

“GraphCast supera significativamente” a HRES en el 90% de las tareas de predicción, observan los autores. GraphCast también es capaz de superar a HRES en la predicción de la forma en que se desarrollan los extremos de calor y frío. Observan que HRES tiene un mejor desempeño en las predicciones que tienen que ver con la estratósfera, en comparación con los cambios superficiales del clima.

Es importante entender que GraphCast no está prediciendo activamente el clima en producción. Lo que hizo bien fue un experimento controlado con datos climáticos previamente conocidos, no datos en tiempo real.

Una limitación intrigante de GraphCast es que falla cuando se sale de un período de 10 días, señala Lam y su equipo. Como ellos escriben, “hay una mayor incertidumbre en plazos más largos”. GraphCast se vuelve “difuso” cuando las cosas se vuelven más inciertas. Eso sugiere que tienen que hacer cambios a GraphCast para lidiar con la mayor incertidumbre en períodos de tiempo más largos, probablemente creando un “conjunto” de pronósticos que se superponen. “Crear pronósticos probabilísticos que modelen la incertidumbre de manera más explícita… es un próximo paso crucial”, escriben Lam y su equipo.

También: Cómo un gemelo digital para clima intenso podría ayudar a los científicos a mitigar el cambio climático

Curiosamente, DeepMind tiene grandes ambiciones para GraphCast. No solo es GraphCast solo uno de los modelos climáticos que esperan tener, sino que forma parte de un interés más amplio en la simulación. El programa opera con datos globales que simulan lo que sucede a lo largo del tiempo. Lam y su equipo sugieren que otros fenómenos se pueden mapear y predecir de esta manera, no solo el clima.

“GraphCast puede abrir nuevas direcciones para otros problemas importantes de pronóstico geo-espaciotemporal”, escriben, “incluyendo clima y ecología, energía, agricultura, actividad humana y biológica, así como otros sistemas dinámicos complejos.

“Creemos que los simuladores aprendidos entrenados con datos del mundo real serán cruciales para avanzar en el papel del aprendizaje automático en las ciencias físicas.”