¿Qué es el índice de Brier?
El índice de Brier, propuesto por Glenn W. Brier en 1950, es la métrica estándar para evaluar pronósticos probabilísticos de eventos binarios en meteorología. Si un modelo dice que hay un 70% de probabilidad de lluvia y finalmente llueve, ¿cómo de bueno fue ese pronóstico? El Brier Score responde a esta pregunta calculando la media del cuadrado de la diferencia entre la probabilidad emitida y el resultado observado (1 si ocurrió, 0 si no). Su valor oscila entre 0 (pronóstico perfecto) y 1 (el peor pronóstico posible).
¿Cómo se calcula y se interpreta?
La fórmula es directa: BS = (1/N) * suma de (p_i - o_i)^2, donde p_i es la probabilidad pronosticada para el caso i y o_i es la observación (1 o 0). Si un modelo pronostica 0.9 de probabilidad de lluvia y llueve, su contribución al BS es (0.9 - 1)^2 = 0.01, muy buena. Si pronostica 0.9 y no llueve, es (0.9 - 0)^2 = 0.81, muy mala. El Brier Score puede descomponerse en tres componentes: fiabilidad (¿cuando digo 70%, llueve el 70% de las veces?), resolución (¿el modelo distingue días lluviosos de secos?) e incertidumbre (¿cuánto varía la climatología del evento?).
El Brier Skill Score
Para saber si un modelo probabilístico aporta valor, se compara su Brier Score con el de la climatología (frecuencia histórica del evento). El Brier Skill Score (BSS) normaliza esta comparación: BSS = 1 - BS_modelo / BS_climatología. Un BSS de 1 indica pronóstico perfecto, 0 indica que el modelo no supera a la climatología, y valores negativos indican que el modelo es peor que simplemente usar la frecuencia climática. Los modelos ensemble modernos como el del ECMWF alcanzan BSS positivos para precipitación hasta 7-10 días de plazo.
Aplicación en predicción operativa
El índice de Brier es especialmente importante para evaluar las predicciones ensemble, que proporcionan probabilidades de eventos como precipitación superior a un umbral, temperaturas extremas o vientos fuertes. Las agencias meteorológicas lo usan rutinariamente para monitorizar la calidad de sus sistemas de predicción. Un modelo ensemble bien calibrado debe tener fiabilidad alta (las probabilidades emitidas coinciden con las frecuencias observadas) y buena resolución (distingue situaciones de alto y bajo riesgo).