¿Qué es un skill score?
El skill score es una métrica fundamental en la verificación de pronósticos meteorológicos. Su objetivo es responder a una pregunta clave: ¿es mi modelo mejor que una referencia trivial? No basta con medir el error absoluto de un pronóstico; lo importante es saber si el modelo aporta información útil que no se podría obtener simplemente repitiendo el clima medio o asumiendo que mañana será igual que hoy (persistencia). El skill score normaliza la calidad del pronóstico respecto a esa referencia.
¿Cómo se calcula?
La fórmula general del skill score es: SS = (S_ref - S_mod) / (S_ref - S_perf), donde S_mod es el score del modelo evaluado, S_ref es el score de la referencia y S_perf es el score de un pronóstico perfecto. Si el modelo iguala a la referencia, SS = 0. Si el pronóstico es perfecto, SS = 1. Si el modelo es peor que la referencia, SS es negativo. Esta formulación se aplica sobre distintas métricas base: el error cuadrático medio produce el MSESS (Mean Squared Error Skill Score), la anomalía de correlación produce el ACC (Anomaly Correlation Coefficient) y el Brier Score produce el Brier Skill Score.
Tipos de skill score en meteorología
El más utilizado en predicción operativa es el ACC (Anomaly Correlation Coefficient), que mide la correlación entre las anomalías pronosticadas y las observadas respecto a la climatología. Un ACC de 0.6 en la altura geopotencial de 500 hPa se considera el umbral mínimo de utilidad del pronóstico. El ECMWF alcanza un ACC de 0.6 hasta el día 9-10, mientras que hace 30 años ese umbral se alcanzaba apenas al día 5. Otros skill scores comunes son el Heidke Skill Score (HSS) para eventos categóricos (lluvia sí/no) y el Peirce Skill Score (PSS) que penaliza las falsas alarmas.
Aplicación práctica
Los skill scores permiten comparar modelos de forma justa. Por ejemplo, un modelo puede tener errores absolutos grandes en zonas montañosas simplemente porque el clima es más variable allí. El skill score elimina este sesgo al comparar siempre con la referencia local. Cuando en Snowy se comparan las predicciones de ECMWF, GFS, ICON, ARPEGE y GEM, los centros meteorológicos usan skill scores para determinar cuál es consistentemente mejor a cada plazo de predicción.