La Universidad de Almería ha dado un importante paso en la intersección entre las matemáticas y el fútbol, un deporte que se caracteriza por generar una cantidad cada vez mayor de datos. Este fenómeno lo convierte en un campo ideal para la implementación de técnicas de ciencia de datos. En este contexto, la investigación se centra en cómo el elevado volumen de información conlleva una considerable incertidumbre respecto a los resultados de los partidos. Este trabajo ha sido liderado por Antonio Salmerón, catedrático de Estadística en la UAL, junto a Nicolás Pérez, quien ha desarrollado su tesis doctoral en esta temática.
El estudio titulado ‘Predicting draws and number of fouls in football matches using Bayesian network classifiers’ ha sido publicado en la reconocida revista ‘Progress in Artificial Intelligence’, editada por Springer y especializada en el área de ‘Computer Science, Artificial Intelligence’. La investigación presenta modelos estadísticos que no solo son útiles para el ámbito deportivo, sino que también tienen aplicaciones potenciales en contextos de apuestas, permitiendo desarrollar estrategias basadas en la ganancia esperada.
Aplicaciones más allá del fútbol
Además, la estrategia propuesta para agrupar datos puede ser utilizada en otros problemas predictivos donde se busque anticipar eventos poco comunes o raros. En particular, el estudio emplea clasificadores bayesianos para prever diversos aspectos relacionados con los partidos de fútbol, como el número de faltas cometidas y la probabilidad de que un encuentro finalice en empate; este último es considerado uno de los resultados más difíciles de pronosticar.
La investigación se basa en datos históricos extraídos de La Liga desde la temporada 2010/2011. Se han propuesto enfoques innovadores para agrupar esta información con el fin de mejorar las capacidades predictivas. Es relevante señalar que todos los modelos estadísticos han sido entrenados utilizando datos disponibles públicamente en internet, lo que garantiza su accesibilidad para cualquier interesado. Una ventaja significativa del uso de clasificadores bayesianos sobre otros métodos predictivos, como aquellos fundamentados en redes neuronales, es su capacidad para ser interpretados fácilmente por humanos, lo que permite comprender el proceso detrás de cada predicción realizada.