Prediciendo las finales de la Copa América y la Eurocopa con Inteligencia Artificial
12 de Julio de 2024Escribe Nicolás García Aramouni, Data & AI Accenture Argentina
Artículo publicado en Medium
Cada vez más, el uso de datos se ha vuelto algo central en nuestra vida, y su uso para la toma de decisiones es cada vez más relevante. Desde el lanzamiento de ChatGPT, ¿quién no lo ha usado como asistente para hacer más fácil tareas cotidianas o laborales? De la misma forma, podemos aprovechar el poder de los modelos analíticos para analizar lo que pasa en los eventos relacionados a nuestros intereses y pasiones, como la música, el arte y los deportes. Si algo es seguro, es que durante el último mes, a quienes nos gusta el fútbol, nuestra rutina estuvo atravesada por el desarrollo de la Copa América y la UEFA Euro.
Con esto en mente, como apasionado del mundo de los deportes y fanáticos de Lionel Messi, nos pusimos como objetivo ver si podíamos calcular la probabilidad de que Argentina consiga el bicampeonato de la Copa América el domingo, y dada la sobredosis de fútbol del último mes, también predecir qué selección entre Inglaterra y España tiene una mayor probabilidad de salir campeona de Europa. Ahora bien, ¿cómo podemos lograr esto?
La estimación del resultado de un partido
La materia prima de los modelos predictivos son los datos históricos, por lo que, a partir de resultados históricos de partidos de selecciones e información sobre los rankings de selecciones de la FIFA, se desarrollaron varios modelos (a partir de approaches distintos) que predecían el resultado de un partido. A grandes rasgos, los dos grandes enfoques fueron
- Modelar la fuerza de ataque y de defensa de un equipo, modelando los goles convertidos y recibidos por un equipo como una distribución Poisson (una versión simplificada de lo que se hace en https://301060.exactas.uba.ar/)
- Desarrollar un modelo de Machine Learning que predice quién gana a partir de información sobre los últimos partidos de los equipos (resultado, goles) y la fuerza de cada equipo (medida por el Ranking FIFA)
¿Quién se estima que ganen las finales del domingo?
A partir de estos modelos, se pueden justamente calcular las probabilidades estimadas de que algún equipo salga campeón. Sin embargo, una limitación de los modelos estadísticos es que necesitan una gran cantidad de datos, por lo que es necesario utilizar información histórica para calcular estas probabilidades. Por más que uno puede darle más importancia a observaciones más recientes, es posible considerar que el pasado no es reflejo de la situación actual de los equipos. Es por eso que, a modo de comparación, en nuestro análisis no solo incluimos el resultado de los modelos estadísticos, si no también el resultado de correr 50 veces la final de la EURO en el videojuego FC24 (lamentablemente esto no se pudo hacer para la Copa América ya que Colombia no está en el juego) -lo cual quizás muestra el estado actual de un equipo de forma más real-, y las probabilidades implícitas que se ven en una casa de apuestas (la probabilidad de empate se repartió de forma equitativa entre ambos equipos):
Como puede observarse, las probabilidades brindadas por los tres enfoques anticipan encuentros parejos (no hay un equipo que tenga una probabilidad especialmente alta), y no parece haber demasiada diferencia entre todos los análisis. Por otro lado, tanto el modelo estadístico como el mercado de apuestas coinciden que Argentina tiene una pequeña diferencia favorable en sus chances de salir campeón versus el seleccionado cafetero, mientras que no hay un consenso total entre los distintos criterios para la final europea. Esto tiene sentido ya que, por más que Inglaterra era el mayor candidato en la previa del torneo, la selección española ha tenido un mayor nivel durante la competición. Dado el nivel de las distintas selecciones, y el poderío de los equipos, tiene sentido que no haya un claro ganador en ninguna de las dos finales.
Próximamente, escribiremos un nuevo post en el que mostraremos la precisión de cada uno de los enfoques propuestos, midiendo la performance económica y de poder predictivo de cada uno.
(*) Nicolás García Aramouni: Data & AI Accenture Argentina