|
Grado en Ingeniería Informática |
TRABAJOS FIN DE GRADO curso: 2021-22
Predicción de resultados de partidos de fútbol usando aprendizaje automático. |
Tecnologías Específicas
Computación
Descripcion y Objetivos
El fútbol es el mayor deporte mundial y una industria multimillonaria en crecimiento. La analítica avanzada de datos es empleada cada vez más frecuentemente por parte de los clubes para mejorar el rendimiento, markegint, scouting, etc.
En ete TFG nos centramos en la siguiente pregunta: "¿Hasta qué punto es posible predecir el resultado de un partido de fútbol, dados los datos de los partidos anteriores?" comúnmente disponibles?". Nuestro objetivo es utilizar técnicas de aprendizaje automático, principalmente redes Bayesianas y ensembles de árboles para predecir el resultado de futuros partidos de fútbol a partir de datos históricos. Para ello, usaremos conjuntos de datos disponibles públicamente y que contienen datos históricos de varias ligas y varias temporadas. El hecho de contener información de distintas ligas permitirá ver si los modelos aprendidos para una liga concreta son lo suficientemente generales para ser aplicados en diferentes contextos (ligas).
En nuestro caso nos centramos inicialmente en dos conjuntos de datos para realizar el estudio (TFG):
- The Big Five European soccer leagues data (temporadas 95-96 a 19-20) que contiene datos de más de 40000 partidos en 25 temporadas de las ligas de Inglaterra, Alemania, España, Italia y Francia). [https://www.kaggle.com/hikne707/big-five-european-soccer-leagues]
- Datos disponibles en [https://fbref.com/es/] sobre jugadores, equipos y partidos de una gran cantidad de ligas.
Por último, es también objetivo de este TFG el desarrollo de una aplicación (móvil, web o de escritorio) que permita la cómoda carga y ejecución de los modelos descubiertos.
Metodología y Competencias
Metodología:
- Estudio de aproximaciones realizadas para modelado de partidos de fútbol y trayectorias de equipos basadas en técnicas de inteligencia artificial subceptibles de ser aplicadas.
- Estudio de los conjuntos de datos objetivo de este trabajo. Se realizará un análisis exploratorio de los conjuntos seleccionados.
- Se preprocesará el conjunto de datos aplicando p.e. técnicas de selección y construcción de variables.
- Diseño e implementación de los algoritmos o procesos de aprendizaje automático basados principalmente en Redes Bayesianas y modelos de ensemble.
- Validación y prueba de los resultados obtenidos.
- Diseño e implementación de la aplicación móvil/web/escritorio para la ejecución de los modelos descubiertos.
- Redacción de la memoria.
Competencias:
Se trabajarán principalmente (en distinto grado) las siguientes competencias específicas de la tecnología de computación:
- [CM1] Capacidad para tener un conocimiento profundo de los principios fundamentales y modelos de la computación y saberlos aplicar para interpretar, seleccionar, valorar, modelar, y crear nuevos conceptos, teorías, usos y desarrollos tecnológicos relacionados con la informática.
- [CM3] Capacidad para evaluar la complejidad computacional de un problema, conocer estrategias algorítmicas que puedan conducir a su resolución y recomendar, desarrollar e implementar aquella que garantice el mejor rendimiento de acuerdo con los requisitos establecidos.
- [CM4] Capacidad para conocer los fundamentos, paradigmas y técnicas propias de los sistemas inteligentes y analizar, diseñar y construir sistemas, servicios y aplicaciones informáticas que utilicen dichas técnicas en cualquier ámbito de aplicación.
- [CM5] Capacidad para adquirir, obtener, formalizar y representar el conocimiento humano en una forma computable para la resolución de problemas mediante un sistema informático en cualquier ámbito de aplicación, particularmente los relacionados con aspectos de computación, percepción y actuación en ambientes o entornos inteligentes.
- [CM7] Capacidad para conocer y desarrollar técnicas de aprendizaje computacional y diseñar e implementar aplicaciones y sistemas que las utilicen, incluyendo las dedicadas a extracción automática de información y conocimiento a partir de grandes volúmenes de datos.
Medios a utilizar
Ordenadores personales, compiladores y entornos de programación. Todo disponible en la ESIIAB o recursos en la nube (Kaggle, Colab, etc.)
Bibliografía
Libros y manuales de inteligencia artificial y aprendizaje automático. Libros y manuales de lenguajes de programación y librerías específicas de aprendizaje automático. Documentación online y artículos científicos sobre predicción de resultados para partidos de fútbol. Todo disponible en la ESIIAB y/o recursos en internet.
Tutores GAMEZ MARTIN, JOSE ANTONIO PUERTA CALLEJON, JOSE MIGUEL | Alumno ESCRIBANO CAMACHO, RODRIGO
|
| |