TRABAJOS FIN DE GRADO curso: 2020-21
Técnicas basadas en Deep Learning para prediccion de Imágenes. Caso de uso: adopción de mascotas |
Tecnologías Específicas
Computación
Descripcion y Objetivos
El uso de técnicas de aprendizaje automático se ha popularizado en las últimas décadas debido a la proliferación de bases de datos digitales donde se almacena información de muy diversas características. La evolución en los sistemas de almacenamiento y computación ha ampliado considerablemente las posibilidades de la ciencia de datos, hasta el punto de que su uso está suponiendo un factor de disrupción en muchos ámbitos.
En este TFG pretendemos abordar tareas de aprendizaje sobre datos en relación con animales, y más concretamente mascotas. Nuestro punto de partida es un conjunto de datos que fue empleado en un challenge de la plataforma kaggle (https://www.kaggle.com/c/petfinder-adoption-prediction/). Empleando estos datos se pretendía predecir cómo de rápido iba a suceder la adopción de una determinada mascota que entra en el sistema/plataforma PetFinder. Además, tiene la particularidad de que a veces se da esta información por grupos, y no únicamente para un individuo.
El conjunto de datos es bastante completo pues contiene información descriptiva (tipo de animal, color, raza y diferentes características), además de un número entero entre 0 y 4 que va a determinar con qué velocidad fue adoptado el animal, de modo que se puedan aprender modelos en el paradigma de aprendizaje supervisado. Además, se dispone de imágenes para cada y cierta información extraída de ellas. Puesto que en los últimos años el aprendizaje a partir de imágenes ha experimentado un gran auge, creemos que es interesante abordar este problema, ya que podemos enriquecerlo con diferente información que puede ser aprendida a través de las imágenes. Para esto último, proponemos usar técnicas de Deep Learning, o aprendizaje profundo, un paradigma de aprendizaje automático basado en las redes neuronales, pero que aprovecha la capacidad de procesamiento de las GPUs para abordar arquitecturas que típicamente usan varias capas de neuronas intermedias con una dimensionalidad importante. En los últimos años, el aprendizaje profundo ha ayudado a lograr avances en áreas tan diversas como la percepción de objetos, la traducción automática y el reconocimiento de voz (todas ellas áreas especialmente complejas para los investigadores en IA). En el caso de procesamiento de imágenes, existen incluso redes pre-entrenadas para diferentes tareas de clasificación o predicción en imágenes, que se pueden adaptar a otros problemas relacionados. Entre ellas encontramos AlexNet, VGG, ResNet o Inception.
En concreto, en este TFG, y comenzando por el dataset público de Kaggle que hemos descrito y referenciado, pretendemos realizar un estudio y análisis de los datos. Después, estudiariamos cómo abordar la predicción de los días que pasarán para que una mascota sea adoptada, pero enriqueciendo el dataset o el proceso con información adicional, extraída de las imagénes de cada animal y/o de fuentes externas.
Metodología y Competencias
METODOLOGÍA:
- Revisar el contexto del problema y la literatura disponible.
- Realizar un análisis exploratorio de los datos existentes.
- Incorporación de información a partir de las imánes.
- Diseñar/implementar modelos basados en diferentes paradigmas.
- Documentar todo el proceso anterior para que sea repetible.
- Validación de los modelos finales (seleccionados)
COMPETENCIAS
Mediante la realización de este TFG se trabajarán, en distinto grado de profundidad, las competencias CM4, CM5, CM6 y CM7, específicas de la intensificación de Computación:
- Capacidad para conocer los fundamentos, paradigmas y técnicas propias de los sistemas inteligentes y analizar, diseñar y construir sistemas, servicios y aplicaciones informáticas que utilicen dichas técnicas en cualquier ámbito de aplicación.
- Capacidad para desarrollar y evaluar sistemas interactivos y de presentación de información compleja y su aplicación a la resolución de problemas de diseño de interacción persona computadora.
- Capacidad para adquirir, obtener, formalizar y representar el conocimiento humano en una forma computable para la resolución de problemas mediante un sistema informático en cualquier ámbito de aplicación, particularmente los relacionados con aspectos de computación, percepción y actuación en ambientes entornos inteligentes.
- Capacidad para conocer y desarrollar técnicas de aprendizaje computacional y diseñar e implementar aplicaciones y sistemas que las utilicen, incluyendo las dedicadas a extracción automática de información y conocimiento a partir de grandes volúmenes de datos.
Medios a utilizar
Todos los medios que se utilizan para la realización de este trabajo fin de grado están disponibles en la ESII y estarán a disposición de alumno que realice este trabajo.
Ordenadores, compiladores, APIs específicas para el desarrollo de las propuestas, etc.
Bibliografía
Libros y manuales de aprendizaje automático, procesamiento imágenes y del lenguaje natural y ciencia/minería de datos.
Libros y manuales de lenguajes de programación y librerías específicas (machine learning, deep learning, visión artificial, etc.).
Todo disponible en la ESIIAB y/o en internet.
Tutores FLORES GALLEGO, MARIA JULIA GAMEZ MARTIN, JOSE ANTONIO | Alumno MORA GARRIDO, DAVID
|
|