Universidad de Castilla-La Mancha
 
Escuela Superior de Ingeniería Informática

 

  cambiar a curso:   2019-20   2021-22



Grado en Ingeniería Informática


TRABAJOS FIN DE GRADO
curso: 2020-21

Técnicas basadas en Deep Learning para prediccion de Imágenes. Caso de uso: adopción de mascotas


Tecnologías Específicas

Computación
 


Descripcion y Objetivos

El uso de técnicas de aprendizaje automático se ha popularizado en las últimas décadas debido a la proliferación de bases de datos digitales donde se almacena información de muy diversas características. La evolución en los sistemas de almacenamiento y computación ha ampliado considerablemente las posibilidades de la ciencia de datos, hasta el punto de que su uso está suponiendo un factor de disrupción en muchos ámbitos. 

En este TFG pretendemos abordar tareas de aprendizaje sobre datos en relación con animales, y más concretamente mascotas. Nuestro punto de partida es un conjunto de datos que fue empleado en un challenge de la plataforma kaggle (https://www.kaggle.com/c/petfinder-adoption-prediction/).  Empleando estos datos se pretendía predecir cómo de rápido iba a suceder la adopción de una determinada mascota que entra en el sistema/plataforma  PetFinder. Además, tiene la particularidad de que a veces se da esta información por grupos, y no únicamente para un individuo.

El conjunto de datos es bastante completo pues contiene información descriptiva (tipo de animal, color, raza y diferentes características), además de un número entero entre 0 y 4 que va a determinar con qué velocidad fue adoptado el animal, de modo que se puedan aprender modelos en el paradigma de aprendizaje supervisado. Además, se dispone de imágenes para cada y cierta información extraída de ellas. Puesto que en los últimos años el aprendizaje a partir de imágenes ha experimentado un gran auge, creemos que es interesante abordar este problema, ya que podemos enriquecerlo con diferente información que puede ser aprendida a través de las imágenes. Para esto último, proponemos usar técnicas de Deep Learning, o aprendizaje profundo, un paradigma de aprendizaje automático basado en las redes neuronales, pero que aprovecha la capacidad de procesamiento de las GPUs para abordar arquitecturas que típicamente usan varias capas de neuronas intermedias con una dimensionalidad importante. En los últimos años, el aprendizaje profundo ha ayudado a lograr avances en áreas tan diversas como la percepción de objetos, la traducción automática y el reconocimiento de voz (todas ellas áreas especialmente complejas para los investigadores en IA). En el caso de procesamiento de imágenes, existen incluso redes pre-entrenadas para diferentes tareas de clasificación o predicción en imágenes, que se pueden adaptar a otros problemas relacionados. Entre ellas encontramos AlexNet, VGG, ResNet o Inception.

En concreto, en este TFG, y comenzando por el dataset público de Kaggle que hemos descrito y referenciado, pretendemos realizar un estudio y análisis de los datos. Después, estudiariamos cómo abordar la predicción de los días que pasarán para que una mascota sea adoptada, pero enriqueciendo el dataset o el proceso con información adicional, extraída de las imagénes de cada animal y/o de fuentes externas.  

 


Metodología y Competencias

METODOLOGÍA:

  1. Revisar el contexto del problema y la literatura disponible.
  2. Realizar un análisis exploratorio de los datos existentes.
  3. Incorporación de información a partir de las imánes.
  4. Diseñar/implementar modelos basados en diferentes paradigmas. 
  5. Documentar todo el proceso anterior para que sea repetible.
  6. Validación de los modelos finales (seleccionados) 

COMPETENCIAS

Mediante la realización de este TFG se trabajarán, en distinto grado de profundidad, las competencias CM4, CM5, CM6 y CM7, específicas de la intensificación de Computación:

  • Capacidad para conocer los fundamentos, paradigmas y técnicas propias de los sistemas inteligentes y analizar, diseñar y construir sistemas, servicios y aplicaciones informáticas que utilicen dichas técnicas en cualquier ámbito de aplicación.
  • Capacidad para desarrollar y evaluar sistemas interactivos y de presentación de información compleja y su aplicación a la resolución de problemas de diseño de interacción persona computadora. 
  • Capacidad para adquirir, obtener, formalizar y representar el conocimiento humano en una forma computable para la resolución de problemas mediante un sistema informático en cualquier ámbito de aplicación, particularmente los relacionados con aspectos de computación, percepción y actuación en ambientes entornos inteligentes.
  • Capacidad para conocer y desarrollar técnicas de aprendizaje computacional y diseñar e implementar aplicaciones y sistemas que las utilicen, incluyendo las dedicadas a extracción automática de información y conocimiento a partir de grandes volúmenes de datos.

 

 


Medios a utilizar

Todos los medios que se utilizan para la realización de este trabajo fin de grado están disponibles en la ESII y estarán a disposición de alumno que realice este trabajo.

Ordenadores, compiladores, APIs específicas para el desarrollo de las propuestas, etc.

 


Bibliografía

Libros y manuales de aprendizaje automático, procesamiento imágenes y del lenguaje natural y ciencia/minería de datos.

Libros y manuales de lenguajes de programación y librerías específicas (machine learning, deep learning, visión artificial, etc.).

Todo disponible en la ESIIAB y/o en internet.

 


Tutores


FLORES GALLEGO, MARIA JULIA
GAMEZ MARTIN, JOSE ANTONIO
 

Alumno


MORA GARRIDO, DAVID

 

 

Sindicación  Sindicación  Sindicación  Sindicación

Curso: 2020-21
© Escuela Superior de Ingeniería Informática
Edificio Infante Don Juan Manuel
Avda. de España s/n
02071 Albacete
Tfno: 967 59 92 00 - Fax: 967 59 92 24

informatica.ab@uclm.es
aviso legal
generar código QR de la página