cambiar a curso:   2014-15   2016-17


Trabajo Fin de Grado 2015-16
 Clasificación de escenas y objetos a partir de imágenes mediante técnicas de Deep Learning


Especialidades
Computación
Tecnologías de la Información


Tutor
GARCÍA VAREA, ISMAEL
MARTINEZ GOMEZ, JESUS


Descripción y Objetivos

Las técnicas de Deep Learning están teniendo un gran auge durante los últimos años dentro del campo del aprendizaje automático, y en especial en el campo de la visión por computador. Dichas técnicas permiten aprender una representación interna adecuada al problema a resolver, sin la necesidad de utilizar técnicas de extracción de características.

El objetivo principal del trabajo es utilizar técnicas de Deep Learning para resolver el problema de la comprensión de escenas. Este problema consiste en describir una escena, representada a través de una imagen, a partir de etiquetas semánticas que determinan el espacio o habitación en que nos encontramos (cocina, pasillo, dormitorio, etc.) así como los objetos que aparecen en la escena (silla, ordenador, teléfono, lavabo, etc.).

Para realizar este trabajo partiremos de diferentes bases de datos de imágenes anotadas manualmente con los objetos que aparecen en ellas, así como la etiqueta de clase a la que pertenece dicha imagen. Estas bases de datos servirán como datos de entrenamiento al sistema a desarrollar (básicamente un clasificador) que permita clasificar futuras imágenes de test dentro del conjunto de etiquetas/categorías semánticas previamente definidas, así como la detección de los objetos que contienen.



Metodología y Competencias

El trabajo se desarrollará en las siguientes etapas:
 

  • Estudio y puesta en funcionamiento del sistema Caffe: instalación, uso de la API, etc.
  • Entrenamiento de modelos de clasificación a partir de la bases de datos de imágenes.
  • Validación y pruebas


Medios a utilizar

Sistemas de clasificación automática de escenas a partir de imágenes.

Librería PCL para el procesamiento de nubes de puntos.

Algoritmos de detección y registrado de objetos 3D.

Dispositivos de captura de imágenes disponibles en el grupo SIMD del i3A.



Bibliografía
  • http://caffe.berkeleyvision.org/
  • http://cs.nyu.edu/~silberman/datasets/nyu_depth_v2.html
  • http://places.csail.mit.edu/
  • https://rubenlopezg.wordpress.com/2014/05/07/que-es-y-como-funciona-deep-learning/
  • https://en.wikipedia.org/wiki/Deep_learning


Asignación
El Trabajo Fin de Grado ha sido a asignado a Don/Doña Luis Peinado Fuentes