El objetivo es desarrollar un clasificador de espacios visuales que tome como entrada la información de los objetos reconocidos en la escena.
El Challenge ImageCLEF 2014 (http://www.imageclef.org/2014/robot) plantea un problema de clasificación de espacios visuales a partir de imágenes visuales y de profundidad capturadas por un robot durante su desplazamiento en un entorno interior. De cada imagen (visual y de profundidad) se pueden extraer diferentes características que sirvan como descriptores, tales como histogramas de niveles de grises o también histogramas de profundidad. El objetivo de la tarea es doble, por una parte identificar la presencia o ausencia de una serie de objetos clave (extintor, teléfono, silla, impresora, urinario, estantería, papelera y frigorífico) y por otra parte determinar la habitación o espacio en el que se encuentra el robot en el momento en que capturó la imagen (pasillo, hall, despacho profesor, despacho alumnos, sala técnica, aseo, secretaría, sala de videoconferencia, almacén y zona de ascensores).
En este proyecto planteamos abordar el problema de forma jerárquica: primero se tratará de reconocer los objetos a partir de las características extraídas de las imágenes (histogramas), y posteriormente usando esta información (y posiblemente también la inicial) se abordará la clasificación del espacio/habitación.
El objetivo del TFG es por tanto la obtención de un sistema integral de clasificación que aborde tanto el problema multietiqueta de la primera fase (objetos) como el problema unidimensional (escena) de la segunda fase.
- Familiarización con el lenguaje de programación MATLAB (alternativamente OCTAVE).
- Estudio de técnicas de extracción de características y aprendizaje supervisado.
- Análisis, diseño e implementación de clasificadores supervisados jerárquicos para abordar
el problema de la clasificación de escenas.
- Estudio del material disponible para el challenge "ImageCLEF 2014"
- Estudio experimental de las soluciones propuestas sobre los datos del challenge anteriormente citado.
- Escritura de la memoria.
- Compiladores y entornos de programación de Matlab/Octave.
- Conjuntos de datos disponibles en Internet (http://www.imageclef.org/2014/robot).
- Librerías específicas de aprendizaje automático (p.e. LibSVM), disponibles gratuitamente.
- PCs de sobremesa y/o portátiles.
Todo disponible en la ESII.