Las técnicas de Deep Learning están teniendo un gran auge durante los últimos años dentro del campo del aprendizaje automático, y en especial en el campo de la visión por computador. Dichas técnicas permiten aprender una representación interna adecuada al problema a resolver, sin la necesidad de utilizar técnicas de extracción de características.
El objetivo principal del trabajo es utilizar técnicas de Deep Learning para resolver el problema de la comprensión de escenas. Este problema consiste en describir una escena, representada a través de una imagen, a partir de etiquetas semánticas que determinan el espacio o habitación en que nos encontramos (cocina, pasillo, dormitorio, etc.) así como los objetos que aparecen en la escena (silla, ordenador, teléfono, lavabo, etc.).
Para realizar este trabajo partiremos de diferentes bases de datos de imágenes anotadas manualmente con los objetos que aparecen en ellas, así como la etiqueta de clase a la que pertenece dicha imagen. Estas bases de datos servirán como datos de entrenamiento al sistema a desarrollar (básicamente un clasificador) que permita clasificar futuras imágenes de test dentro del conjunto de etiquetas/categorías semánticas previamente definidas, así como la detección de los objetos que contienen.
Sistemas de clasificación automática de escenas a partir de imágenes.
Librería PCL para el procesamiento de nubes de puntos.
Algoritmos de detección y registrado de objetos 3D.
Dispositivos de captura de imágenes disponibles en el grupo SIMD del i3A.