TRABAJOS FIN DE GRADO curso: 2017-18
Evaluación de la calidad estética en imágenes usando deep learning |
Tecnologías Específicas
Computación
Descripcion y Objetivos
La evaluación de la calidad estética en fotografía es un problema reciente del campo de Computer Vision. Este problema es uno de los más complejos debido a la alta subjetividad de la tarea, ya que incluso un grupo de expertos pueden tener opiniones distintas sobre si una foto es buena o mala. Sin embargo, hay un interés creciente en la automatización de dicha tarea, en parte a las redes sociales, donde página como Instragam, Flickr o Pinterest reciben millones de fotos al día. En este tipo de plataformas, poder contar con herramientas como filtros de calidad o rankings que permitan ordenarlas según su atractivo son de especial utilidad. Otras aplicaciones pueden servir para mejorar las aplicaciones actuales de las cámaras, proporcionando feedback de la calidad de la fotografía o haciendo recomendaciones de filtros dependiendo del tipo de fotografía que se esté realizando. Pero no sólo eso, la evaluación de la calidad estética también sirve para entender que es lo que hace que nos sintamos atraídos por una imagen y sus fines en publicidad e investigación son numerosos.
El trabajo realizado hasta ahora ha consistido en el estudio de las técnicas de procesamiento de imágenes y de los algoritmos que permiten obtener, a partir de las características de una imagen, resultados sobre la calidad de la misma. El uso de redes neuronales, unos algoritmos que simulan el comportamiento de las neuronas y que han demostrado su gran potencial en muchas aplicaciones como el reconocimiento facial o del habla va a ser el enfoque adoptado en este trabajo.
En la literatura actual se han conseguido resultados obtenidos con las redes neuronales y se consideran el estado del arte. El principal objetivo a desarrollar en este trabajo es la implementación de varios enfoques estudiados en la literatura y su posterior análisis y posibles mejoras.
Metodología y Competencias
METODOLOGÍA:
- Revisar el contexto del problema y la literatura disponible.
- Realizar un análisis exploratorio de los datos existentes.
- Transformar las representaciones no estructuradas (imagenes) en representaciones estructuradas usando técnicas de procesamiento en redes profundas.
- Sobre la partición de datos de entrenamiento diseñar procesos de minería de datos centrados en:
- Preprocesamiento de datos (selección de variables, construcción de variables, discretización, etc.)
- Identificación de los algoritmos de minería de datos que mejor encajen en el problema objetivo. Aplicar realizando selección de modelos en función de los parámetros.
- Validación de los modelos obtenidos.
- Iterar refinando los pasos anteriores hasta determinar uno o varios modelos exitosos.
- Documentar todo el proceso anterior para que sea repetible.
- Estimar la bondad de los modelos finales (seleccionados) sobre el conjunto de datos de test reservado a tal efecto.
- Redactar la memoria.
COMPETENCIAS:
Se trabajarán principalmente (en distinto grado) las siguientes competencias específicas de la tecnología de computación:
- Capacidad para evaluar la complejidad computacional de un problema, conocer estrategias algorítmicas que puedan conducir a su resolución y recomendar, desarrollar e implementar aquella que garantice el mejor rendimiento de acuerdo con los requisitos establecidos.
- Capacidad para conocer los fundamentos, paradigmas y técnicas propias de los sistemas inteligentes y analizar, diseñar y construir sistemas, servicios y aplicaciones informáticas que utilicen dichas técnicas en cualquier ámbito de aplicación.
- Capacidad para adquirir, obtener, formalizar y representar el conocimiento humano en una forma computable para la resolución de problemas mediante un sistema informático en cualquier ámbito de aplicación, particularmente los relacionados con aspectos de computación, percepción y actuación en ambientes entornos inteligentes.
- Capacidad para conocer y desarrollar técnicas de aprendizaje computacional y diseñar, implementar aplicaciones y sistemas que las utilicen, incluyendo las dedicadas a extracción automática de información y conocimiento a partir de grandes volúmenes de datos.
Medios a utilizar
Ordenadores personales, compiladores y entornos de programación. Todo disponible en la ESIIAB.
Bibliografía
Libros y manuales de aprendizaje automático, procesamiento del lenguaje natural y ciencia/minería de datos. Libros y manuales de lenguajes de programación y librerías específicas (machine learning, deep learning, visión artificial, etc.). Todo disponible en la ESIIAB y/o en internet.
Tutores PUERTA CALLEJON, JOSE MIGUEL GAMEZ MARTIN, JOSE ANTONIO | Alumno LEO MUÑOZ, PABLO
|
|