|
Grado en Ingeniería Informática |
TRABAJOS FIN DE GRADO curso: 2021-22
Evaluación Estética de Fotografías: Modelos Basados en Aprendizaje Profundo y Transformers |
Tecnologías Específicas
Computación
Descripcion y Objetivos
Nos centraremos en el problema de la clasificación automática de fotografías desde el punto de vista de su calidad estética. Este problema es un interés creciente debido la uso intensivo de imágenes en gran cantidad de aplicaciones donde existe se necesitan fotografías e imágenes de calidad elegidas a menudo de entre una ingente colección de ellas. Este problema presenta dos retos importantes, el primero de ello es el de caracterizar las imágenes de tal forma que sean tratables de forma automática, este problema últimamente se está abordado con un éxito indudable con el uso de la denominadas Redes Profundas. El segundo problema que plantea es el carácter subjetivo del problema. Una determinada fotografía puede ser buena desde su punto de vista estético para una persona y no serlo para otra, a menudo ni siquiera expertos en el tema ofrecen una visión de consenso sobre la calidad estética.
De lo anterior se deduce que unas de la técnicas mas utilizadas para resolver este problema es el uso de redes profundas entrenadas para tal fin. Aunque estas técnicas han ofrecido un rendimiento espectacular en problemas relaciones de visión artificial, no ha sido tanta la mejora mostrada por estos modelos para este problema particular, debido fundamentalmente a el carácter subjetivo del problema.
Las bases de datos a partir de la que entrenan estos modelos no son bases de datos supervisadas al estilo de otros problemas de aprendizaje, esto es, no hay una etiqueta para cada imagen con su clasificación en "buena" calidad estética o "mala" calidad estética. Lo habitual es encontrarnos unas bases de datos donde un número importante de usuarios anotan cada imagen evaluandose normalmente con una rango finito y discreto de valores, por ejemplo, desde 1 hasta 10, donde 1 representa la por valoración de la imagen y 10 la mejor valoración.
Existen en la actualidad diferentes modelos que resuelven el problema de forma mas o menos adecuada, pero están presenten un número alto de problemas que no se han resuelto de forma adecuada.
El principal objetivo de este proyecto es utilizar esta fuente de información para predecir la calidad estética de fotografías para intentar mejorar los modelos actuales introduciéndoles los denominados modelos de auto-atención que han tenido un éxito destacado en otro tipos de redes profundas dedicadas fundamentalmente al procesamiento del lenguaje natural y que nosotros creemos que pueden también ser usados para el problema descrito explotando sus principales características.
Metodología y Competencias
METODOLOGÍA:
- Revisar el contexto del problema y la literatura disponible.
- Realizar un análisis exploratorio de los datos existentes.
- Diseñar/implementar basados en modelos existentes modelos de atención sobre imáganes.
- Documentar todo el proceso anterior para que sea repetible.
- Estimar la bondad de los modelos finales (seleccionados) sobre el conjunto de datos de test reservado a tal efecto.
COMPETENCIAS:
Se trabajarán principalmente (en distinto grado) las siguientes competencias específicas de la tecnología de computación:
- Capacidad para evaluar la complejidad computacional de un problema, conocer estrategias algorítmicas que puedan conducir a su resolución y recomendar, desarrollar e implementar aquella que garantice el mejor rendimiento de acuerdo con los requisitos establecidos.
- Capacidad para conocer los fundamentos, paradigmas y técnicas propias de los sistemas inteligentes y analizar, diseñar y construir sistemas, servicios y aplicaciones informáticas que utilicen dichas técnicas en cualquier ámbito de aplicación.
- Capacidad para adquirir, obtener, formalizar y representar el conocimiento humano en una forma computable para la resolución de problemas mediante un sistema informático en cualquier ámbito de aplicación, particularmente los relacionados con aspectos de computación, percepción y actuación en ambientes entornos inteligentes.
- Capacidad para conocer y desarrollar técnicas de aprendizaje computacional y diseñar, implementar aplicaciones y sistemas que las utilicen, incluyendo las dedicadas a extracción automática de información y conocimiento a partir de grandes volúmenes de datos.
Medios a utilizar
Todos los medios que se utilizan para la realización de este trabajo fin de grado están disponibles en la ESII y estarán a disposición de alumno que realice este trabajo.
Ordenadores, compiladores, APIs específicas para el desarrollo de las propuestas, etc.
Bibliografía
Libros y manuales de aprendizaje automático, procesamiento del lenguaje natural y ciencia/minería de datos.
Libros y manuales de lenguajes de programación y librerías específicas (machine learning, deep learning, visión artificial, etc.).
Todo disponible en la ESIIAB y/o en internet.
Tutores PUERTA CALLEJON, JOSE MIGUEL GONZÁLEZ NAHARRO, LUIS | Alumno CORONADO MARTÍN, DANIEL
|
| |