cambiar a curso:   2013-14   2015-16


Trabajo Fin de Grado 2014-15
 Clasificación supervisada mediante aprendizaje a partir de datos con múltiples evaluaciones.


Especialidades
Computación


Tutor
GAMEZ MARTIN, JOSE ANTONIO
ALEDO SÁNCHEZ, JUAN ÁNGEL


Descripción y Objetivos
El problema de la clasificación supervisada responde al aprendizaje de una "función" f(x1,x2, ..., xn) -> y, a partir de un conjunto de datos previamente etiquetado con valores para todas las variables. Obviamente, el objetivo es aplicar luego esa función a datos nuevos, donde el valor de y es desconocido, puesto que es el valor a predecir. Obviamente, la idea es que nuestra función o modelo aprendido a partir de los datos, sea capaz de capturar el conocimiento implícito en los mismos y, por tanto, obtenga un rendimiento similar al que obtendría el experto (o expertos) que etiquetaron el conjunto usado para aprender.

El principal problema en este contexto es la escasez de expertos y, por tanto, de datos "correctamente" etiquetados. En los últimos años, con el boom de Internet y de los sitios web en los que los usuarios pueden dejar sus evaluaciones, es fácil disponer de, no una, si no múltiples evaluaciones para un objeto (caracterizado mediante sus atributos), p.e. una película, un libro, una fotografía, etc. La principal pega es que en las etiquetas disponibles la mayoría no son de expertos, algunas incluso pueden ser malintencionadamente erróneas, algunas generadas de forma aleatoria, etc .... El paradigma "learning from crowd" trata de obtener clasificadores a partir de este tipo de datos, enfrentándose así al problema de tener distintos anotadores, de distinta fiabilidad y de no disponer de los valores reales (ground-truth) para validar correctamente el modelo aprendido. 

En la literatura del último lustro existen distintas aproximaciones, la mayoría basadas en el algoritmo EM (Expectation-Maximization) para abordar el problema. Nuestro objetivo es el estudio e implementación de algunas de las propuestas más relevantes.


Metodología y Competencias
- Estudio de la bibliografía relevante al problema propuesto.
- Identificación de dos propuestas del estado del arte e implementación de las mismas.
- Realización de un estudio experimental.
- Particularizar a un caso de estudio o propuesta de algoritmo mejorado.


Medios a utilizar
- Compiladores y software específico de libre distribución.
- PCs de sobremesa y/o portátiles.



Bibliografía
- Bibliografía específica, mayoritariamente artículos. Disponible on-line o en bilbioteca de la UCLM.


Asignación
El Trabajo Fin de Grado ha sido a asignado a Don/Doña Enrique González Rodrigo