Universidad de Castilla-La Mancha
 
Escuela Superior de Ingeniería Informática

 

  cambiar a curso:   2016-17   2018-19



Grado en Ingeniería Informática


TRABAJOS FIN DE GRADO
curso: 2017-18

Propuesta de clasificador Label Ranking admitiendo rankings parciales.


Tecnologías Específicas

Computación
 


Descripcion y Objetivos

La clasificación supervisada es probablemente la tarea que más interés concentra en el ámbito del aprendizaje automático y la minería/ciencia de datos. En la última década han aparecido una serie de problemas de clasificación que se distinguen del estándar (una única variable clase tomando varios estados) por el tipo de respuesta a predecir. Uno de estos problemas es el conocido como Label Ranking, en el que el objetivo es predecir un ranking u ordenamiento estricto de (algunas de) las etiquetas o estados de la variable clase, según la preferencia que le corresponde dados los valores de las variables predictoras para el objeto a clasificar. Evidentemente, este tipo de información también debe ser tenida en cuenta durante la fase de aprendizaje, es decir, no sólo se predice un ranking, si no que se dispone de instancias etiquetadas con rankings de las que aprender. En la literatura podemos encontrar algoritmos basados en árboles de clasificación/regresión, métodos basados en instancias y multiclasifcadores (p.e. bagging).

El objetivo de este TFG es explorar el problema más general en el que se permiten rankings parciales, en el sentido de que no es necesario un orden estricto entre las etiquetas. Así, una posible instancia podría ser etiquetada con el ranking "informática | matemáticas, física | biología", indicando que la mejor recomendación sería informática, seguida de matemáticas o física (sin distinguir entre ellas) y finalmente biología. Los objetivos parciales consisitirían en la definición formal del problema, diseño e implementación de algoritmos para abordarlo basados en árboles de decisión y métodos basados en instancias, identificar/crear conjuntos de datos para la prueba de los algoritmos y realizar una comparativa detallada para validar las propuestas realizadas.

 

 

 


Metodología y Competencias

Metodología:

  1. Revisar la literatura disponible (artículos científicos).
  2. Definir el problema.
  3. Identificar/crear (por simulación) bases de datos para usar durante las pruebas.
  4. Diseño e implementación de algoritmos basados en árboles de decisión y el paradigma del vecino más cercano.
  5. Diseño experimental y validación estadística de los resultados.
  6. Escritura del TFG.

Competencias:

Se trabajarán principalmente (en distinto grado) las siguientes competencias específicas de la tecnología de computación:

  • Capacidad para evaluar la complejidad computacional de un problema, conocer estrategias algorítmicas que puedan conducir a su resolución y recomendar, desarrollar e implementar aquella que garantice el mejor rendimiento de acuerdo con los requisitos establecidos.

  • Capacidad para conocer los fundamentos, paradigmas y técnicas propias de los sistemas inteligentes y analizar, diseñar y construir sistemas, servicios y aplicaciones informáticas que utilicen dichas técnicas en cualquier ámbito de aplicación.

  • Capacidad para adquirir, obtener, formalizar y representar el conocimiento humano en una forma computable para la resolución de problemas mediante un sistema informático en cualquier ámbito de aplicación, particularmente los relacionados con aspectos de computación, percepción y actuación en ambientes entornos inteligentes.

  • Capacidad para conocer y desarrollar técnicas de aprendizaje computacional y diseñar e implementar aplicaciones y sistemas que las utilicen, incluyendo las dedicadas a extracción automática de información y conocimiento a partir de grandes volúmenes de dato.

 


Medios a utilizar

Ordenadores personales, compiladores y entornos de programación. Todo disponible en la ESIIAB.

 


Bibliografía

Artículos especializados en el tema abordado. Libros y manuales de aprendizaje automático y ciencia/minería de datos. Libros y manuales de lenguajes de programación y librerías específicas (machine learning, pln, etc.). Todo disponible en la ESIIAB y/o en internet.

 


Tutores


ALEDO SÁNCHEZ, JUAN ÁNGEL
GAMEZ MARTIN, JOSE ANTONIO
 

Alumno


ALFARO JIMÉNEZ, JUAN CARLOS

 

 

Sindicación  Sindicación  Sindicación  Sindicación

Curso: 2017-18
© Escuela Superior de Ingeniería Informática
Edificio Infante Don Juan Manuel
Avda. de España s/n
02071 Albacete
Tfno: 967 59 92 00 - Fax: 967 59 92 24

informatica.ab@uclm.es
aviso legal
generar código QR de la página