|
Grado en Ingeniería Informática |
TRABAJOS FIN DE GRADO curso: 2020-21
Diseño de una aplicación web para la detección de melanoma en imágenes usando técnicas de aprendizaje automático. |
Tecnologías Específicas
Computación
Descripcion y Objetivos
El cáncer de piel es uno de los tipos de cáncer más comunes. En particular, el melanoma es el responsable de alrededor de un 75% de las muertes por cáncer de piel, a pesar de ser el tipo de cáncer de piel menos prevalente. Por ello, una detección precoz y precisa puede ser crucial para lograr que el tratamiento sea más eficaz, y por ende aumentar la probabilidad de supervivencia del paciente.
En este trabajo fin de grado vamos a abordar el problema mediante el desarrollo de modelos de aprendizaje automático capaces de predecir si un paciente tiene un melanoma, a partir de imágenes y sus correspondientes metadatos. Los datos que se van a usar provienen de más de 30000 pacientes, los cuáles han sido proporcionados por la Society for Imaging Informatics in Medicine (SIIM). La misión de esta organización es promover la medical imaging informatics a través de la educación, investigación e innovación multidisciplinar. Actualmente estos datos están disponibles en el archivo de la International Skin Imaging Collaboration (ISIC) (https://challenge2020.isic-archive.com) y en la plataforma Kaggle como competición (https://www.kaggle.com/c/siim-isic-melanoma-classification/overview).
El objetivo de este trabajo fin de grado es estudiar el problema y proporcionar distintas soluciones al mismo, comparándolas desde un punto de vista formal (validación). Además, se proporcionará una herramienta web para realizar predicciones online. Con este fin planteamos los siguientes subobjetivos:
- Realizar un estudio de los datos disponibles (imágenes y metadatos de los pacientes), realizando las transformaciones necesarias sobre los datos de entrada para poder abordar la tarea correspondiente (predicción de melanoma).
- Definir las distintas estrategias de predicción, abordando desde técnicas de Deep Learning (para las imágenes) como métodos clásicos de aprendizaje automático (para los metadatos).
- Integrar el modelo de aprendizaje automático en una aplicación web online para predecir si un paciente tiene melanoma a partir de una imagen.
Metodología y Competencias
Metodología:
- Revisar el contexto del problema y la literatura disponible.
- Objetivo de ciencia de datos.
- Realizar un análisis exploratorio de los datos existentes.
- Sobre la partición de datos de entrenamiento diseñar procesos de minería de datos centrados en:
- Preprocesamiento de datos (selección de variables, construcción de variables, etc.).
- Identificación de los algoritmos de minería de datos que mejor encajen en el problema objetivo.
- Validación de los modelos obtenidos.
- Iterar refinando los pasos anteriores hasta determinar uno o varios modelos exitosos.
- Documentar todo el proceso anterior para que sea reproducible.
- Estimar la bondad de los modelos finales sobre el conjunto de datos de prueba reservado a tal efecto.
- Integrar los modelos finales en una aplicación web.
- Redactar la memoria.
Competencias:
Se trabajarán principalmente (en distinto grado) las siguientes competencias específicas de la tecnología de computación:
- Capacidad para evaluar la complejidad computacional de un problema, conocer estrategias algorítmicas que puedan conducir a su resolución y recomendar, desarrollar e implementar aquella que garantice el mejor rendimiento de acuerdo con los requisitos establecidos.
- Capacidad para conocer los fundamentos, paradigmas y técnicas propias de los sistemas
inteligentes y analizar, diseñar y construir sistemas, servicios y aplicaciones informáticas
que utilicen dichas técnicas en cualquier ámbito de aplicación.
- Capacidad para adquirir, obtener, formalizar y representar el conocimiento humano en una
forma computable para la resolución de problemas mediante un sistema informático en
cualquier ámbito de aplicación, particularmente los relacionados con aspectos de
computación, percepción y actuación en ambientes entornos inteligentes.
- Capacidad para conocer y desarrollar técnicas de aprendizaje computacional y diseñar e
implementar aplicaciones y sistemas que las utilicen, incluyendo las dedicadas a extracción
automática de información y conocimiento a partir de grandes volúmenes de datos.
Medios a utilizar
Ordenadores personales, compiladores y entornos de programación. Todo disponible en la ESIIAB.
Bibliografía
Libros y manuales de inteligencia artificial y aprendizaje automático. Libros y manuales de lenguajes de programación y librerías específicas de aprendizaje automático. Todo disponible en la ESIIAB y/o en internet.
Tutores GAMEZ MARTIN, JOSE ANTONIO ALFARO JIMENEZ, JUAN CARLOS | Alumno MOROTE GARCÍA, CARLOS
|
| |