|
Grado en Ingeniería Informática |
TRABAJOS FIN DE GRADO curso: 2021-22
Clasificación de tumores cerebrales usando aprendizaje automático a partir de imágenes radiogenómicas |
Tecnologías Específicas
Computación
Descripcion y Objetivos
El glioblastoma es la forma más común de cáncer cerebral, además de ser la que peor diagnóstico tiene, pues la esperanza de vida de los pacientes que la sufren es de menos de un año. De acuerdo con estudios recientes, la presencia de una secuencia genética específica en el tumor conocida como metilación del promotor (MGMT) es un marcador de valor pronóstico y predictivo de la capacidad de respuesta de la quimioterapia. Sin embargo, para realizar este análisis genético se requiere de una muestra de tejido cerebral, la cuál suele obtenerse mediante métodos invasivos. Además, se requieren semanas para determinar la caracterización genética del tumor. Por tanto, el diseño de métodos eficientes, precisos y no invasivos que permitan determinar la genética del cáncer a través de imágenes (radiogenómicas) permitiría reducir potencialmente el número de cirugías realizadas y, por tanto, refinar el tipo de terapia requerida.
En este trabajo fin de grado vamos a abordar el problema mediante el desarrollo de modelos de aprendizaje automático capaces de predecir la presencia de un biomarcador genético (la metilación del promotor de la enzima MGMT) a partir de imágenes obtenidas mediante resonancia magnética. Los datos que se van a usar provienen de la Radiological Society of North America (RSNA) y Medical Image Computing and Computer Assisted Intervention Society (MICCAI). La misión de estas organizaciones es promover el análisis infomático de imágenes médicas a través de la educación, investigación e innovación multidisciplinar. Actualmente estos datos están disponibles en la plataforma Kaggle (enlace).
El objetivo de este trabajo fin de grado es estudiar el problema y proporcionar distintas soluciones al mismo, comparándolas desde un punto de vista formal (validación). Además, se proporcionará una aplicación software para realizar predicciones online. Con este fin planteamos los siguientes subobjetivos:
- Realizar un estudio de los datos disponibles (imágenes), realizando las transformaciones necesarias sobre los datos de entrada para poder abordar la tarea correspondiente (predicción de la enzima MGMT).
- Definir las distintas estrategias de predicción, abordando desde técnicas de Deep Learning a métodos clásicos de aprendizaje automático.
- Integrar el modelo de aprendizaje automático en una aplicación online para predecir la presencia de la enzima MGMT.
Metodología y Competencias
Metodología:
- Revisar el contexto del problema y la literatura disponible.
- Realizar un análisis exploratorio de los datos existentes.
- Sobre la partición de datos de entrenamiento diseñar procesos de minería de datos centrados en:
- Validación de los modelos obtenidos.
- Identificación de los algoritmos de minería de datos que mejor encajen en el problema objetivo.
- Preprocesamiento de datos (selección de variables, construcción de variables, etc.).
- terar refinando los pasos anteriores hasta determinar uno o varios modelos exitosos.
- Documentar todo el proceso anterior para que sea reproducible.
- Estimar la bondad de los modelos finales sobre el conjunto de datos de prueba reservado a tal efecto.
- Integrar los modelos finales en una aplicación web.
- Redactar la memoria.
Competencias:
Se trabajarán principalmente (en distinto grado) las siguientes competencias específicas de la tecnología de computación:
- Capacidad para evaluar la complejidad computacional de un problema, conocer estrategias algorítmicas que puedan conducir a su resolución y recomendar, desarrollar e implementar aquella que garantice el mejor rendimiento de acuerdo con los requisitos establecidos.
- Capacidad para conocer los fundamentos, paradigmas y técnicas propias de los sistemas inteligentes y analizar, diseñar y construir sistemas, servicios y aplicaciones informáticas que utilicen dichas técnicas en cualquier ámbito de aplicación.
- Capacidad para adquirir, obtener, formalizar y representar el conocimiento humano en una forma computable para la resolución de problemas mediante un sistema informático en cualquier ámbito de aplicación, particularmente los relacionados con aspectos de computación, percepción y actuación en ambientes entornos inteligentes.
- Capacidad para conocer y desarrollar técnicas de aprendizaje computacional y diseñar e implementar aplicaciones y sistemas que las utilicen, incluyendo las dedicadas a extracción automática de información y conocimiento a partir de grandes volúmenes de datos.
Medios a utilizar
Ordenadores personales, compiladores y entornos de programación. Servicios GPU para el entrenamiento de redes profundas. Todo disponible en la ESIIAB, I3A o mediante servicios en la nube.
Bibliografía
Libros y manuales de inteligencia artificial y aprendizaje automático. Libros y manuales de lenguajes de programación y librerías específicas de aprendizaje automático. Todo disponible en la ESIIAB y/o en internet.
Tutores GAMEZ MARTIN, JOSE ANTONIO ALFARO JIMENEZ, JUAN CARLOS | Alumno MAKSYMIV MAKSYMIV, VLADYSLAV
|
| |