|
Grado en Ingeniería Informática |
TRABAJOS FIN DE GRADO curso: 2024-25
Aprendizaje Federado en imágenes médicas: Clasificación de lesiones cutáneas |
Tecnologías Específicas
Computación
Descripcion y Objetivos
El aprendizaje federado permite entrenar modelos de inteligencia artificial en datos distribuidos sin necesidad de que los datos salgan de sus ubicaciones de origen. medicina, donde los datos sensibles como las imágenes médicas están sujetos a estrictas normativas de privacidad, esta técnica es especialmente relevante. Los hospitales pueden colaborar en el desarrollo de modelos robustos y precisos sin comprometer la confidencialidad de los datos de sus pacientes, mejorando el rendimiento de los modelos en comparación con los entrenados exclusivamente con datos locales de cada hospital.
El uso de aprendizaje federado en imágenes médicas tiene un gran potencial para mejorar el diagnóstico asistido por IA, especialmente en tareas como la clasificación de lesiones cutáneas, donde la detección temprana de melanomas es crucial para la supervivencia del paciente. El principal desafío es combinar eficazmente las actualizaciones de los modelos locales de cada hospital para crear un modelo global preciso que se generalice bien en los datos de todos los participantes, respetando al mismo tiempo las normativas de privacidad.
Objetivos
- Implementar un sistema de aprendizaje federado para la clasificación de imágenes médicas basado en redes neuronales convolucionales (CNN).
- Aplicar este sistema a un conjunto de imágenes dermatoscópicas distribuidas entre varios hospitales, tratándolos como clientes federados entre los cuales no se puede compartir ninguna imagen.
- Comparar la precisión del modelo global respecto a los modelos entrenados localmente en cada hospital.
- Estudiar el impacto de la heterogeneidad de los datos entre los distintos hospitales, como las diferencias en la prevalencia de ciertos tipos de cáncer y la calidad de las imágenes.
- Desarrollar una herramienta que permita realizar predicciones y visualizar la contribución de cada hospital al modelo global.
- Escribir la memoria del TFG documentando el proceso, los resultados y las conclusiones.
Metodología y Competencias
Metodología
- Estudio del Aprendizaje Federado:
- Revisar el marco teórico del aprendizaje federado, especialmente su aplicación en imágenes médicas utilizando redes neuronales.
- Investigar métodos para mejorar la agregación de modelos locales, buscando el equilibrio entre privacidad y precisión.
- Diseño del modelo:
- Implementar un modelo de red neuronal convolucional para la clasificación de lesiones cutáneas en un entorno federado.
- Obtención del conjunto de datos, preprocesamiento y análisis del mismo:
- Como base, utilizar el conjunto de datos proporcionado en la competición ISIC 2019 (https://challenge.isic-archive.com/landing/2019/), que contiene 25.331 imágenes categorizadas en uno de nueve tipos de cáncer.
- Descargar los datos desde FLamby (https://github.com/owkin/FLamby/blob/main/flamby/datasets/fed_isic2019/README.md), una suite de datasets preparados para su uso en aprendizaje federado. En concreto, proporciona las imágenes divididas dependiendo del centro de origen, contando con seis de ellos (BCN, HAM_vidir_molemax, HAM_vidir_modern, HAM_rosendahl, MSK, HAM_vienna_dias).
- Preprocesar las imágenes asegurando su consistencia.
- Realizar un análisis exploratorio para comprender la distribución de clases y las características de los datos de cada centro.
- Plantear métodos de aumento de imágenes si fuese necesario.
- Entrenamiento Federado:
- Entrenar modelos localmente con los datos de cada hospital y combinar sus actualizaciones para crear un modelo global.
- Evaluar el rendimiento del modelo global frente a los modelos individuales locales.
- Estudiar el impacto de la heterogeneidad de los datos de cada hospital sobre la precisión del modelo global.
- Desarrollo de una Aplicación:
- Desarrollar una herramienta que permita visualizar la contribución de cada hospital al modelo global y simular predicciones.
- Documentación:
- Redactar la memoria del TFG, describiendo tanto el marco teórico como el proceso de implementación y los resultados obtenidos.
Competencias
Este proyecto desarrollará competencias clave en las siguientes áreas:
- [CM3] Capacidad para evaluar la complejidad computacional de un problema, conocer estrategias algorítmicas que puedan conducir a su resolución y recomendar, desarrollar e implementar aquella que garantice el mejor rendimiento de acuerdo con los requisitos establecidos.
- [CM5] Capacidad para adquirir, obtener, formalizar y representar el conocimiento humano en una forma computable para la resolución de problemas mediante un sistema informático en cualquier ámbito de aplicación, particularmente los relacionados con aspectos de computación, percepción y actuación en ambientes o entornos inteligentes.
- [CM7] Capacidad para conocer y desarrollar técnicas de aprendizaje computacional y diseñar e implementar aplicaciones y sistemas que las utilicen, incluyendo las dedicadas a extracción automática de información y conocimiento a partir de grandes volúmenes de datos.
Medios a utilizar
- Herramientas de programación como Python, junto con plataformas para poder ejecutar código utilizando GPUs o TPUs como Google Colab o Kaggle.
- Herramientas especializadas en aprendizaje federado aplicado a redes neuronales como por ejemplo TensorFlow Federated o PySyft.
- Suites de datasets como FLamby, de las cuales poder obtener el conjunto de datos ISIC 2019 o aquellos que sean necesarios.
Bibliografía
- Documentación sobre aprendizaje federado y sus aplicaciones en privacidad y optimización.
- Artículos científicos sobre uso de aprendizaje federado en redes neuronales convolucionales, incluyendo los métodos más efectivos para combinar la información de los distintos clientes en estos casos.
- Bases de datos junto con información acerca de las mismas procedente de FLamby.
- Manuales y guías sobre el uso de librerías como PySyft o TensorFlow Federated para el desarrollo de modelos distribuidos y federados.
Tutores PUERTA CALLEJON, JOSE MIGUEL TORRIJOS ARENAS, PABLO | Alumno ORTIZ MORENO, DAVID
|
| |