EspecialidadesIng. de Computadores
Tutor
CAMINERO HERRÁEZ, Mª BLANCA
MORENO GALDON, RAUL
Descripción y Objetivos
Las aplicaciones para genómica suelen caracterizarse por basarse en el procesamiento de una gran cantidad de datos.
A su vez, el paradigma de programación MapReduce ha surgido con fuerza en los últimos años para facilitar el procesamiento masivo de datos, aprovechando de manera eficiente numerosos recursos computacionales como clústers e incluso recursos virtuales basados en tecnología Cloud, en el marco que se conoce actualmente como la era del "Big Data".
El presente TFG tiene como objetivo general el estudio y migración de una aplicación particular de genómica al mencionado paradigma MapReduce. Con ello se podrían aprovechar las características inherentes de la elevada escalabilidad y tolerancia a fallos que este paradigma ofrece, permitiendo aumentar el rendimiento y robustez de la aplicación.
Metodología y Competencias
El objetivo general planteado para este TFG se abordará a través de los siguientes pasos:
1. Estudio del paradigma de computación Map/Reduce, y de su implementación Hadoop
2. Análisis de la aplicación de genómica
3. Identificación de las partes de la aplicación susceptibles de migración
4. Preparación, diseño e implementación de los datos de entrada y de las funciones Map y Reduce
5. Validación de la aplicación desarrollada
6. Evaluación de prestaciones
Medios a utilizar
PCs y Clústers de cálculo, disponibles en el I3A.
Aplicación de genómica desarrollada en el I3A.
Software de libre disposición (Hadoop, compiladores, S.O. Linux, OpenNebula....).
Bibliografía
Sobre Hadoop: http://hadoop.apache.org/
Sobre la aplicación de genómica: http://www.opencb.org/
Asignación
El Trabajo Fin de Grado ha sido a asignado a Don/Doña Cifuentes Cabañero, María Llanos