El paradigma de programación MapReduce se haya estrechamente relacionado con la computación en nube o computación Cloud. A través de MapReduce, es posible emplear los recursos virtuales que proporciona la nube para procesar grandes cantidades de datos de manera escalable y con cierta capacidad de tolerancia a fallos.
En este proyecto, se pretender migrar una aplicación de búsqueda de patrones a este paradigma de programación, pues cumple con los requisitos de grandes cantidades de datos a procesar y un cierto grado de independencia en el procesamiento de los mismos.
Más concretamente, los objetivos a perseguir son:
.- Estudio del entorno de trabajo: computación Cloud, paradigma MapReduce, aplicación de búsqueda de patrones
.- Análisis y diseño de la estrategia de división de datos (fase Map)
.- Análisis y diseño de la estrategia de combinación de datos (fase Reduce)
.- Implementación de la aplicación en MapReduce
.- Evaluación de prestaciones de la aplicación desarrollada
Este proyecto será co-dirigido por Francisco J. Conejero Bañon (Becario FPI, I3A).
Material hardware:
- PC
- Clúster de cálculo
Disponible en el Instituto de Investigación en Informática (I3A).
Material software:
- Aplicación de búsqueda de patrones
- Hadoop (implementación Apache de MapReduce)
- Compiladores
Todo el software empleado es de libre disposición.