cambiar a curso:   2014-15   2016-17


Trabajo Fin de Grado 2015-16
 Migración de aplicaciones Hadoop al cloud público de Microsoft Azure


Especialidades
Ing. de Computadores
Tecnologías de la Información


Tutor
CARRIÓN ESPINOSA, CARMEN
CAMINERO HERRÁEZ, Mª BLANCA


Descripción y Objetivos
Hadoop es uno de los entornos de desarrollo para aplicaciones de tipo Big­Data más empleado tanto en el ámbito empresarial como académico. Es por ello que casi todos los proveedores de infraestructuras Cloud ofrecen clústers virtuales basados en Hadoop bajo demanda. 
El objetivo del TFG es explorar el servicio Hadoop ofrecido por el proveedor público Microsoft Azure. Para ello, se portarán
aplicaciones desarrolladas sobre Hadoop a un entorno virtualizado basado en el servicio Hadoop de Azure, y se realizarán diversas pruebas de configuración y rendimiento.
Para ello, en este TFG será necesario desplegar un cluster Hadoop dentro de Azure. Se adaptará el código de la aplicación disponible para su correcta ejecución en este entorno y se configurará el sistema. La aplicación sigue la filosofía Map­Reduce soportada por los clústers Hadoop.
El proceso de migración será correctamente documentado, resaltando los pasos realizados y buscando un mecanismo de
mecanización del mismo. El trabajo concluirá con una evaluación de coste y rendimiento de las infraestructuras creadas. En ese estudio se ha de buscar una solución de compromiso entre las características hardware empleadas por la aplicación, tales como número de máquinas virtuales o la capacidad de almacenamiento, y el coste final en euros computado por el proveedor.


Metodología y Competencias
Para conseguir los objetivos planteados, se plantean las siguientes tareas:
  1. Estudio del paradigma MapReduce y de su implementación Hadoop.
  2. Familiarizarse con el uso del entorno de Cloud público Azure (credenciales de acceso, despliegue de máquinas virtuales, catálogo de servicios, ...)
  3. Migración de aplicaciones Hadoop, como casos de prueba
  4. Despliegue de diversas configuraciones de infraestructura virtual y evaluación de prestaciones
  5. Análisis de costes de las infraestructuras desplegadas
 


Medios a utilizar
  • Acceso a la plataforma Microsoft Azure (gratuito para instituciones académicas)
  • Software Apache Hadoop (de libre disposición)
  • Aplicaciones Hadoop (de libre disposición y/o de desarrollo propio)


Bibliografía
  • Apache Hadoop: https://hadoop.apache.org/
  • Tutorial Hadoop: http://hadoop.apache.org/docs/current/hadoop-mapreduce-client/hadoop-mapreduce-client-core/MapReduceTutorial.html
  • Microsoft Azure: http://azure.microsoft.com/es-es/
 
 


Asignación
Pendiente de asignar