Hadoop es uno de los entornos de desarrollo para aplicaciones de tipo BigData más empleado tanto en el ámbito empresarial como académico. Es por ello que casi todos los proveedores de infraestructuras Cloud ofrecen clústers virtuales basados en Hadoop bajo demanda.
El objetivo del TFG es explorar el servicio Hadoop ofrecido por el proveedor público Microsoft Azure. Para ello, se portarán
aplicaciones desarrolladas sobre Hadoop a un entorno virtualizado basado en el servicio Hadoop de Azure, y se realizarán diversas pruebas de configuración y rendimiento.
Para ello, en este TFG será necesario desplegar un cluster Hadoop dentro de Azure. Se adaptará el código de la aplicación disponible para su correcta ejecución en este entorno y se configurará el sistema. La aplicación sigue la filosofía MapReduce soportada por los clústers Hadoop.
El proceso de migración será correctamente documentado, resaltando los pasos realizados y buscando un mecanismo de
mecanización del mismo. El trabajo concluirá con una evaluación de coste y rendimiento de las infraestructuras creadas. En ese estudio se ha de buscar una solución de compromiso entre las características hardware empleadas por la aplicación, tales como número de máquinas virtuales o la capacidad de almacenamiento, y el coste final en euros computado por el proveedor.