Universidad de Castilla-La Mancha
 
Escuela Superior de Ingeniería Informática

 

  cambiar a curso:   2020-21   2022-23



Grado en Ingeniería Informática


TRABAJOS FIN DE GRADO
curso: 2021-22

Monitorización y análisis del consumo de energía en un clúster HPC


Tecnologías Específicas

Ingeniería de Computadores
 


Descripcion y Objetivos

Los sistemas de computación de los grandes centros de datos y de supercomputación consumen una gran cantidad de energía, y lograr una relación óptima rendimiento/energía es un desafío para los creadores de este tipo de sistemas. El número de componentes que los forman sigue aumentando con el paso del tiempo y con ello el consumo total del sistema. Por tanto, hay que realizar propuestas que afecten al diseño y funcionamiento de los diferentes elementos de estos sistemas para intentar detener ese crecimiento del consumo energético. 

Desde hace décadas se vienen realizando esfuerzos para diseñar nodos de cómputo eficientes energéticamente. Sin embargo, se ha prestado mucha menos atención al consumo de energía de la red de interconexión, el otro componente principal de los sistemas HPC. 

Las propuestas para reducir el consumo de estos sistemas se suelen probar y evaluar midiendo de alguna manera la reducción de consumo que consiguen. Las técnicas de medición de energía para los componentes de los sistemas HPC van desde el uso de un hardware externo dedicado a la medición de energía hasta el uso del soporte para la medición de energía que dichos componentes incorporan.

Cada una de estas técnicas de monitorización del consumo tiene ventajas e inconvenientes. Los medidores de energía externos pueden dar datos precisos sobre el consumo de energía, pero suelen ser caros. En el otro lado, soporte hardware incluido en los propios componentes son más simples y económicos, pero no suelen ofrecer el mismo nivel de precisión.


El propósito de este TFG es realizar un estudio comparativo de los datos obtenidos con ambas técnicas de medición de consumo, para lo cual se utilizará un clúster real.

Para lograr este objetivo general se deberán cubrir un conjunto de objetivos particulares:

- Conocer con detalle las características, componentes y funcionamiento de los componentes de un clúster.
- Aprender a usar al menos un medidor externo que pueda ser conectado a los elementos principales del clúster.
- Estudiar el soporte hardware/software de los componentes del clúster para realizar mediciones.
- Saber obtener datos de consumo con los dos tipos de técnicas, es decir medidor externo y soporte interno.
- Comparar y analizar los datos obtenidos.

 


Metodología y Competencias

Las tareas que deberán completarse para lograr el objetivo principal del trabajo se realizarán siguiendo la metodología utilizada habitualmente en este tipo de trabajos, que en general consiste básicamente en motivar y justificar la conveniencia de realizar este trabajo; elegir el material necesario para ello y aprender su manejo y los datos que ofrece; establecer las configuraciones hardware/software adecuadas; recoger datos y analizarlos para extraer las conclusiones más relevantes.

Al aplicar dicha metodología al caso particular de este Trabajo Fin de Grado, se obtienen las siguientes tareas principales a realizar:

1. Revisión de las características del clúster Cellia y del medidor de consumo disponible, con el propósito de conocer los aspectos necesarios para realizar el trabajo. Para realizar esta tarea se consultará diversa documentación del clúster y sus componentes, y el manual de usuario del medidor de consumo.

2. Estudio del soporte hardware/software disponible en/para los componentes del clúster que permita medir el consumo sin necesidad de medidor externo. En el caso de los nodos de cómputo ese soporte existe, mientras que habrá que averiguar a qué nivel lo hay en el caso de la red de interconexión.

3. Selección de un conjunto representativo de aplicaciones de centros de datos y de supercomputación que serán usadas en el estudio. Los datos de consumo serán recogidos durante la ejecución de dichas aplicaciones, y también cuando el sistema esté ocioso para comprobar los consumos base de los componentes.

4. Configuración de las pruebas y desarrollo de las mismas para la obtención de los datos de consumo de energía. Se considerarán, como se ha indicado, varias aplicaciones con diferentes cargas y se harán variaciones sobre algunos parámetros del clúster, como el número de nodos, puertos de los switches, NICs, etc.

5. Análisis de resultados y obtención de conclusiones. Se espera obtener un gran volumen de datos, y por tanto será necesario desarrollar diverso código para su manejo, y/o paquetes estadísticos para la presentación y análisis de los mismos. 


Las competencias que se aplican en el caso de la Tecnología de Ingeniería de Computadores son:

- [IC3] Capacidad de analizar y evaluar arquitecturas de computadores, incluyendo plataformas paralelas y distribuidas, así como desarrollar y optimizar software para las mismas.

- [IC5] Capacidad de analizar, evaluar y seleccionar las plataformas hardware y software más adecuadas para el soporte de aplicaciones empotradas y de tiempo real.

- [IC7] Capacidad para analizar, evaluar, seleccionar y configurar plataformas hardware para el desarrollo y ejecución de aplicaciones y servicios informáticos.

 


Medios a utilizar

Los recursos necesarios para el desarrollo de este TFG son:

- Clúster Cellia.
- Medidor de consumo PZ4000.
- Portátil u ordenador de sobremesa.

Todos estos recursos se pondrán a disposición del alumno para realizar el trabajo. Será  necesario también usar algunas herramientas software que deberán ser buscadas de acuerdo con las características de los recursos hardware indicados anteriormente.
 

 


Bibliografía

- Documentación del clúster Cellia y de sus componentes.
- Manual de usuario del analizador PZ4000.
- Artículos sobre medición de consumo en sistemas HPC.
 

 


Tutores


SÁNCHEZ GARCÍA, JOSÉ LUIS
ALFARO CORTES, FRANCISCO JOSÉ
 

Alumno




 

 

Sindicación  Sindicación  Sindicación  Sindicación

Curso: 2021-22
© Escuela Superior de Ingeniería Informática
Edificio Infante Don Juan Manuel
Avda. de España s/n
02071 Albacete
Tfno: 967 59 92 00 - Fax: 967 59 92 24

informatica.ab@uclm.es
aviso legal
generar código QR de la página