Universidad de Castilla-La Mancha
 
Escuela Superior de Ingeniería Informática
     
  •  

 

  cambiar a curso:   2017-18   2019-20



Grado en Ingeniería Informática


TRABAJOS FIN DE GRADO
curso: 2018-19

Implementación de una configuración eficiente de una topología híbrida de tipo KNS en un cluster InfiniBand


Tecnologías Específicas

Ingeniería de Computadores
 


Descripcion y Objetivos

La especificación InfiniBand está muy presente en los actuales sistemas de computación de altas prestaciones (aproximadamente en un 35,4 % de los sistemas de la lista TOP500). Las funcionalidades básicas de la red tales como la función de encaminamiento, se implementan en los componentes InfiniBand mediante un software de control, concretamente el entorno Open-Fabrics Software (OFS). En este TFG se plantea la configuración de un cluster InfiniBand real (basado en componentes del fabricante Mellanox) de modo que el patrón de su red de interconexión sea la topología híbrida conocida como KNS. Concretamente, se configurará con esta topología el clúster CELLIA (Cluster for the Evaluation of Low-Latency Architectures) del grupo de Redes y Arquitecturas de Altas Prestaciones (RAAP) de la UCLM. CELLIA está formado por 38 nodos de cómputo y almacenamiento, interconectados por medio de una red con tecnología InfiniBand. El entorno OFS deberá ser modificado de modo que la función de encaminamiento sea adecuada para la topología mencionada, implementando concretamente el algoritmo conocido como Hybrid-DOR.

 


Metodología y Competencias

Para conseguir los objetivos del TFG, las actividades principales a realizar por el alumno son las siguientes (se indica el tiempo estimado de realización en meses, asumiendo una dedicación de 37,5 horas/mes y unas 300 horas de dedicación total al TFG):

  1. Conocer la especificación InfiniBand y las características de los componentes de red Mellanox. así como conocer las topologías KNS, el algoritmo de encaminamiento Hybrid-DOR y los esquemas de colas propuestos para dichas topologías (1 mes).
  2. Comprender el entorno de programación Open-Fabrics Software (OFS):  instalación, compilación, estructura del código fuente, ejecución, etc. (1.5 meses).
  3. Implementar en OFS el algoritmo de encaminamiento Hybrid-DOR (1.5 meses).
  4. Configurar físicamente (conexionado) el cluster InfiniBand según la topología KNS, y ejecutar en el cluster InfiniBand aplicaciones paralelas, como pueden ser los benchmarks HPCC y Graph500 (1.5 mes).
  5. Evaluar las prestaciones de la red InfiniBand del cluster a partir de los resultados obtenidos con las diferentes aplicaciones paralelas ejecutadas (1.5 mes).
  6. Documentar los resultados, incluyendo la memoria del TFG (1 mes)

Competencias adquiridas:

  • Capacidad de analizar y evaluar arquitecturas de computadores, incluyendo plataformas paralelas y distribuidas, así como desarrollar y optimizar software para las mismas.
  • Capacidad de diseñar e implementar software de sistema y de comunicaciones.
  • Capacidad para analizar, evaluar, seleccionar y configurar plataformas hardware para el desarrollo y ejecución de aplicaciones y servicios informáticos.
 


Medios a utilizar

Los medios a utilizar para el desarrollo del TFG son los siguientes:

  • Cluster CELLIA del RAAP: este cluster está formado por 38 nodos de cómputo, procesadores Intel Xeon E5, 32 GB de RAM y una red de interconexión InfiniBand, con tarjetas de red Mellanox  ConnectX3 MCX354A-QCBT QSFP y velocidad QDR de 40 Gbps, conmutadores Mellanox IS5022 y cableado InfiniBand de cobre marca Mellanox. El cluster está disponible para ser empleado durante la duración del TFG.
  • Distribución de OFS: documentación, código fuente y tutoriales. La distribución está disponible.
  • Benchmarks y aplicaciones paralelas para la generación de tráfico en el cluster CELLIA.
  • Ordenador tipo PC.
 


Bibliografía

La bibliografía básica para el desarrollo del TFG es la siguiente:

  • Especificación InfiniBand.
  • Diversos libros y artículos sobre redes de interconexión, especialmente sobre la topología KNS y encaminamiento Hybrid-DOR.
  • Guías de configuración de la red InfiniBand y del Clúster CELLIA.

Toda la bibliografía está disponible.

 


Tutores


GARCÍA GARCÍA, PEDRO JAVIER
ESCUDERO SAHUQUILLO, JESUS
 

Alumno


GÓMEZ LÓPEZ, GABRIEL

 

 

Sindicación  Sindicación  Sindicación  Sindicación

Curso: 2018-19
© Escuela Superior de Ingeniería Informática
Edificio Infante Don Juan Manuel
Avda. de España s/n
02071 Albacete
Tfno: 967 59 92 00 - Fax: 967 59 92 24

informatica.ab@uclm.es
aviso legal
generar código QR de la página