cambiar a curso:   2012-13   2014-15


Trabajo Fin de Grado 2013-14
 Configuración de un cluster basado en tecnología InfiniBand para una gestión eficiente y abierta de los niveles de servicio


Especialidades
Ing. de Computadores


Tutor
GARCÍA GARCÍA, PEDRO JAVIER
ESCUDERO SAHUQUILLO, JESUS


Descripción y Objetivos
La especificación InfiniBand está muy presente en los actuales sistemas de computación de altas prestaciones (aproximadamente en un 45% de los sistemas de la lista TOP500). Entre sus ventajas, destaca la posibilidad de configurar varios mecanismos para adaptarlos a las necesidades del sistema, aunque la implementación concreta de dichos mecanismos no siempre está completamente definida por el estándar InfiniBand. Uno de estos aspectos configurables es la gestión de los niveles de servicio (SLs) y los canales virtuales (VLs), que se usan en diversos algoritmos y técnicas orientadas a maximizar las prestaciones de la red de interconexión. En este TFG se plantea la configuración efectiva de SLs y VLs en un cluster InfiniBand real, construido con componentes del fabricante Mellanox, de modo que se asignen los SLs disponibles a distintos flujos de tráfico. Dicha asignación se realizará de forma dinámica, ya que la infraestructura software del cluster permite una asignación dinámica de SLs a flujos de datos en tiempo de ejecución de las aplicaciones, es decir, cuando dichos flujos de datos vayan a ser inyectados en la red. En función del SL obtenido, el sistema asignará a los flujos de tráfico el VL correspondiente, de modo que dichos flujos podrán circular  separadamente si se asignan a VLs distintos. Esto resulta especialmente útil  de cara a minimizar los efectos de retardo debido a la interacción entre flujos. Esta asignación de SLs y VLs se implementa en los componentes InfiniBand mediante software, concretamente el entorno Open-Fabrics Enterprise Distribution (OFED), que deberá ser modificado para permitir la configuración descrita anteriormente.


Metodología y Competencias
Para conseguir los objetivos del TFG, los principales pasos a seguir por el alumno serían los siguientes (se indica una estimación aproximada del tiempo requerido para cada uno de ellos):

- Conocer la especificación InfiniBand (1 mes).

- Conocer el entorno de programación Open-Fabrics Enterprise Distribution (OFED):  instalación, compilación, estructura del código fuente, ejecución, etc (2 meses).

- Implementación en OFED de varias políticas para la asignación de SLs a flujos de tráfico, que se basan en propuestas teóricas existentes en la bibliografía (2 meses).

- Ejecución en un cluster InfiniBand real de aplicaciones paralelas, como pueden ser los benchmarks HPCC y OSU, o las aplicaciones WRF y GROMACs (1.5 meses).

- Evaluación de prestaciones de la red InfiniBand del cluster a partir de los resultados obtenidos con las diferentes aplicaciones paralelas ejecutadas (1.5 meses).

- Documentación de resultados, incluyendo la memoria del TFG (1 mes)




Medios a utilizar
Los medios a utilizar para el desarrollo del TFG son los siguientes:

- Cluster CELLIA del RAAP: este cluster está construido con componentes InfiniBand, concretamente tarjetas de red Mellanox  ConectX3 MCX353A-QCBT QSFP con conexión QDR,  conmutadores Mellanox IS5022 y cableado InfiniBand estándar. El cluster está disponible para ser empleado durante la duración del TFG.

- Distribución de OFED: documentación, código fuente y tutoriales. La distribución está disponible.

- Ordenador tipo PC.



Bibliografía
La bibliografía básica para el desarrollo del TFG es la siguiente:

- Especificación InfiniBand.

- Diversos artículos relacionados con la configuración de los SLs y VLs en InfiniBand.

- Diversos artículos relacionados con la separación de los flujos de tráfico en distintos VLs mediante la asignación de SLs.

Toda la bibliografía está disponible.


Asignación
El Trabajo Fin de Grado ha sido a asignado a Don/Doña ÁLVARO CEBRIÁN GARCÍA