|
Grado en Ingeniería Informática |
TRABAJOS FIN DE GRADO curso: 2024-25
Instalación y configuración de una red de interconexión experimental con FPGAs |
Tecnologías Específicas
Ingeniería de Computadores
Descripcion y Objetivos
Las redes de interconexión de altas prestaciones son el elemento esencial de los sistemas de cómputo de altas prestaciones (HPC) y de los Data-Centers, que están formados por miles de nodos. De hecho, el rendimiento de la propia red de interconexión influye muy notablemente en el rendimiento del sistema completo, por lo que el diseño de la arquitectura de dicha red es una tarea crucial. El grupo RAAP de la UCLM desarrolla investigación de vanguardia en redes de interconexión de altas prestaciones para supercomputadores y centros de datos, y colabora activamente con empresas e instituciones internacionales como NVIDIA, ATOS/BULL, Intel, Huawei y el CERN. También, mantiene otras líneas de investigación con universidades como la Universitat Politècnica de València, Jaume I de Castellón, Carlos III de Madrid, ETH de Zürich, Heidelberg y Simula Research Labs (Oslo, Noruega).
Una de las últimas líneas de investigación que el grupo RAAP ha puesto en marcha, se centra en el diseño y desarrollo de nuevas tecnologías de red de interconexión de altas prestaciones mediante el uso de dispositivos hardware programables, como son las FPGAs (Field-Programmable Gate Arrays). Estos dispositivos, permiten diseñar y desarrollar modelos de red de interconexión que serán programados en dispositivos hardware reales, por lo que la transferencia a la industria de estos diseños es casi inmediata, ya que no hay proceso de adaptación de un diseño abstracto a un chip real. Actualmente, existen varios ejemplos de comunidades científicas que promueven el uso de estas tecnologías, como son Corundum (https://github.com/corundum/corundum) y NetFPGA (https://netfpga.org/).
Sin embargo, los prototipos de red de interconexión basados en FPGAs que se han logrado construir en el grupo RAAP hasta la fecha disponen de dos o tres interfaces de red, a lo sumo, y de un único conmutador (switch) que los interconecte. Téngase en cuenta que estos prototipos de pequeña escala no permiten demostrar comportamientos de redes de interconexión de un tamaño máyor. Por ello, el objetivo principal de este TFG es la construcción de un prototipo de red de interconexión con FPGAs de un tamaño mayor al conseguido actualmente. En concreto, el clúster de FPGAs que se propone construir consta de 8 interfaces de red y 10 switches de 4 puertos cada uno. Esta configuración nos permitirá construir diversas topologías de red y probar diferentes mecanismos de encaminamiento, control de congestión y gestión del consumo de energía de la red. Además, las interfaces de red se podrán conectar a nodos de cómputo disponibles en el grupo RAAP, por lo que se podrá evaluar el comportamiento del prototipo construido mediante la ejecución de aplicaciones paralelas reales.
Metodología y Competencias
Para el desarrollo de este TFG se usará una metodología consistente en reuniones periódicas con los tutores, en principio quincenales, para realizar un adecuado seguimiento que garantice el éxito del trabajo, a la vez que sirva para una provechosa retro-alimentación del mismo.
Para alcanzar los objetivos del TFG, las actividades principales a realizar por el alumno son las siguientes (se indica el tiempo estimado de realización en meses, asumiendo una dedicación de 8 meses, 37,5 horas/mes y 300 horas de dedicación total al TFG):
1. Conocer, con un nivel de detalle adecuado a la carga del TFG, el estado del arte de las redes de interconexiónd de altas prestaciones, de las FPGAs y dispositivos programabales, y de los proyectos Corundum y NetFPGA, para el prototipado de redes de interconexión (1 mes).
2. Instalación y configuración del prototipo en el clúster CELLIA (2 meses).
3. Síntesis y programación de las FPGAs para implementar las interfaces de red y los switches en el prototipo (3 meses).
4. Evaluación de prestaciones del prototipo (1 mes).
5. Documentación de los resultados y redacción de la memoria del TFG (1 mes).
Competencias adquiridas:
[CO19] Ejercicio original a realizar individualmente y presentar y defender ante un tribunal universitario, consistente en un proyecto de naturaleza profesional en el ámbito de la tecnología específica de la Ingeniería en Informática que ha realizado el estudiante. En este ejercicio se deben sintetizar e integrar las competencias adquiridas en las enseñanzas.
[IC3] Capacidad de analizar y evaluar arquitecturas de computadores, incluyendo plataformas paralelas y distribuidas, así como desarrollar y optimizar software para las mismas.
[IC4] Capacidad de diseñar e implementar software de sistema y de comunicaciones.
[IC7] Capacidad para analizar, evaluar, seleccionar y configurar plataformas hardware para el desarrollo y ejecución de aplicaciones y servicios informáticos.
[IC8] Capacidad para diseñar, desplegar, administrar y gestionar redes de computadores.
[UCLM3] Correcta comunicación oral y escrita.
[INS1] Capacidad de análisis, síntesis y evaluación.
[INS2] Capacidad de organización y planificación.
[SIS5] Creatividad.
Medios a utilizar
- Ordenador personal tipo PC.
- Clúster CELLIA del grupo RAAP.
- Gestor de trabajos SLURM del clúster CELLIA.
- Diferentes benchmarks y aplicaciones paralelas.
- Para la construcción de este prototipo se utilizarán:
- 10 FPGAs Xlinix Varium C1100 de doble puerto, que ofrecen una ratio prestaciones/precio muy interesante.
- 20 transceptores ópticos para conectar todos los puertos que ofrecen las FPGAs.
- Cableado necesario (breakout cables) para configurar diferentes topologías de red de altas prestaciones.
Bibliografía
La bibliografía básica para el desarrollo del TFG es la siguiente:
- Jose Duato, Sudhakar Yalamanchili, and Ni Lionel. 2002. Interconnection Networks: An Engineering Approach. Morgan Kaufmann Publishers Inc., San Francisco, CA, USA.
- William James Dally and Brian Patrick Towles. 2004. Principles and Practices of Interconnection Networks. Morgan Kaufmann Publishers Inc., San Francisco, CA, USA.
- Proyecto Corundum (ReadTheDocs): https://docs.corundum.io/en/latest/
- Diversos libros y artículos sobre redes de interconexión y prototipado usando FPGAs.
Toda la bibliografía está disponible.
Tutores ESCUDERO SAHUQUILLO, JESUS QUILES FLOR, FRANCISCO JOSE | Alumno TOMÁS MARTÍNEZ, DANIEL
|
| |