|
Grado en Ingeniería Informática |
TRABAJOS FIN DE GRADO curso: 2024-25
Desarrollo de un chatbot inteligente ESIICHAT mediante tecnología RAG |
Tecnologías Específicas
Computación
Descripcion y Objetivos
Introducción
En el contexto educativo universitario, la disponibilidad de información clara y accesible para los estudiantes es clave para una buena experiencia académica. Sin embargo, la diversidad de procesos y la complejidad de los planes de estudio pueden generar dudas frecuentes que requieren atención constante por parte del personal administrativo. Un chatbot inteligente basado en tecnología RAG (Retrieval-Augmented Generation) puede proporcionar respuestas rápidas y precisas a las preguntas más comunes de los estudiantes, mejorando la eficiencia en la comunicación y aliviando la carga administrativa.
La tecnología RAG permite combinar la generación de lenguaje natural (LLM) con la recuperación de información específica de fuentes locales. En este caso, las fuentes incluirán datos y documentos locales de la Escuela Universitaria de Ingeniería Informática (ESII), como el plan de estudios, guías académicas, normativas y procesos internos.
Objetivos
- Desarrollar un chatbot inteligente que pueda responder automáticamente a preguntas relacionadas con los planes de estudio y procesos de la Escuela Universitaria de Ingeniería Informática (ESII).
- Implementar una solución basada en tecnología RAG para garantizar que las respuestas del chatbot estén basadas en información actualizada y local del centro.
- Evaluar la efectividad del chatbot en términos de precisión y utilidad a través de pruebas con estudiantes y personal de la ESII.
Metodología y Competencias
Metodología
Diseño del Sistema
El proyecto estará basado en la implementación de un modelo de Retrieval-Augmented Generation (RAG), que combinará el uso de un LLM (Modelo de Lenguaje Extenso) con un sistema de recuperación de información de fuentes locales.
-
Recuperación de Información:
- Se integrará un sistema de búsqueda basado en una base de datos local que contenga la documentación relevante de la ESII: planes de estudio, normativas, procesos administrativos, etc.
- Para la implementación, se podría usar herramientas como Elasticsearch o Haystack, que faciliten la indexación y recuperación de documentos.
-
Generación de Respuestas:
- Se utilizará un LLM (por ejemplo, GPT) para generar respuestas naturales a las preguntas planteadas, enriqueciendo las respuestas con la información recuperada del sistema de búsqueda.
-
Integración y Desarrollo del Chatbot:
- El chatbot estará disponible a través de una interfaz amigable para los estudiantes, ya sea como una aplicación web, en plataformas de mensajería o en la web del centro.
- Se integrarán API’s de LLM para el procesamiento de lenguaje natural, junto con la tecnología RAG para asegurar que las respuestas estén contextualizadas con la información local.
Recolección de Datos
- Se recopilarán los documentos clave del centro, como el plan de estudios, reglamentos académicos, normativas de prácticas, asignación de tutorías, procesos de matrícula, y cualquier otro material relevante.
- Los datos serán estructurados e indexados para una recuperación eficiente por parte del sistema de búsqueda.
Análisis y Desarrollo
- Entrenamiento y Ajuste del Modelo: Aunque el LLM ya estará preentrenado, se realizará un ajuste fino para las respuestas específicas del centro universitario, asegurando que las respuestas sean contextualizadas.
- Evaluación del Chatbot: Se realizarán pruebas con estudiantes y personal del centro para medir la precisión y la utilidad del chatbot. Los resultados de estas interacciones se utilizarán para mejorar iterativamente el sistema.
Competencias
[CM1] Capacidad para tener un conocimiento profundo de los principios fundamentales y modelos de la computación y saberlos aplicar para interpretar, seleccionar, valorar, modelar, y crear nuevos conceptos, teorías, usos y desarrollos tecnológicos relacionados con la informática.
[CM4] Capacidad para conocer los fundamentos, paradigmas y técnicas propias de los sistemas inteligentes y analizar, diseñar y construir sistemas, servicios y aplicaciones informáticas que utilicen dichas técnicas en cualquier ámbito de aplicación.
[CM6] Capacidad para desarrollar y evaluar sistemas interactivos y de presentación de información compleja y su aplicación a la resolución de problemas de diseño de interacción persona computadora.
[CM7] Capacidad para conocer y desarrollar técnicas de aprendizaje computacional y diseñar e implementar aplicaciones y sistemas que las utilicen, incluyendo las dedicadas a extracción automática de información y conocimiento a partir de grandes volúmenes de datos.
Medios a utilizar
- Hardware: Computadoras con capacidad suficiente para ejecutar el sistema de búsqueda y el modelo de lenguaje (servidor local o soluciones en la nube como AWS o Google Cloud).
- Software:
- Lenguajes de programación como Python para la implementación del sistema.
- Frameworks como Haystack o Elasticsearch para la recuperación de información.
- API de OpenAI o similares para el uso del LLM.
- Recursos Locales: Documentación interna de la ESII para ser indexada y utilizada como fuente de información.
Bibliografía
- Lewis, P., et al. (2020). Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks. In NeurIPS 2020.
- Brown, T. et al. (2020). Language Models are Few-Shot Learners. In NeurIPS 2020.
- Haystack Documentation (https://haystack.deepset.ai/)
Tutores GAMEZ MARTIN, JOSE ANTONIO PUERTA CALLEJON, JOSE MIGUEL | Alumno COPETE GONZÁLEZ, ALEJANDRO
|
| |