|
Grado en Ingeniería Informática |
TRABAJOS FIN DE GRADO curso: 2017-18
Diseño de un sistema de reconocimiento y comprensión del habla para la interacción humano-robot |
Tecnologías Específicas
Computación Tecnologías de la Información
Descripcion y Objetivos
El objetivo de este TFG es el estudio de distintos reconocedores automáticos del habla disponibles y sistemas de comprensión, así como su instalación, puesta en marcha, y prueba en un robot social.
Para ello se utilizarán las librerías y APIs proporcionadas por dichos sistemas y tendrán que adaptarse para su uso dentro de una arquitectura cognitiva para la robótica social ya existente. Principalmente se estudiarán y utilizarán sistemas basados en Deep Learning que son lo que establecen el estado del arte actual.
Como resultado del proyecto se desarrollará un componente capaz de reconocer el habla de distintos usuarios y poder evaluar la calidad de la señal capturada y la transcripción realizada, así como su comprensión para el desarrollo de futuros sistemas de diálogo entre humanos y robots.
Metodología y Competencias
Metología:
Para la realización de este trabajo se sugiere una metodología de desarrollo agil como por ejemplo SCRUM. Se estudiará utilizar otra metodología distinta en función del alumno que realize este trabajo, sus preferencias, así como la intensificación que esté cursando.
Plan de trabajo:
Para la realización de este trabajo se deben llevar a cabo las siguientes tareas:
- Estudio del estado del arte y de las distintas técnicas para abordar el problema
- Estudio de la tecnología hardware y software que permita implementar el componente
- Diseño software del componente
- Validación y pruebas
Competencias:
- [CM4] Capacidad para conocer los fundamentos, paradigmas y técnicas propias de los sistemas inteligentes y analizar, diseñar y construir sistemas, servicios y aplicaciones informáticas que utilicen dichas técnicas en cualquier ámbito de aplicación.
- [CM5] Capacidad para adquirir, obtener, formalizar y representar el conocimiento humano en una forma computable para la resolución de problemas mediante un sistema informático en cualquier ámbito de aplicación, particularmente los relacionados con aspectos de computación, percepción y actuación en ambientes entornos inteligentes.
- [CM6] Capacidad para desarrollar y evaluar sistemas interactivos y de presentación de información compleja y su aplicación a la resolución de problemas de diseño de interacción persona computadora.
- [IS3] Capacidad de dar solución a problemas de integración en función de las estrategias, estándares y tecnologías disponibles.
- [IS4] Capacidad de identificar y analizar problemas y diseñar, desarrollar, implementar, verificar y documentar soluciones software sobre la base de un conocimiento adecuado de las teorías, modelos y técnicas actuales.
Medios a utilizar
- Plataformas robóticas y de adquisición de datos disponibles en el laboratorio SIMD del I3A
- Sistemas de reconocimiento y de comprensión del habla ya implementados.
Bibliografía
Reconocedores del habla:
- Sofware Kaldi: http://kaldi.sourceforge.net/about.html
- Software LTK: https://www.translectures.eu/web/tlk/
- Software Julius: http://julius.osdn.jp/en_index.php
- Software DeepSpeech: https://github.com/mozilla/DeepSpeech
Sistemas de comprensión semántica:
- Senna: http://ml.nec-labs.com/senna/
- OpenCCG: http://openccg.sourceforge.net/
Tutores GARCÍA VAREA, ISMAEL ROMERO GONZALEZ, CRISTINA | Alumno GÓMEZ CLEMENTE, VÍCTOR
|
| |