TRABAJOS FIN DE GRADO curso: 2018-19
Transcodificador de Vídeo HEVC/VVC usando Machine Learning |
Tecnologías Específicas
Computación Tecnologías de la Información
Descripcion y Objetivos
HEVC ha sido desarrollado por el JCT-VC para reemplazar a su predecesor, el estándar H.264/AVC. El objetivo principal de HEVC es mejorar significativamente los prestaciones de Rate-Distortion (RD) comparado con H.264/AVC para hacer posible nuevas aplicaciones, como las resoluciones mayores que las de Alta Defición (HD) (como 4K, 3840x2160 píxeles, y 8K, 7680x4320 píxeles). Este seguramente sea el evento más significativo de la compresión de vídeo digital en una década. Con el esfuerzo colaborativo de muchos expertos, HEVC puede proveer aproximadamente el doble de compresión que los estándares hasta ahora usados manteniendo la misma calidad, a costa sin embargo de costes computacionales extremadamente superiores.
Por otro lado, diversos estudios han confirmado que la distribución de video se ha convertido en el principal tráfico de datos a nivel mundial, llegando al 70% del tráfico total de internet en 2016, en especial sobre redes celulares e inalámbricas, y su volumen continuará creciendo hasta el 82% en 2020, motivado fundamentalmente por el auge en el número de servicios y de usuarios, pero también por el incremento de la resolución espacial y temporal que han experimentado los formatos de video por encima de la alta definición. En 2020 se espera que el número de dispositivos conectados a la red capaces de consumir contenidos audiovisuales triplicará la población mundial (una media de 3.4 dispositivos per capita).
Es por ello que, en octubre de 2015, los organismos internacionales encargados de regular la estandarización de los códecs de video ITU-T VCEG (Video Coding Expert Group) e ISO/IEC MPEG (Moving Picture Expert Group), crearon el Joint Video Exploration Team (JVET) con el objetivo de desarrollar y definir conjuntamente un nuevo estándar de compresión (probablemente denominado H.266), que mejore sustancialmente las prestaciones actuales de HEVC (en torno a un 50%), y con el objetivo de que sea aprobado a finales del año 2019 o principios del 2020. El ámbito de aplicación de esta nueva especificación pretende incluir una amplia variedad de fuentes y aplicaciones de vídeo, entre las que se encuentran, además de las ya abarcadas por HEVC, los contenidos de vídeo en 360º, realidad virtual, contenidos en HDR (High Dynamic Range), etc. Actualmente ya existe un primer modelo software desarrollado por el JVET y conocido como Versatile Video Coding (VVC), que en su versión 1.0 proporciona una mejora apreciable (30%) de las prestaciones, entérminos de eficiencia de compresión con respecto a su predecesor HEVC, pero con un coste computacional demasiado elevado (unas 12 veces más lento que éste).
La idea de este TFG es el diseño e implementación de un trancodificador de vídeo HEVC/VVC para convertir contenidos audiovisuales desde el formato HEVC hacia el formato VVC de una manera eficiente usando para ellos técnicas de Machine Learning.
Metodología y Competencias
Para la realización de este TFG se ha seguido la siguiente metodología:
- Fase 1: Estudio del funcionamiento y las características de los estándares a tratar. Esta fase consiste en la lectura de trabajos e investigaciones que explican y detallan los estándares VVC y HEVC, así como sus diferencias y comparativas con otros estándares.
- Fase 2: Estudio del código. Se procederá a estudiar el código de los codificadores de HEVC y VVC y localizar las etapas mas importantes en las que se puede implementar el trasncodificador.
- Fase 3: Diseño e implementación del algoritmo propuesto basado en técnicas de Machine Learning.
- Fase 4: Ejecución de las pruebas y escritura de la memoria. Ejecutar todas las pruebas necesarias para obtener las prestaciones. Debido a que estas pruebas necesitaban bastante tiempo para ejecutarse, se comenzará paralelamente la escritura de la memoria.
- Fase 5: Recogida de datos y finalización de la memoria. Una vez finalizadas todas las pruebas, se recogerán datos y se procesarán para su inclusión de éstas en la memoria. Con los datos preparados, se realizará un análisis de los mismos para obtener las conclusiones para finalizar la memoria.
Este TFG permite completar la competencia específica [TI6] de la Intensificación de Tecnologías de la Información, y las competencias [CM1][CM3][CM4] y [CM7] de la Intensificación de Computación.
Tecnología específica. Computación.
[CM1] Capacidad para tener un conocimiento profundo de los principios fundamentales y modelos de la computación y saberlos aplicar para interpretar, seleccionar, valorar, modelar, y crear nuevos conceptos, teorías, usos y desarrollos tecnológicos relacionados con la informática.
[CM3] Capacidad para evaluar la complejidad computacional de un problema, conocer estrategias algorítmicas que puedan conducir a su resolución y recomendar, desarrollar e implementar aquella que garantice el mejor rendimiento de acuerdo con los requisitos establecidos.
[CM4] Capacidad para conocer los fundamentos, paradigmas y técnicas propias de los sistemas inteligentes y analizar, diseñar y construir sistemas, servicios y aplicaciones informáticas que utilicen dichas técnicas en cualquier ámbito de aplicación.
[CM7] Capacidad para conocer y desarrollar técnicas de aprendizaje computacional y diseñar e implementar aplicaciones y sistemas que las utilicen, incluyendo las dedicadas a extracción automática de información y conocimiento a partir de grandes volúmenes de datos.
Tecnología específica. Tecnologías de la información
[TI6] Capacidad de concebir sistemas, aplicaciones y servicios basados en tecnologías de red, incluyendo Internet, web, comercio electrónico, multimedia, servicios interactivos y computación móvil.
Medios a utilizar
Todo el equipamiento está disponible en el grupo de investigación RAAP del I3A. En concreto se usará un PC de trabajo con el código de los codificadores y el software Weka y 4 PCs de especificaciones superiores para la codificación de vídeo HEVC y VVC.
Bibliografía
[1] ITU-T Recommendation H.265 and ISO/IEC 23008-2 (Version 2). High Efficiency Video Coding, Oct 2014.
[2] G. J. Sullivan, J.-R. Ohm, W.-J. Han, and T. Wiegand. Overview of the High Efficiency Video Coding (HEVC) Standard, volume 22. IEEE Press, Piscataway, NJ, USA, Dec. 2012.
[3] High Efficiency Video Coding (HEVC): Coding Tools and Specification Mathias Wien, Springer. 2015
[4] https://hevc.hhi.fraunhofer.de/
[5] J. Chen, E. Alshina, G. J. Sullivan, J.-R. Ohm, J. Boyce (JEM editors) “Algorithm Description of Joint Exploration Test Model 5 (JEM 5)”, JVET-E1001, 5th Meeting, Geneva, January 2017.
[6] JEM Rference software,https://jvet.hhi.fraunhofer.de/svn /svn_HMJEMSoftware/.
Tutores CUENCA CASTILLO, PEDRO ÁNGEL GARCIA LUCAS, DAVID | Alumno MARCOS ESCRIBANO, JORGE
|
|