cambiar a curso:   2016-17   2018-19


Grado en Ingeniería Informática


TRABAJOS FIN DE GRADO
curso: 2017-18

Transcodificador de Vídeo HEVC/JEM usando Machine Learning


Tecnologías Específicas

Computación
Tecnologías de la Información
 


Descripcion y Objetivos

HEVC ha sido desarrollado por el JCT-VC para reemplazar a su predecesor, el estándar H.264/AVC. El objetivo principal de HEVC es mejorar significativamente los prestaciones de Rate-Distortion (RD) comparado con H.264/AVC para hacer posible nuevas aplicaciones, como las resoluciones mayores que las de Alta Defición (HD) (como 4K, 3840x2160 píxeles, y 8K, 7680x4320 píxeles). Este seguramente sea el evento más significativo de la compresión de vídeo digital en una década. Con el esfuerzo colaborativo de muchos expertos, HEVC puede proveer aproximadamente el doble de compresión que los estándares hasta ahora usados manteniendo la misma calidad, a costa sin embargo de costes computacionales extremadamente superiores.

Por otro lado, diversos estudios han confirmado que la distribución de video se ha convertido en el principal tráfico de datos a nivel mundial, llegando al 70% del tráfico total de internet en 2016, en especial sobre redes celulares e inalámbricas, y su volumen continuará creciendo hasta el 82% en 2020, motivado fundamentalmente por el auge en el número de servicios y de usuarios, pero también por el incremento de la resolución espacial y temporal que han experimentado los formatos de video por encima de la alta definición. En 2020 se espera que el número de dispositivos conectados a la red capaces de consumir contenidos audiovisuales triplicará la población mundial (una media de 3.4 dispositivos per capita).

Es por ello que, en octubre de 2015, los organismos internacionales encargados de regular la estandarización de los códecs de video ITU-T VCEG (Video Coding Expert Group) e ISO/IEC MPEG (Moving Picture Expert Group), crearon el Joint Video Exploration Team (JVET) con el objetivo de desarrollar y definir conjuntamente un nuevo estándar de compresión (probablemente denominado H.266), que mejore sustancialmente las prestaciones actuales de HEVC (en torno a un 50%), y con el objetivo de que sea aprobado a finales del año 2019 o principios del 2020. El ámbito de aplicación de esta nueva especificación pretende incluir una amplia variedad de fuentes y aplicaciones de vídeo, entre las que se encuentran, además de las ya abarcadas por HEVC, los contenidos de vídeo en 360º, realidad virtual, contenidos en HDR (High Dynamic Range), etc. Actualmente ya existe un primer modelo software desarrollado por el JVET y conocido como Joint Exploration Model (JEM), que en su versión 5.0 proporciona una mejora apreciable (30%) de las prestaciones, entérminos de eficiencia de compresión con respecto a su predecesor HEVC, pero con un coste computacional demasiado elevado (unas 12 veces más lento que éste).

La idea de este TFG es el diseño e implementación de un trancodificador de vídeo HEVC/JEM para convertir contenidos audiovisuales desde el formato HEVC hacia el formato JEM de una manera eficiente usando para ellos técnicas de Machine Learning.

 


Metodología y Competencias

Para la realización de este TFG se ha seguido la siguiente metodología:

- Fase 1: Estudio del funcionamiento y las características de los estándares a tratar. Esta fase consiste en la lectura de trabajos e investigaciones que explican y detallan los estándares JEM y HEVC, así como sus diferencias y comparativas con otros estándares.

- Fase 2: Estudio del código. Se procederá a estudiar el código de los codificadores de HEVC y JEM y localizar las etapas mas importantes en las que se puede implementar el trasncodificador.

- Fase 3: Diseño e implementación del algoritmo propuesto basado en técnicas de Machine Learning.

- Fase 4: Ejecución de las pruebas y escritura de la memoria. Ejecutar todas las pruebas necesarias para obtener las prestaciones. Debido a que estas pruebas necesitaban bastante tiempo para ejecutarse, se comenzará paralelamente la escritura de la memoria.

- Fase 5: Recogida de datos y finalización de la memoria. Una vez finalizadas todas las pruebas, se recogerán  datos y se procesarán para su inclusión de éstas en la memoria. Con los datos preparados, se realizará un análisis de los mismos para obtener las conclusiones para finalizar la memoria.

Este TFG permite completar la competencia específica [TI6] de la Intensificación de Tecnologías de la Información, y las competencias [CM1][CM3][CM4] y [CM7] de la Intensificación de Computación.

 


Medios a utilizar

Todo el equipamiento está disponible en el grupo de investigación RAAP del I3A. En concreto se usará un PC de trabajo con el código de los codificadores y el software Weka y 4 PCs de especificaciones superiores para la codificación de vídeo HEVC.

 


Bibliografía

[1] ITU-T Recommendation H.265 and ISO/IEC 23008-2 (Version 2). High Efficiency Video Coding, Oct 2014.

[2]  G. J. Sullivan, J.-R. Ohm, W.-J. Han, and T. Wiegand. Overview of the High Efficiency Video Coding (HEVC) Standard, volume 22. IEEE Press, Piscataway, NJ, USA, Dec. 2012.

[3] High Efficiency Video Coding (HEVC): Coding Tools and Specification Mathias Wien, Springer. 2015 

[4] https://hevc.hhi.fraunhofer.de/

[5] J. Chen, E. Alshina, G. J. Sullivan, J.-R. Ohm, J. Boyce (JEM editors) “Algorithm Description of Joint Exploration Test Model 5 (JEM 5)”, JVET-E1001, 5th Meeting,  Geneva, January 2017.

[6] JEM Rference software,https://jvet.hhi.fraunhofer.de/svn /svn_HMJEMSoftware/.

 

 


Tutor


CUENCA CASTILLO, PEDRO ÁNGEL
 

Alumno