cambiar a curso:   2017-18   2019-20


Grado en Ingeniería Informática


TRABAJOS FIN DE GRADO
curso: 2018-19

Transcodificador de Vídeo HEVC/AV1 usando Machine Learning


Tecnologías Específicas

Computación
Tecnologías de la Información
 


Descripcion y Objetivos

HEVC ha sido desarrollado por el JCT-VC para reemplazar a su predecesor, el estándar H.264/AVC. El objetivo principal de HEVC es mejorar significativamente los prestaciones de Rate-Distortion (RD) comparado con H.264/AVC para hacer posible nuevas aplicaciones, como las resoluciones mayores que las de Alta Defición (HD) (como 4K, 3840x2160 píxeles, y 8K, 7680x4320 píxeles). Este seguramente sea el evento más significativo de la compresión de vídeo digital en una década. Con el esfuerzo colaborativo de muchos expertos, HEVC puede proveer aproximadamente el doble de compresión que los estándares hasta ahora usados manteniendo la misma calidad, a costa sin embargo de costes computacionales extremadamente superiores.

El codificador de referencia, el denominado HM es un codificador/decodificador que implementa toda la funcionalidad del estándar pero es muy costoso computacionalmente ya que, entre otras cosas, no está optimizado. Además, la implementacion de varios de sus algoritmos esta sujeto al pago de royalties debido a la esistencia de patentes por parte de las empresas que comercialicen y usen estos codecs. Debido a ello, recientemente ha apecido una alternativa liderada por empresas del sector como Amazon, ARM, Cisco, Google (Youtube), Intel, Microsoft, Mozilla, Netflix and NVIDIA, conocida como Alliance for Open Media . Dicha colaboracion ha diseñado un nuevo codec conocido como AV1 que pretende ser una alternativa a HEVC.

La idea de este TFG es el diseño e implementación de un trancodificador de vídeo HEVC/AV1 para convertir contenidos audiovisuales desde el formato HEVC hacia el formato AV1 de una manera eficiente usando para ellos técnicas de Machine Learning.

 


Metodología y Competencias

Para la realización de este TFG se ha seguido la siguiente metodología:

- Fase 1: Estudio del funcionamiento y las características de los estándares a tratar. Esta fase consiste en la lectura de trabajos e investigaciones que explican y detallan los estándares AV1 y HEVC, así como sus diferencias y comparativas con otros estándares.

- Fase 2: Estudio del código. Se procederá a estudiar el código de los codificadores de HEVC y AV1 y localizar las etapas mas importantes en las que se puede implementar el trasnclodificador.

- Fase 3: Diseño e implementación del algoritmo propuesto usando Machine Learning.

- Fase 4: Ejecución de las pruebas y escritura de la memoria. Ejecutar todas las pruebas necesarias para obtener las prestaciones. Debido a que estas pruebas necesitaban bastante tiempo para ejecutarse, se comenzará paralelamente la escritura de la memoria.

- Fase 5: Recogida de datos y finalización de la memoria. Una vez finalizadas todas las pruebas, se recogerán  datos y se procesarán para su inclusión de éstas en la memoria. Con los datos preparados, se realizará un análisis de los mismos para obtener las conclusiones para finalizar la memoria.

Este TFG permite completar la competencia específica [TI6] de la Intensificación de Tecnologías de la Información, y las competencias [CM1][CM3][CM4] y [CM7] de la Intensificación de Computación.

Tecnología específica. Computación.
 
[CM1] Capacidad para tener un conocimiento profundo de los principios fundamentales y modelos de la computación y saberlos aplicar para interpretar, seleccionar, valorar, modelar, y crear nuevos conceptos, teorías, usos y desarrollos tecnológicos relacionados con la informática.
[CM3] Capacidad para evaluar la complejidad computacional de un problema, conocer estrategias algorítmicas que puedan conducir a su resolución y recomendar, desarrollar e implementar aquella que garantice el mejor rendimiento de acuerdo con los requisitos establecidos.
[CM4] Capacidad para conocer los fundamentos, paradigmas y técnicas propias de los sistemas inteligentes y analizar, diseñar y construir sistemas, servicios y aplicaciones informáticas que utilicen dichas técnicas en cualquier ámbito de aplicación.
[CM7] Capacidad para conocer y desarrollar técnicas de aprendizaje computacional y diseñar e implementar aplicaciones y sistemas que las utilicen, incluyendo las dedicadas a extracción automática de información y conocimiento a partir de grandes volúmenes de datos.
 
Tecnología específica. Tecnologías de la información

[TI6] Capacidad de concebir sistemas, aplicaciones y servicios basados en tecnologías de red, incluyendo Internet, web, comercio electrónico, multimedia, servicios interactivos y computación móvil.

 


Medios a utilizar

Todo el equipamiento está disponible en el grupo de investigación RAAP del I3A. En concreto se usará un PC de trabajo con el código de los codificadores y el software Weka y 4 PCs de especificaciones superiores para la codificación de vídeo HEVC y AV1.

 


Bibliografía

[1] ITU-T Recommendation H.265 and ISO/IEC 23008-2 (Version 2). High Efficiency Video Coding, Oct 2014.

[2]  G. J. Sullivan, J.-R. Ohm, W.-J. Han, and T. Wiegand. Overview of the High Efficiency Video Coding (HEVC) Standard, volume 22. IEEE Press, Piscataway, NJ, USA, Dec. 2012.

[3] High Efficiency Video Coding (HEVC): Coding Tools and Specification Mathias Wien, Springer. 2015 

[4] https://hevc.hhi.fraunhofer.de/

[5] http://aomedia.org/

 


Tutor


CUENCA CASTILLO, PEDRO ÁNGEL
 

Alumno