|
Grado en Ingeniería Informática |
TRABAJOS FIN DE GRADO curso: 2022-23
Aceleración de la codificación de vídeo en VVC mediante técnicas de pre-análisis |
Tecnologías Específicas
Tecnologías de la Información
Descripcion y Objetivos
Versatile Video Coding (VVC) es el nuevo estándar de codificación de vídeo desarrollado por las organizaciones ISO/IEC MPEG e ITU-T VCEG para reemplazar a su predecesor, el estándar High Efficiency Video Coding (HEVC). El objetivo principal de VVC es mejorar significativamente la eficiencia de codificación de HEVC en términos de Rate-Distortion (RD) para así llevar a la realidad nuevas aplicaciones como resoluciones 4K (3840x2160 píxeles) y 8K (7680x4320 píxeles), mayor profundidad de bits, High Dynamic Range (HDR), etc. Así, gracias al esfuerzo colaborativo de muchos expertos, VVC es capaz de proveer aproximadamente el doble de compresión que los estándares hasta ahora usados manteniendo la misma calidad, a costa sin embargo de costes computacionales extremadamente superiores que hacen que las implementaciones concretas sean un tanto ineficientes si se persigue alcanzar su ejecución en tiempo real.
Si bien el tiempo de codificación puede reducirse desde múltiples enfoques, como por ejemplo mediante la paralelización de la codificación, este TFG se marca como objetivo el uso de técnicas de pre-análisis para reducir este parámetro de forma sustancial tratando de mantener a la vez la eficiencia de codificación alcanzada por el codificador. Dichas técnicas de pre-análisis suelen basarse en la codificación preliminar de uno o varios frames futuros, de tal manera que se pueda realizar una estimación del coste de cada posible particionamiento, y así evitar la evaluación de ciertos modos de codificación en base a esta información. Dada la amplísima complejidad de la estructura de particionamiento de VVC, denominada Multi-Type Tree (MTT), el uso de heurísticas que invaliden ciertos particionamientos e impidan su evaluación puede suponer una sustancial reducción del tiempo de codificación sin un perjuicio en las prestaciones de calidad o tasa de compresión del codificador.
Metodología y Competencias
Se llevarán a cabo reuniones periódicas semanales/bisemanales en las que se hará un control del progreso del siguiente plan de trabajo:
- Revisión de los conceptos básicos sobre codificación de vídeo, y en particular del estándar VVC y la estimación de movimiento.
- Revisión del estado del arte y otros trabajos relacionados en la literatura.
- Diseño y desarrollo de un algoritmo de pre-análisis basado en la estimación de movimiento.
- Desarrollo de heurísticas que determinen los modos de particionamiento más probables en función de la información obtenida en la etapa de pre-análisis.
- Evaluación de rendimiento.
- Escritura de la memoria.
Las competencias desarrolladas a lo largo de este proyecto son:
- [CO3] Capacidad para evaluar la complejidad computacional de un problema, conocer estrategias algorítmicas que puedan conducir a su resolución y recomendar, desarrollar e implementar aquella que garantice el mejor rendimiento de acuerdo con los requisitos establecidos.
- [TI2] Capacidad para seleccionar, diseñar, desplegar, integrar, evaluar, construir, gestionar, explotar y mantener las tecnologías de hardware, software y redes, dentro de los parámetros de coste y calidad adecuados.
- [TI6] Capacidad de concebir sistemas, aplicaciones y servicios basados en tecnologías de red, incluyendo Internet, web, comercio electrónico, multimedia, servicios interactivos y computación móvil.
Medios a utilizar
Todos los recursos software que se utilizarán para la realización de este TFG tales como compiladores, codificadores de vídeo, librerías, etc. son de libre disposición. Cualesquiera medios hardware requeridos por el alumno o alumna para su realización podrán ponerse a su disposición en la ESII o en el I3A.
Bibliografía
[1] ITU-T VCEG and ISO/IEC MPEG, Versatile Video Coding, Rec. ITU-T H.266 and ISO/IEC 23090-3 (VVC), Feb. 2021.
[2] B. Bross et al., "Overview of the Versatile Video Coding (VVC) Standard and its Applications," in IEEE Transactions on Circuits and Systems for Video Technology, vol. 31, no. 10, pp. 3736-3764, Oct. 2021, doi: 10.1109/TCSVT.2021.3101953.
[3] Fraunhofer Versatile Video Encoder (VVenC) software repository. Available online: https://github.com/fraunhoferhhi/vvenc. Retrieved. Nov. 2021.
[4] VTM software repository. Available online: https://vcgit.hhi.fraunhofer.de/jvet/VVCSoftware_VTM. Retrieved: Nov. 2021.
[5] J. Chen et al., "Algorithm description for Versatile Video Coding and Test Model 11." Tech. rep. JVET-T2002. Available online: https://jvet-experts.org/doc_end_user/current_document.php?id=10541. Retrieved: Nov. 2021.
[6] G. Cebrián-Márquez et al., "Adaptive inter CU partitioning based on a look-ahead stage for HEVC," in Signal Processing: Image Communication, vol. 76, pp. 97-108, Aug. 2019, doi: 10.1016/j.image.2019.04.019.
Tutores CEBRIAN MARQUEZ, GABRIEL CUENCA CASTILLO, PEDRO ÁNGEL | Alumno CHILLERÓN CALVILLO, RAÚL
|
| |