Escuela Superior de Ingeniería Informática

cambiar a curso: 2015-16 2017-18

Grado en Ingeniería Informática

TRABAJOS FIN DE GRADO
curso: 2016-17

Transcodificación perceptual de vídeo con clasificadores Naïve-Bayes

Tecnologías Específicas

Computación
Tecnologías de la Información

Descripcion y Objetivos

La codificación perceptual de vídeo consiste en aplicar mayores tasas de compresión a las regiones de los fotogramas a las que el ojo humano no presta demasiada atención, cayendo únicamente en su área de visión periférica. Estas regiones tendrán una peor calidad, pero ésta no es mayormente apreciada por el ojo humano y, en cambio, permite ahorrar una cantidad significativa de ancho de banda.

En concreto, en este TFG se tomarán unas cuantas secuencias de entrenamiento que serán visualizadas y las regiones de interés de guardarán mediante el uso de un "eye tracker". Por otra parte, se procederá a identificar la información recolectada en el transcodificador que podría ser relevante para "averiguar" las regiones de interés.

Se usarán clasificadores Naïve-Bayes usando como entrada la información del transcodificador y como salida si se trata de un área de interés o no. Finalmente, a las áreas clasificada como "de menos interés", se les aplicará una cuantificación más agresiva que al resto, de forma que se puede comprimir más la señal de vídeo sin que el ojo apenas note la pérdida de calidad ocasionada.

Metodología y Competencias

Para la realización de este TFG se ha seguido la siguiente metodología:

- Fase 1: Estudio del funcionamiento y las características de los estándares a tratar. Esta fase consiste en la lectura de trabajos e investigaciones que explican y detallan los estándares H.264/AVC y HEVC, así como sus diferencias y comparativas con otros estándares.

- Fase 2: Puesta en marcha del "eye tracker" y captura del seguimiento visual de varias secuencias de entrenamiento.

- Fase 3: Estudio del código. Se procederá a estudiar el código del codificador de HEVC y localizar las zonas en las que se aplica la cuantificación, probando distintos valores de incremento según las áreas obtenidas en la fase 2.

- Fase 4: Ejecución de las pruebas y escritura de la memoria. Ejecutar todas las pruebas necesarias para obtener las prestaciones. Debido a que estas pruebas necesitaban bastante tiempo para ejecutarse, se comenzará paralelamente la escritura de la memoria.

- Fase 5: Recogida de datos y finalización de la memoria. Una vez finalizadas todas las pruebas, se recogerán datos y se procesarán para su inclusión de éstas en la memoria. Con los datos preparados, se realizará un análisis de los mismos para obtener las conclusiones para finalizar la memoria.

Medios a utilizar

Todo el equipamiento está disponible en el grupo de investigación RAAP del I3A. En concreto se usará un PC de trabajo, un eye tracker y 4 PCs de especificaciones superiores para la codificación de vídeo HEVC.

Bibliografía

[1] ITU-T Recommendation H.265 and ISO/IEC 23008-2 (Version 2). High Efficiency Video Coding, Oct 2014.

[2] G. J. Sullivan, J.-R. Ohm, W.-J. Han, and T. Wiegand. Overview of the High Efficiency Video Coding (HEVC) Standard, volume 22. IEEE Press, Piscataway, NJ, USA, Dec. 2012.

[3] S. H. Khatoonabadi, I. V. Bajic, and Y. Shan. Compressed-domain correlates of human xations in dynamic scenes. Multimedia Tools and Applications, 74:10057-10075, 2015.

[4] D.-I. Bogdan. H.264/AVC to HEVC Perceptual Transcoder. July 2016.

Tutor

CUENCA CASTILLO, PEDRO ÁNGEL

Tutor

Alumno