TRABAJOS FIN DE GRADO curso: 2017-18
Compresión de vídeo para grabación de pantallas siguiendo los movimientos del ojo |
Tecnologías Específicas
Tecnologías de la Información
Descripcion y Objetivos
La codificación perceptual de vídeo consiste en aplicar mayores tasas de compresión a las regiones de los fotogramas a las que el ojo humano no presta demasiada atención, cayendo únicamente en su área de visión periférica. Estas regiones tendrán una peor calidad, pero ésta no es mayormente apreciada por el ojo humano y, en cambio, permite ahorrar una cantidad significativa de ancho de banda.
En concreto en este TFG se pretende aplicar la codificación perceptual a secuencias de vídeo correspondientes a la grabación de pantallas, ya que en ese caso la persona que graba la secuencia la está viendo también en su pantalla y se puede usar la información de las regiones a las que esa persona mira para aplicar una compresión más agresiva a las regiones que no son de su interés.
Metodología y Competencias
Para la realización de este TFG se ha seguido la siguiente metodología:
- Fase 1: Estudio del funcionamiento y las características del estándar a tratar. Esta fase consiste en la lectura de trabajos e investigaciones que explican y detallan el estándar HEVC, así como sus diferencias y comparativas con otros estándares.
- Fase 2: Puesta en marcha del "eye tracker" y captura del seguimiento visual de las secuencias que contienen grabaciones de pantallas.
- Fase 3: Estudio del código. Se procederá a estudiar el código del codificador de HEVC y localizar las zonas en las que se aplica la cuantificación, probando distintos valores de incremento según las áreas obtenidas en la fase 2.
- Fase 4: Ejecución de las pruebas y escritura de la memoria. Ejecutar todas las pruebas necesarias para obtener las prestaciones. Debido a que estas pruebas necesitaban bastante tiempo para ejecutarse, se comenzará paralelamente la escritura de la memoria.
- Fase 5: Recogida de datos y finalización de la memoria. Una vez finalizadas todas las pruebas, se recogerán datos y se procesarán para su inclusión de éstas en la memoria. Con los datos preparados, se realizará un análisis de los mismos para obtener las conclusiones para finalizar la memoria.
Este TFG permite completar la competencia específica [TI6] de la Intensificación de Tecnologías de la Información, y las competencias [CM1][CM3][CM4] y [CM7] de la Intensificación de Computación.
Medios a utilizar
Todo el equipamiento está disponible en el grupo de investigación RAAP del I3A. En concreto se usará un PC de trabajo, un eye tracker y 4 PCs de especificaciones superiores para la codificación de vídeo HEVC.
Bibliografía
[1] ITU-T Recommendation H.265 and ISO/IEC 23008-2 (Version 2). High Efficiency Video Coding, Oct 2014.
[2] G. J. Sullivan, J.-R. Ohm, W.-J. Han, and T. Wiegand. Overview of the High Efficiency Video Coding (HEVC) Standard, volume 22. IEEE Press, Piscataway, NJ, USA, Dec. 2012.
[3] S. H. Khatoonabadi, I. V. Bajic, and Y. Shan. Compressed-domain correlates of human xations in dynamic scenes. Multimedia Tools and Applications, 74:10057-10075, 2015.
[4] D.-I. Bogdan. H.264/AVC to HEVC Perceptual Transcoder. July 2016.
Tutor CUENCA CASTILLO, PEDRO ÁNGEL | Alumno SERRANO CARRASCO, DIEGO JESÚS |
|