Universidad de Castilla-La Mancha
 
Escuela Superior de Ingeniería Informática
     
  •  

 

  cambiar a curso:   2017-18   2019-20



Grado en Ingeniería Informática


TRABAJOS FIN DE GRADO
curso: 2018-19

Transcodificación perceptual de vídeo con clasificadores Naïve-Bayes


Tecnologías Específicas

Computación
Tecnologías de la Información
 


Descripcion y Objetivos

La codificación perceptual de vídeo consiste en aplicar mayores tasas de compresión a las regiones de los fotogramas a las que el ojo humano no presta demasiada atención, cayendo únicamente en su área de visión periférica. Estas regiones tendrán una peor calidad, pero ésta no es mayormente apreciada por el ojo humano y, en cambio, permite ahorrar una cantidad significativa de ancho de banda.

En concreto, en este TFG se tomarán unas cuantas secuencias de entrenamiento que serán visualizadas y las regiones de interés de guardarán mediante el uso de un "eye tracker". Por otra parte, se procederá a identificar la información recolectada en el transcodificador que podría ser relevante para "averiguar" las regiones de interés.

Se usarán clasificadores Naïve-Bayes usando como entrada la información del transcodificador y como salida si se trata de un área de interés o no. Finalmente, a las áreas clasificada como "de menos interés", se les aplicará una cuantificación más agresiva que al resto, de forma que se puede comprimir más la señal de vídeo sin que el ojo apenas note la pérdida de calidad ocasionada.

 


Metodología y Competencias

Para la realización de este TFG se ha seguido la siguiente metodología:

- Fase 1: Estudio del funcionamiento y las características de los estándares a tratar. Esta fase consiste en la lectura de trabajos e investigaciones que explican y detallan los estándares H.264/AVC y HEVC, así como sus diferencias y comparativas con otros estándares.

- Fase 2: Puesta en marcha del "eye tracker" y captura del seguimiento visual de varias secuencias de entrenamiento.

- Fase 3: Estudio del código. Se procederá a estudiar el código del codificador de HEVC y localizar las zonas en las que se aplica la cuantificación, probando distintos valores de incremento según las áreas obtenidas en la fase 2.

- Fase 4: Ejecución de las pruebas y escritura de la memoria. Ejecutar todas las pruebas necesarias para obtener las prestaciones. Debido a que estas pruebas necesitaban bastante tiempo para ejecutarse, se comenzará paralelamente la escritura de la memoria.

- Fase 5: Recogida de datos y finalización de la memoria. Una vez finalizadas todas las pruebas, se recogerán  datos y se procesarán para su inclusión de éstas en la memoria. Con los datos preparados, se realizará un análisis de los mismos para obtener las conclusiones para finalizar la memoria.

Este TFG permite completar la competencia específica [TI6] de la Intensificación de Tecnologías de la Información, y las competencias [CM1][CM3][CM4] y [CM7] de la Intensificación de Computación.

 

Tecnología específica. Computación.
 
[CM1] Capacidad para tener un conocimiento profundo de los principios fundamentales y modelos de la computación y saberlos aplicar para interpretar, seleccionar, valorar, modelar, y crear nuevos conceptos, teorías, usos y desarrollos tecnológicos relacionados con la informática.
[CM3] Capacidad para evaluar la complejidad computacional de un problema, conocer estrategias algorítmicas que puedan conducir a su resolución y recomendar, desarrollar e implementar aquella que garantice el mejor rendimiento de acuerdo con los requisitos establecidos.
[CM4] Capacidad para conocer los fundamentos, paradigmas y técnicas propias de los sistemas inteligentes y analizar, diseñar y construir sistemas, servicios y aplicaciones informáticas que utilicen dichas técnicas en cualquier ámbito de aplicación.
[CM7] Capacidad para conocer y desarrollar técnicas de aprendizaje computacional y diseñar e implementar aplicaciones y sistemas que las utilicen, incluyendo las dedicadas a extracción automática de información y conocimiento a partir de grandes volúmenes de datos.
 
Tecnología específica. Tecnologías de la información

[TI6] Capacidad de concebir sistemas, aplicaciones y servicios basados en tecnologías de red, incluyendo Internet, web, comercio electrónico, multimedia, servicios interactivos y computación móvil.

 


Medios a utilizar

Todo el equipamiento está disponible en el grupo de investigación RAAP del I3A. En concreto se usará un PC de trabajo, un eye tracker y 4 PCs de especificaciones superiores para la codificación de vídeo HEVC.

 


Bibliografía

[1] ITU-T Recommendation H.265 and ISO/IEC 23008-2 (Version 2). High Efficiency Video Coding, Oct 2014.

[2]  G. J. Sullivan, J.-R. Ohm, W.-J. Han, and T. Wiegand. Overview of the High Efficiency Video Coding (HEVC) Standard, volume 22. IEEE Press, Piscataway, NJ, USA, Dec. 2012.

[3]  S. H. Khatoonabadi, I. V. Bajic, and Y. Shan. Compressed-domain correlates of human xations in dynamic scenes. Multimedia Tools and Applications, 74:10057-10075, 2015.

[4] D.-I. Bogdan. H.264/AVC to HEVC Perceptual Transcoder. July 2016.

 


Tutores


CUENCA CASTILLO, PEDRO ÁNGEL
DIAZ HONRUBIA, ANTONIO JESUS
 

Alumno


PEDROSA SÁNCHEZ, SARA

 

 

Sindicación  Sindicación  Sindicación  Sindicación

Curso: 2018-19
© Escuela Superior de Ingeniería Informática
Edificio Infante Don Juan Manuel
Avda. de España s/n
02071 Albacete
Tfno: 967 59 92 00 - Fax: 967 59 92 24

informatica.ab@uclm.es
aviso legal
generar código QR de la página