cambiar a curso:   2017-18   2019-20


Grado en Ingeniería Informática


TRABAJOS FIN DE GRADO
curso: 2018-19

Homogeneización y estabilización de datos clínicos


Tecnologías Específicas

Tecnologías de la Información
 


Descripcion y Objetivos

La reutilización de datos clínicos procedentes de la Historia Clínica Electrónica (HCE) para usos secundarios como Sistemas de Ayuda a la Toma de Decisión (CDSS), Monitorización de procesos clínicos e Investigación sanitaria, implica  asegurar la calidad de sus datos1,2.

A nivel conceptual, múltiples estudios coinciden en definir un conjunto aspectos o dimensiones de calidad de datos que deben ser evaluadas2-6. Además, los problemas de calidad de datos pueden estructurarse en distintos niveles de granularidad sobre los que medir las dimensiones utilizando diferentes ejes6.

El Hospital Virgen del Castillo, perteneciente a la Gerencia del Área V de Salud del Servicio Murciano de Salud, mantiene abierta desde 2008 una línea de trabajo en calidad de datos biomédicos liderada por el servicio de pediatría y la sección de tecnologías de la información. Esta línea se consolidó como línea de investigación en colaboración con el Grupo de Investigación en Informática Biomédica (IBIME) de la Universidad Politécnica de Valencia a partir de 2012 en el ámbito perinatal y de alimentación del lactante hasta los dos años.

Fruto de esta colaboración, han definido un proceso de generación de repositorios de datos clínicos con calidad asegurada8 basado en el framework propuesto por Sáez et all6 que define 9 dimensiones de calidad de datos. Dicho proceso está formado por una serie de 13 procedimientos donde podemos diferenciar dos bloques en el proceso de generación de repositorios: El primero consiste en el aseguramiento de la integridad de la estructura de datos; debido a que las organizaciones sanitarias son entornos cambiantes donde se producen continuos cambios en la forma de registrar la información clínica, es preciso homogeneizar y estabilizar estos datos antes de realizar el segundo bloque de análisis de calidad de datos relacionado con la semántica clínica de los mismos, para obtener finalmente el repositorio con calidad asegurada.

El objetivo del presente trabajo es generar un software que cubra el bloque estructural del proceso de aseguramiento de calidad de datos definido por García-de-León-Chocano R et all8. El software cubrirá la carga de información procedente de la HCE (Raw Data) y la generación de un repositorio homogéneo y estable (correspondiente al repositorio intermedio del proceso completo de aseguramiento, origen de datos para las fases relacionadas con el aseguramiento semántico). Durante la generación del repositorio homogéneo y estable, la evaluación de calidad de datos se realiza sobre 3 de las dimensiones del modelo de Sáez et all6: Validez Predictiva, Contextualización y Estabilidad temporal.

 


Metodología y Competencias

El aseguramiento de la estructura se realizará mediante 6 procedimientos a partir del Raw Data procedente de la HCE:

  1. Parametrización del sistema (parámetros estructurales)
  2. Selección de variables informativas
  3. Armonización de formularios y variables multicódigo
  4. Detección y corrección de formularios mal asignados
  5. Estandarización del contexto
  6. Recodificación y armonización de categorías de variables

El trabajo será desarrollado en las siguientes fases:

  • Revisión de la literatura
  • Definición de las estructuras de datos
  • Generación de interfaces clínicos
  • Desarrollo de los procedimientos
  • Prueba del software.

El trabajo en el hospital será coordinado por Ricardo García de León Chocano, jefe de sección de tecnologías de la información.

La realización de este TFG conlleva el desarrollo y ejercitación de todas las competencias propias de la asignatura de TFG y, en particular, las siguientes:

  • CO19 Ejercicio original a realizar individualmente y presentar y defender ante un tribunal universitario, consistente en un proyecto de naturaleza profesional en el ámbito de la tecnología específica de la Ingeniería en Informática que ha realizado el estudiante. En este ejercicio se deben sintetizar e integrar las competencias adquiridas en las enseñanzas.
  • INS1 Capacidad de análisis, síntesis y evaluación.
  • INS2 Capacidad de organización y planificación.
  • INS3 Capacidad de gestión de la información.
  • INS4 Capacidad de resolución de problemas aplicando técnicas de ingeniería.
  • INS5 Capacidad para argumentar y justificar lógicamente las decisiones tomadas y las opiniones.
  • PER4 Capacidad de relación interpersonal.
  • SIS1 Razonamiento crítico.
  • SIS3 Aprendizaje autónomo.
  • SIS5 Creatividad.
  • SIS8 Capacidad de iniciativa y espíritu emprendedor.
  • UCLM2 Capacidad para utilizar las Tecnologías de la Información y la Comunicación.
 


Medios a utilizar

Se utilizará software libre tanto para conectar con las BBDD origen como para el desarrollo del software.

El trabajo se realizará fundamentalmente en las instalaciones del hospital.

 


Bibliografía

  1. Weng C, Appelbaum P, Hripcsak G, et al. Using EHRs to integrate research with patient care: promises and challenges. J Am Med Inform Assoc. 2012 ;19: 684-7.
  2. Weiskopf NG, Weng C. Methods and dimensions of electronic health record data quality assessment: enabling reuse for clinical research. J Am Med Inform Assoc. 2013; 20: 144-51.
  3. Wang RY, Strong DM Beyond Accuracy: What Data Quality Means to Data Consumers. J Manag Inform Syst. 1996; 12: 5-34.
  4. Karr AF et.al. Data quality: A statistical perspective. Stat Meth 2006; 3: 137-173.
  5. Cruz-Correia R.J et al. Data Quality and Integration Issues in Electronic Health Records. V. Hristidis (ed.) Information Discovery On Electronic Health Records. 2010; 55-96.
  6. Sáez C, Martínez-Miranda J, Robles M, García-Gómez JM. Organizing data quality assessment of shifting biomedical data. Stud Health Technol Inform. 2012; 180: 721-5.
  7. Oliveira P, et al. A formal definition of data quality problems. MIT IQ Conference, 10-12 Nov, 2005.
  8. García-de-León-Chocano R, Sáez C, Muñoz-Soler V, García-de-León-Gonzalez R, García-Gómez JM.  Construction of quality-assured infant feeding process of care data repositories: definition and design (Part 1).  Computers in Biology and Medicine
 


Tutores


GARCIA-CONSUEGRA BLEDA, JESUS DAMIAN
GARCÍA DE LEÓN CHOCANO, RICARDO
 

Alumno


CLEMENTE VILLAESCUSA, LUIS