Proyectos de Investigación

Proyecto ReCOVID

Proyecto
ReCOVID
Financiado por
URJC - Banco Santander
IPs
A. Torrado Carvajal (URJC) I. Mora Jiménez (URJC)

Entidades

LAIMBIO

Laboratorio de Análisis de Imagen Médica y Biometría de la URJC

Banco Santander

Convocatoria de ayudas para la financiación de proyectos de Investigación Santander

HM Hospitales

Grupo Hospitalario Universitario privado madrileño con servicios de investigación y docencia

HUS

Hospital Universitario del Sureste

ReCOVID: “Reconocimiento de patrones multimodales para caracterización y predicción de la evolución clínica de pacientes afectados por SARS-CoV-2” (2021)

Covid Data Save Lives (hmhospitales.com)

Equipo investigador

Ángel Torrado Carvajal (URJC), Norberto Malpica (URJC), Inmaculada Mora Jiménez (URJC), Cristina Soguero-Ruiz (URJC), Jose Luis Rojo Álvarez (URJC), Alberto Sánchez Campos (URJC), José María Castellano Vázquez (HM), Jesús Rodríguez Pascual (HM), José Felipe Varona Arche (HM), Ángel Gómez Delgado (HUS), Adrián García Romero (URJC), Paloma Santos Álvarez (HUS)

Resumen de la Propuesta

En los pacientes afectados por infección COVID-19, cualquier técnica diagnóstica o predictiva de evolución clínica de alta fiabilidad supondría un avance médico muy relevante y tendría asimismo importantes implicaciones económicas, éticas y legales. El desarrollo de estos test resulta en sí enormemente relevante debido a la falta de biomarcadores confiables a día de hoy que permitan medir objetivamente la progresión de la enfermedad.

En los últimos años la capacidad de recopilar y almacenar datos en el ámbito sanitario ha aumentado notablemente, y han aparecido nuevos métodos de aprendizaje automático que, unidos a la creciente capacidad de computación, permiten extraer conocimiento útil en la práctica clínica, incluso a partir de datos multimodales heterogéneos.

La aplicación de técnicas de Inteligencia Artificial sobre distintas fuentes de datos clínicos proporcionadas por el Grupo HM permitirá extraer conocimiento sobre la relación que las patologías previas del paciente y el tratamiento recibido desde el diagnóstico de la enfermedad por nuevo coronavirus (SARS-CoV-2) tienen en la evolución clínica del paciente.

El objetivo de esta propuesta es el diseño y aplicación de técnicas de IA para identificar factores de riesgo y diseñar modelos predictivos de la evolución clínica de pacientes afectados por COVID-19, y el desarrollo de herramientas que permitan el uso de estas técnicas en la rutina clínica de la atención a pacientes afectados por esta infección.

Hipótesis y Objetivos

Hipótesis: La aplicación de técnicas de IA sobre distintas fuentes de datos clínicos permitirá extraer conocimiento sobre la relación que las patologías previas del paciente y el tratamiento recibido desde el diagnóstico de COVID-19 tienen en la evolución clínica del paciente.

Objetivo General: Aplicar técnicas de IA para identificar factores de riesgo y diseñar modelos predictivos de la evolución del estado de salud de pacientes diagnosticados con COVID-19.

Objetivo Específicos:

  • OE1: Análisis exploratorio de la base de datos de los pacientes ingresados en HM.
  • OE2: Identificar qué factores clínicos (biométricos, analíticos, de imagen, Farmacológicos…) influyen más en la identificación temprana de pacientes de alto riesgo, progresión y tratamiento de los pacientes con COVID-19. Diseño de modelos predictivos de IA para predecir la evolución clínica del paciente diagnosticado de COVID-19.
  • OE3: Identificar qué factores de imagen (características radiómicas) influyen más en la identificación temprana de pacientes de alto riesgo, progresión y tratamiento de los pacientes con COVID-19. Diseño de modelos predictivos de IA para predecir la evolución clínica del paciente basados en imagen.
  • OE4: Integrar los factores clínicos e imagenológicos de OE2 y OE3 para diseñar modelos predictivos multimodales haciendo uso de herramientas de IA.

Metodología

T0: Reuniones de planificación y seguimiento.

Descripción: Reuniones semanales para la coordinación de la ejecución del proyecto, la revisión del cronograma, la evaluación del desarrollo de los objetivos planteados, así como para la definición de próximos pasos.

T1: Análisis exploratorio de la base de datos y pre-procesamiento

Descripción: El tratamiento e integración de datos procedentes de múltiples fuentes requiere un análisis detallado para una efectiva extracción de conocimiento. Se prestará especial atención a la codificación y tratamiento de valores anómalos, de datos de naturaleza heterogénea (categóricos y numéricos), así como al tratamiento de series temporales con muestreo irregular. En caso de disponer de campos asociados a texto libre, se considerarán herramientas para su adecuado tratamiento e integración con el resto de los datos disponibles.

En el caso concreto de las imágenes del estudio, será necesario revisar las imágenes proporcionadas, estableciendo unos criterios de control de calidad que tengan en cuenta artefactos de la práctica clínica habitual (distorsión por movimiento, etc.), así como unos criterios de estandarización de las imágenes para su posterior análisis. Se aplicará una etapa automática de normalización de intensidades, para tener en cuenta imágenes que provienen de distintos equipos de adquisición, así como una normalización en tamaño, mediante la detección automática del fondo de la imagen. A continuación, se extraerán parámetros de la imagen (radiomics).

T2: Aplicación de técnicas de inteligencia artificial para identificar variables que permitan caracterizar la progresión de un paciente diagnosticado con COVID-19

Descripción: Diseño y desarrollo de herramientas de aprendizaje automático para identificar variables explicativas procedentes de datos heterogéneos, considerando factores demográficos, clínicos e imagenológicos.

En caso de que los datos disponibles ofrezcan un desequilibrio entre distintas categorías, se aplicarán técnicas para minimizar el impacto de este desequilibrio en las técnicas de aprendizaje consideradas. Se evaluarán distintas técnicas de submuestreo y sobremuestreo, así como algoritmos específicos para una ponderación no homogénea de los registros, en función de la categoría a la que estén asociados.

T3: Aplicación de técnicas de inteligencia artificial para diseñar modelos predictivos

Descripción: Evaluación de la capacidad predictiva de las variables identificadas en T2 bajo un enfoque basado en aprendizaje automático. Se evaluarán métodos lineales y no lineales con diferentes grados de interpretabilidad y capacidad de inferencia.

Impacto Esperado de los Resultados

Este proyecto pretende contribuir al avance científico y tecnológico diseñando herramientas que permitan extraer conocimiento de datos de naturaleza heterogénea, incompletos, dispersos y muestreados de forma irregular. La suma de las habilidades y experiencia del equipo investigador añadidas al conocimiento adquirido durante el desarrollo del presente proyecto conducirá a la generación de nuevos conocimientos sobre la fisiopatología de la infección COVID-19 y sobre los posibles mecanismos moleculares de interacción entre el virus SARS-CoV-2 y el huésped, así como en su posible tratamiento. Sobre la base del conocimiento adquirido y las herramientas desarrolladas en este proyecto, las mejoras técnicas desarrolladas en los distintos objetivos podrán ser transferidas a la práctica clínica para su posible evaluación poblacional.