Fuentes fiables para la predicción de la pandemia

Los indicadores clave en relación al número de afectados por Covid-19 no permiten la generación de modelos fiables de predicción de la pandemia. Seleccionando fuentes alternativas y con calidad de datos respecto a un número realista de infectados se puede conseguir la generación de modelos de estimación más ajustados que permitan definir matrices de riesgo. Una vez finalizado el proceso de desescalada, este tipo de soluciones también permitirá evaluar el riesgo de los desplazamientos  para la población, ya que la sociedad tiene un rol clave en la evolución de la crisis. 

¿Qué indicadores clave ya identificados nos permitirá normalizar los datos para que sean más transparentes y accionables? ¿Qué predicciones se pueden hacer en base a esos indicadores clave ya identificados? ¿Qué otros indicadores podrían ayudar a predecir la evolución de la epidemia?

Marco de trabajo

El reto comportaba dos grandes problemas. El primero de ellos estaba ligado a la falta de test masivos: la estimación del número de infectados. El equipo debía ser capaz de identificar y desarrollar una manera de estimar el número de infectados para poder trabajar en modelos predictivos fiables.

El segundo problema era la identificación de las zonas de riesgo. Es necesario crear modelos que permitan conocer y mapear las zonas de más riesgo de contagio de manera individual para de este modo ayudar a prevenir que la pandemia se continúe extendiendo y así poder hacer una “desescalada” gradual controlando el riesgo de un nuevo brote.

Áreas de trabajo

  1. Datos

Se utilizaron los datos proporcionados por la API de Datos del Coronavirus de Narrativa (http://covid19tracking.narrativa.com/) que contiene la base de datos más completa del mundo del coronavirus agregando los datasets globales más importantes y completándolos con datasets oficiales de más de 22 países que proporcionan datos a nivel regional y provincial.

Dado que hay un consenso en la inexactitud en el dato de casos confirmados se ha optó por usar el modelo de estimación CoronaSurveys project (https://coronasurveys.org) desarrollado por el Instituto IMDEA Networks que provee de una estimación  más realista.

2. Desarrollo de modelos de evaluación de riesgo de zonas geográficas

  • Se desarrolló una matriz de riesgo en la que se pueden comparar las diferencias entre los niveles de riesgo para todos los pares de regiones por fecha para tener así el incremento de dicho riesgo de moverse de una región a otra. 
  • Adicionalmente al nivel del riesgo de cada zona se estimaron  probabilidades/pre-valencias de perfiles de contagiados

Estos perfiles se construyeron utilizando la información de las características demográficas, clínicas y de antecedentes epidemiológicos contenida en los informes sobre la situación de COVID-19 en España a cargo de la Red Nacional de Vigilancia Epidemiológica.

La solución

El equipo propuso la creación de un servicio en el que los usuarios proporcionan datos de salud (relacionados con el COVID-19) así como edad, sexo, etc además de indicar la localización. Con esta información el sistema realiza una evaluación del nivel de riesgo para la persona en la zona donde se encuentra. 

Del mismo modo se permitirá incluir un destino (en caso de planear un desplazamiento) y el sistema indicará el riesgo tanto para la persona como para la población del destino, asociado con dicho desplazamiento. En algunos casos el nivel de riesgo de ser infectado será mayor para la persona que se desplaza y en otros casos el riesgo de ser infectado será mayor para la población del destino.

Como resultado, obtendremos una recomendación sobre si debemos ir a ese sitio o no.

Próximos pasos

El equipo está actualmente valorando la creación de un primer modelo funcional de la APP para uso por parte de un limitado grupo de personas con alto nivel de riesgo. Una vez evaluados los resultados se podría evaluar el desarrollo de una versión extendida para su uso masivo por parte de la población.

En paralelo, se perseguirá la obtención de datos con granularidad a nivel de localidad para poder extender y mejorar el modelo de evaluación de riesgo. De la misma manera se buscará la obtención de datos epidemiológicos mucho más granulares para poder, también, mejorar el modelo.

Equipo de trabajo

Adrián Bornás, Alexis Cascales, Alexis  Carriere, Ana Victoria Vera, Antonio Fernández Anta, Cristina Blanco, Dario Fernandez, David Llorente, Eva Baonza, Faustino Lorenzo, Gerardo Fernández moreno, Irene Martinez, Jaime Garcia, Jonathan Gómez, José Méndez, Luis Encinas, Luis Martín, Pelayo Ramon

Cómo contactar

Escribe un email a info@dataforhope.com o déjanos tus datos para que nos pongamos en contacto contigo