Machine learning contra el Covid-19

La pandemia representa un desafío sin precedentes para nuestro abandonado sistema de salud. En este contexto, un grupo de alumnos y egresados de la UNI ha preparado una herramienta que permite estimar las cifras de contagios y fallecidos con dos semanas de anticipación. 

La pandemia por el Covid-19 y, en particular, la segunda ola de contagios que sortea el Perú, representa un desafío sin precedentes para nuestro históricamente abandonado sistema de salud. 

En este contexto, obtener proyecciones de las cifras de contagios y fallecidos es de vital utilidad para establecer estrategias de gestión de recursos hospitalarios que mitiguen la crisis sanitaria. Es por ello que un grupo de estudiantes del Círculo de Modelamiento de Fenómenos Aleatorios y Sistemas Complejos (CIMFASC) de la Universidad Nacional de Ingeniería, liderados por el estadístico y matemático MsC. Helder Rojas, han creado Radar Perú Covid-19.

Se trata de una herramienta disponible en línea que busca estimar la cantidad de contagios y muertes por la pandemia que serán reportados durante las próximas dos semanas en cada región del país. 

COMPROMISO

“Estuvimos trabajando, desde julio del 2020 en un proyecto relacionado a las finanzas y el mercado de valores. Queríamos hacer pronósticos de precios a corto plazo. Se suele abordar desde la matemática, pero nosotros queríamos hacerlo desde la estadística y aplicar técnicas de machine learning, una forma de inteligencia artificial”, nos cuenta Helder. 

“Mientras estudiábamos familias generalizadas de modelos temporales con el fin de aplicarlas a este tipo de predicciones, la pandemia y sus consecuencias arreciaban cada vez más y esto nos motivó a cambiar nuestros objetivos, queríamos aportar”. 

La cifra de contagios y muertes es crucial para diagnosticar el estado de la pandemia y monitorear la dinámica del virus. Estas son utilizadas para la gestión de recursos hospitalarios y el planeamiento de políticas de contención. 

“Parte importante de un trabajo científico es atacar problemas de coyuntura, ofrecer contribuciones sociales o industriales”, enfatiza Helder. 

RADAR PERÚ COVID-19

En dicho contexto, el equipo de trabajo del CIMFASC comprende que los modelos temporales que venía estudiando podían aplicarse para estimar las cifras con una antelación de dos semanas, el tiempo de incubación del virus. 

“El número de contagios en el futuro tiene que ver mucho con el número de contagios en el pasado, dado el periodo de incubación de la enfermedad, que es de dos semanas. Trabajamos con esa base”.

En total, el equipo escogió un grupo de aproximadamente 300 modelos potencialmente útiles para realizar las proyecciones. 

“En los datos de contagios y muertes hay una estructura matemática (una ley) que permite predecir lo que estoy viendo; sin embargo, el reto con estos fenómenos es que esta ley cambia constantemente. 

“Entonces, lo desafiante era probar todos estos modelos para cada uno de los 27 departamentos del Perú, cada día. Es en este punto donde recurrimos a la inteligencia artificial”.

MACHINE LEARNING

El método llamado machine learning, funciona de manera similar a nuestro proceso de aprendizaje natural: tomamos decisiones basadas en nuestras experiencias previas. 

El equipo primero entrenó al software a partir de patrones pasados. Escogieron periodos de tiempo determinados, con cifras conocidas, y excluyeron las dos últimas semanas, como si no las conocieran. 

“El software analiza la dependencia entre las cifras del primer día y el segundo, el tercero, el cuarto, y así sucesivamente. Y no solo eso, analiza también todas las relaciones posibles entre todos los días del periodo escogido para el entrenamiento. Finalmente, hacemos que pronostique, medimos su performance y corregimos lo que sea necesario corregir”.

Una vez que el software ya “sabe” qué criterios seguir para escoger modelos que permitan hacer predicciones acertadas, está listo para ser utilizado. 

“Cada día se prueban, automáticamente, entre 200 y 300 modelos para cada departamento. El que tiene mejores resultados, es el que se utiliza para hacer la proyección”, explica Helder. 

NUEVOS RETOS

El proyecto fue presentado la primera semana de enero, pero el equipo no ha dejado de trabajar. 

Los pronósticos ofrecidos son temporales. El siguiente reto planteado es conocer la distribución del virus no solo en el tiempo, sino también en el espacio. 

“La relación entre Huancayo y Lima no es la misma que existe entre Puno y Loreto, por ejemplo. Los niveles de dependencia son distintos y si hay un pronóstico alentador o catastrófico para cierta región, es posible predecir en qué medida afectará a las otras. Es un trabajo que tomará meses. Estamos en ello”. 

Mientras tanto, poco después de presentar Radar Perú Covid-19, el equipo fue contactado por el Centro Nacional de Epidemiología y Control de Enfermedades del Ministerio de Salud. 

“Nos llamaron para trabajar en conjunto ya que es posible utilizar las mismas metodologías para analizar el desarrollo de otras enfermedades como la malaria y el zika. Incluso es posible relacionar ciertas enfermedades con factores ambientales o sanitarios ligados a la evolución de los virus. Agregar variables diversas como niveles de salubridad, desempleo, presupuesto, etc.”

CIMFASC

El equipo está conformado también por Víctor Quilca, estadístico egresado de la Facultad de Ingeniería Económica, Estadística y Ciencias Sociales (FIEECS); Jesús García, estudiante de los últimos ciclos de la misma facultad; y Josué Julcarima, ingeniero de sistemas de la Facultad de Ingeniería Industrial y de Sistemas. 

Todos ellos pertenecen al CIMFASC, grupo creado en el 2018 a iniciativa de Helder con la intención de contribuir a la formación de los investigadores desde el pregrado. Cada año se arman entre cuatro y cinco grupos de trabajo conformados por alumnos de los últimos ciclos, supervisados y guiados por un especialista destacado.

“Mi motivación es formar egresados que salgan con la idea de hacer maestrías, doctorados y desarrollarse como investigadores. En el CIMFASC los alumnos adquieren experiencia en temas de vanguardia y muchas veces les sirve para una tesis, para presentarse en eventos internacionales (que es muy valorado cuando se postula a un posgrado), y para ganar experiencia académica en general”. 

El Círculo abarca proyectos no solo relacionados a la estadística, matemática y economía,  también intervienen ciencias básicas, ingeniería de sistemas, electrónica, mecánica, entre otras disciplinas. “Cada vez se abre más a alumnos de distintas facultades y eso es muy enriquecedor”. 

Los interesados en ser parte del CIMFASC puede entrar a su página de Facebook para conocer las próximas convocatorias.


 Artículo de divulgación científica elaborado gracias al apoyo del Programa de Responsabilidad Social Universitaria (RSU-UNI) a través de su eje de apoyo a la investigación.