Si bien algunos de los comportamientos que conducen a las infecciones por SARS-CoV-2 son claros, las nuevas oleadas de casos de COVID-19 no siempre siguen los patrones previstos.
Ahora, sin embargo, un estudio de investigadores del Instituto Courant de Ciencias Matemáticas de la Universidad de Nueva York describe un posible medio de detectar aumentos repentinos de infecciones antes de que ocurran a través del análisis de búsquedas en línea.
Los investigadores descubrieron una correlación entre un aumento en las búsquedas relacionadas con actividades fuera del hogar (actividades que podrían poner a las personas en riesgo de infección por SARS-CoV-2) y un aumento en los casos de COVID-19 entre 10 y 14 días después. Las infecciones disminuyeron cuando hubo un aumento en las búsquedas relacionadas con las actividades en el hogar.
La autora del estudio, Anasse Bari, profesora asistente clínica en el Instituto Courant, señala que los expertos ya han utilizado con éxito la minería de datos "en finanzas para generar inversiones basadas en datos, como estudiar imágenes satelitales de automóviles en estacionamientos para predecir las ganancias de las empresas".
"Nuestra investigación muestra que se podrían aplicar las mismas técnicas para combatir una pandemia al detectar, con anticipación, dónde es probable que ocurran brotes", dice la autora principal Megan Coffee de la División de Enfermedades Infecciosas e Inmunología de la Universidad de Nueva York (NYU). Escuela de Medicina Grossman.
Identificar con mayor precisión aquellos comportamientos que producen picos de infección puede ayudar a los epidemiólogos y a los legisladores a configurar de manera más efectiva las políticas públicas con respecto a cierres, encierros, etc.
El sistema que describe el documento de estudio evita problemas de privacidad al involucrar solo grandes grupos de datos anónimos.
El estudio aparece en Social Network Analysis and Mining .
Movilidad vs aislamiento
El primer paso de los investigadores fue desarrollar categorías basadas en frases de búsqueda o palabras clave que luego pudieran rastrear.
Las dos categorías clave que rastrearon se denominaron índice de movilidad e índice de aislamiento.
El equipo asignó ciertas búsquedas a la pista de índice de movilidad, incluidos "teatros cerca de mí", "boletos de avión" y otras consultas sobre actividades que implican salir de casa y estar en proximidad física con otros.
Como dice Bari, "cuando alguien busca la hora de cierre de un bar local o busca direcciones a un gimnasio local, dan una idea de los riesgos futuros que pueden tener".
Para la pista del índice de aislamiento, los investigadores recopilaron consultas de búsqueda, como "yoga en el hogar" o "entrega de alimentos", que indicaron una intención de permanecer en casa y aislado.
Los investigadores basaron su categorización de palabras clave en la encuesta Democracy Fund + UCLA Nationscape , un estudio en el que los encuestados enumeraron las cosas que harían si "se levantaran las restricciones sobre los consejos de los funcionarios de salud pública con respecto a las actividades".
La encuesta encontró que las tres actividades principales que la gente se perdía eran "ir a un estadio / concierto", "ir al cine" y "asistir a un evento deportivo".
Según Bari, "este es un primer paso hacia la creación de una herramienta que puede ayudar a predecir los aumentos repentinos de casos de COVID-19 al capturar actividades de mayor riesgo y la movilidad prevista, que las búsquedas de gimnasios y cenas en persona pueden iluminar".
El índice de movimiento neto
Los investigadores recopilaron datos de búsqueda de marzo a junio de 2020 de los 50 estados de Estados Unidos. Utilizaron Google Trends para rastrear tendencias en los datos, lo que les permitió desarrollar los índices de movilidad y aislamiento.
Los investigadores también crearon un "Índice de movimiento neto" para indicar la relación entre los dos índices. Un movimiento de red más alto indicó un cambio hacia las consultas de búsqueda de movilidad y lejos de las búsquedas de aislamiento.
Los autores escriben: "Teóricamente, esperamos que una disminución repentina en el movimiento neto (es decir, más personas que se quedan en casa) correspondería a una reducción en la propagación de COVID-19, con un retraso equivalente al período de incubación de COVID-19".
En 42 de los 50 estados, cada aumento en el movimiento de la red predijo con precisión un aumento de las infecciones por COVID-19 entre 10 y 14 días después.
Ayudando a los legisladores
Los autores del estudio exploraron la relación entre el índice de movilidad y las tasas de infección luego de la eliminación de las órdenes de quedarse en casa en cinco estados: Arizona, California, Florida, Nueva York y Texas.
Tras la implementación de cada bloqueo, el índice de movilidad había disminuido significativamente, reflejado de cerca por una reducción en las infecciones. Sin embargo, la flexibilización de las órdenes de quedarse en casa en Arizona, California, Florida y Texas precedió a un fuerte aumento en las búsquedas de tipo movilidad, seguida poco después por un aumento en el número de infecciones reportadas en junio de 2020.
Otro autor del estudio, Aashish Khubchandani, estudiante de la Universidad de Nueva York, concluye:
"A partir de este trabajo, esperamos construir una base de conocimientos sobre el cambio de comportamiento humano a partir de datos alternativos durante el ciclo de vida de la pandemia para permitir que el aprendizaje automático prediga el comportamiento en epidemias futuras".