Cómo los datos de búsqueda de Google pueden predecir los brotes de COVID-19

https://www.freepik.com/premium-photo/chiang-mai-thailand-march-30-2020-woman-searching-information-about-covid-19-google-application_7516155.htm#page=1&query=covid%20google&position=28

Si bien algunos de los comportamientos que conducen a las infecciones por SARS-CoV-2 son claros, las nuevas oleadas de casos de COVID-19 no siempre siguen los patrones previstos.

Ahora, sin embargo, un estudio de investigadores del Instituto Courant de Ciencias Matemáticas de la Universidad de Nueva York describe un posible medio de detectar aumentos repentinos de infecciones antes de que ocurran a través del análisis de búsquedas en línea.

Los investigadores descubrieron una correlación entre un aumento en las búsquedas relacionadas con actividades fuera del hogar (actividades que podrían poner a las personas en riesgo de infección por SARS-CoV-2) y un aumento en los casos de COVID-19 entre 10 y 14 días después. Las infecciones disminuyeron cuando hubo un aumento en las búsquedas relacionadas con las actividades en el hogar.

La autora del estudio, Anasse Bari, profesora asistente clínica en el Instituto Courant, señala que los expertos ya han utilizado con éxito la minería de datos "en finanzas para generar inversiones basadas en datos, como estudiar imágenes satelitales de automóviles en estacionamientos para predecir las ganancias de las empresas".

"Nuestra investigación muestra que se podrían aplicar las mismas técnicas para combatir una pandemia al detectar, con anticipación, dónde es probable que ocurran brotes", dice la autora principal Megan Coffee de la División de Enfermedades Infecciosas e Inmunología de la Universidad de Nueva York (NYU). Escuela de Medicina Grossman.

Identificar con mayor precisión aquellos comportamientos que producen picos de infección puede ayudar a los epidemiólogos y a los legisladores a configurar de manera más efectiva las políticas públicas con respecto a cierres, encierros, etc.

El sistema que describe el documento de estudio evita problemas de privacidad al involucrar solo grandes grupos de datos anónimos.

El estudio aparece en Social Network Analysis and Mining .

Movilidad vs aislamiento

El primer paso de los investigadores fue desarrollar categorías basadas en frases de búsqueda o palabras clave que luego pudieran rastrear.

Las dos categorías clave que rastrearon se denominaron índice de movilidad e índice de aislamiento.

El equipo asignó ciertas búsquedas a la pista de índice de movilidad, incluidos "teatros cerca de mí", "boletos de avión" y otras consultas sobre actividades que implican salir de casa y estar en proximidad física con otros.

Como dice Bari, "cuando alguien busca la hora de cierre de un bar local o busca direcciones a un gimnasio local, dan una idea de los riesgos futuros que pueden tener".

Para la pista del índice de aislamiento, los investigadores recopilaron consultas de búsqueda, como "yoga en el hogar" o "entrega de alimentos", que indicaron una intención de permanecer en casa y aislado.

Los investigadores basaron su categorización de palabras clave en la encuesta Democracy Fund + UCLA Nationscape , un estudio en el que los encuestados enumeraron las cosas que harían si "se levantaran las restricciones sobre los consejos de los funcionarios de salud pública con respecto a las actividades".

La encuesta encontró que las tres actividades principales que la gente se perdía eran "ir a un estadio / concierto", "ir al cine" y "asistir a un evento deportivo".

Según Bari, "este es un primer paso hacia la creación de una herramienta que puede ayudar a predecir los aumentos repentinos de casos de COVID-19 al capturar actividades de mayor riesgo y la movilidad prevista, que las búsquedas de gimnasios y cenas en persona pueden iluminar".