Forskere ved Northeastern bruger Google Cloud Platform til at skabe modeller af zikavirussens udbredelse

Northeastern Universitys MoBS-team (Modeling of Biological and Socio-technical Systems) havde brug for hurtigt at lave en model af zikavirussen. Ved hjælp af GCE og Preemptible Virtual Machines (virtuelle maskiner, der kan standses) har MoBS kørt mere end 10 millioner simuleringer og har reduceret tiden til dataanalyser markant.

I 2015 da den myggebårne zikavirus hurtigt spredte sig i Nord- og Sydamerika, blev der udstedt rejseforbud og karantæner, og der blev endda opfordret til at aflyse de olympiske lege, som skulle afholdes i Brasilien i 2016. Da Verdenssundhedsorganisationen WHO erklærede en international folkesundhedsmæssig nødsituation, havde regeringerne i de berørte lande brug for en måde, hvorpå de med stor nøjagtighed kunne forudsige antallet og steder med nye infektioner. Eftersom kun 20 procent af alle zikatilfælde er symptomatiske, er det en særligt udfordrende virus at forudsige.

I januar 2016 igangsatte MoBS-teamet på Northeastern University det såkaldte Zika Modeling Project med støtte fra Center for Inference and Dynamics of Infectious Diseases for at hjælpe myndighederne og forskere med at få en bedre forståelse af virussens udvikling og spredning.

Det siger forskerne

"Ved at bruge big data og massiv computerkraft håber vi på at hjælpe forskere og det offentlige sundhedsvæsen."

Matteo Chinazzi, Associate Research Scientist, Northeastern University

GCP: Leverer vigtige forudsigelsesværktøjer, analyseværktøjer og meget mere

Ved hjælp af en matematisk og beregningsbaseret tilgang, hvor man har brugt Google Cloud Platform (GCP), har teamet studeret forskellige scenarier for, hvordan zikavirussen kunne spredes, og forudsagt dens indvirkning på de berørte befolkninger. Modellen er baseret på den første spredning af zikavirussen i Brasilien, hvor den brød ud i 2015. Forskerne kan nu forudsige indvirkningen af nye smitteudbrud andre steder ved at anvende yderligere datalag, herunder temperatur, antal myg, befolkningsstørrelse og folks rejsemønstre.

Med GCP kan teamet køre flere forskellige parallelle simuleringer, og de kan analysere flere terabyte data, der er genereret ud fra de modellerede scenarier. "Vi bruger flere forskellige GCP-produkter," siger Matteo Chinazzi, Associate Research Scientist på Northeastern University. "Google Cloud Storage fungerer som lagerplads for alle vores modeldata og hoster vores website. Google Compute Engine (GCE) og Preemptible Virtual Machines (virtuelle maskiner, der kan standses) kører simuleringer af sygdommens spredning. Google BigQuery undersøger de simulerede scenarier, hvoraf hver enkelt omfatter variabler som f.eks. datoer og antal infektioner. Indtil videre har vi behandlet en kolossal mængde data – hundredvis af terabytes i alt. Og der er plads til det hele i Google Cloud Storage."

Hurtige resultater i stor skala

Ved brug af GCE og Preemptible Virtual Machines (virtuelle maskiner, der kan standses) har MoBS kørt mere end 10 millioner simuleringer. GCE og BigQuery har reduceret tiden til udførelse af simuleringer og analyser af data markant. (Begge prodesser tager nu timer i stedet for uger). "Vi har mulighed for at skalere op til adskillige tusinde uafhængige virtuelle tilfælde parallelt," siger han. "Så vi kan generere en komplet analyse for et enkelt scenarie for et udbrud af en smitsom sygdom – som kan bestå af op til 250.000 uafhængige simuleringer – på mindre end en dag."

Denne model, der har givet forskerne mulighed for at få større indsigt i spredningen af zikavirussen, vil muligvis også kunne fungere som en skabelon til at analysere andre epidemier som f.eks. denguefeber. Selvom zikavirussen ikke længere udgør en international krise, som den på det tidspunkt blev erklæret af WHO, kræver det stadig en stor indsats at forhindre udbrud af myggebårne sygdomme. Ved hjælp af big data og ubegrænset datakraft håber teamet på MoBS at kunne hjælpe forskere og det offentlige sundhedsvæsen med at opnå dette.

"Tiden spiller en altafgørende rolle, når vi står over for udbrud af en smitsom sygdom," siger Chinazzi. "Og med GCP har vi de nødvendige værktøjer til at reagere hurtigt og i stor skala."

Hvis du vil vide mere om den forskning og det analysearbejde, der er udført af MoBS-teamet vedrørende zikavirussen, kan du læse "Spread of Zika virus in the Americas", som er udgivet af Proceedings of the National Academy of Sciences of the United States of America.

Det siger forskerne

"Vi har mulighed for at skalere op til adskillige tusinde uafhængige virtuelle instanser parallelt, så vi kan generere en komplet analyse for ét enkelt scenarie for et udbrud af en smitsom sygdom – som kan bestå af op til 250.000 uafhængige simuleringer – på mindre end en dag."

Matteo Chinazzi, Associate Research Scientist, Northeastern University

Organisationsprofil

MoBS-teamet (Modeling of Biological and Socio-technical Systems) på Northeastern University har fokus på at udvikle datadrevne modeller for spredningen af smitsomme sygdomme, studere menneskers sociale adfærd, modellere udviklingen af komplekse sociale og teknologiske netværk, fastlægge brugen af og trafikmønstre i teknologiske netværk som f.eks. internettet, og studere interaktionen mellem den sociale dynamik og adfærden på nettet.

Anvendte produkter

Tak for din tilmelding

Fortæl os mere om dine interesser.