Posvet o modeliranju in statističnih vidikih COVID-19

31.05.2020 by Ana Slavec Komentiraj

V torek, 21. aprila, smo v okviru 4. srečanja Mlade sekcije SdS prek spleta organizirali posvet na temo Modeliranje in statistični vidiki COVID-19 v Sloveniji, na katerem smo soočili pet strokovnjakov, moderirala pa sva ga dr. Andrej Srakar in jaz. Dogodek je gostil Inštitut za biostatistiko in medicinsko informatiko (IBMI), pri organizaciji in promociji dogodka pa je sodelovala tudi skupina COVID-19 Sledilnik.

Poskrbljeno je bilo tudi za prenos v živo in na spletu si lahko takoj po dogodku ogledali posnetek večjega pogovora do 21. ure (01:50:05). Celoten posnetek (02:35:55), ki vključuje tudi končno razpravo, pa si lahko ogledate na YouTube kanalu Mlade sekcije.

Namen dogodka je bilo zbrati skupaj strokovnjake za to področje ter razpravljati o prednostih in slabostih modelov ter o njihovih predpostavkah. V tem prispevku povzemam predstavitve naših petih gostov ter njihove odgovore na vprašanja, ki so bila postavljena bodisi sproti v klepetalnici Webex bodisi preko aplikacije Sli.do, kjer smo jih zbirali že dan pred dogodkom.

COVID-19 in podatkovna odličnost (00:07:05, PDF)

9r1ksdom_400x400-1 Dr. Aleks Jakulin, profesor, raziskovalec in podjetnik, je predstavil skupnost Covid-19 sledilnik, v kateri koordinira modelsko delo. Povedal je, kako je prišel v stik z ekipo Sledilnika in zakaj se je aktiviral v tej skupnosti. Poudaril je pomen podatkovne odličnosti in hitrosti procesov, ki jih omogoča digitalna znanost 21. stoletja.

Na koncu smo ga vprašali (00:20:43), ali pozna kakšne podobne iniciative v tujini, ki so jih vzeli kot zgled. Odgovoril je, da gre za pri skupnosti unikat, vendar je omenil tudi nekaj podobnih projektov univerz (npr. Johns Hopkins COVID-19 Dashboard). Presenetilo pa ga je, da teh podatkov nima Svetovna zdravstvena organizacija.

Simulacija pandemije COVID-19 na socialnem omrežju Slovenije (00.23.25, PDF)

hu2dl5o4 Dr. Žiga Zaplotnik, podoktorski raziskovalec na področju meteorologije na Fakulteti za matematiko in fiziko UL, je predstavil model, v katerem je pandemijo bolezni COVID-19 simuliral na podlagi socialnega omrežja Slovencev ter predstavil učinke strategij na zadrževanje virusa (Zaplotnik et al. 2020). V zaključku predstavitve opozori, da večja kompleksnost modelov še ni zagotovilo za takojšnjo izboljšavo napovedi, vendar numerično napovedovanje vremena in klime kaže, da je to prava smer. Poudari, da je treba strateško razvijati ne le aplikativno, ampak tudi temeljno znanost, saj ne moremo vnaprej vedeti, kdaj bomo neko znanje potrebovali.

Po predstavitvi (00:44:12) smo mu postavili tri vprašanji iz klepeta in dve, ki sta bili postavljeni preko sli.do. Prvo se je nanašalo na vir IFR, tj. ocen stopnje smrtnosti (angl. Infection fatality ratio). To sta bila članek Verity et al. 2020 in še ena korejska študija, saj sta bili to edini, ki sta smrtnost ocenjevali glede na vse okužene, ne pa le glede na potrjene pozitivne primere. Drugo vprašanje se je glasilo “Kaj pa bi se zgodilo ob ponovnem povečanju stikov in v primeru, da je še vedno recimo 15 % okuženih?” Odgovor se lahko razbere iz simulacij, vendar moramo biti ob tem pozorni, saj so simulacije zelo občutljive na vhodne parametre. Tretje vprašanje je bilo o smiselnosti tega, da bi v model dali novo porazdelitev – kam bi konvergirala takšna iteracija? Žiga misli, da bi lahko konvergirala k pravi vrednosti, ampak z neveljavnimi parametri lahko tudi k napačni. Pri četrtem vprašanju, kakšen postopek navezovanja stikov je bil uporabljen v modelu, pojasni, da je verjetnost prenosa okužbe določena z vrednostmi prikazani na 4. prosojnici. Na peto vprašanje, kakšne prednosti ima model na osnovi grafa pred modeli SER in SEIR je Žiga odgovoril že v predstavitvi, in sicer, da ne predpostavi homogenega mešanja, ampak upošteva obstoj super prenašalcev, ki okužijo več ljudi, je torej bolj realističen.

Posnetek zaslona sredi predstavitve Žige Zaplotnika

Model SEIR za spremljanje in napovedovanje širjenja epidemije virusa COVID 19 v Sloveniji (00:48:41, PDF)

janez_zibert2-1 Izr. prof. dr. Janez Žibert, ki predava na Zdravstveni fakulteti in Fakulteti za računalništvo in informatiko UL, je predstavil napovedni model SEIR, katerega osnovna ideja je, da z diferencialnimi enačbami prve stopnje opisuje dinamiko prehajanja bolezni med dovzetnimi (Susceptible), izpostavljenimi (Exposed), okuženimi (Infectious) in ozdravljenimi (Recovered). Izpostavi prednosti in slabosti tega modela ter predstavitev zaključi z mislijo, da so vsi modeli napačni, a nekateri so uporabni.

Po predavanju smo mu postavili tri vprašanja iz klepeta (01:10:28). Najprej, ali je preveril, kako se njegov model oz. napovedi obnašajo, če zadnje dni oz tedne prekrijejo? Kakšna bi bila napaka pri napovedi? Odgovori, da napovedi delajo na trenutnih podatkih in delajo tudi validacije za nazaj, da ocenijo napako in ta se pojavlja predvsem pri skupnem številu umrlih. Nato, zakaj v modelu ni bila upoštevana prepoved zbiranja na javnih mestih? Odgovoril je, da njegov model sicer predvideva dve intervenciji, prehod med njima pa je zvezen, linearen in definiran s časovnim intervalom. S tem je lahko v modelu upošteval posledice ukrepov, če ti niso imeli prevelikega učinka na višino reprodukcijskega faktorja. In tretje, kako je v SEIR modelu ocenil posamezne vključene dejavnike, kjer je odgovoril, da so slednji navadno znani in se jih vključi v takšen model precej preprosto. V primeru pandemije COVID-19 ni bilo tako, zato jih je bilo potrebno oceniti prek optimizacijskih postopkov in dostopnih podatkov o preteklem poteku pandemije.

Ocena stopnje reprodukcije okužbe in deleža okuženih z virusom SARS-CoV-2 v Sloveniji (01:14:41, PDF)

2015-05-13-18-37-23-2_face_crop-1-e1587143805546 Prof. dr. Maja Pohar Perme, redna profesorica biostatistike in predstojnica Inštituta za biostatistik in medicinsko informatiko je predstavila model za oceno stopnje reprodukcije okužbe in deleža okuženih z virusom, ki je nastal na podlagi modela študije Flaxman et al (2020). V članku, ki ga pripravljajo z Damjanom Manevkim in Rokom Blagusom, so analizirali tudi razvoj epidemije po sprostitvi ukrepov. Ugotavljajo, da so bili dosedanji ukrepi uspešni, saj je stopnja reprodukcije pod ena, vendar je kumulativni delež okuženih zelo nizek in smo zelo daleč od kolektivne imunosti. Opozorila je, da je število potencialno kužnih posameznikov veliko, zato bi delna opustitev ukrepov lahko ponovno povečala stopnjo reprodukcije.

V razpravi po predstavitvi smo jo prosili, da odgovori na dva izmed komentarjev in dve izmed vprašanj, ki so se pojavila v klepetu (01:38:42). Najprej to, da je število umrlih neroden glavni parameter, saj močno uteži starejšo populacijo in je zato močno odvisen od stikov med starostniki v domovih za ostarele. S tem se je popolnoma strinjala in pojasnila, da so občutljivost modela na ta dejavnik preverili s tem, da so poskusili uporabiti različne stopnje smrtnosti. Drugi komentar, da je bi bilo mogoče manj šuma, če bi vedeli čas nastopa simptomov ter starost in spol za vsak primer smrti. V Sloveniji podatki nisi dovolj globoki, saj imamo na voljo le agregirane podatke in ne posamičnih primerov. Odgovorila je, da so najprej poskušali s precej kompleksnejšim modelom, ampak so ugotovili, da v Sloveniji nimamo ustreznih podatkov, kar zahteva ogromno predpostavljanja. Na njihovem inštitutu so se v zvezi s tem že povezali z Infekcijsko kliniko, da bi vzpostavili utrezno podatkovno bazo, vendar zaenkrat s tem še niso dovolj daleč. Na vprašanje, koliko lahko zaupamo napovedim glede na relativno veliko negotovost parametrov, je odgovorila, da gre za novo bolezen in je literature malo, zato se lahko za marsikatero predpostavko izkaže, da je napačna. Skušajo narediti najbolje, kar se s trenutno dosegljivim znanjem da. Zadnje vprašanje, ki smo ji ga postavili je bilo, koliko boljši bodo lahko postali modeli ob podatkih nacionalnega testiranja, ki se zdaj izvaja. Odgovorila je, da bo zanimivo videti rezultate raziskave, predvsem če bo pokazala več okuženih. Dodala pa je tudi, da z dostopnimi podatki žal bistveno drugačnih ocen ni bilo mogoče podati..

Komentar predstavljenih modelov z vidika zdravstvene in statistične stroke (01:44:26)

prenos Doc. dr. Tomaž Štupnik, predstojnik Kliničnega oddelka za torakalno kirurgijo UKC Ljubljana in magistrant programa Uporabna statistika, je delo prejšnjih govorcev pohvalil s komentarjem, da je matematika naredila svojo domačno nalogo, medicina pa je ni. Glede na to, da imamo registre za druge bolezni, meni, da bi ga lahko vzpostavili tudi za to, saj to ni tako zahtevno. Pričakoval bi, da bi zraven nastopila tudi zdravstvena zavarovalnica, saj je to njen interes, da je čim manj okuženih. Danes predstavljeni modeli bi se lahko v medicini lahko uporabljali pri številnih odločitvah, npr. kdaj odpreti oziroma zapreti nek dodaten oddelek.

Postavili smo tudi vprašanja iz klepetalnice (1:50:49). Na prvo, ali se je kakšen od teh modelov dejansko uporabil s strani naših naših odločevalcev pri postavitvi ukrepov, je odgovorila kar Pohar Perme, in sicer, da jih je kontaktirala Bojana Beović. Drugo, od kod potreba po vpletanju zavarovalnice – resda obstaja nuja po informatizaciji zdravstvenih podatkov, vendar naj bi tej podatki bili na voljo stroki, ne pa zavarovalnicam? Štupnik je odgovoril, da zavarovalnica te podatke že ima in za njih to ne bi bilo težko deliti ter s tem pomagati izboljšati modele.

Zaključna razprava

Tekom razprave po Štupnikovi predstavitvi je prišlo do prekinitve seje, vendar smo povezavo ponovno vzpostavili (01:53:38) in v omejeni zasebi nadaljevali z razpravo (01:55:14). Postavili smo tri vprašanja, ki so na slidu prejela največ glasov, in sicer:

Ali pričakujete, da vam bodo rezultati Nacionalne raziskave o razširjenosti bolezni COVID-19 na vzorcu 3000 prebivalcev Slovenije, pomagali izboljšati vaše modele?
Kateri so podatki, ki bi jih želeli uporabiti v svojih modelih, pa nimate dostopa do njih?
Čigave modele uporablja Vlada RS oziroma strokovni štab? Ali je kdo od avtorjev v kontaktu z njimi? Kako bi moralo to biti urejeno?

Ogromno vprašanj pa je ostalo neodgovorjenih, zato sva moderatorja naredila izbor teh vprašanj in goste prosila za pisne odgovore. Izključila sva nekaj vprašanj, ki se nama niso zdela dovolj povezana s temo ali ki so bila podobna že postavljenim vprašanjem. Njihove odgovore lahko preberete PDF dokumentu.

Naslednje srečanje Mlade sekcije bo potekalo v sredo, 3. junija 2020, in sicer se bosta dr. Vanja Erčulj in dr. Andrej Srakar pogovarjala z dr. Gajem Vidmarjem (URI Soča), Metko Zaletel (NIJZ), Miho Kaduncem (COVID-19 Sledilnik) in Aljažem Vindišem (3fs).

Avtor: Ana Slavec

Docentka na Fakulteti za matematiko, naravoslovje in informacijske tehnologije Univerz na Primorskem in svetovalka za statistiko na centru odličnosti InnoRenew CoE. Pred tem je bila sedem let raziskovalka na Fakulteti za družbene vede. Je članica upravnega odbora Društva mlada akademija in sokoordinatirica Mlade sekcije Statističnega društva Slovenije.