Udomačena statistika

Mladi statistiki pišemo blog.

Anketa o simptomih COVID-19, 1. del: Opis vzorčenja in vprašalnika

1 komentar

Če uporabljate družabno omrežje Facebook, se vam verjetno je v zadnjih mesecih na vrhu novic enkrat ali večkrat pojavilo vabilo k sodelovanju v Anketi o COVIDU-19 za namene raziskave o javnem zdravju. Raziskavo izvaja Univerza v Marylandu, vodi pa jo prof. Frauke Kreuter, ena izmed vodilnih raziskovalk na področju anketne metodologije in izvoljena članica Ameriškega statističnega društva. Pri raziskavi sodelujejo tudi strokovnjaki s področja epidemiologije in zdravstvene politike, ki podatke uporabljajo za za modeliranje različnih scenarijev, kar je osnova za odločanje o ukrepih.

Slika: Vabilo na vrhu novic (levo) in Podrobnosti ankete (desno)

V raziskavo so zajeti polnoletni uporabniki Facebooka iz vseh držav sveta. Kot navajajo v opisu metodologije se vsak dan izbere presečni vzorec. Na tedenski ravni imajo 1,7 milijona sodelujočih. Sodelujoči so ponovno vabljeni k sodelovanju čez nekaj tednov ali mesecev, odvisno od gostote poselitve kraja, vendar njihovih odgovorov ne spremljajo longitudinalno.

Vprašalnik je bil preveden v več kot 50 različnih jezikov. Po uvodnem delu respondenta najprej vpraša po kraju, v katerem je prespal prejšnjo noč, nato pa o pojavnosti posameznih simptomov v zadnjih 24 urah. Gre za 13 simptomov, in sicer glavobol, utrujenost, izguba voha ali okusa, slabost, bolečine v mišicah, kašelj, težave z dihanjem, vročina, bolečine v očeh, bolečine v prsih, zamašen nos ali izcedek iz nosu, vneto grlo in mrzlica. 

Sledi vprašanje, ali so imeli v zadnjih 24 urah neposreden stik z osebo izven gospodinjstva – tiste, ki nanj pritrdilno odgovorijo pa vprašajo še, kako pogosto so v zadnjih sedmih dneh preživljali čas v zdravstvenih ustanovah, nosili maske, preživljali čas z osebami izven gospodinjstva, se počutili nemirno ali potrto.

V nadaljevanju jih zanima zaskrbljenost respondenta, da bi on ali nekdo od bližnjih zbolel za koronavirusno boleznijo, zaskrbljenost glede zalog hrane za naslednji teden in finančnih sredstev za naslednji mesec. Nato vprašajo po delovni aktivnosti v zadnjih sedmih dneh in pred tem ter niz demografskih vprašanj (spol, starost, število let izobraževanja, število sob v stanovanju, posedovanje pametnega telefona in namestitev aplikacij, povezanih s koronavirusom).

Najosnovnejši prikaz rezultatov ankete je dostopen na strani covid-survey.dataforgood.fb.com, kjer si je možno za izbrano državo ogledati pojavnost simptomov ter nekaj drugih statistik. Spodnja slika prikazuje rezultate za Slovenijo ter za štiri slovenske regije z zadostnim številom odgovorov. Prek aplikacijskega vmesnika je možno dostopati do agregiranih podatkov tako za ZDA kot tudi za ostale države, medtem ko se dostop do neagregiranih podatkov odobri le v raziskovalne namene na podlagi oddane prošnje.

Slika: Rezultati Ankete o COVID-19 za Slovenijo

Kakšna je kakovost teh podatkov? Ali jim lahko zaupamo? Bralci Udomačene statistike se boste morda spomnili, da sem pred meseci kritizirala portal covid-19-stats.si in podobne poskuse samoporočanja o simptomih COVID-19. Veliko omejitev, ki sem jih opisala v marčevski objavi, velja tudi za anketo Univerze v Marylandu: Facebook ne pokriva niti vseh slovenskih uporabnikov interneta, kaj šele celotne slovenske populacije (napaka nepokritja), določene enote v raziskavi ne sodelujejo (napaka neodgovora) in sodelujoči se pri poročanju o simptomih in v drugih odgovorih lahko motijo (merska napaka).

Kar anketo ločuje od portalov za samoporočanje – poleg vrhunskega raziskovalnega tima in daljšega nabora vprašanj – pa je to, da Facebook lahko za vzorčni okvir uporablja seznam svojih uporabnikov in pripravi verjetnostni vzorec, medtem ko pri portalih za samoporočanje verjetnostno vzorčenje ni možno. Facebook poleg tega raziskovalni skupini pomaga računati uteži, s katerimi popravljajo pristranost in izboljšujejo reprezentativnost vzorca.

Z Andrejem Virščkom sva pripravila analizo agregiranih podatkov za Slovenijo, ki je predstavljena v drugem delu prispevka.

Avtor: Ana Slavec

Svetovalka za statistiko na centru odličnosti InnoRenew CoE. Pred tem je bila sedem let raziskovalka na Fakulteti za družbene vede. Je članica upravnega odbora Društva mlada akademija, urednica bloga Udomačena statistika ter sovoditeljica Meta PHoDcasta. Na Twitterju je @aslavec.

One thought on “Anketa o simptomih COVID-19, 1. del: Opis vzorčenja in vprašalnika

  1. Pingback: Anketa o simptomih COVID-19, 2. del: Analiza agregiranih podatkov za Slovenijo | Udomačena statistika

Oddajte komentar

Fill in your details below or click an icon to log in:

WordPress.com Logo

Komentirate prijavljeni s svojim WordPress.com računom. Odjava /  Spremeni )

Google photo

Komentirate prijavljeni s svojim Google računom. Odjava /  Spremeni )

Twitter picture

Komentirate prijavljeni s svojim Twitter računom. Odjava /  Spremeni )

Facebook photo

Komentirate prijavljeni s svojim Facebook računom. Odjava /  Spremeni )

Connecting to %s