Udomačena statistika

Mladi statistiki pišemo blog.

Posvet o vizualizaciji zdravstvenih podatkov

1 komentar

Pregovor, da slika velja več kot 1000 besed se je ponovno izkazal za resničnega na 5. srečanju Mlade sekcije Statističnega društva Slovenije na temo vizualizacije zdravstvenih podatkov, ki je potekalo v sredo, 3. 6. 2020, preko aplikacije Zoom v gostovanju Fakultete za management Univerze na Primorskem in s prenosom v živo. V virtualnih gosteh so bili štirje gostje, ki se intenzivno ukvarjajo s prikazom podatkov, dogodek pa sva moderirala skupaj z dr. Andrejem Srakarjem.

Prvi gost, izr. prof. dr. Gaj Vidmar (Skladnost – mere in prikaz; od 00:05:37 naprej), vodja oddelka za biostatistiko in informatiko na URI Soča, je govoril o teoretičnih načelih, ki veljajo za kakovostno in razumljivo vizualizacijo ter predstavil nekaj primerov vizualizacij na področju ugotavljanja skladnosti med ocenjevalci, instrumenti in merami. Opozoril je na načela prikaza podatkov pionirja na tem področju, Edwarda Tuftea, ki veljajo še danes. Tufte je zagovarjal grafično odličnost v nasprotju z risbosmetjem (Slika 1a). Prikaz podatkov mora biti poveden in preprost, brez odvečnih vizualnih elementov, ki niso nujni za razumevanje podanih informacij. Priporoča, da je faktor lažnjivosti (Slika 1b), razmerje med velikostjo učinka v podatkih in na grafikonu, čim bliže 1. To pravilo, na primer, kršijo vsi 3D grafikoni ter grafikoni z izhodiščem, neenakim 0. Predlaga, da naj bo razmerje podatki – črnilo, razmerje med črnilom za podatke in skupnim črnilom na grafikonu (Slika 1c), čim večje. Posledica izbrisa črnila iz dela grafikona, ki predstavlja podatke, bi bila ob doslednem upoštevanju tega pravila, prazna slika.

220px-macedonian_statistical_regions_-_it

Slika 1a: Primer risbosmetja: barve niso povedne (Vir: Wikipedija)

liefactor_doctor

Slika 1b: Primer faktorja lažnjivosti enakega 2,8 (Tufte, 1991)

calorie

Slika 1c: Neustrezno razmerje med podatki in črnilom (Vir: adexpertise.blogspot.com)

Tufte je hkrati avtor iskrnih črt (angl. sparklines), preprostih, a sporočilnih miniaturnih grafikonov, ki so nam danes zelo znani. Iskrne črte za prikaz podatkov uporabljajo tudi na Covid-19 Sledilniku (Slika 2). Eden od gostov je bil tehnološki direktor podjetja Sinergise in eden osrednjih oblikovalcev vizualizacij podatkov o koronavirusni bolezni v okviru projekta Sledilnik, Miha Kadunc (Grafični_prikazi_na COVID-19 Sledilnik; od 01:09:40 naprej).

sledilnik1

Slika 2: Uporaba iskrnih črt (Vir: Covid-19 Sledilnik).

Prikazi stanja COVID-19 so nastali s skupnimi močmi snovalcev strani COVID-19, ki prihajajo iz različnih strokovnih področij. Pomemben del razumevanja prikazov je bil razvoj terminologije za spremljanje bolezni. Podatki so bili pridobljeni iz različnih prosto dostopnih virov in se enkrat ali dvakrat dnevno osveževali. Na grafikonih je bilo treba označiti pomembne mejnike, ki bi lahko vplivali na interpretacijo prikazanih podatkov. Tako so avtorji prišli na idejo prikaza in poimenovanja posameznih faz spremljanja bolezni (Slika 3). Na dogodku so bili predstavljeni nekateri grafični prikazi, ki še niso javno dostopni, ter vizualizacija širjenja nove koronavirusne bolezni po slovenskih občinah. Na Sledilniku razmišljajo tudi o možnih razširitvah prikazov na podnebne, ekonomske in druge pomembne družbene ali okoljske spremembe.

 

sledilnik2

Slika 3: Covid-19 skozi čas (Vir: Covid-19 Sledilnik).

 

Tuftejeva načela prikaza zdravstvenih podatkov upoštevajo tudi na Nacionalnem inštitutu za javno zdravje (NIJZ), katerega ključne funkcije so spremljanje zdravja in zdravstvenega varstva, analize in raziskave s področja javnega zdravja, razvoj programov in upravljanje preventivnih programov, promocija zdravja, obvladovanje tveganj s področja nalezljivih bolezni in okolja ter vodenje projektov e-zdravje in SVIT. NIJZ zbira podatke in informacije z vseh področij zdravja in uporabe zdravstvenega sistema in je glavna kontaktna točka za poročanje mednarodnim organizacijam. Naša gostja je bila gospa Metka Zaletel (Vizualizacija_podatkov o zdravju in zdravstvenem varstvu – izzivi, zmote in dosežki; od 00:46:57 naprej), predstojnica zdravstvenega podatkovnega centra na Nacionalnem inštitutu za javno zdravje, ki je na praktičnih primerih ilustrirala nekatere izzive, s katerimi se srečujejo pri pripravi grafičnih prikazov. Poslužujejo se t.i. infografik ali informacijskih grafik s katerimi skušajo informacije podati na razumljiv način in jih narediti bolj atraktivne. Z leti praktičnih izkušenj so prišli do ugotovitve, da so najbolj razumljive za bralca preproste vizualizacije podatkov (primer razvoja infografike poškodb pri delu je prikazan na Sliki 4), ki upoštevajo Tuftejevo priporočilo odsotnosti risbosmetja. Prihodnost vidijo v krepljenju timov, ki se ukvarjajo z vizualizacijami, razvoju interaktivnih vizualizacij, podpori podatkovnemu portalu in avtomatiziranemu generiranju vizualizacij.

nijz

Slika 4: Nastajanje grafičnega prikaza poškodb pri delu (NIJZ).

Prikaz zdravstvenih informacij na mikropodročju zdravstvene statistike, to je skladnosti med ocenjevalci in merami, lahko poteka na več načinov. Najbolj znan prikaz, test-retest številskih podatkov ali ujemanje številskih mer, je Bland-Atmanov grafikon (Slika 5a). Gaj Vidmar je poudaril, da je članek Blanda in Altmana, ki predstavi ujemanje meritev z izračunom razlike med pari merjenj in s prikazom povprečne razlike ter mej ujemanja, eden najbolj citiranih člankov nasploh. Najbolj znane mere skladnosti pri številskih podatkih pa so intraklasni koeficient korelacije, katerega posebna oblika je tudi znani Cronbachov koeficient alfa. V medicini se (sicer redkeje) za prikaz skladnosti med številskimi merami uporablja tudi mehurčkasti konkordančni diagram (Slika 5b). Črtkana črta predstavlja popolno ujemanje mer, velikost mehurčka pa število preiskovancev z določeno kombinacijo vrednosti na spremenljivkah.

blandaltmanov

Slika 5a: Prikaz ujemanja med testi in merami (Bland-Altmanov grafikon)

mehurckasti

Slika 5b: Mehurčkasti diagrm (Vir: pubmed)

Najbolj znana mera ujemanja med urejenostnimi podatki (rangiranji) je koeficient konkordance, ki zavzame vrednosti med 0 in 1. Tudi za prikaz konkordance so se uporabljali mehurčni konkordančni diagrami, sorodni tistemu na Sliki 5a ali pa konkordančni diagrami z vzporednima osema (Slika 6 levo). Inovativen prikaz v polarnih koordinatah je bil diagram blazinice z bucikami (slika 6b), kjer je pri popolni konkordanci prikazana le navpična črta, dolžina daljice pa prikazuje število razlik.

konkordanca

Slika 6a: Konkordančni diagram z vzporednima osema

blazinice

Slika 6b: Diagram blazinice z bucikami

Za ugotavljanje skladnosti med ocenjevalci v imenskih spremenljivkah, se najpogosteje uporablja Cohenov koeficient kappa (dva ocenjevalca in dve kategoriji) in Fleissova kappa (več ocenjevalcev ali kategorij). Za prikaz skladnosti med dvojiškimi in urejenostnimi spremenljivkami se uporablja Bangdiwalov grafikon (Slika 7).

bangdiwalov

Slika 7: Bangdiwalov grafikon

Področje skladnosti med ocenjevalci se lahko prenese tudi na snovalce grafičnih prikazov, ki se morajo ujemati pri ocenjevanju kakovosti lastnega grafičnega prikaza. Tudi o tem (med drugim) je spregovoril Aljaž Vindiš (Podatki & oblikovanje: Od vsebin do produktov; od 01:34:38 naprej), načrtovalec digitalnih produktov v podjetju 3fs in nekdanji oblikovalec infografik v Dnevnikovi prilogi Objektiv. Za slednje je bilo uredništvo za leto 2012 nagrajeno s Priznanjem za odličnost statističnega poročanja v medijih Statističnega društva Slovenije. Pri pripravi infografik je sodelovala interdisciplinarna ekipa, katere odločitev, ali je infografika primerna za objavo, je morala biti sprejeta soglasno, drugače se infografika ni objavila v časopisu. Za namen izboljšanja kakovosti podatkov in njihovega prikaza so pri pripravi grafičnih prikazov sodelovali tudi z javnimi institucijami (SURS, NIJZ), večino dela pa je bilo opravljenega znotraj ekipe. Priloga Objektiv je za sedem infografik, objavljenih v letu 2013, dobila mednarodno nagrado Malofiej, ki jo strokovnjaki neuradno imenujejo Pulitzerjeva nagrada za infografiko. Nekatere infografike so prikazovale tudi zdravstvene podatke, na primer incidenco, umrljivost, grobo in starostno standardizirano stopnjo za različne vrste raka (primer za melanom na sliki 8).

melanom

Slika 8: Primer infografike (Dnevnik, 14.3.2015)

Bogate izkušnje s prikazom podatkov so vodile do nekaterih pomembnih spoznanj, med drugim, da je upodobitev lahko raziskovalno orodje in ne le končni izdelek, ki mora temeljiti na podatkih samih in ne na avtorski ideji. Podatki morajo biti predstavljeni na zanimiv način, da se lahko vanje končni uporabniki poglobijo. Zelo pomembna je integriteta prikaza podatkov, brez zavajanja uporabnikov k napačnim zaključkom.

V podjetju 3fs, kjer Aljaž trenutno dela, pripravljajo orodja za upodobitev podatkov, kjer iščejo pomembne vzorce v podatkih. Predstavljenih je bilo nekaj orodij, razvitih v podjetju, ki omogočajo branje podatkov iz različnih virov, njihovo vizualizacijo ter jasne in uporabniku prijazne in relevantne informacije v obliki navodil.

Zelo pomembno področje prikaza podatkov je tudi človečnost, ki se v prikazu dejstev velikokrat izgubi. Na Sliki 9 je izsek iz infografike, ki pri upodobitvi umrlih za novim koronavirusom upošteva tudi človeški vidik.

nyt

Slika 9: Prikaz izseka infografike iz časopisa New York Times, ki upošteva človeški vidik prikaza podatkov

Človeški vidik se na primer upošteva tudi pri aplikaciji, ki je na voljo za izvajalce prve pomoči in zdravnike, in s pomočjo navidezne resničnosti (uporaba očal VR) prikaže osebo, ki potrebuje oživljanje. Simulacija je mnogo bolj človeška kot lutka, ki jo trenutno uporabljajo za ta namen v Univerzitetnem kliničnem centru.

Srečanje Mlade sekcije Statističnega društva se je zaključilo s sklepnimi mislimi gostov. Pri tem se je ponovno izkazal za resničnega navedek Edwarda Tufteja:

Grafična odličnost je tista, ki da posamezniku največje število idej v najkrajšem možnem času z najmanj črnila na najmanjšem prostoru.

Se vidimo na naslednjem srečanju!

 

Avtor: Vanja Erčulj

Sem psihologinja in doktorica družboslovne statistike, zaposlena kot predavateljica na Fakulteti za varnostne vede Univerze v Mariboru. Ukvarjam se z veljavnostjo in zanesljivostjo merjenja, tekstovnim rudarjenjem, varnostjo v lokalnih skupnostih in strukturnim modeliranjem.

One thought on “Posvet o vizualizaciji zdravstvenih podatkov

  1. Pingback: Dejavnost predaavateljev - junij 2020 | Fakulteta za varnostne vede

Oddajte komentar

Fill in your details below or click an icon to log in:

WordPress.com Logo

Komentirate prijavljeni s svojim WordPress.com računom. Odjava /  Spremeni )

Google photo

Komentirate prijavljeni s svojim Google računom. Odjava /  Spremeni )

Twitter picture

Komentirate prijavljeni s svojim Twitter računom. Odjava /  Spremeni )

Facebook photo

Komentirate prijavljeni s svojim Facebook računom. Odjava /  Spremeni )

Connecting to %s