Udomačena statistika

Mladi statistiki pišemo blog.

Zakaj nas mora skrbeti ogrožena neodvisnost SURS

Komentiraj

V varni sobi Statističnega urada RS visi plakat, na katerem je naštetih 16 načel kodeksa ravnanja evropske statistike, med katerimi je na prvem mestu strokovna neodvisnost statističnih organov od drugih političnih, nadzornih ali upravnih oddelkov ali organov, pa tudi od zasebnega sektorja. Brez strokovne neodvisnosti ni možno zagotavljati verodostojnosti statistik.

Ta neodvisnost je bila ogrožena maja letos, ko je bil brez razloga in nekrivdno razrešen Bojan Nastav, ki je bil na mesto generalnega direktorja SURS imenovan avgusta lani, potem ko je bil izbran kot najprimernejši kandidat na javnem razpisu. O tem, ali je bila razrešitev zakonita, stroka ni enotna. Dejstvo pa je, da to, da lahko Zakon o javnih uslužbencih povozi Zakon o državni statistiki (ZDSta), pomeni grožnjo strokovni neodvisnosti državnega statističnega sistema in s tem neusklajenost s prvim načelom zgoraj omenjenega kodeksa.

Še bolj zaskrbljujoč pa je kontekst, v katerem je prišlo do razrešitve. Čeprav ob razrešitvi niso bili podani nobeni razlogi, je kasneje vlada odločitev utemeljevala z Nastavovo neodzivnostjo. Portal Necenzurirano.si je razkril, da je do razrešitve prišlo, ker SURS vladni svetovalni skupini ni bil pripravljen dovoliti brezpogojnega dostopa do varovanih podatkov, ki jih zbira o slovenskem gospodarstvu. Skupina naj bi zaradi zapletenih postopkov anonimizacije podatkov do njih lahko dostopala šele po več mesecih.

Na podlagi odzivov v medijih in na socialnih omrežjih opažam, da del javnosti ne razume, kaj je sploh vloga SURS-a, zakaj ti podatki niso odprto dostopni in zakaj do teh podatkov vlada ali njena posvetovalna skupina ne moreta kar tako (prosto) dostopati. Postavljeno zahtevo opravičujejo s tem, da se je podatke nujno potrebovalo za pripravo protikriznih ukrepov in odstavljenemu direktorju očitajo paragrafarstvo.

lahkovnik

Zaslonska slika tvita Mateja Lahovnika (Vir: Twitter)

Tudi Matej Lahovnik, vodja posvetovalne skupine, v tvitu skuša varnostne postopke SURS-a prikazati kot slovensko posebnost, vendar imajo tudi druge države znotraj Evropskega statističnega sistema vzpostavljene podobne postopke, saj so zavezane k varovanju zaupnih podatkov. Da sploh lahko zaprosite za dostop do mikropodatkov Eurostata, mora biti vaša institucija na seznamu raziskovalnih organizacij, ki jih prepoznava, nato pa postopek pridobivanja dostopa do mikropodatkov traja od osem do deset tednov. Ne vem, kako dolg je postopek v statističnih uradih drugih evropskih državah, lahko pa opišem svojo izkušnjo s SURS. Ko sem nazadnje zaprosila za podatke, sem bila opozorjena, da bo zaradi večjega obsega dela postopek morda trajal več kot tri mesece, nato pa sem podatke dobila v dvanajstih tednih. Verjamem pa, da je v preteklosti oziroma v primeru priprave kompleksnejših podatkovij to lahko trajalo tudi dlje.

Problema dolgotrajnosti postopka pridobivanja podatkov se je zavedal tudi Nastav, saj je, kot v uvodniku letošnjega Biltena Statističnega društva Slovenije (str. 6) opisuje prof. Matevž Bren, v svojem kratkem mandatu direktorja organiziral skupen sestanek za uporabnike podatkovnih baz SURS, na katerem so iskali predloge za izboljšave pogojev sodelovanja in dela raziskovalcev. Da delajo na tem, da bi postopki bili krajši, je povedal tudi, ko smo ga to vprašali na drugem srečanju Mlade sekcije društva. Torej je Lahovnik v odgovorih na zgornji tvit Nastava zmotno obtožil, da je skrbel za status quo.

SURS bi v primeru Lahovnikove skupine morda izjemoma lahko bistveno pohitril postopek in jim pravočasno omogočil dostop do podatkov, vendar se sprašujem, ali bi v tako kratkem času skupina sploh lahko pripravila kakovostno analizo. Poleg tega bi dostop dobili le do podatkov za pretekla obdobja, saj najnovejši podatki verjetno sploh še niso bili prečiščeni in pripravljeni za objavo. Tudi v drugih državah mikropodatki za najnovejše obdobje postanejo dostopni z določenim zamikom, zato bi bilo zanimivo izvedeti, kako so se pridobivanja podatkov in priprave ukrepov lotili v drugih državah.

V času, ko se raziskovalci, vključno z mano, zavzemamo za vrednote odprte znanosti, se strogo varovanje nekih podatkov morda res zdi paradoksalno, vendar tudi v okviru gibanja za odprte podatke pri dostopnosti velja načelo “toliko odprti, kot je mogoče, toliko zaprti, kot je potrebno”. Že pri delu z običajnimi raziskovalnimi podatki je treba upoštevati določene etične in pravne vidike povezane z varstvom podatkov in pridobivanjem soglasja udeležencev. Pri uradnih podatkih pa je zaščita še toliko bolj pomembna.

Zakon o državni statistiki ni sam sebi namen in pravila glede dostopa do podatkov obstajajo z razlogom. Ne glede na nujnost zahteve je treba razumeti, zakaj ima SURS poseben status. Kot je v začetku junija v Sobotni prilogi pojasnil Rudi Seljak, višji svetovalec na SURS, so podatki, ki jih urad zbira, podlaga za veliko administrativnih in drugih uradnih predpisov, zato imajo že majhne razlike v rezultatih lahko velike posledice. Spomnimo se implikacij primera nezanesljivih podatkov o argentinski inflaciji ter o grškem državnem dolgu.

Za zagotavljanje kakovosti uradnih podatkov je ključno imeti zaupanje dajalcev podatkov (tako fizičnih kot pravnih oseb), da je njihova identiteta varovana in bodo podatki uporabljeni le za statistične namene. SURS se zato glede na tip uporabnika odloči za postopek zaščite. Pri datotekah namenjenih javnosti (javni mikropodatki), so informacije zato precej okrnjene. Pri datotekah za raziskovalce je izguba podatkov sicer manjša, vendar mora raziskovalec podpisati tudi pogodbo, v kateri se zaveže, da bo podatke uporabljal izključno za namen, za katerega mu je bil omogočen dostop in jih ne bo posredoval ali drugače razkril katerikoli tretji osebi.

Statistična zaščita mikropodatkov ni trivialen proces, saj ne zadostuje odstranitev direktnih identifikatorjev (npr. davčna številka podjetja), ampak je treba poskrbeti tudi za zakritje indirektnih identifikatorjev. To so spremenljivke, ki lahko v kombinaciji z drugimi spremenljivkami privedejo do razkritja enote, še posebej pri redkih kombinacijah, kjer obstaja velika verjetnost prepoznanja enote (npr. iz kombinacije števila zaposlenih, področja in občine lahko sklepamo,  za katero konkretno podjetje gre).

Ko so podatki pripravljeni, lahko raziskovalec, odvisno od občutljivosti podatkov, do njih dostopa na daljavo ali pa mu je dostop omogočen le v varni sobi. Raziskovalci, ki delamo v varni sobi, moramo ravnati v skladu z navodili za delo v varni sobi. Vsak obisk je treba najaviti vsaj en dan vnaprej in se ob prihodu in odhodu elektronsko evidentirati. Vanjo ne smemo vnašati nobenih naprav, ki bi omogočale iznos podatkov ali podatkovnih zbirk, torej moramo zunaj pustiti tudi mobilni telefon. Če želimo rezultate analiz izvoziti, moramo izpolniti obrazec za pregled izhodnih datotek z vidika statistične zaščite podatkov. Vsako datoteko pregleda oseba, odgovorna za statistično zaščito podatkov, šele nato lahko rezultate analiz prejmemo po elektronski pošti.

Vsi ti strogi protokoli so vzpostavljeni zaradi statistične zaupnosti in varstva podatkov, ki sta predmet petega načela uvodoma omenjenega Kodeksa ravnanja evropske statistike. Če dajalcem podatkov zaupnost ne bi bila zagotovljena, ti namreč ne bi bili pripravljeni sodelovati v raziskavah ali pa bi navajali lažne podatke. Nespoštovanje zaupnosti torej lahko ogrozi kakovost statističnih podatkov. Zato ni čudno, da je nad dogajanjem zaskrbljen tudi Eurostat.

Rudi Seljak v Sobotni prilogi ekonomistom, ki so želeli do podatkov dostopati mimo postavljenih pravil, očita, da so s tem uničili trud vseh, ki se zavzemajo za popolno strokovno neodvisnost statistike. Njihov pritisk je tudi v nasprotju z etičnim kodeksom Univerze v Ljubljani, kjer so zaposleni. Ta namreč med drugih zahteva, da raziskovalci upoštevajo zaupnost podatkov ter da so družbeno odgovorni in se izogibajo povzročanju škode. Taka škoda pa lahko pri uporabi varovanih podatkov nastane tudi nenamerno.

Za konec bi izpostavila še trinajsto načelo evropskega kodeksa, pravočasnost in točnost objavljanja, ki med drugim pravi, da naj se pri pogostosti objavljanja v čim večji meri upoštevajo zahteve uporabnikov. Potrebe uporabnikov po podatkih naraščajo in uradna statistika se jim bo morala, če bo želela ostati relevantna zanje, prilagoditi in posodobiti svoje delovne procese. Informacijska tehnologija se hitro razvija in obstajajo rešitve, s katerimi se postopke ravnanja s podatki lahko optimizira brez ogrožanja njihove varnosti in zaupnosti dajalcev. Ta prehod pa se žal ne more zgoditi iz danes na jutri, ampak zahteva svoj čas.

 

P. S. Po objavi sem izvedela za intervju z Bojanom Nastavom v Sobotni prilogi. Na vprašanje glede sodelovanja z Lahovnikovo skupino je odgovoril:

“Na povpraševanje ljudi iz te skupine smo se odzivali z razlago, kateri podatki so (že) na voljo in kako se do njih pride. Pojasnili smo tudi, da je posredovanje podatkov Lahovnikovi skupini za nas prioritetna naloga. Varna soba je bila med epidemijo sicer zaprta, a če bi dobili vlogo za dostop do podatkov v tej sobi, bi jo odprli.” (Sobotna priloga, 20. 6. 2020)

Avtor: Ana Slavec

Svetovalka za statistiko na centru odličnosti InnoRenew CoE. Pred tem je bila sedem let raziskovalka na Fakulteti za družbene vede. Je članica upravnega odbora Društva mlada akademija, urednica bloga Udomačena statistika ter sovoditeljica Meta PHoDcasta. Na Twitterju je @aslavec.

Oddajte komentar

Fill in your details below or click an icon to log in:

WordPress.com Logo

Komentirate prijavljeni s svojim WordPress.com računom. Odjava /  Spremeni )

Google photo

Komentirate prijavljeni s svojim Google računom. Odjava /  Spremeni )

Twitter picture

Komentirate prijavljeni s svojim Twitter računom. Odjava /  Spremeni )

Facebook photo

Komentirate prijavljeni s svojim Facebook računom. Odjava /  Spremeni )

Connecting to %s