Udomačena statistika

Mladi statistiki pišemo blog.

Pogovor z Gregorjem Sočanom

Komentiraj

Gregor Sočan je študiral na univerzah v Ljubljani in Groningenu. Trenutno je izredni profesor za psihološko metodologijo na Filozofski fakulteti Univerze v Ljubljani, kjer sodeluje pri izvajanju predmetov s področja psihometrije in uporabne statistike v okviru programov Psihologija, Kognitivna znanost, Uporabna statistika, Statistika ter Humanistika in družboslovje. Njegovi interesi obsegajo multivariatno analizo, metode točkovanja testov, ocenjevanje zanesljivosti in merske invariantnosti ter aplikacijo multivariatnih in psihometričnih metod v psihologiji osebnosti, razvojni psihologiji, zdravstvu in drugod.

Gregor Sočan | Filozofska fakulteta Univerze v Ljubljani
  1. Študirali ste psihologijo. Kaj je v vas zbudilo zanimanje za statistiko?

Zanimanje za merske probleme – v psihologiji je namreč merjenje zelo tesno povezano s statistično analizo. Na začetku študija sem bil sicer zelo prototipičen študent psihologije, ki mu je statistika bolj kot ne odveč. Vendar sem si predvsem ob študiju kognitivne psihologije in psihologije osebnosti ustvaril mnenje, da imamo v psihologiji še vedno velike težave z dobrim merjenjem in da to tudi zavira njen strokovni in znanstveni napredek. Stanje se je od takrat nekoliko (čeprav ne radikalno) izboljšalo, vsekakor pa sem svojo kariero zapeljal na področje psihometrije in uporabne statistike.

  1. Kako bi laiku pojasnili uporabnost statistike v vsakdanjem življenju? Lahko podate primer (anekdoto) ali pogled, kako statistika dviguje kakovost življenja ljudi?

V času »pametnih algoritmov« in epidemije – ko celo v splošnih medijih redno srečujemo pojme s področja statističnega modeliranja – je verjetno vsakomur jasno, kako pomembni so podatki za državne in poslovne odločevalce. Sam si sicer ne bi upal tako optimistično trditi, da statistika sama po sebi dviguje kakovost življenja; kot pri vseh orodjih je to vendarle odvisno od tega, kako njene rezultate uporabljamo…

Sicer pa menim, da je razumevanje osnov statistike resnično koristno tudi v vsakdanjem življenju. Pa ne le pri posvetnih stvareh, kot je učinkovito spremljanje hišnih stroškov ali pridobivanja dojenčkove telesne mase. Ukvarjanje s statistiko ti pomaga razumeti pojme (ne)predvidljivosti in naključja, zaradi česar lahko živiš bolj pomirjeno tudi, ko kdaj ne gre vse tako, kot si si zamislil. 

  1. Statistiki se pogosto očita, da je lažniva. Seveda neupravičeno. Katera statistična laž ali napaka v statističnem sklepanju vas je do sedaj najbolj razjezila?

Verjetno sem se najbolj jezil kar nad lastnimi napakami, ko sem si kdaj nakopal dodatno delo, ko sem se šele sredi dela zavedel, da sem se analize ali merjenja lotil na suboptimalen način. Dobra šola je bila že diplomsko delo, ko sem moral lep del analiz ponoviti, ker zaradi nestrpnosti nisem začel s temeljitim pregledom podatkov. Na srečo sem napake pri vnosu podatkov, ki so se spremenile v ekstremne vplivne točke, opazil še pravočasno. Žal sem precej prepričan, da se mnogokrat motnje v podatkih neopaženo izmuznejo vse do objave in so zaslužne tudi za kako presenetljivo empirično ugotovitev.

  1. S katerim znanim statistikom iz zgodovine bi najraje poklepetali? Zakaj? 

Zelo zanimiva oseba se mi zdi Charles Spearman. Po uspešni vojaški karieri se je sredi svojih 30. odločil za znanstveno kariero in se priključil leipziškemu laboratoriju, ki je s svojim naravoslovno-empiričnim pristopom predstavljal alternativo dotedanji filozofski psihologiji. Spearman je v svojem doktorskem delu postavil temelje znanstvenemu proučevanju inteligentnosti; s statističnega vidika pa je zanimivo, da je ob tem – tako rekoč kot stranski produkt – utemeljil tudi faktorsko analizo in klasično testno teorijo.

Glede na to, da naju druži zanimanje za pivo, pa bi si gotovo imela marsikaj povedati tudi z Williamom Gossetom – Studentom.

  1. Kateri problem v statistiki se vam zdi trenutno največji izziv?

Izpostavil bi dva precej splošna izziva. Prvi se nanaša na identiteto oz. temelje statistike. Še v času mojega študija je bilo jasno, da je statistika v osnovi veja matematike, ki s svojimi aplikativnimi podaljški sega v »vsebinske« oz. empirične discipline. V zadnjih recimo dvajsetih letih pa vse večji pomen pridobivajo metode, ki vsaj toliko ali še bolj kot na matematičnih dokazih temeljijo na računalniški moči. (Pod)discipline, ki izvirajo predvsem iz računalniških in inženirskih ved, kot so podatkovna znanost, podatkovna analitika, strojno učenje, umetna inteligenca itd. se včasih lotevajo podobnih problemov kot »klasična« statistika. Zanimivo bo videti, kakšno bo sobivanje teh pristopov v prihodnjih desetletjih in ali bo prišlo do njihove integracije.

Drug izziv, ki se bo moral razrešiti v naslednjih desetletjih, pa je odnos med frekventistično in Bayesovo statistiko. V psihologiji se Bayesove metode vse bolj uveljavljajo, a zaenkrat pretežno pri reševanju parcialnih problemov, kot je npr. ocenjevanje vrednosti latentnih spremenljivk. Če bo Bayesov pristop nekoč postal dominanten, bo to zahtevalo revolucionarne spremembe tako v poučevanju statistike kot tudi v standardih prakse (npr. pri objavljanju rezultatov raziskav).

  1. V Sloveniji veliko raziskovalcev tuje vprašalnike prevede in uporabi v svojih raziskavah. Kakšne so najpogostejše napake, ki jih pri tem naredijo?

Najbolj naivna napaka je seveda, da nekdo vprašalnik samo prevede (po možnosti sam in brez vzvratnega prevoda) in ne preveri njegovih psihometričnih lastnosti. Pri bolje poučenih raziskovalcih pa pogosto zasledim težnjo, da sicer naredijo psihometrično analizo, vendar po »liniji najmanjšega odpora«. Npr., uporabijo klasično testno teorijo, ko bi bila teoretično bolj smiselna analiza latentnih potez; izračunajo le eno od mer zanesljivosti, ne pa tudi analize postavk … Nekateri raziskovalci tudi gojijo (vsaj implicitno) prepričanje o magičnih značilnostih psihometrične analize, kot da nam ta pove vse o lastnostih vprašalnika; posledica so nejasne in dvoumne formulacije postavk in odgovornih lestvic, ki kažejo, da avtor vprašalnika ni niti natančno prebral za sabo, kaj šele, da bi opravil npr. kognitivni intervju s tipičnimi preizkušanci.

  1. Metodo glavnih komponent lahko gledamo kot nekakšno predhodnico faktorske analize. Ali menite, da je danes metoda še vedno aktualna? 

Sam metode glavnih komponent ne vidim kot predhodnice faktorske analize – obe metodi sta nastali približno istočasno (v prvih letih 20. stoletja), pri čemer je šele pozneje postalo jasno, da lahko metodo glavnih komponent na sintaktični ravni obravnavamo kot poseben model faktorske analize. Vsekakor pa mislim, da je komponentna analiza še vedno uporabna in legitimna, ko želimo izdelati optimalne povzetke večjega števila izmerjenih spremenljivk, pri čemer nas ne zanimajo njihovi hipotetični skupni latentni vzroki. Poleg tega je analiza glavnih komponent tudi konceptualna osnova nekaterih pomembnih metod lestvičenja, kot je npr. »Gifijev sistem«. 

8. Kaj bi počeli, če ne bi bili statistik?

Če bi ostal na področju psihologije, bi verjetno skušal najti delo, povezano z nevropsihologijo.

9. Katere spletne strani, bloge ali knjige s področja statistike bi priporočili kot poljudno branje?

Če sem iskren, poljudnih strani o statistiki ne spremljam preveč sistematično, mislim pa, da jih tudi ni prav veliko, vsaj v primerjavi z nekaterimi bolj popularnimi disciplinami. Udomačena statistika je med svetlimi izjemami.

Stran https://xkcd.com/ sicer ni omejena na statistiko, je pa na njej najti precej prebliskov o statističnih temah.

Avtor: Vanja Erčulj

Sem psihologinja in doktorica družboslovne statistike, zaposlena kot predavateljica na Fakulteti za varnostne vede Univerze v Mariboru. Ukvarjam se z veljavnostjo in zanesljivostjo merjenja, tekstovnim rudarjenjem, varnostjo v lokalnih skupnostih in strukturnim modeliranjem.

Oddajte komentar

Fill in your details below or click an icon to log in:

WordPress.com Logo

Komentirate prijavljeni s svojim WordPress.com računom. Odjava /  Spremeni )

Google photo

Komentirate prijavljeni s svojim Google računom. Odjava /  Spremeni )

Twitter picture

Komentirate prijavljeni s svojim Twitter računom. Odjava /  Spremeni )

Facebook photo

Komentirate prijavljeni s svojim Facebook računom. Odjava /  Spremeni )

Connecting to %s