Udomačena statistika

Študenti statistike pišemo blog.

Analiza podatkov Evropske družboslovne raziskave z vmesnikom Nesstar

Komentiraj

Ko izvajamo raziskavo, je eden izmed prvih korakov vedno to, da preverimo, ali  že obstajajo anketni podatki za izbrano temo. Pri tem so v veliko pomoč predvsem podatkovni arhivi, na primer naš Arhiv družboslovnih podatkov. Ne le, da podatki obstajajo, možno jih je tudi analizirati s spletnimi vmesniki, kot je na primer program PC-Axis, s katerim sem zadnjič analizirala podatke SURS o slovenskih blogerjih. Zelo podoben je tudi vmesnik Nesstar, s katerim lahko, med drugim, analiziramo podatke Evropske družboslovne raziskave (ESS). Uporaba je brezplačna, vendar se je treba registrirati.

ESS meri stališča, vrednote in vedenjske vzorce v več kot tridesetih, večinoma evropskih državah. Zbiranje podatkov poteka vsako drugo leto (prvič v 2002) z osebnim anketiranjem na terenu. Do sedaj je bilo izvedenih sedem rund, šest pa je že objavljenih. V vmesniku Nesstar za podatke ESS v levem okvirju najprej izberemo rundo raziskave, ki jo želimo analizirati, nato v hierarhično urejenem kazalu poiščemo spremenljivke, ki nas zanimajo:

  • Ob kliku na ikono levo od imena spremenljivke lahko izberemo frekvenčno porazdelitev po vrsticah (add to row) ali stolpcih (add to column), opisne statistike (add as measure) ali pa spremenljivko uporabimo kot filter. Slednje bi recimo uporabili v primeru, ko bi se želeli omejiti le na podatke določene države ali pa samo na določene starostne kategorije.
  • V zavihku Description si lahko ogledamo opis spremenljivk in katere kategorije vsebujejo – za pravilno uporabo je zelo pomembno, da opis razumemo!
  • V zavihku Tabulation  lahko generiramo različne univariatne (ena spremenljivka) ali bivariatne (dve spremenljivki) tabele, ki jih potem lahko izpišemo tudi kot različne grafične prikaze, med drugim tudi zemljevide, kar bom prikazala v nadaljevanju.
  • V zavihku Analysis lahko izračunamo korelacijo med spremenljivkama ali naredimo regresijsko analizo, vendar ga tokrat nisem uporabila.
  • Poleg tega lahko podatke tudi utežimo (Weight). Mimogrede, post-stratifikacijsko uteževanje smo za vse izvedbe in države ESS opravili na Centru za družboslovno informatiko. Več o uteževanju v eni izmed prihodnjih objav.

Ker to objavo pripravljam na mednarodni dan žensk, sem kot primer izbrala vprašanji G4 in G5 iz rotirajočega modula Work, Family and Wellbeing, ki se je pojavil v letih 2004 in 2010. V slovenščini se je vprašanje glasilo:

“Sedaj vam bom prebral nekaj trditev o moških, ženskah in njihovi vlogi v družini. S pomočjo kartice povejte, kako močno soglašate ali ne soglašate z njimi.
G4. Ženska mora biti pripravljena zmanjšati obseg svojega plačanega dela v korist svoje družine.
G5. Kadar ni dovolj delovnih mest, bi morali imeti moški prednost pri zaposlovanju pred ženskami.”

Na kartici je anketiranec izbiral med kategorijami Močno soglašam (1), Soglašam (2), Niti soglašam niti ne soglašam (3), Ne soglašam (4) in Sploh ne soglašam (5).

Pustimo ob strani dejstvo, da ubeseditev trditev ni optimalna (Problem večdimenzionalnosti vprašanj) in poskusimo v vmesniku Nesstar pregledati rezultate za vse države, ki so bile vključene v peto izvedbo (2010). Spremenljivki G4 in G5 imata ordinalno mersko lestvico, vendar ob predpostavki, da so razlike med kategorijami enake, lahko izračunamo povprečja in druge opisne statistike (ukaz add as measure). Državo sem pri obeh dodala v vrstico. Uporabila sem tudi post-stratifikacijsko utež,  ki delno popravi pristranost podatkov zaradi neodgovov in s tem ocene približa pravim vrednostim.

Dobila sem tabeli, kjer so v vrsticah države, v stolpcih pa opisne statistike mediana, povprečje, minimum, maksimum, standardni odklon, vsota in velikost vzorca. Na spodnjih dveh slikah prikazujem mediano (median) in povprečje (average), dve različni meri srednje vrednosti, pri čemer so države razporejene naraščujoče po vrednosti mediane. Na levi je spremenljivka G4 (Ženska mora biti pripravljena zmanjšati obseg svojega plačanega dela v korist svoje družin), na desni pa G5 (Kadar ni dovolj delovnih mest, bi morali imeti moški prednost pri zaposlovanju pred ženskami). Pozor pri interpretaciji – lestvica je kontraintuitivno obrnjena, zato nižje povprečje pomeni močnejše soglašanje  s trditvijo, višje povprečje pa obratno.

ESStable

ESS5-2010, ed.3.2 (last updated 11/24/14); Levo: “Ženska mora biti pripravljena zmanjšati obseg svojega plačanega dela v korist svoje družine.” (1 – Močno soglašam, 5 – Sploh ne soglašam); Desno: “Kadar ni dovolj delovnih mest, bi morali imeti moški prednost pri zaposlovanju pred ženskami.” (1 – Močno soglašam, 5 – Sploh ne soglašam)

Z obema trditvama je največ soglašanja v nekaterih vzhodnoevropskih državah (Ukrajina, Litva, Rusija) pa tudi v nekaterih južnoevropskih (Grčija, Ciper). Najmanj soglasja pa je v Skandinaviji (Danska, Švedska, Norveška in Finska) ter Beneluksu (Nizozemska, Belgija). Podobno velja tudi za soglašanje s trditvijo, da bi moški morali imeti prednost pri zaposlovanju, kjer je največ soglašanja na Madžarskem, sledijo pa Ukrajina, Ciper, Grčija in Rusija. Najmanj pa Danska, Švedska, Norveška, Francija in Španija.

Povprečja po državah prikazujemo tudi na spodnjih dveh zemljevidih, kjer so države glede na vrednost povprečja razdeljene v pet skupin (število je možno izbrati v vmesniku)

ESS1

ESS5-2010, ed.3.2 (last updated 11/24/14) “Ženska mora biti pripravljena zmanjšati obseg svojega plačanega dela v korist svoje družine.” (1 – Močno soglašam, 5 – Sploh ne soglašam)

ESS2

ESS5-2010, ed.3.2 (last updated 11/24/14) “Kadar ni dovolj delovnih mest, bi morali imeti moški prednost pri zaposlovanju pred ženskami.” (1 – Močno soglašam, 5 – Sploh ne soglašam)

Vmesnik Nesstar sem uporabljala prvič po zelo dolgem času in moram priznati, da je veliko bolj uporaben in zmogljiv, kot je bil. Sama bom podatke še naprej analizirala v statističnih programih, ki zmorejo več in so bolj fleksibilni, a za kakšne preproste analize se mi zdi zelo priročen. Predvsem sem navdušena nad zemljevidi. V eni izmed prihodnjih objav bom pokazala tudi, kako narisati grafikon kvantilov (boxplot). Uporabniško izkušnjo vmesnika bi se sicer dalo še precej izboljšati. Ker sem vešča v statistiki in poleg tega ESS podatke zelo dobro poznam, sem se hitro znašla, začetnikom pa pred uporabo priporočam, da se udeležijo katerega izmed usposabljanj, ki jih organizira Arhiv družboslovnih podatkov ali pa vsaj branje gradiv na njihovi spletni strani.

Advertisements

Avtor: Ana Slavec

Doktorica statistike in raziskovalka na Arhivu družboslovnih podatkov na Fakulteti za družbene vede. Je članica upravnega odbora Društva mlada akademija, urednica bloga Udomačena statistika ter sovoditeljica Meta PHoDcasta. Na Twitterju je @aslavec.

Oddajte komentar

Fill in your details below or click an icon to log in:

WordPress.com Logo

Komentirate prijavljeni s svojim WordPress.com računom. Odjava / Spremeni )

Twitter picture

Komentirate prijavljeni s svojim Twitter računom. Odjava / Spremeni )

Facebook photo

Komentirate prijavljeni s svojim Facebook računom. Odjava / Spremeni )

Google+ photo

Komentirate prijavljeni s svojim Google+ računom. Odjava / Spremeni )

Connecting to %s