Udomačena statistika

Mladi statistiki pišemo blog.


Komentiraj

Koronavirus pod lupo medijskega poročanja

V času, ko je življenje kot ga poznamo zastalo, nam poročanje medijev še toliko bolj predstavlja okno v svet. Da lahko skozenj jasno vidimo, se moramo zavedati narave prejetih informacij ter pomanjkljivosti nekritičnega sprejemanja le-teh.

Poročanje o koronavirusni bolezni COVID-19 je na nacionalnem spletnem portalu rtvslo.si dobilo nov zamah ob razglasitvi epidemije in v obdobju po njej (Slika 1). Analiza besedila pokaže, da so bili v proučevanem obdobju (11. 2. – 26. 3) v katerem je bilo objavljenih 157 člankov o koronavirusni bolezni, prevladujoči negativno naravnani članki. Zanimivo pa je, da merilnik čustvene naravnanosti (tudi sentimenta), ki temelji na leksikonu Hu in Liu ter izračunu razlike med številom pozitivnih in številom negativnih besed v na določen dan objavljenih prispevkih, skozi čas zlagoma narašča od negativnega proti nevtralnemu. Najbolj negativen članek v proučevanem obdobju se ni nanašal na razmere v Sloveniji, ampak na Kitajskem (14. 2.), ko so bili v Evropi le posamezni primeri okužb in je še obstajal dvom o širitvi bolezni COVID-19 k nam. Analiza sentimenta kaže, da nacionalni mediji ob zaostrovanju razmer pri nas, ubirajo nevtralnejši ton, ki ima na bralce pomirjujoč učinek. Poročanje je bilo mnogo bolj senzacionalistično (če se lahko tako izrazimo) pred izbruhom bolezni pri naših sosedih in pri nas. Nadaljujte z branjem


1 komentar

Risanje grafikonov kvantilov v Nesstarju

V zadnji objavi sem podatke Evropske družboslovne raziskave analizirala z vmesnikom Nesstar in jih prikazala na zemljevidu. Tak prikaz je vizualno zanimiv, vendar je omejen le na eno mero srednje vrednosti, v tem primeru povprečje, zanemari pa razpršenost podatkov.

Statistična razpršenost (tudi variabilnost, disperzija ali variacija) govori o tem, koliko so vrednosti različne med seboj, koliko se vrednosti odklanjajo od srednje vrednosti in koliko se od srednje vrednosti razlikujejo. Poznamo različne mere razpršenosti, med drugim tudi kvartilni odklon. Nadaljujte z branjem


Komentiraj

Analiza podatkov Evropske družboslovne raziskave z vmesnikom Nesstar

Ko izvajamo raziskavo, je eden izmed prvih korakov vedno to, da preverimo, ali  že obstajajo anketni podatki za izbrano temo. Pri tem so v veliko pomoč predvsem podatkovni arhivi, na primer naš Arhiv družboslovnih podatkov. Ne le, da podatki obstajajo, možno jih je tudi analizirati s spletnimi vmesniki, kot je na primer program PC-Axis, s katerim sem zadnjič analizirala podatke SURS o slovenskih blogerjih. Zelo podoben je tudi vmesnik Nesstar, s katerim lahko, med drugim, analiziramo podatke Evropske družboslovne raziskave (ESS). Uporaba je brezplačna, vendar se je treba registrirati. Nadaljujte z branjem


2 komentarja

Ljubljanski maraton skozi leta

Ljubljanski maraton je dogodek, ki privablja vsako leto več udeležencev. Ni vsakemu cilj doseči čim boljši čas, pa vendar na koncu radi pogledamo svoje rezultate in jih morda primerjamo s prejšnjimi leti ali pa so-tekmovalci.  Vse opisano (in še več) je sicer dostopno tudi preko spletne aplikacije. Ta je narejena s pomočjo paketa shiny za programski jezik R, o uporabi katerega si lahko preberete tu. Nadaljujte z branjem


5 komentarjev

Ljubo povprečje, kdor ima porazdelitev

Pri razumevanju okolja okoli nas se moramo pogosto zaradi zapletenosti (kompleksnosti) problemov zanašati na nekakšne povzetke. Denimo primer podjetja z veliko zaposlenimi. Lastnik ne bo mogel poznati vsakega zaposlenega, mu bo pa zelo koristilo, da ve koliko ima zaposlenih, ali pa koliko je zaposlenih na posameznem oddelku. Podobno je pri plačah. Ker si težko predstavljamo višino plač (vseh) zaposlenih, se zatečemo k neki številki, ki vseeno da neko informacijo o plačah. Nadaljujte z branjem


Komentiraj

Sezona okužb z boleznimi, ki jih prenašajo klopi

S pomladjo pride veliko prijetnih stvari, na žalost pa spet prihajajo na plano tudi klopi. Ti so že sami po sebi precej zoprni paraziti, prenašajo pa lahko tudi bolezni. Med njimi sta tudi limska borelioza in klopni meningoencefalitis. Prva je bila leta 2011 šesta na seznamu najpogosteje hospitaliziranih zaradi nalezljivih bolezni v Sloveniji (Tabela 2). Nekoliko več o boleznih in zaščiti pred njimi si lahko preberete na spletnih straneh IVZZa občutek o razširjenosti bolezni bomo narisali nekaj grafov. Nadaljujte z branjem


1 komentar

Zakaj odstotek ni samostojen in zakaj so metodološka pojasnila pomembna?

V tokratnem prispevku želim nekaj besed nameniti temu, zakaj je pomembno, da kontekst podatkov, ki smo jih obravnavali in na podlagi katerih smo prišli do določenih ugotovitev, ki jih želimo predstaviti, predstavimo korektno in dovolj natančno. Pri prebiranju številnih prispevkov, v katerih je navedeno, da gre za poročilo o rezultatih ankete, na primer, o zadovoljstvu diplomiranih študentov, ugotavljam, da se pogosto ponavljajo napake, ki izhajajo iz omenjenega. V tokratnem prispevku se želim ustaviti pri dveh ‘pogostih napakah’, ki ju lahko poimenujemo: Nadaljujte z branjem