Udomačena statistika

Statistiki pišemo blog.


Komentiraj

Kdaj rečemo, da so rezultati čudni?

Pogosto se srečam z vprašanjem ali mislijo, če je to kar vidim iz podatkov čudno? Za čudno navadno smatram nekaj, česar ne pričakujem, da se bo zgodilo. Denimo, da bom zadel na loteriji, kar bi bil sorodnik čudnega, čudež tako zvani.

V statistiki se srečujemo z razlikami v povprečjih, za kar že tradicionalno uporabljamo t-test (če gre za razliko med dvema skupinama) in sorodne metode. Test je svoje ime dobil po porazdelitvi t, s pomočjo katere ocenimo ali gre za čudno razliko v povprečjih ali ne. Več o tem testu je pisal Črt v prispevku Zakaj je pivo tako dobro ali kdo je Student.

Poglejmo si kako gledamo na razlike v povprečjih s pomočjo praktičnega primera. Denimo, da imamo na voljo kosilnice za travo znamk Fergucon iz Wajdušne in Tomo Ovinkelj iz Raven na Koroškem. Od vsakega podjetja imamo na razpolago petdeset naprav. Predpostavimo, da imajo vse kosilnice enako velik rezervoar za bencin, ki ga napolnimo z enako količino goriva. Kosilnice uporabljamo dokler bencina ne zmanjka in ne ostanemo na travniku kot župniki s Primorske. Za vsako napravo zabeležimo čas obratovanja. Iz teh podatkov za vsako znamko naredimo frekvenčni diagram (število kosilnic, ki je porabila določeno količino goriva), ki bi simbolno prikazan izgledal nekako tako kot prikazuje slika spodaj. Nadaljujte z branjem


1 komentar

Sam po SURSu, se sprehajam, grafe rišem, deklica ti

Še pomnite tovariši, ko nas je v večjem delu Slovenije prizadela ujma, ki je živi spomin ne pomni? Govorim seveda o februarskem žledu leta 2014. Posledic še danes nismo uspeli odpraviti v celoti, kar z vidika organizmov v gozdu seveda ni problem.

V prvih dneh po ujmi je bil del Slovenije odrezan od sveta, saj je bilo veliko gospodinjstev brez električne energije. Takrat sem postavil hipotezo, da bo to super čas za negledanje televizije (pomežik pomežik, dreg s komolcem) in bo po gestacijski dobi značilni za človeka (to je doba devetih mesecev, ko se zarodek razvija v materi) mogoče zaznati povečano število rojstev. V letu 2016 je to s pomočjo statističnih podatkov, ki jih vodi Statistični urad republike Slovenije (v nadaljevanju: SURS), moč preveriti.

S strani o Prebivalstvu sem posnel podatke o rojstvih po mesecih za zadnja štiri leta. Če 10.2.2014 prištejemo 240 dni (kolikor časa v povprečju traja nosečnost), dobimo kot rezultat 8.10.2014. Poglejmo število rojstev v septembru in novembru, predvsem pa oktobru. Nadaljujte z branjem


Komentiraj

Politična usmerjenost slovenskih volivcev

Tako, dobil sem vašo pozornost. Kot se že razbere iz naslova, bo govora o politiki. V času volitev in referendumov se pogosto razvname debata o politični usmerjenosti volivcev in se poskuša napovedati izid glede na trenutno vzdušje. Politični analitiki so včasih tako pametni, da jim že škodi (poglejmo primer zadnjega napovedovanja izida volitev v Veliki Britaniji in dejanski rezultat), zato potrebujemo konkretne, nepristranske podatke. Več o tem v eni od prihodnjih objav, kjer bomo pod drobnogled vzeli anketo, ki je bila izvedena za potrebe plebiscita leta 1990. Nadaljujte z branjem


5 komentarjev

Ljubo povprečje, kdor ima porazdelitev

Pri razumevanju okolja okoli nas se moramo pogosto zaradi zapletenosti (kompleksnosti) problemov zanašati na nekakšne povzetke. Denimo primer podjetja z veliko zaposlenimi. Lastnik ne bo mogel poznati vsakega zaposlenega, mu bo pa zelo koristilo, da ve koliko ima zaposlenih, ali pa koliko je zaposlenih na posameznem oddelku. Podobno je pri plačah. Ker si težko predstavljamo višino plač (vseh) zaposlenih, se zatečemo k neki številki, ki vseeno da neko informacijo o plačah. Nadaljujte z branjem