Udomačena statistika

Mladi statistiki pišemo blog.


Komentiraj

O modelih več indikatorjev in več vzrokov: zgodovina, delovanje in uporabnost

Modeli več indikatorjev in več vzrokov (ang. Multiple Indicators and Multiple Causes oziroma z okrajšavo MIMIC) se nahajajo na meji med ekonomsko statistiko in ekonometrijo. Čeprav so jih razvili pomembni avtorji iz zgodovine ekonometrije, kot sta Arnold Zellner in Dennis J. Aigner, ter o njih razpravljali ekonometriki kot Gary Chamberlain, pa se danes le še izjemoma uspejo prebiti na vodilne ekonometrične konference. V prispevku kratko predstavljam njihovo matematično strukturo in delovanje ter možnosti uporabe.

Nadaljujte z branjem


2 komentarja

Knjiga The Joy of Statistics

Pred časom sem sodelovala v raziskavi založbe Oxford University Press in v zameno prejela vaučer, s katerim sem si privoščila nakup dveh njihovih knjig. Ena izmed dveh je The Joy of Statistics oziroma “radost statistike” ali “veselje statistike” kot bi lahko naslov dobesedno prevedli v slovenščino.

Nadaljujte z branjem


Komentiraj

Kako nam lahko verjetnost pomaga razložiti dogajanja v vesolju? O Schramm-Loewnerjevih naključnih procesih

Slika: Tuttejeve vložitve v naključnih ravninskih mapiranjih. Vir: Jason Miller.

Zapis je nadaljevanje mojega poročanja z lanskoletnega svetovnega kongresa verjetnosti in statistike Bernoulli-IMS. Večino kongresa sem se udeleževal paralelnih sekcij s področja verjetnosti in naključnih procesov, v največji meri tistih z zelo posebnega področja trenutnega raziskovanja, ki je namenjeno iskanju tako imenovanih skalirnih limit naključnih procesov in matematičnih objektov.

Področje tvori enega jeder današnjega raziskovanja verjetnosti in ima močne posledice tudi za bolj praktična in uporabna raziskovanja, zlasti tista na področju matematične fizike. Področje je blizu tudi trenutno zelo aktualnim matematičnim raziskovanjem na področju kompleksne analize.

Nadaljujte z branjem


Komentiraj

Ob letošnji Nobelovi nagradi za ekonomijo: postavitev temeljev ekonomskemu empiričnemu delu

Letošnje podelitve Nobelovih nagrad so za nami. Tisti, ki imamo radi področje verjetnosti, smo se veselili tudi nagrade fiziku Giorgiu Parisiju, soavtorju stohastične parcialne diferencialne enačbe Kardar-Parisi-Zhang. Za tiste s področja regresijskega modeliranja in ekonometrije pa je bil vrhunec seveda zadnji dan in podelitev letošnje nagrade za ekonomijo.

Letošnjo nagrado so podelili trem ekonomistom: polovico Davidu Cardu za njegove prispevke k empiričnemu raziskovanju ekonomike trga dela (velikokrat se je omenjal predvsem njegov znani prispevek skupaj s pokojnim Alanom B. Kruegerjem), ter po četrtino Joshui D. Angristu in Guidu W. Imbensu za njuno »revolucijo kredibilnosti« v ekonomiji, torej za metodološki doprinos k empiričnemu raziskovanju v ekonomiji, ki je danes prav zaradi njunega dela takšna, kot jo poznamo. V prispevku pišem predvsem o njiju, torej tistem delu nagrade, ki je najmočneje vezan na statistiko, pregledne članke o nagradi pa najdete tudi na portalu VoxEU ter na strani Nobelovih nagrad samih.

Nadaljujte z branjem


1 komentar

Virtualno srečanje za matematične sladokusce

V sredini meseca julija je potekal 10. kongres verjetnosti in statistike združenj Bernoulli in IMS, ki velja za osrednji in najbolj prestižni dogodek področij verjetnosti in matematične statistike v mednarodnem merilu. Sam sem se kongresa udeležil prvič in prejel nagrado za najboljši poster na uvodni dvodnevni delavnici mladih raziskovalcev. Kongres je ponudil zelo veliko in bil del intenzivnega konferenčnega dogajanja s področij matematike in statistike v tem letu.

Vir: Spletna stran kongresa.
Nadaljujte z branjem


Komentiraj

Pogovor z Mojco Bavdaž

Mojca Bavdaž je izredna profesorica na Ekonomski fakulteti UL, kjer se ukvarja z uradno in ekonomsko statistiko ter predava različne statistične in metodološke predmete. Je tudi med izvajalci predmetov na magistrskem in doktorskem študiju statistike. Leta 2007 je doktorirala iz statistike na temo merskih napak in procesa odgovora v anketah podjetij. Vprašanja za rubriko Pogovori smo ji zastavili preko elektronske pošte.

Nadaljujte z branjem


Komentiraj

Predavanje Erika Štrumblja o Bayesovih računskih metodah in Bayesovi statistiki

V torek, 6. aprila 2021, smo na 8. Srečanju Mlade sekcije Statističnega društva Slovenije gostili izr. prof. dr. Erika Štrumblja, izrednega profesorja in člana Laboratorija za kognitivno modeliranje na Fakulteti za računalništvo in informatiko UL, kjer predava predmete s področja verjetnosti, statistike in strojnega učenja. Ker je eden od začetnikov sistematičnega poučevanja in raziskovanja na področju Bayesovih metod v Sloveniji, sem ga povabil na pogovor o trenutnem stanju Bayesove statistike in njenem razmerju do frekventističnega sklepanja, sodobnih računskih metodah, ter o njegovih dognanjih in delu na tem področju. Pogovor si lahko ogledate na YouTube kanalu Mlade sekcije.

Bayesova statistika je z nami vse od začetkov razmišljanj o statistiki. Splošno se šteje, da je bil do določene mere Bayesijanec že francoski matematik Laplace, ko je razmišljal o verjetnosti. Bayesova statistika pri reševanju statističnega problema razmišlja o vnaprejšnjih predpostavkah in (vnaprejšnji) verjetnosti nekega pojava. Iz dejanskih podatkov in ob upoštevanju takšne apriorne verjetnosti nato izračuna končno, posteriorno verjetnost in na njeni osnovi dokonča statistično sklepanje.

Na pogovoru smo govorili o naslednjih osrednjih vprašanjih:
– Kako je tekel razvoj področja, zakaj je bilo Bayesovo razmišljanje tako prisotno v začetkih statistike, se kasneje umaknilo (zlasti v času enega začetnikov sodobne statistike Ronalda Aylmerja Fisherja ter frekventizma tradicije avtorjev Jerzyja Neymana, Egona Pearsona in Abrahama Walda) ter se danes ponovno vrača z velikimi koraki;
– O razlikah med frekventističnimi in Bayesovimi metodami v statistiki ter kako sploh poučevati statistiko (v Sloveniji in nasploh);
– Katera so najbolj zanimiva področja trenutnega raziskovanja v Bayesovi statistiki;
– Kako so Bayesovi pristopi in računske metode uporabni v vsakodnevni statistični praksi ter o računski zahtevnosti teh pristopov;
– Zakaj so Bayesove metode prišle v ospredje tudi v času sedanje epidemije COVID-19;
– O spoznanjih in delu prof. dr. Štrumblja in njegovih sodelavcev ter kako to, da se je v Sloveniji raziskovanje Bayesovih metod posebej močno uveljavilo na Fakulteti za računalništvo in informatiko Univerze v Ljubljani.

Z dobo računalništva in umetne inteligence je Bayesova statistika ponovno prišla v samo ospredje zanimanja v statistiki, verjetnosti in ekonometriji, Bayesove metode so tudi temelj raziskovanja v metodah strojnega učenja in podatkovne znanosti. Vprašanje, ki ga je več desetletij nazaj postavljal Bradley Efron, zakaj še vedno nismo vsi Bayesijanci, postaja torej spet in vedno močneje aktualno.


1 komentar

Demonstracija uporabe metod tekstovnega rudarjenja: tipi socialne opore v spletni podporni skupnosti Neplodnost

Pomen socialne opore na ozdravitev in tudi smrtnost je bil že izpostavljen v številnih raziskavah (na primer Ali, Merlo, Rosvall, Lithman, and Lindström, 2006; McDade, Hawkley, and Cacioppo, 2006; Tomaka, Thompson, and Palacios, 2006). V grobem delimo socialno oporo na informacijsko in emocionalno. Prva vključuje posredovanje informacij osebi, ki potrebuje oziroma išče informacijo, emocionalna pa kot priznanje in ovrednotenje posameznikovih čustev ali nudenje utehe in spodbude (Sherbourne in Stewart, 1991). Ti dve vrsti socialne opore sta v največji meri prisotni tudi v spletnih podpornih skupnostih spoprijemanja z neplodnostjo. Ključni funkciji socialne opore sta blažilni učinek, ki ga ima na stresni odziv posameznika po prejemu informacije, ki povzroča stres. Lahko pa deluje zaviralno, to je prepreči stresni odziv še preden se ta pojavi. Pogovor z osebo, ki nudi socialno oporo, lahko namreč pomaga videti situacijo v drugi luči ali pa zaradi spodbude in empatije služi kot blažilec stresnega odziva. Poleg omenjenih tipov socialne opore, obstajata še dva, in sicer instrumentalna opora in druženje, ki pa sta v spletnih podpornih skupnostih prisotna v manjši meri.

Nadaljujte z branjem


Komentiraj

Pogovor z Gregorjem Sočanom

Gregor Sočan je študiral na univerzah v Ljubljani in Groningenu. Trenutno je izredni profesor za psihološko metodologijo na Filozofski fakulteti Univerze v Ljubljani, kjer sodeluje pri izvajanju predmetov s področja psihometrije in uporabne statistike v okviru programov Psihologija, Kognitivna znanost, Uporabna statistika, Statistika ter Humanistika in družboslovje. Njegovi interesi obsegajo multivariatno analizo, metode točkovanja testov, ocenjevanje zanesljivosti in merske invariantnosti ter aplikacijo multivariatnih in psihometričnih metod v psihologiji osebnosti, razvojni psihologiji, zdravstvu in drugod.

Nadaljujte z branjem


3 komentarji

O učinkih samoizolacije zaradi COVID-19 v Sloveniji

Analize vzročnih učinkov ukrepov so metodološko področje, ki se nahaja med ekonometrijo in statistiko. Na tem blogu sem že večkrat pisal o področju vzročnega sklepanja v splošnem, pri ocenjevanju učinkov ukrepov pa se je razvilo veliko področje, ki so ga ekonometriki poimenovali metode ocenjevanja programov (angl. program evaluation). Med drugim je v povezavi z njim Nobelovo nagrado v letu 2000 prejel čikaški ekonomist in ekonometrik James Heckman, eden najbolj vplivnih med še živečimi ekonomisti. Področje je močno razvito na zahodu, še posebej v ZDA. V tem prispevku bom o njem spregovoril v povezavi s COVID-19.

Ko se je pandemija COVID-19 v začetku leta 2020 razširila po vsem svetu, je statistično in epidemiološko modeliranje njenega poteka postalo ena osrednjih točk znanstvenega raziskovanja. Novi koronavirus SARS-CoV-2 se je hitro razširil po vsem svetu in močno vplival na vse vidike našega življenja. Eden ključnih razlogov za njegovo hitro širjenje je visoko efektivno reprodukcijsko število R_t, o tem katerem sem pisal v prispevku, nastalem v začetku pandemije, Uvod v modeliranje in statistični vidiki COVID-19, poleg efektivnega pa poznamo tudi osnovno reprodukcijsko število R_0. Vrednost R_t predstavlja povprečno število ljudi, ki jih posameznik okuži v obdobju okužbe, pri čemer t predstavlja čas. Ko je R_t manjši od 1, se pojavnost novih primerov zmanjša, ko pa je R_t večji od 1, narašča, dokler epidemija ne doseže vrhunca; po tem se pojavnost novih primerov začne zmanjševati zaradi (vsaj začasne) čredne imunosti. Sliko gibanja števila primerov in umrlih v času pandemije v Sloveniji vidimo na spodnji sliki iz članka Manevskega in sodelavcev (2020), ki je eno od znanih slovenskih modeliranj COVID-19.

Nadaljujte z branjem