Udomačena statistika

Študenti statistike pišemo blog.

O metodah analize ekstremnih vrednosti in prihajajoči konferenci v Zagrebu

Komentiraj

V začetku meseca julija bo v Zagrebu potekal večji statistični dogodek, osrednja konferenca s področja metod analize ekstremnih vrednosti (EVA). Konference s tega področja, ki jih soorganizira tudi osrednje statistično združenje Bernoulli, so se pričele v letu 1997 v švedskem Göteborgu, zadnja pa je potekala leta 2017 v Delftu na Nizozemskem. Tokratna konferenca bo potekala med 1. in 5. julijem 2019 na oddelku za matematiko Univerze v Zagrebu.

Metode analize ekstremnih vrednosti, ki pogosto temeljijo na spoznanjih hrvaškega matematika Williama (rojenega kot Vilibalda Srećka) Fellerja, so se razvijale zlasti v drugi polovici dvajsetega stoletja. Njihova statistična osnova izhaja iz dveh vej: na eni strani analize stabilnih statističnih porazdelitev, ter na drugi iz porazdelitve maksimuma vrste med seboj neodvisnih in identično porazdeljenih naključnih spremenljivk. Glede slednjih nam na tem področju dobro znani izrek Fisher-Tippett-Gnedenko, pove, da je po ustrezni transformaciji statistična porazdelitev takšnega ekstrema lahko zgolj treh vrst: Gumbelova, Fréchetova ali obratna Weibullova. Vse tri porazdelitve pogosto združimo v t.i. posplošeno porazdelitev ekstremnih vrednosti (angl. Generalized Extreme Value distribution, GEV), ki jo opisujejo trije parametri: običajna parametra lokacije in razpona (v jeziku normalne porazdelitve sta to kar prva dva momenta porazdelitve, torej povprečje in standardni odklon), ter parameter oblike, ksi. Enačba zbirne porazdelitvene funkcije za takšno GEV porazdelitev je prikazana spodaj.

Gumbelova porazdelitev je od teh treh najbolj podobna običajnih porazdelitvam (denimo normalni, eksponentni, beta in podobnim), je najbolj simetrična in ima precej kratke “repe”. Obratna Weibullova je zelo pogosta pri opisovanju ekstremnih dogodkov v naravi, kot so temperatura, veter in nivo morske gladine, je pa nagnjena v levo in prirezana v zgornjem repu porazdelitve. Tretja od njih, Fréchetova, pa je prirezana na levi, torej spodaj, sicer pa ima zelo dolge repe. Pogosto je v uporabi pri modeliranju padavin, pretočnih lastnosti, pa tudi v ekonomiji pri vrednotenju ekonomskih učinkov. Posebna je tudi po tem, da ima pod določenimi pogoji neskončna prvi in/ali drugi moment porazdelitve. Splošna grafična oblika vseh treh je prikazana na sliki spodaj.

Metode analize ekstremnih vrednosti imajo številne uporabe. Spletna stran konference tako navaja uporabe na področju klimatskih in atmosferičnih znanosti, tveganj v industriji, geoznanostih, hidrologiji, finančni in aktuarski ekonomiki, bioznanostih, fiziki ter vedah o telekomunikacijah in stohastičnih omrežjih.

Lep primer uporabe navaja gradivo Erica Gillelanda. Spodaj je sličica, ki pokaže količino padavin v Fort Collinsu v ameriški državi Colorado v letih 1900-1999. Iz slike je lepo vidno, da je bila ekstremna vrednost padavin dosežena ob veliki poplavi 28. julija 1997. Vprašamo se, kolikšna je bila verjetnost takšnega ekstremnega dogodka. Gilleland spodnje podatke modelira s pomočjo Fréchetove porazdelitve in pokaže, da z vsaj 95% verjetnostjo lahko zavrnemo trditev, da se podobna poplava dogodi prej kot v okrog 100 letih od zadnje.

Podobnih uporab je še zelo veliko. Tako denimo ekonomska teorija uporablja metode ekstremnih vrednosti pri modeliranju nekaterih procesov v financah. Znani modeli Value-at-Risk (VaR) so primer takšne uporabe. Prav tako področje zavarovalništva uporablja metode ekstremnih vrednosti denimo pri modeliranju zavarovančeve izpostavljenosti bankrotu (t.i. ruin models). Primerov uporabe kar mrgoli tudi pri modeliranju naravnih nesreč, športnih rezultatov, klimatskih sprememb in pojavov v astronomiji.

Vse to torej obeta zanimivo in vrhunsko konferenco. V zgornjem seveda nismo omenili skoraj nobenih metodoloških podrobnosti, ki se sučejo denimo okrog parametričnega in neparametričnega modeliranja, določanja momentov uporabljenih porazdelitev, metod ocenjevanja, kot so različne metode verjetja (npr. profilno verjetje, angl. profile likelihood) in bayesijanskih vidikov. Več o vsem tem boste zagotovo lahko slišali julija v Zagrebu.

Avtor: Andrej Srakar

Mathematical statistician and cultural economist, based in Ljubljana, Slovenia.

Oddajte komentar

Fill in your details below or click an icon to log in:

WordPress.com Logo

Komentirate prijavljeni s svojim WordPress.com računom. Odjava /  Spremeni )

Google photo

Komentirate prijavljeni s svojim Google računom. Odjava /  Spremeni )

Twitter picture

Komentirate prijavljeni s svojim Twitter računom. Odjava /  Spremeni )

Facebook photo

Komentirate prijavljeni s svojim Facebook računom. Odjava /  Spremeni )

Connecting to %s