Udomačena statistika

Statistiki pišemo blog.

Modeliranje časovnih vrst: med makroekonometrijo in sodobno statistiko

3 komentarji

Ko sem se sam med mojim prvim doktorskim študijem, študijem ekonomije, srečeval z ekonometrijo, je bilo eno zanimivejših branj in poslušanj vezano na poletne inštitute NBER. Slednji so se pričeli s pregledom stanja v sodobni ekonometriji, ki sta ga izvedla dva izmed trenutno vodilnih svetovnih ekonometrikov, Guido Imbens in Jeffrey Wooldridge (vse prezentacije in odlična gradiva so še vedno dostopna tukaj). V naslednjem letu je sledil kot poseben del še: “pregled stanja v sodobni ekonometriji – časovne vrste” (tudi ta gradiva v celoti najdete tukaj), ki sta ga izvedla James Stock in Mark Watson.

Časovne vrste imajo torej že dolgo prav posebno mesto v statistiki, in še bolj specifično, ekonometriji. Pogosto niso del običajnih učbenikov oziroma se slednji velikokrat delijo na mikroekonometrijo (ki zajema tudi ekonometrijo panelnih podatkov, ki je sicer križanec presečnih podatkov in časovnih vrst) in ekonometrijo časovnih vrst. Še danes so le redki poskusi križanj, le počasi se tako denimo v ospredje prebijajo modeli panelne vektorske avtoregresije (t.i. panelni VAR oziroma PVAR).

Čeprav je analiza časovnih vrst seveda stara skorajda toliko kot statistika sama, je poseben preskok, še posebej na področju ekonomije in ekonometrije, zagotovo dobila z delom Nobelovega nagrajenca sira Clivea W.J. Grangerja. Osrednji prispevek slednjega je bil verjetno v tem, da je pokazal, kako se analiza časovnih vrst v temelju razlikuje v situacijah t.i. stacionarnih in nestacionarnih časovnih vrst. Pri tem je opozoril na pojav navidezne korelacije, ki lahko nastane v primeru, ko analiziramo nestacionarne vrste – če nestacionarnosti pri tem ne upoštevamo, dobimo pristrane in včasih absurdne rezultate (npr. da je gibanje BDP neke države povezano s sončnimi pegami oziroma premiki vesoljskih teles – to je le en absurden primer, ki se tu pogosto navaja). Takšne navidezne korelacije lahko nastopijo še posebej, če v analizo vključimo spremenljivke, ki sledijo statističnemu procesu naključnega hoda (angl. random walk), ki označuje gibanje spremenljivke, kjer je naslednja vrednost odvisna le od prejšnje vrednosti in slučajne napake. Sliko takšnega procesa najdete spodaj.

 

V primeru, ko opazujemo korelacijo med dvema spremenljivkama, ki sledita procesu slučajnega hoda, dobimo spodnjo statistično porazdelitev korelacij med takšnima (poljubnima) spremenljivkama.

Po logiki med takšnima (poljubnima) spremenljivkama seveda ne bi smelo biti prav nikakršne korelacije, vsaj v “povprečju”. Iz zgornje slike pa je jasno vidno, da je ta korelacija prav lahko tako rekoč kakršna koli – lahko je denimo 0.5, lahko je -0.5, ali tako rekoč katerakoli vrednost v razponu, ki ga korelacija po definiciji zajema. Zgornja gostota statistične porazdelitve ima namreč vsaj na prvi pogled skorajda uniformno obliko.

To torej pokaže, da potrebujemo narediti kar nekaj statističnih prilagoditev, v kolikor želimo analizo časovnih vrst v takšnih primerih (ki so pogosti pri praktičnem delu) izvesti korektno. V ta namen so ekonometriki in statistiki razvili pojma red integracije in kointegracija. Red integracije označuje število potrebnih diferenc (tega, da iz prejšnje spremenljivke naredimo novo, katere vrednosti so razlike med trenutno in preteklo vrednostjo v prejšnji spremenljivki), da spremenljivka postane stacionarna, kar pomeni, da se njena verjetnostna porazdelitev, pa tudi prvi momenti (povprečje in varianca) ne spreminjajo skozi čas. Izkaže se, da lahko velikokrat v modeliranju časovnih vrst pravilno delamo naprej šele, ko izvedemo takšno preoblikovanje spremenljivke. Kointegracija pa označuje nekakšen pandan korelaciji za običajne spremenljivke – kadar sta dve časovni vrsti kointegrirani, kot na sliki spodaj (kar je odvisno od njunega reda integracije), lahko v grobem rečemo, da sta “dejansko” korelirani, tudi v smislu časovnih vrst. Da se “premikata skupaj”, bi morda lahko bolje dejali.

Ker sem ta zapis pričel pisati z namenom, da bi prikazal nekaj sodobnih napredkov v analizi časovnih vrst, pa me je zdaj odneslo zelo daleč v dokaj osnovne razlage, naj vendarle sklenem z nekaj osnovnimi smernicami trenutnega razvoja tega velikega področja.

Velika tema je seveda napovedovanje s pomočjo časovnih vrst. Zelo lep pregled trenutnega stanja na tem velikem področju ponuja prispevek Gooijerja in Hyndmana. Naslednja tema so modeli splošnega ravnovesja, kot so dinamični stohastični modeli (DSGE), o katerih je kljub kritikam v času sedanje gospodarske krize še vedno največ govora. O teh modelih najdete lep nedavni pregledni prispevek Christiana, Eichenbauma in Trabandta na tejle povezavi, čisto svežega, krajšega, pa tudi tukaj. Veliko je govora tudi o vzročnosti v analizi časovnih vrst, zlasti o modelih vektorskih avtoregresij (VAR), v vseh njihovih neštetih izpeljankah. Za pregled tega področja svetujem prispevek Helmuta Lütkepohla, dostopen na tej povezavi (pri vzročnosti seveda ne moremo mimo t.i. Grangerjeve vzročnosti, ki je posebna oblika vzročnosti za časovne vrste – tudi o njej malce več najdete v prispevku Lütkepohla). Večina zgornjega se navezuje na multivariatne časovne vrste, posebno vlogo pri analizi časovnih vrst pa igrajo univariatne vrste, lep pregled nekaj zanimivejših tem tega področja najdete tukaj. Posebna tema je tudi modeliranje variance modelov časovnih vrst, ki je zelo pomembno denimo v finančni ekonometriji, najbolj znana modela tu sta gotovo ARCH in GARCH. Nekaj več o tem najdete v tem gradivu Piotra Fryzlewicza. Naposled omenimo še modele, ki kombinirajo sodobne statistične pristope k analizi masivnih in kompleksnih podatkov z modeli časovnih vrst, tu so zelo aktivni tudi slovenski ekonometriki, predvsem prof. dr. Igor Masten z Ekonomske fakultete Univerze v Ljubljani. Enega njegovih zadnjih prispevkov na to temo najdete tukaj.

S tem dejansko nismo načeli niti vrha gore vseh zanimivih pristopov, ki na področju nastajajo in se razvijajo. Upamo pa, da smo vseeno uspeli pokazati na nekaj osnov, zakaj je področje posebno in koga navdušiti za nadaljnje branje in igranje s podatki in matematičnimi izpeljavami na tem področju.

 

Avtor: Andrej Srakar

Economist and mathematician, working mainly in probability theory and mathematical analysis. Coordinator of the YoungStatS project (part of YSE). Joint coordinator, Young Section (MSS) of the Slovenian Statistical Society. Committee member, Emerging Applications Section and Discussion Paper Meetings, Royal Statistical Society.

3 thoughts on “Modeliranje časovnih vrst: med makroekonometrijo in sodobno statistiko

  1. Pingback: Zakaj ekonometrija je in ni statistika | Udomačena statistika

  2. Pingback: O modelih več indikatorjev in več vzrokov: zgodovina, delovanje in uporabnost | Udomačena statistika

  3. Pingback: O modelih več indikatorjev in več vzrokov: zgodovina, delovanje in uporabnost | andrej1975

Komentiraj