Udomačena statistika

Mladi statistiki pišemo blog.

Zakaj ekonometrija je in ni statistika

Komentiraj

Ekonometrija je posebno področje, ki je danes temeljno in osnovno za celotno ekonomsko področje, prispevki, ki ne vsebujejo ekonometričnih obravnav pa precej težje pridejo do objav v ekonomski literaturi. Vendar, kakšno je razmerje ekonometrije do statistike? Ali obstaja razlika med ekonomsko statistiko in ekonometrijo in kakšna? Ali lahko pojmujemo ekonometrijo kot del statistike? Ali je, kot menijo nekateri na ekonomskem področju, statistika lažja in celo manjvredna od ekonometrije?

Čeprav lahko zametke ekonometrije vidimo že ob začetkih ekonomske znanosti v 18. stoletju, pa navadno štejemo za začetek področja ustanovitev organizacije Econometric Society in njene krovne revije Econometrica v letu 1933. Še danes je temeljno poslanstvo Econometric Society spodbujanje razvoja matematičnih in statističnih metod v ekonomiji, organizacija pa je danes osrednja in temeljna na ekonomskem področju v svetovnem merilu. Nekaj več o njenem zgodovinskem razvoju lahko preberete tukaj (spodaj je tudi slika, izvirajoča iz nastanka tega združenja).

Osnovna zamejitev področja ekonometrije je navadno na presečišču treh krožnic: ekonomije, matematike in statistike. To pomeni, da je ekonometrija tisti del matematične ekonomije, ki zadeva delo s podatki (torej statistiko); tisti del ekonomske statistike, ki vključuje matematično modeliranje; ter tisti del matematične statistike, ki zadeva modeliranje v ekonomiji. Ker pa modeliranje v ekonomiji navadno zadeva ocenjevanje parametrov, pomembnih za ekonomijo, kot so inflacija, različne vrste elastičnosti ponudbe in povpraševanja, parametri proračunske in denarne politike, devizni tečaji, stopnja gospodarske rasti in podobni, ki so med seboj velikokrat vzročno povezani, je osnovna statistična metoda, ki tvori jedro ekonometričnega modeliranja, regresija. Dejansko bi lahko brez večjih težav postavili enačaj: ekonometrija je regresijsko modeliranje.

Vir: Lastni prikaz

Kljub temu, da smo ekonometrijo opredelili kot del matematične statistike, pa je šla lastno pot in razvila nekatere pristope, ki so v matematični statistiki le redko prisotni, povezani pa predvsem z analizo kavzalnosti. V najbolj osnovni ločnici ekonometrijo delimo na mikro in makroekonometrijo: prva zajema regresijske modele s presečnimi in panelnimi podatki, druga pa ekonometrijo časovnih vrst. Takoj je treba omeniti, da je velika večina ekonometrije frekventistična, Bayesovi (t.j. verjetnostni) pristopi se na področje prebijajo le počasi, največkrat v makroekonometričnih pristopih vektorskih avtoregresij.

Čeprav naštevanje ni osnovni namen tega prispevka, vseeno navedimo grobe teme, ki navadno zajemajo tudi poučevanje ekonometrije pri nas in v tujini. Ko govorimo o regresijah s presečnimi podatki, ekonometrija seveda prične pri običajni linearni regresiji z metodo najmanjših kvadratov (angl. ordinary least squares oz. OLS), nadaljuje pri njeni razširitvi v posplošeno metodo najmanjših kvadratov (angl. generalized least squares oz. GLS), ki je tesno povezana z uteženo metodo najmanjših kvadratov (angl. weighted least squares oz. WLS). Obsežno področje so modeli omejenih odvisnih spremenljivk, ki jim v statistiki rečemo modeli s kategorialnimi podatki. Najbolj osnovni so tisti, kjer je odvisna spremenljivka binarna, modeli pa zajemajo najbolj osnovni model linearne verjetnosti, predvsem pa t.i. indeksne modele, kot so logit, probit in njune razširitve (bivariatni, ordinalni, multinominalni, gnezdeni, pogojni, mešani, heteroskedastični logit in probit ter logit in probit z instrumentalnimi spremenljivkami in za panelne podatke). Tu velja omeniti še model dogit Marca Gaundrya in Marcela Dagenaisa ter logično regresijo Ruczinskega, Kooperberga in LeBlanca, kjer pa so kategorialne/binarne neodvisne in ne odvisne spremenljivke.

Tudi v ekonometriji se vedno bolj uveljavljajo posplošeni linearni modeli (angl. generalized linear models oz. GLM), kjer je porazdelitev napak lahko poljubna (ni nujno, da je porazdeljena po normalni porazdelitvi). Pogosto uporabljeni so modeli omejenih odvisnih spremenljivk (zlasti Tobit in modeli robnih rešitev). Regresijsko modeliranje števnih odvisnih spremenljivk izhaja iz običajnega Poissonovega modela, razširi pa se na negativne binomske modele. Poseben problem pri modeliranju števnih spremenljivk je večja prisotnost ničel v odvisni spremenljivki, kjer so v veljavi modeli presežnih ničel (angl. zero-inflated), kot so modeli ovir (angl. hurdle) in razširitve običajnih modelov s korekcijami za presežne ničle. Modele analize preživetja, dobro znane iz statistike, ekonometrija poimenuje modeli trajanja (angl. duration models), sicer pa so tu modeli bolj ali manj enaki kot v statistiki (denimo običajne Coxove regresije). Probleme pristranosti izbora (angl. sample selectivity) ekonometrija najpogosteje rešuje s pomočjo dvostopenjske Heckmanove korekcije. Pomembnejše teme pri regresijskih analizah z uporabo presečnih podatkov so še pol in neparametrične metode, modeli mešanic (angl. mixture models), mešani oz. večnivojski modeli ter Bayesove razširitve.

V regresijah s panelnimi podatki sta paradna konja seveda linearna modela s stalnimi (angl. fixed) in naključnimi (angl. random) učinki. Med razširitvami na nelinearne modele velja omeniti predvsem dinamične panelne modele, ki so postali velika tema ekonometrije. Kot pove že ime, v njih vstopa dinamična, časovna dimenzija na temelju odloženih odvisnih spremenljivk. Zelo znani in uporabljeni so tu trije modeli: Anderson-Hsiao, Arellano-Bond (pogosto imenovan tudi GMM v razlikah) in Arellano-Bover (pogosto imenovan tudi sistemski GMM). Nasploh je ena posebnosti ekonometrije ocenjevanje s posplošeno metodo momentov (angl. generalized method of moments oz. GMM), ki jo je 1982 razvil Lars Peter Hansen (in zanjo prejel Nobelovo nagrado za ekonomijo leta 2013). Slednja sicer izhaja iz običajne metode momentov, znane iz statistike, vendar je optimizacija utemeljena na uteženih kombinacijah pogojev momentov in ne na običajnih enačbah momentov, kot sicer. Regresije s panelnimi podatki so tudi tema sveže številke Journal of Econometrics. V njej sta uvod napisala Vasilis Sarafidis in Tom Wansbeek, kot zanimivejše trenutne teme področja pa omenjata nelinearne in faktorske panelne modele, modele z različnimi naklonskimi koeficienti, ter večdimenzionalne in večnivojske panelne modele.

Posebna tema ekonometrije so regresije s časovnimi vrstami, o katerih sem na blogu že pisal. Najpogosteje uporabljeni in izpostavljeni so zagotovo modeli vektorskih avtoregresij in modeliranja pogojne heteroskedastičnosti (modela osnovne in posplošene avtoregresijske pogojne heteroskedastičnosti, ARCH in GARCH). Zelo zanimiva tema, ki je na meji matematične ekonomije in ekonometrije (v njih ni vedno prisotne stohastične komponente) so tudi modeli splošnega ravnovesja, ki pa jim morda posvetimo poseben zapis. Z njimi danes ekonomisti večinoma modelirajo učinke posameznih ukrepov makroekonomskih politik.

Kot sem omenil že v začetku, je morda osrednja tema sodobne ekonometrije modeliranje kavzalnosti. Tu je ekonometrija napravila več pomembnih razvojev, ki v statistiki še vedno niso pogosto prisotni in uporabljeni, kot so modeli instrumentalnih spremenljivk (sam na to distinkcijo velikokrat naletim, ko predavam kje v tujini – ekonometriki slabše poznajo sodobnejše pristope v Bayesovi statistiki ali v neparametričnem modeliranju, statistiki pa metode instrumentalnih spremenljivk). Tudi o temi kavzalnosti sem na blogu že pisal, v grobem tu obstajata dva pristopa, pristop potencialnih izidov (tudi: nasprotujočih dejstev, angl. counterfactuals), ki je prevladujoč tudi v ekonometriji, ter pristop strukturnih modelov oz. strukturnih enačb. Ključni avtorji obeh so velikokrat v precejšnjem sporu, kar ima precejšen vpliv na modeliranje v ekonomiji. O tej temi je v preprintu na arXiv.org lepo pisal Guido W. Imbens, trenutno zagotovo ena osrednjih osebnosti na področju ekonometrije in ekonomije nasploh.

Za ponazoritev povedanega je spodaj empirični primer ekonometričnega dela iz nekega drugega lastnega članka (trenutno v postopku recenzije) s področja zunanje trgovine. Tabela prikaže rezultate različnih regresijskih modelov, ki postavljajo v odvisnost uvoz dobrine od domačega in tujega BDP in BDP na prebivalca, deleža prebivalcev iz tujih držav (t.i. imigrantov), različnih oblik razdalje med domačo in tujo državo (dveh najbolj osnovnih: geografske in kulturne) in prisotnosti skupnega jezika.

Ker je šlo za panelne podatke (modeliranje zunanjetrgovinskih aktivnosti kanadske ekonomije v letih 1996-2010), so vključeni panelni modeli, kot so model stalnih učinkov (s korekcijo Swamy-Arora) in sistemski GMM, ter dva druga modela na temelju cenilk za presečne podatke, Poissonove cenilke psevdo največjega verjetja ter izračunljive (angl. feasible) metode posplošenih najmanjših kvadratov (GLS)

Zvezdice na sliki označujejo običajne meje statistične značilnosti regresijskih koeficientov in statistik (*** – do 1%; ** – do 5%; * – do 10%).

Utrinek s konference

Vir: Lastni prikaz

Iz modela so vidne povezave med različnimi spremenljivkami, ki so dokaj pričakovane. Višji tuji BDP pozitivno vpliva na uvoz dobrin. Višja stopnja prebivalstva iz tujih držav poveča uvoz iz teh držav. Večja geografska razdalja praviloma zmanjša količino uvoženega, večja kulturna pa ima nekoliko bolj dvoznačen učinek (znan tudi iz dosedanjih ugotovitev). Če imata državi skupni jezik (primer Kanade in ZDA), je praviloma tudi uvoz večji.

To je primer ekonometričnega dela v praksi – uporaba regresijskih modelov v namen ocenjevanja učinka parametrov. V modelih sicer ni vključene posebne analize kavzalnosti, čeprav vsaj delno to upoštevajo modeli sistemske metode posplošenih momentov, ki vključujejo instrumentalne spremenljivke na temelju odlogov.

Katere so nekatere ključne odprte teme razvoja ekonometrije v prihodnosti? Najprej, kot že omenjeno ob omembi modelov strukturnih enačb, se ekonometrija zdi zaenkrat še dokaj zaprta pred mnogimi pristopi, prisotnimi na drugih področjih statistike. Tako se le počasi v ospredje prebijajo Bayesovi modeli, prisotne so sicer pol in neparametrične metode, še vedno pa so te močneje razvite v matematičnem delu statistike, vedno močneje (čeprav še vedno počasi) se vključujejo modeli strojnega učenja, še posebej v namen analize kavzalnosti. Simulacijske metode, še posebej različne oblike metod ponovnega vzorčenja (zlasti bootstrap) so trenutno močno zastopane na področju. Vedno močneje se prebijajo metode dela z nestandardnimi podatki, zlasti analiza funkcijskih podatkov, pa tudi analiza intervalov (znana iz analize simbolnih podatkov). Ko govorimo o slednjem, velja omeniti tudi metode z odvisnimi, predvsem prostorskimi in prostorsko-časovnimi podatki (t.i. prostorska ekonometrija), pa tudi metode dela s podatki analize omrežij (tu sta nedavna daljša prispevka prispevala Arun Chandrasekhar in Bryan Graham).

Med pomembnejšimi razpravami na področju pa v sklepu omenimo še dve. Najprej, razkorak med uporabno in teoretsko ekonometrijo. V zadnjih letih je prisoten močan razmah prve in več organizacij in konferenc, ki skušajo aplikacijam ekonometričnih metod dati večjega zamaha in močneje spodbuditi razvoj na tem področju. Kot je še v letu 2009 zapisal eden ključnih avtorjev področja ekonometrije, David Hendry, je uporabna ekonometrija v splošnem še vedno na dokaj slabem glasu na ekonomskem področju, vendar se to v zadnjem desetletju počasi spreminja. Za Slovenijo pa, po mojem mnenju, prej velja obratno in nam manjka teoretskega dela.

Druga razprava, s katero se je pričel ta prispevek, pa je razmerje med ekonometrijo in statistiko. To je tema, ki je tudi meni dajala precej misliti ob vpisu na drugi doktorski študij. Ker ekonometrija navadno velja za zelo matematično (statistika pa je zelo raznorodna), vsaj pri nas velikokrat prihaja do napačnega mnenja, da je ekonometrija nekakšna zahtevnejša nadgradnja statistike. Resnica je drugačna: kot smo omenili že uvodoma, bi verjetno ekonometrijo v splošnem lahko pojmovali kot tisti del matematične statistike, ki zadeva modeliranje ekonomije (v tem pa je res povsem drugačna od ekonomske statistike, kjer ni nujna uporaba matematičnih metod). Vseeno pa sta ekonometrija in statistika vse od tridesetih let preteklega stoletja in ustanovitve Econometric Society šli različne poti, odkritja in metodološke novosti pa so se porajale na obeh področjih in vzajemno oplajale. Danes tako sam na konferencah matematične statistike srečujem mnoge teme, ki jih na ekonometričnih (še) ni, kot so Bayesove neparametrične metode, inverzni problemi, veliko bolj poglobljena uporaba analize diferencialnih enačb in stohastičnih procesov, kompleksnejši računski pristopi in podobno. Prav tako pa nekatere teme iz ekonometrije, kot so modeli instrumentalnih spremenljivk, modeliranje splošnega ravnovesja in kompleksnejše teme iz analize časovnih vrst, redkeje srečamo na področju statistike. Vseeno velja upati, da se sedanje stanje nadaljuje in nadgrajuje ter da bosta obe področji rasli naprej in ostajali v stanju »stabilnega ravnovesja«.

Opomba: Prispevek temelji na enciklopedičnem geslu, ki sva ga pripravila skupaj s prof. dr. Miroslavom Verbičem in bo v letu 2020 izšlo pri založbi Sage)

Avtor: Andrej Srakar

Mathematical statistician and cultural economist, based in Ljubljana, Slovenia.

Oddajte komentar

Fill in your details below or click an icon to log in:

WordPress.com Logo

Komentirate prijavljeni s svojim WordPress.com računom. Odjava /  Spremeni )

Google photo

Komentirate prijavljeni s svojim Google računom. Odjava /  Spremeni )

Twitter picture

Komentirate prijavljeni s svojim Twitter računom. Odjava /  Spremeni )

Facebook photo

Komentirate prijavljeni s svojim Facebook računom. Odjava /  Spremeni )

Connecting to %s