Udomačena statistika

Mladi statistiki pišemo blog.

Ob letošnji Nobelovi nagradi za ekonomijo: postavitev temeljev ekonomskemu empiričnemu delu

Komentiraj

Letošnje podelitve Nobelovih nagrad so za nami. Tisti, ki imamo radi področje verjetnosti, smo se veselili tudi nagrade fiziku Giorgiu Parisiju, soavtorju stohastične parcialne diferencialne enačbe Kardar-Parisi-Zhang. Za tiste s področja regresijskega modeliranja in ekonometrije pa je bil vrhunec seveda zadnji dan in podelitev letošnje nagrade za ekonomijo.

Letošnjo nagrado so podelili trem ekonomistom: polovico Davidu Cardu za njegove prispevke k empiričnemu raziskovanju ekonomike trga dela (velikokrat se je omenjal predvsem njegov znani prispevek skupaj s pokojnim Alanom B. Kruegerjem), ter po četrtino Joshui D. Angristu in Guidu W. Imbensu za njuno »revolucijo kredibilnosti« v ekonomiji, torej za metodološki doprinos k empiričnemu raziskovanju v ekonomiji, ki je danes prav zaradi njunega dela takšna, kot jo poznamo. V prispevku pišem predvsem o njiju, torej tistem delu nagrade, ki je najmočneje vezan na statistiko, pregledne članke o nagradi pa najdete tudi na portalu VoxEU ter na strani Nobelovih nagrad samih.

V šestdesetih in sedemdesetih letih prejšnjega stoletja je bila ekonomija potopljena v matematične teoretske modele. Pri tem so velikokrat izstopali avtorji iz univerze v Chicagu, po svojih doprinosih k razpravam je postal znan posebej Milton Friedman. Slednji je šel tako daleč, da je postavil drzno, malce noro tezo, da bolj kot ekonomska teorija in hipoteze odstopajo od realnosti, toliko večji je njihov pomen za raziskovanje.

V znanem prispevku iz leta 1983 je tako ameriški ekonomist Edward Leamer zapisal, da empiričnim ekonomistom tistega časa ne verjame tako rekoč nihče. Predlagal je, da naredijo več na analizah občutljivosti in robustnosti njihovih spoznanj. To je bil čas teoretskih ekonomistov, Leamer (in večina takratnih ekonomistov z njim) pa je dvomil v kredibilnost in nasploh možnosti empiričnega dela v ekonomiji (kasneje, po nastalih odkritjih, sta Angrist in Jörn-Steffen Pischke odgovorila na takratne Leamerjeve pomisleke).

V devetdesetih letih so se na univerzi v Harvardu srečali trije mlajši profesorji: ekonomista Joshua D. Angrist in Guido W. Imbens, ter statistik Donald B. Rubin, ki je dobro desetletje pred tem razvil svoj model vzročnega sklepanja, ki je postal osnova tega, na čemer sta poslej gradila tudi Angrist in Imbens. Rubin je nadaljeval sodelovanje predvsem z Imbensom, plod njunega sodelovanja je monografija, ki je danes osnova področju metod vzročnega sklepanja v statistiki in ekonometriji.

Že pred srečanjem z Rubinom sta Angrist in Imbens objavila enega svojih najbolj znanih prispevkov, kjer sta razvila tako imenovano LATE (local average treatment effect oz. povprečni lokalno zamejeni učinek tretmaja) cenilko. Ko je Imbens nato stopil v stik z Rubinom (o tem podrobneje Rubin v svojem daljšem intervjuju za revijo Statistical Science), so se Rubinu njegove zamisli in zamisli Angrista zdele zanimive in nastalo je trajnejše sodelovanje. Najbrž najbolj znan prispevek, ki je nastal na temelju takratnih razprav je bil objavljen v reviji Journal of the American Statistical Association (JASA), in postavlja pristope instrumentalnih spremenljivk, ki so bili značilni za do tedaj prevladujoče strukturne ekonomske modele, v kontekst Rubinovega vzročnega modela, ki temelji na pristopu potencialnih izidov oz. nasprotujočih dejstev (angl. potential outcomes in counterfactuals).

Nasprotovanje in polemike med pristopi na temelju Rubinovega vzročnega modela, ki so danes povsem prevladali v ekonometriji, ter pristopi t.i. grafičnih modelov (katerih primer so modeli strukturnih enačb) so še danes zelo žive, morda celo bolj kot kadarkoli zaradi vzpona umetne inteligence in strojnega učenja, ki sta močno povezani z metodami vzročnega sklepanja. V zadnjih letih prihaja sicer do poskusov zlivanja obeh pristopov. V času epidemije je tako postala zelo znana študija ekonometrika in matematičnega statistika Victorja Chernozhukova in sodelavcev, ki so za oceno vzročnih učinkov zaprtij nekaterih ameriških držav zaradi epidemije uporabili pristope strukturnih enačb, povezane s standardnimi ekonometrični pristopi na temelju Rubinovega vzročnega modela.

Desetletja po druženju Angrista in Imbensa z Rubinom so prinesla več nadaljnjih prelomnih pristopov. Močno se je razvilo raziskovanje pristopov razlike-v-razlikah (angl. difference-in-differences), ki je danes eno najbolj živahnih v ekonometriji. Razvita je bila nadgradnja pristopa regresijskih prekinitev (angl. regression discontinuity design). Še močneje pa današnja raziskovanja v ekonometriji zaznamuje pristop sintetičnih kontrol (angl. synthetic control), ki se je prvič pojavil v prispevku Alberta Abadieja in Javierja Gardeazabala iz leta 2003 (povezuje pa se ga tudi s kasnejšim prispevkom Abadieja, Diamonda in Hainmuellerja iz 2010). Ta pristop zgradi nasprotno dejstvo (angl. counterfactual) iz utežene kombinacije trajektorij enot v kontrolni skupini, s čimer olajša delo pri reševanju mnogih problemov vzročnega sklepanja. Trenutno lahko omenimo še dva porajajoča se pristopa, ki bosta verjetno naletela na veliko raziskovanja v prihodnjih letih: v prispevku, objavljenem v JASA v 2019 sta Iavor Bojinov in Neil Shephard pristop potencialnih izidov prenesla tudi na vzročnost za podatke časovnih vrst, kjer je doslej prevladoval problematični pojem Grangerjeve vzročnosti; v zadnjih dveh letih pa so na področje ekonometrije močneje vstopili pristopi iz visoko-dimenzionalne statistike, posebej matrično in tenzorsko dopolnjevanje (angl. matrix and tensor completion), že prej pa tudi pristopi strojnega učenja (denimo večkraki banditi in predvsem različne oblike nevronskih mrež), kjer so posebej znani prispevki Susan Athey (življenjske sopotnice Guida Imbensa), Stefana Wagerja ter Imbensa samega; pa tudi že omenjenega Victorja Chernozhukova in njegovih sodelavcev.

Opazimo lahko tudi precejšnje razlike na življenjski poti Angrista in Imbensa. Prvi je nadaljeval svojo pot veliko bolj v smeri raziskovanja uporabnih tem kot metodologije, in pri svojem delu večinoma analizira teme s področja ekonomike izobraževanja, trga dela in urbanizma. Drugi, Imbens, je prvenstveno metodolog in statistik oziroma teoretski ekonometrik. Oba sta zelo produktivna in še danes objavita desetine člankov vsako leto, zelo znana pa sta postala tudi po svojih pedagoških pristopih in bila mentorja številnih danes znanih ekonomistov in ekonometrikov.

O razlikah med statistiko in ekonometrijo smo že pisali. Lahko rečemo, da ogromno večino današnje popularnosti ekonometrija dolguje prav revoluciji Angrista in Imbensa. Živimo namreč v času uporabnih, empiričnih ekonomistov, ogromna večina raziskovanj v ekonomiji poteka skozi ekonometrične analize baz podatkov. Pri tem ne gre toliko za razlikovanje teorije in prakse, pač pa za to, da sta šele Angrist in Imbens ponudila temelje današnjim empiričnim študijam v ekonomiji, ki so pomenile velikanski preskok naprej področja ekonomije. Letošnjo nagrado torej sam ne vidim kot nagrado empiričnemu delu, pač pa postavitvi temeljev zanj.

Področje ekonomije in ekonometrije je trenutno zelo živo. Zdi se, da se po velikih obtožbah čezenj v času Velike recesije stvari počasi postavljajo na svoje mesto. Trenutno sam še vedno vidim prevelik razkorak med tako-imenovano prevladujočo, mainstream ekonomijo, ki temelji prav na uporabi metod revolucije kredibilnosti, torej na delu Angrista in Imbensa, na eni, in heterodoksnimi šolami na drugi. Slednje temeljijo na nasprotovanju postavki maksimizacije koristnosti in homo economicusu (v temelju racionalnem), pa tudi pojmu ekonomskega ravnovesja kot neustreznim, preveč preprostim osnovam za ekonomsko razmišljanje in modeliranje. Tako lahko dosedanje Nobelovce iz heterodoksnih šol še vedno iščemo kot šivanko v senu – vprašanje je, če bi sploh kakšnega od Nobelovcev zadnjih desetletij resnično lahko šteli mednje. Matematično modeliranje je tudi v teh krogih vedno bolj živo, namesto statistike pa velikokrat izhaja iz matematične fizike in verjetnosti, teorij kompleksnosti in sistemske teorije. Zaradi močne matematične kompleksnosti, ki se poraja v heterodoksnih krogih se zdi, da bodo prihodnja leta zelo razburljiva, ta spoznanja pa naposled odmevneje vstopila v prevladujočo ekonomijo. Mogoče je, da nas kmalu čaka paradigmatski preobrat, in, kot napovedujejo nekateri ponovno oblikovanje enotne, skupne ekonomske paradigme, ki pa bo precej drugačna od dosedanje.

Na drugi strani je velikanska skupina uporabnih ekonomistov in ekonometrikov. Bojim se, da tudi tukaj nastaja razkorak in metodološko usmerjeni ekonomisti niso vedno najbolj cenjeni in sprejeti. Iz revolucije kredibilnosti, postavitve osnov empiričnemu delu, je nastala nekakšna »tiranija empirije«, ko prispevek brez uporabe ekonometričnih metod na konkretnem naboru podatkov sploh ne pride do možnosti resnejše objave. Velikokrat je takšno delo nereflektirano, prispevek posvečuje zgolj sklicevanje na začetnike revolucije. Zgolj analiza podatkov torej služi legitimaciji pomembnosti prispevka. Vendar je to problem splošne ekonomije tega trenutka, pa tudi prevladujočih ideologij področja, bolj kot ekonometrije in metodološkega dela, ki temu ponuja le orodja.

S statističnega vidika pa se ekonometrične metode razvijajo zelo hitro, aktiven je predvsem krog okrog samega Imbensa in več drugih ameriških profesorjev. Kot že omenjeno, se pristopi vedno bolj navezujejo na strojno učenje, na Bayesove pristope, na pol- in neparametrične metode, tudi na grafične (DAG) vzročne modele in na analizo neevklidskih (denimo funkcijskih in prostorskih) podatkov. Tudi ekonometrija se torej ponovno odpira hitremu razvoju področja statistike, pa tudi verjetnosti in naključnih procesov.

Nagrado se je torej zagotovo podelilo pravim avtorjem, ki v temelju zaznamujejo čas, ki ga ekonomisti živimo, verjetno trenutno celo bolj kot kdorkoli drug. Njeno utemeljitev je verjetno bolje iskati v omogočanju možnosti za empirično delo v ekonomiji, kot za samo empirično delo. Ekonomija in ekonometrija pa se razvijata naprej in to hitro, v veliki meri v povezavi s splošnim razvojem področij statistike in naključnih procesov.

Avtor: Andrej Srakar

Mathematician, statistician, econometrician and cultural economist, based in Ljubljana, Slovenia.

Oddajte komentar

Fill in your details below or click an icon to log in:

WordPress.com Logo

Komentirate prijavljeni s svojim WordPress.com računom. Odjava /  Spremeni )

Google photo

Komentirate prijavljeni s svojim Google računom. Odjava /  Spremeni )

Twitter picture

Komentirate prijavljeni s svojim Twitter računom. Odjava /  Spremeni )

Facebook photo

Komentirate prijavljeni s svojim Facebook računom. Odjava /  Spremeni )

Connecting to %s