Udomačena statistika

Mladi statistiki pišemo blog.

O algebrajski statistiki, Gröbnerjevih bazah in metodi momentov

Komentiraj

Algebrajska statistika je relativno novo področje matematične statistike, ki se je razmahnilo v zadnjih dveh desetletjih. Po svoji naravi povezuje pojme in pristope iz algebrajske geometrije, komutativne algebre in kombinatorike. Njeni pristopi so se velikokrat razvili pri reševanju problemov matematične utemeljenosti računalniško podprtih algoritmov, nastajajočih v sodobni statistiki (Zimmermann, 2015). Za prelomno delo področja velja prispevek Diaconisa in Sturmfelsa, verjetno gonilne osebnosti področja, iz leta 1998, ki je v torične statistične modele vpeljalo pojem markovskih baz in se s tem navezalo na področje komutativne algebre. Torični statistični modeli so utemeljeni na reprezentaciji statističnih modelov s toričnimi ideali, enim temeljnih pojmov algebrajske geometrije, ki označuje matematične prostore, ki jih v grobem generirajo razlike med monomi. Danes so torični modeli postali zanimivi do te mere, da nekateri govorijo, da je v matematičnem smislu “ves svet toričen”.

Kasneje se je takšno povezovanje algebre in statistike razširilo na druga področja, kot so parametrično ocenjevanje, filogenetske invariante ter ocenjevanje na temelju metode največjega verjetja. Za drugi ključni članek področja velja prispevek Pistoneja in Wynna (1996), ki je vpeljal metode komutativne računske algebre v načrtovanje in analizo eksperimentov. Zelo znana je tudi monografija Algebrajska statistika za računsko biologijo (Algebraic Statistics for Computational Biology, glej Pachter in Sturmfels, 2005). Mislim, da je na področju algebrajske statistike nekaj časa aktivneje deloval tudi slovenski matematik prof. dr. Jakob Cimprič.

Najbolj pogost matematični pojem, ki označuje povezavo algebre in statistike, je polinom. Da pridemo do polinomske oblike modelov v statistiki, pričnimo s pojmom zasnove (angl. design). Slednji označuje končni nabor n različnih podatkovnih točk v k dimenzijah. Takšno zasnovo točk  A lahko vidimo kot rešitev sistema n polinomskih enačb, ki v algebrajski geometriji označujejo algebrajske varietete. S pomočjo polinomskih kombinacij osnovnih polinomov f, katerih ničle iščemo ter funkcij g polinomske oblike, lahko definiramo razmerje do ideala takšne zasnove:

Vsaka točka v A je torej ničla produkta zgoraj, sama množica A pa je podmnožica množice ničel vsakega polinoma v idealu zasnove. Velja tudi obratno, t.j. če je A vsebovana v množici ničel nekega polinoma, potem se ta polinom nahaja v njenem idealu. Ideal(A) je torej algebrajski objekt, pripadajoč zasnovi A. Poimenujemo ga lahko zasnovni ideal A, polinomi g pa so generatorji takšnega ideala (ki niso enoznačno določeni).

Podobno določimo tudi polinomski ideal. Naj bo D končna množica med seboj različnih točk. Predpostavimo, da se koordinate teh točk nahajajo v nekem polju K, ki je lahko polje racionalnih, realnih ali kompleksnih števil. Naj K (kot spodaj) označuje množico vseh polinomov iz spremenljivk x s koeficienti iz K. Definirajmo:

Ideal(D) je polinomski ideal za D. Po Hilbertovem izreku o bazi je takšen polinomski ideal generiran s končno mnogo polinomi. Prav tako je Ideal(D) izračunljiv na temelju koordinat točk v D. Množici polinomskih funkcij nad D z vrednostmi v K pravimo kolobar koordinat v D in jo označimo s K[D].

Eden osrednjih pojmov v algebrajski statistiki so Gröbnerjeve baze. O njihovi matematični zasnovi v prispevku za Obzornik za matematiko in fiziko malce podrobneje pišeta matematika Brigita Ferčec in Matej Mencinger.

V matematiki Gröbnerjeve baze nastopijo pri odgovoru na vprašanje, ali je neki polinom element danega ideala, pri problemu enakosti idealov, izračunu preseka dveh ali več idealov in podobno. Teorijo Gröbnerjevih baz je leta 1965 v svoji doktorski tezi vpeljal Bruno Buchberger in jo poimenoval po svojem mentorju. Na teorijo lahko gledamo s stališča posplošitve Evklidovega algoritma, pa tudi kot na posplošitev Gaussove eliminacije linearnega sistema, katere rezultat je (zgornje-) trikotna oblika linearnega sistema. Teorija Gröbnerjevih baz omogoča računanje (deljenje) v kolobarju polinomov več spremenljivk, ki je analogno računanju (deljenju) v polinomskih kolobarjih ene spremenljivke. Preprosta matematična definicija, ki nam je lahko v pomoč, se glasi: Gröbnerjeva baza splošnega polinomskega ideala I je takšna množica G, kjer je ideal, ki ga generirajo vodilni členi polinomov v G enak idealu, ki ga generirajo vodilni členi vseh polinomov v I.

Kadarkoli imamo torej v statistiki opravka z modeli oziroma sistemi modelov, ki jih sestavljajo polinomi lahko za takšen sistem izračunamo njegovo Gröbnerjevo bazo in ga s tem prevedemo na lažje izračunljiv problem. Še posebej je to uporabno, ko imamo opravka s sistemi nelinearnih polinomskih enačb. Eden najbolj običajnih primerov je ocenjevanje z metodo momentov, primere pa najdemo marsikje v statistiki: modeli analize mešanic (compositional data), analiza kontingenčnih tabel, ter grafični modeli (kot so Bayesova omrežja) in modeli analize kavzalnosti nasploh. Obstaja vrsta računskih modulov za izračune Gröbnerjevih baz, med bolj znanimi so Maplov groebnerGroebnerBasis v Wolfram Mathematici, mathic v C++, algebrajske metode v statistiki pa so vključene tudi v knjižnici algstat v R.

Maria Iannario in Rosaria Simone v svojem prispevku lepo prikažeta kako poteka ocenjevanje takšnih modelov, kadar imamo opravka z metodo momentov in modeli mešanic (angl. mixtures). Uporabita primer mešanice beta binomske in diskretne uniformne porazdelitve in izračunata prve tri momente takšne mešanice. Ker se njune enačbe momentov pretvorijo v nelinearne polinomske enačbe, je logična izbira reševanje s pomočjo Gröbnerjevih baz. Iannariova in Simonejeva izračunata štiri elemente Gröbnerjeve baze in na temelju simulacije pokažeta računske prednosti pristopa ocenjevanja modela s pomočjo uporabljenih algebrajskih metod.

Algebrajski pristop k statistiki poraja več vprašanj. Najprej so tu računske prednosti: prispevki, ki jih avtorji na področju predstavljajo na konferencah, se velikokrat zvedejo na zelo dolge in zapletene sisteme algebrajskih enačb, ki so sami po sebi precejkrat še bolj zapleteni od osnovne metode. Drugo vprašanje je širjenje pristopa izven reševanja polinomskih enačb. Samega me je pred časom zanimala razširitev pristopa iz ocenjevanja s pomočjo metode momentov na ocenjevanje s pomočjo metode posplošenih momentov (angl. generalized method of moments, GMM). Pri slednji namreč ni več nujno, da je optimizacijski pristop utemeljen na reševanju polinomskih enačb, kljub temu pa nekateri prispevki predlagajo uporabo hermitskih polinomov in Steinovih pristopov, o kateri smo tudi tu že pisali. Morda je možno podobne pristope uporabiti tudi pri prevajanju podobnih, nepolinomskih pristopov drugje v statistiki v ogrodje, ki ga omogoča algebrajska statistika.

Sklenil bom s povabilom k spremljanju skupine za nelinearno algebro na inštitutu Max Planck v Leipzigu, kjer mislim, da trenutno verjetno poteka večina dejavnosti na področju algebrajske statistike. Mislim, da je bila v preteklosti z algebrajskim delom te skupine nekoliko povezana tudi mlajša slovenska matematičarka delujoča v ZDA, doc. dr. Sara Kališnik Verovšek. Prav tako pa poteka tudi spletni seminar iz algebrajske statistike, kjer boste v prihodnje verjetno lahko bolj podrobno spremljali dogajanja na področju.

Avtor: Andrej Srakar

Mathematical statistician and cultural economist, based in Ljubljana, Slovenia.

Oddajte komentar

Fill in your details below or click an icon to log in:

WordPress.com Logo

Komentirate prijavljeni s svojim WordPress.com računom. Odjava /  Spremeni )

Google photo

Komentirate prijavljeni s svojim Google računom. Odjava /  Spremeni )

Twitter picture

Komentirate prijavljeni s svojim Twitter računom. Odjava /  Spremeni )

Facebook photo

Komentirate prijavljeni s svojim Facebook računom. Odjava /  Spremeni )

Connecting to %s