Kdor se je že vsaj malo ukvarjal s statistiko, je verjetno že slišal za Studentov t-test. Morda pa ni tako znano, zakaj je ta test nastal in kako je dobil svoje ime …
William Sealy Gosset je leta 1899, pri 23 letih, na Oxfordu diplomiral iz kemije in matematike. Istega leta je začel delati v varilnici piva Guinness, kjer so ga angažirali predvsem zaradi njegovega znanja kemije (kot je opisano v knjigi: The Lady Tasting Tea). Za varilnico je bil dobra pridobitev, saj se je izkazal tudi kot dober administrator in sčasoma je napredoval do vodje enote za širše območje Londona.Poleg znanja kemije so se v kontroli procesa varjenja piva kot uporabna izkazala tudi njegova matematična znanja. Pivu je namreč treba dodati ravno pravšnjo količino kvasovk, da fermentacija ni prešibka ali premočna. Kvasovke so gojili v posodah, kjer so se lahko različno hitro razvijale. Zato je bilo potrebno pred uporabo oceniti, kakšna koncentracija kvasovk se je razvila v posodi. Gosset je ugotovil, da se lahko število preštetih kvasovk opiše s Poissonovo distribucijo. Na ta način so lahko pri Guinessu bolje ocenili, koliko mešanice kvasovk dodati in tako dosegli bolj konstantno kakovost piva. Tako morda Guinessovo pivo lahko štejemo kot Gossetov najbolj znan dosežek. Gosset je želel rezultate svojega dela objaviti, vendar pivovarna Guiness ni dovolila, da bi njeni zaposleni javno objavljali, saj so se bali uhajanja poslovnih skrivnosti. Gosset si je izbral psevdonim “Student” in objavil članek v reviji Biometrika, katere urednik je bil Karlu Pearson, pri katerem je Gosset v tistem času študiral. Članek je dostopen na spletu, vendar je žal plačljiv. Pod tem imenom je objavil še mnogo člankov. Ni gotovo, ali so v pivovarni izvedeli za objave pred njegovo smrtjo.
V statistiki pa je Gosset najbolj poznan po preizkusu za enakost povprečij med dvema vzorcema, ki ga po njem imenujemo “Studentov t-test”. Gosset je delal z majhnimi vzorci in je potreboval metode za primerjavo kakovosti zvarjenega piva. Ugotovil je, kakšni porazdelitvi sledi ocena povprečne vrednosti, če delamo z majhnimi vzorci. Njegove ugotovitve se še danes uporabljajo za delo z relativno majhnimi vzorci in omogočajo primerjavo razlik med njimi ter testiranje domnev.
Tudi mi ga uvrščamo med pomembnejše statistike, saj se je navsezadnje ukvarjal in prispeval k nadvse pomembnemu in duši koristnemu področju. Na zdravje!
Pingback: Kdaj rečemo, da so rezultati čudni? | Udomačena statistika
Pingback: 1. pogovorni večer mladih v znanosti | Mlada akademija