Udomačena statistika

Študenti statistike pišemo blog.

Krasne nove metode ali Kdaj bodo ankete izumrle?

7 komentarjev

Ob opazovanju zmožnosti pridobivanja in analize podatkov, ki nam ga omogoča nagel razvoj informacijsko-komunikacijskih tehnologij, si nemalo kdo postavlja vprašanje, ali za pridobivanje kvantitativnih podatkov sploh še potrebujemo anketno raziskovanje. Imamo sisteme, ki omogočajo beleženje vrste podatkov, od nakupov v trgovinah do sledenja mobilnim napravam. Za razliko od 20 in več let nazaj, so podatki dandanes torej relativno poceni dobrina. Dodatna prednost je, da je veliko od teh podatkov možno analizirati v realnem času, od Google iskalnih trendov (npr. gripa ali razne trenutno vroče teme) do ekonomskih indeksov na podlagi cen v spletnih trgovinah.

Na področju družboslovja je opazno predvsem navdušenje nad zmožnostmi procesiranja podatkov s spletnih socialnih omrežij, kot sta Facebook in Twitter – nekateri govorijo celo o novi vedi, tviterologiji. Razloge za entuziazem odlično ponazori Nicholas A. Christakis (NY Times, 24 Jun 2011): »If you had asked social scientist even 20 years ago what powers they dreamed of acquiring, they might have cited the capacity to incospicuosly track the behaviors, purchases, movements, interactions and thoughts of whole cities of people, in real time.«

Tudi sama pozdravljam nove možnosti vpogleda v obnašanje množic prebivalstva, vendar se je treba zavedati tudi omejitev teh pristopov. V zanesenjaških namigih in napovedih, da lahko spletna analitika nadomesti ankete (npr. R. Poynter, M. Huš na SloTech), se odraža nerazumevanje, kaj anketno raziskovanje sploh je in kaj je njegov namen.

tombstone

Vir: Thombstone Creator (ideja: The Survey is Dead, Long Live the Survey)

Spraševanje (npr. ankete, intervjuji) in opazovanje (npr. spletna analitika, opazovalne študije) sta povsem različna raziskovalna postopka, zato je izbor pristopa odvisen od predmeta raziskovanja. Vsaka metoda zbiranja podatkov ima svoje prednosti in slabosti – v določenih primerih je bolj primerno opazovanje, v določenih pa spraševanje. Z opazovanjem smo omejeni na podatke o pojavih, ki jih je možno opazovati. S spraševanjem pa lahko pridobimo tudi podatke o obnašanju in stališčih, ki jih posamezniki ne razkrivajo javno. Ljudje so lahko zelo pristranski, ko se odločajo, kaj bodo objavili in česa ne bodo objavili na spletu.

Recimo, da sem marketinški raziskovalec in me, na primer, zanima kakšno zobno pasto uporabljajo različne ciljne skupine – to ni nekaj, o čemer bi ljudje razpravljali na Facebooku, podatki o nakupih v trgovinah, pa nam nič ne povejo, o lastnostih osebe, ki je izdelek kupila. Spletna analitika nam torej ne more ponuditi odgovora na določena vprašanja, ki so zelo pomembna za nekatera podjetja. Poučen je tudi primer uporabe žajblja, ki ga opiše RTI International, katerega raziskovalci  so nekaj let spremljali naraščajoč trend uporabe tega zelišča, pri čemer so Twitter in Google trende primerjali s podatki nacionalne raziskave o uporabi drog in zdravju (Twitter Feeds and Google Search Query Survelliance: Can they Supplement Survey Data Collection?). Pokazali so, da spletni trendi ne morejo nadomestiti anketnih raziskav (slika).

Ogromni podatkovni nizi (t. i. Big Data), ki so poleg hitrosti (analiza v realnem času) glavni paradni konj zagovornikov absolutne premoči spletne  analitike, niso prav zelo informativni, če so podatki pristranski. Poleg zgoraj opisanih merskih napak, je velika težava tudi pokritost. Če se omejimo na Slovenijo, je po podatkih SURS le okrog 73% populacije od 10-74 let uporabljalo internet. Posamezne spletne strani imajo še manjši doseg, poleg tega se uporabniki zelo razlikujejo tudi v stopnji aktivnosti. Naj bodo spletne strani še tako obiskane in spletna socialna omrežja še tako številčna, njihovi uporabniki se v številnih lastnostih  (že recimo starostna in izobrazbena sestava) razlikujejo od neuporabnikov in manj pogostih uporabnikov. Zato so analize obnašanja spletnih uporabnikov v veliki meri veljavne le za proučevanje le-teh, težje pa je na tej podlagi širše posploševati.

Če nas, na primer, zanima, katero stranka je trenutno najbolj priljubljena v naši državi, analiza tvitov ni najbolj optimalna metoda, saj je na Twitterju trenutno le nekaj več kot 25.000 Slovencev (vir), ki se po številnih lastnostih razlikujejo od državljanov, ki niso na Twitterju. V ZDA je Pew Research center v svojih raziskavah pokazal, da obstajajo precejšnje razlike v odzivih na politične dogodke na Twitterju in v javnomnenjskih raziskavah (Twitter Reaction to Events Often at Odds with Overall Public Opinion). Uporabniki Twitterja so precej bolj liberalno usmerjeni, kar je razvidno tudi iz njihovih tvitov.

S tem ne pravim, da so ne-anketni podatki manjvredni, nikakor ne – le znati jih je treba uporabiti v pravem kontekstu, kar zahteva razumevanje, kaj pravzaprav merijo in do kolikšne mere so posplošljivi. Zelo so lahko koristni, na primer v eksplorativnih fazah raziskave, ko nimamo še jasno opredeljenega raziskovalnega vprašanja.

O omejitvah spletne analitike in podobnih pristopov piše tudi Robert Groves, nekdanji direktor ameriškega statističnega urada, maja 2011 v prispevku »Designed Data« and »Organic data«. Uvodoma poudari, da podatek še ni informacija, ampak ga mora uporabnik osmisliti z raziskovalnim vprašanjem. Groves avtomatsko beležene podatke,  ki nastajajo v različnih transakcijah, označi kot organske podatke (organic data), ker so inherentni sistemu, vendar so to samo podatkovni nizi, ki sami po sebi niso veljavne informacije. Nasproti postavi načrtovane podatke (designed data), kjer imamo nadzor, nad tem, kar želimo meriti. Gre za podatke, ki jih statistični uradi in druge raziskovalne inštitucije zbirajo z anketami (pa tudi z eksperimenti in drugimi metodami) in imajo točno določen namen, kar imajo uporabniki v mislih že pri načrtovanju raziskave – zaradi tega so precej bolj informativni kot organski podatki. Spletna analitika in drugi organski podatki torej ne morejo izpodriniti anket, ampak bi morali vsi skupaj razmišljati o načinih, kako kombinirati in integrirati organske in načrtovane podatke za izboljšanje rezultatov raziskav. Svojo idejo je podrobneje razdelal in postavil v kontekst celotne zgodovine razvoja anketnih metod v članku Three Eras of Survey Research v posebni izdaji revije Public Opinion Quarterly ob njeni 75. obletnici. Zanimivo branje je tudi njegov govor novembra 2012 na konfereci The Future of Survey Research (transkript).

Glede na vse navedeno, lahko torej sklepamo, da bodo ankete še dolgo v uporabi. Spletna analitika in drugi načini pridobivanja t. i. organskih podatkov se bodo v prihodnosti izboljšali glede pokritosti, vendar bomo še vedno potrebovali tudi t. i. načrtovane podatke. Brez načrtovanega spraševanja ne bomo nikoli imeli vpogleda v notranja stanja oziroma vsaj ne do takrat, ko bo izumljeno (in etično sprejeto) branje misli. Do česar pa ne bo prišlo še tako kmalu.

P.S. Upam, da sem s tem zbudila nekaj zanimanja za anketno raziskovanje. Vsi, ki vas na kakršenkoli način zanima to področje, letos bo v Ljubljani od 15. do 19. Julija potekala 5. konferenca Evropskega združenja za anketno raziskovanje (ESRA). Prijavljenih je več kot 500 prispevkov, pričakuje pa se vsaj še enkrat toliko ljudi. Če se registrirate do 15. maja, je kotizacija 195€ (155€ za člane in 125€ za študente).

Advertisements

Avtor: Ana Slavec

Doktorica statistike in raziskovalka na Arhivu družboslovnih podatkov na Fakulteti za družbene vede. Je članica upravnega odbora Društva mlada akademija, urednica bloga Udomačena statistika ter sovoditeljica Meta PHoDcasta. Na Twitterju je @aslavec.

7 thoughts on “Krasne nove metode ali Kdaj bodo ankete izumrle?

  1. Pingback: Ljubljana je gostila 5. ESRA konferenco | Udomačena statistika

  2. Pingback: Sam svoj Kupid | Udomačena statistika

  3. Pingback: Kako prešteti slovenske blogerje? | Udomačena statistika

  4. Pingback: Kako porabljamo čas? | Udomačena statistika

  5. Pingback: Stara družba, nova družba: trendi kvantitativnega raziskovanja s 70. konference AAPOR | Udomačena statistika

  6. Pingback: Statistični dan 2015: Masivni podatki | Udomačena statistika

  7. Pingback: Vzorčenje v dobi masivnih podatkov | Udomačena statistika

Oddajte komentar

Fill in your details below or click an icon to log in:

WordPress.com Logo

Komentirate prijavljeni s svojim WordPress.com računom. Odjava / Spremeni )

Twitter picture

Komentirate prijavljeni s svojim Twitter računom. Odjava / Spremeni )

Facebook photo

Komentirate prijavljeni s svojim Facebook računom. Odjava / Spremeni )

Google+ photo

Komentirate prijavljeni s svojim Google+ računom. Odjava / Spremeni )

Connecting to %s