Dobar uzorak je kao parče torte

Ukoliko se neka nepravilnost desi na jednom biračkom mestu, to ne znači da se svuda dešava. Zamislite da krenete da jedete parče torte i odmah naiđete na sitnu košticu od voća. To ne mora nužno da znači da se koštice nalaze u celoj torti. Moguće je da je samo ta jedna sitna koštica zapala u celu tortu i to neće narušiti kvalitet cele torte. Međutim, ukoliko nastavite da jedete parče koje ste dobili i nailazite na još koštica, onda je opravdano očekivati da ćete koštice nalaziti u celoj torti i da torta nije dobra.
Zoran Drekalovic

Predsednički i parlamentarni izbori koji su se prethodne nedelje održali na ukupno 8.115 biračkih mesta u Srbiji, posmatračka misija organizacije Crta pratila je na uzorku od 500 biračkih mesta. Da li je ovih šest posto biračkih mesta dovoljno za dobijanje preciznih rezultata? Ispostavlja se – jeste. Rezultati Crte gotovo se u potpunosti poklapaju se sa rezultatima Republičke izborne komisije (RIK). Na osnovu uzorka koji čini mnogo manji broj članova iz cele populacije moguće je dobiti precizne rezultate. Da li to onda znači da bi rezultati bili znatno precizniji ukoliko bi uzorak bio duplo veći, npr. 1.000 biračkih mesta?

Korišćenje većeg uzorka bilo bi manje ekonomično i teško sprovodivo s organizacijske strane, pri čemu to ne bi doprinelo dobijanju značajno preciznijih rezultata. Drugim rečima, na osnovu matematičkih zakona i simulacija, moguće je izračunati koja veličina uzorka je dovoljna da bi on veoma dobro predstavljao čitavu populaciju, odnosno da bi margina greške bila dovoljno niska, pri čemu dodavanje novih mesta ne bi bitno doprinelo preciznosti rezultata. Iz tog razloga povećanje uzorka nije neophodno, a da je za posmatranje izbora sasvim dovoljno 500 biračkih mesta, može se videti i na sledećem primeru posmatranja izbora 2022. godine

U naredne dve tabele upoređena su odstupanja u rezultatima na parlamentarnim i predsedničkim izborima o kojima je izvestila Crta u odnosu na zvanične rezultate Republičke izborne komisije (RIK) sa obrađenih oko 99,5% biračkih mesta.

 

Rezultati izbora na uzorku

 

Kada su u pitanju parlamentarni izbori, odstupanje rezultata na uzorku u odnosu na rezultate koji se odnose na celu Srbiju izuzetno su mali. Najveće odstupanje uzorka od populacije iznosi svega 0,5% i to za kandidata koji je osvojio ubedljivo najveći broj glasova, odnosno gde postoji veći varijabilitet u glasanju. To je u okviru margine greške koja iznosi 1,3% za pobedničku listu. Po pravilu, za liste koje su osvojile manji broj glasova javlja se manji varijablitet, a otuda i još niža margina greške, i manje odstupanje rezultata na uzorku od konačnih rezultata na populaciji. Ukoliko bi rezultati izlazili van margine greške, to bi moglo da znači da postoji problem sa podacima, npr. da je neko od posmatrača pogrešno uneo rezultate, ali nakon dodatne verifikacije podataka, odstupanje zvaničnih rezultata od margine greške moglo bi da ukazuje da je došlo do krađe glasova na mestima koja nisu posmatrana.

Na predsedničkim izborima, u situaciji gde je pobednički kandidat osvojio još veći broj glasova (57,8%), razlika između rezultata na uzorku i RIK-ovih rezultata je 0,8%, dakle i dalje ispod jednog procentnog poena, iako je varijabilitet nešto veći nego u prethodnom primeru. Za sve kandidate koji imaju manji broj osvojenih glasova, rezultati na uzorku potpuno odgovaraju rezultatima na populaciji svih građana Srbije, ili odstupaju najviše za 0,1%.

Na kraju, važno je istaći da rezultati RIK-a uključuju glasove sa biračkih mesta iz inostranstva, iz zatvora i sa Kosova, stoga i nije moguće potpuno preklapanje rezultata, pošto Crta nije posmatrala izbore na tim biračkim mestima.

 

Parče torte mora sadrži sve slojeve

 

Utvrdili smo da je 500 biračkih mesta sasvim dovoljno da bismo dobili precizne rezultate na kraju izbornog dana. Međutim, ono što je od ključne važnosti je da uzorak na kom se posmatraju izbori bude identičan populaciji biračkih mesta po svim njenim svojstvima. Nije svaki uzorak dobar uzorak.

Zamislite da ste napravili čizkejk tortu i da želite da isečete jedno parče (uzorak) gostu koji se raduje da je proba.

Prvi uslov za dobar uzorak torte je da sadrži sve važne slojeve (reprezentativnost). Čizkejk se sastoji obično iz tri sloja: keksa, sira i voća (u želatinu). Ako gostu isečete samo gornji deo (voće), takvo parče neće biti dobar reprezent cele torte. Zato je važno da isečete parče torte koje će sadržati sva tri njena sloja, i to u onom odnosu koji je u torti. Ako isečete parče torte koje sadrži i keks i sir i voće, ali ne u proporcionalnoj razmeri, pa bude npr. mnogo više voća, onda će to parče ponovo biti loš reprezent cele torte jer sadrži previše voća.

Drugi uslov za dobar uzorak torte je da bude dovoljno veliki (adekvatnost). Ukoliko isečete samo jedno pretanko parčence torte, ono neće sadržati sve slojeve torte u dovoljnoj meri i gost neće moći da oceni kvalitet torte.

Dakle, da bi gost mogao dobro da proceni ukus torte, treba da isečete parče koje će biti dovoljno veliko i koje će dobro reprezentovati celu tortu.

Na ovaj način i Crta pravi uzorak za posmatranje izbora. Zamislite da tortu predstavljaju sva biračka mesta u Srbiji, a parče torte uzorak na kom se posmatraju izbori. U uzorku koji koristi Crta, svi regioni Srbije (slojevi torte) su dobro reprezentovani, jer je njihov broj u uzorku proporcionalan njihovom broju u populaciji. Ako najviše biračkih mesta u Srbiji ima u Vojvodini, u Crtinom uzorku će takođe biti najviše biračkih mesta u Vojvodini. Isto tako, u uzorku su proporcionalno reprezentovana biračka mesta male veličine, srednje veličine i velika biračka mesta, kao i glavna uporišta opozicije i vlasti.

Uzorak je takođe adekvatan, odnosno dovoljno veliki tako da obezbeđuje da Crta dobro proceni kvalitet izbornog procesa i tok glasanja u čitavoj populaciji. Iako povećanje uzorka na preko 500 biračkih mesta ne bi znatno poboljšalo uzorak, uzorak koji bi imao manje od 500 biračkih mesta potencijalno ne bi bio dovoljno veliki da obezbedi precizne rezultate.

Na kraju, način na koji se obezbeđuje da uzorak dobro reprezentuje populaciju svih biračkih mesta je taj da potpuno slučajnim odabirom računar bira koja biračka mesta će se naći u našem uzorku, u okviru svakog regiona. Ukoliko bi statističar iz Crte ručno birao, to bi moglo da dovede do raznih pristrasnosti. Na primer, mogao bi namerno da izbegne mesta koja su u planinskim, teško pristupačnim krajevima, a da bira ona mesta koja su lako dostupna posmatračima. Takav uzorak, pogađate, ne bi dobro reprezentovao populaciju, odnosno bio bi pristrasan.

Ako se na određenom broju biračkih mesta na kojem se nalaze posmatrači Crte dese nepravilnosti i kršenja zakona, moguće je na osnovu toga zaključiti da li se one dešavaju na svim drugim biračkim mestima. Međutim, veoma je važno da razlikujemo sledeće situacije. Ukoliko se neka nepravilnost desi na jednom biračkom mestu, to ne znači da se svuda dešava. Zamislite da krenete da jedete parče torte i odmah naiđete na sitnu košticu od voća. To ne mora nužno da znači da se koštice nalaze u celoj torti. Moguće je da je samo ta jedna sitna koštica zapala u celu tortu i to neće narušiti kvalitet cele torte. Međutim, ukoliko nastavite da jedete parče koje ste dobili i nailazite na još koštica, onda je opravdano očekivati da ćete koštice nalaziti u celoj torti i da torta nije dobra.

 

Rizične projekcije

 

Tokom izbornog dana, pojedine organizacije saopštavaju rezultate glasanja čim prikupe rezultate sa određenog broja biračkih mesta. Zašto to može da bude problematično?

Naime, nakon što se završi glasanje oko 20h, članovi biračkog odbora kreću sa prebrojavanjem glasova. Glasački listići se najpre prebroje sa najmanjih biračkih mesta, na primer, onih na kojima je upisano manje od 400 birača, dok je rezultate sa većih biračkih mesta, ili onih slabije organizovanih, potrebno čekati duže. To znači da se stabilnost uzorka, koji je slučajan i reprezentativan, postiže tek kasnije, kada se obrade rezultati sa velikog broja biračkog mesta, koji sadrže sve potrebne karakteristike (slojeve torte), dakle, biračka mesta svih veličina, iz svih regiona, kao i biračka mesta koja su tradicionalna uporišta kako opozicije, tako i vlasti.

Stoga je sigurnije objaviti rezultate tek kada budu obrađeni rezultati sa većeg broja biračkih mesta, kako u javnosti ne bi došlo do pogrešnih tumačenja podataka koji pristižu i koji mogu biti pristrasni u datom trenutku.

Autor je master psiholog i viši istraživač u Crti.

Naslovna fotografija: Istinomer/Zoran Drekalović