Predviđanje predsjedničkih izbora – bez anketa?

grafikaVeć smo naviknuti da se u tjednima koji predhodne političkim izborima objavljuju rezultati raznih istraživanja raspoloženja birača u svrhu predviđanja uspjeha kandidata na nadolazećim izborima. Upravo smo u jednom takvom periodu priprema za predsjedničke izbore. Zanimljivo je, međutim, da je u svijetu zadnjih desetak godina došlo do velikog procvata metoda kojima se takva predviđanja rade koristeći matematičke modele koji uzimaju sve dostupne ankete zajedno ili čak ne koriste ankete uopće!

U ovom prilogu opisujemo, po prvi puta u Hrvatskoj, jednu takvu metodu predviđanja nadolazećih hrvatskih predsjedničkih izbora koristeći isključivo razultate prethodnih predsjedničkih, parlamentarnih i EU izbora, te razne socioekonomske podatke o stanovništvu.

Razlog zašto je takav matematički model moguće kreirati krije se u vrlo čvrstim i sporo promijenjivim političkim stavovima većine birača u Hrvatskoj. Ti stavovi su u vrlo jakoj korelaciji s nizom socioekonomskih parametara koji opisuju biračko tijelo. To se zorno može vidjeti u rezultatima analize izbora za EU parlament, koju je izradio Institut sinergije znanosti i društva. Ta analiza daje nam smjernice kako izgraditi model koji će tražiti pravilnosti u ponašanju birača i na temelju toga pružati predikcije njihovih budućih odluka.

 Sažeti opis metode i rezultata

Cilj našeg modela nije samo odrediti pobjednika, nego i što preciznije odrediti postotak glasova koje će taj kandidat dobiti u prvom i potencijalno drugom krugu izbora. Ulazni podatak u model su razni podaci po općinama i gradovima: rezultati predsjedničkih izbora 2009. godine, parlamentarnih 2011, EU izbora 2014, razne komponente popisa stanovništva 2011, nezaposlenost po podacima Zavoda za zapošljavanje, te neto masa plaća i mirovina po podacima Porezne uprave. Model se zasebno primjenjuje na 6 različitih regija kako bi se mogao prilagoditi regionalnim razlikama u stavovima birača u Hrvatskoj.

HRstat_VukovicMr.sc. Vuk Vuković komentira ovo predviđanje predsjedničkih izbora bez korištenja anketiranja birača.

Na predstojećim izborima Josipović je glavni kandidat “lijevog centra”, te možemo očekivati da će prikupiti glasove koji su se na izborima 2009. raspršili na nekoliko kandidata – Josipovića, Pusić, Kajina, Vidoševića i Mikšića. Kombinacijom njihovih glasova kreirali smo proto-kandidata čiji uspjeh na izborima 2009. prvo modeliramo samo s udjelima glasova za SDP i HDZ koalicije na izborima 2011. Zanimljivo je kako rezultat pokazuje da se na ovaj način može objasniti od 64% (Zagrebačka regija) do čak 93% (Istra i primorje) ponašanja birača na predsjedničkim izborima. Zatim se modelu dodaju i socioekonomski podaci po općinama i gradovima kako bi po svim regijama mogli objasniti barem oko 80% ponašanja birača, a uspjeh proto-kandidata na izborima 2009. pogađati unutar 1% glasova. Kada je model dosegao tu razinu točnosti, zamijenjeni su podaci o izborima 2011. s podacima o izborima za EU parlament 2014., što je dovelo do promjene u postotku glasova za proto-kandidata na predsjedničkim izborima. Sumiranjem tih rezultata po regijama došli smo do konačnog broja glasova koje očekujemo da će Josipović dobiti u prvom krugu izbora. Za drugi krug postupak je bio isti, samo što se od početka koristi udio glasova za Josipovića u drugom krugu izbora 2009.

  • Regija: Sjeverozapadna Županije: Krapinsko-zagorska, Varaždinska, Koprivničko-križevačka, Međimurska Predviđanje glasova za kandidata: Josipović: 1.krug: 47.3%; 2. krug: 65.2%
  • Regija: Zagrebačka Županije: Zagrebačka, Grad Zagreb Predviđanje glasova za kandidata: Josipović: 1.krug: 45.9%; 2. krug: 52.9%
  • Regija: Središnja i gorska Županije: Sisačko-moslavačka, Karlovačka, Bjelovarsko-bilogorska, Ličko-senjska Predviđanje glasova za kandidata: Josipović: 1.krug: 37.9%; 2. krug: 46.4%
  • Regija: Slavonija Županije: Virovitičko-podravska, Požeško-slavonska, Brodsko-posavska, Osječko-baranjska, Vukovarsko-srijemska Predviđanje glasova za kandidata: Josipović: 1.krug: 36.5%; 2. krug: 47.6%
  • Regija: Istra i primorje Županije: Istarska, Primorsko-goranska Predviđanje glasova za kandidata: Josipović: 1.krug: 66.3%; 2. krug: 73.3%
  • Regija: Dalmacija Županije: Zadarska, Šibensko-kninska, Splitsko-dalmatinska, Dubrovačko-neretvanska Predviđanje glasova za kandidata: Josipović: 1.krug: 37.8%; 2. krug: 43.2%
  • Regija: Hrvatska Predviđanje glasova za kandidata: Josipović: 1.krug: 44.0%; 2. krug: 52.9%

Očekivanu pogrešku procjenjujemo na oko 1%, jer je to bio i zahtjev na preciznost prilagodbe modela na izbore 2009. Vrlo dobro poklapanje s dosad objavljenim istraživanjima raspoloženja birača pokazuje da model uspijeva predvidjeti barem rezultate tih istraživanja.

Opširniji opis metode i rezultata

Za one koje zanima više detalja, evo i nešto opširnijeg opisa modela. Prvo je pitanje kako generirati proto-kandidata kombinirajući glasove za Josipovića, Pusić, Kajina, Vidoševića i Mikšića. Posljednja dva kandidata ne pokazuju trend korelacije s glasovima za stranke na izborima 2011, pa smo se stoga odlučili uključiti samo 50% njihovih glasova, tako da je formula za proto-kandidata u prvom krugu izbora: Josipović + Pusić + Kajin + 1/2 Vidošević + 1/2 Mikšić.

Idući korak je “ograničeni” model koji povezuje uspjeh proto-kandidata na izborima 2009. po općinama i gradovima s uspjehom SDP i HDZ koalicija na izborima 2011. Koristeći višestruku regresiju dobiveni su slijedeći rezultati po regijama (vidi stupac “Ograničeni model” u Tabeli i grafove na slici ispod):

1. krug izbora

Izbori 2009 Ograničeni model (koristi samo izbore 2011) Kompletan model (izbori 2011 + socioekonomski parametri) Predikcija za predsjedničke izbore: Josipović
Regija % glasova 2009 % glasova 2009 R2 % glasova 2009 R2 % glasova
Sjeverozapadna 59.3 58.0 0.68 58.5 0.78 47.3
Zagrebačka 52.0 48.2 0.64 54.4 0.82 45.9
Središnja i gorska 46.2 45.3 0.74 46.2 0.83 37.9
Slavonija 44.9 42.9 0.73 45.2 0.78 36.5
Istra i primorje 71.0 70.8 0.93 70.8 0.93 66.3
Dalmacija 43.2 42.1 0.90 42.7 0.92 37.8
HRVATSKA 51.7 49.4 0.76 51.7 0.84 44.0

grafika

Vidimo da je već i taj limitiran pristup omogućio jako dobro preklapanje modeliranog postotka glasova i stvarne vrijednosti na izborima 2009. To je dokaz kako su predsjednički izbori vrlo čvrsto vezani uz podršku strankama, pogotovo u Istri, primorju i Dalmaciji. No, mi želimo biti još točniji u predikcijama, pa si zadajemo cilj da se model mora preklopiti s izborima 2009. unutar 1%, a R2 neka bude barem oko 80% u svim regijama. Istra i primorje su ta dva kriterija zadovoljili već samo s ograničenom modelom, pa nećemo dalje tu regiju modelirati.

Model kompletiramo tako da mu dodajemo socioekonomske podatke po općinama i gradovima i uključejmo ih kao varijable u višestruku (multipla) regresiju. Zatim izbacujemo iz modela one varijable koje nisu statistički značajne (pratimo njihovu p-vrijednost), s ciljem da po modelu ostavimo samo po dvije ili tri socioekonomske varijable, a da pritom zadovoljimo cilj na točnost modela. Konačni uspjeh takvog modeliranja prikazan je u tabeli pod stupcem “Kompletan model”. Cilj oko točnosti uspjeli smo postići u svim regijama, osim u Zagrebačkoj regiji gdje je odstupanje veće od 1% glasova. To je vjerojatno posljedica toga što Grad Zagreb tretiramo kao jednu cjelinu, a ne uključujemo značajne statističke i izborne razlike koje postoje unutar Grada Zagreba. To ćemo unaprijediti u budućim modelima.

Konačno, sada možemo zamjeniti varijablu izbora 2011. s podacima izbora za EU parlament 2014. Pritom ne mijenjamo koeficijente koje smo dobili višestrukom regresijom. Glasove za SDP i ORAH na izborima 2014. zbrajamo budući da postoji vrlo snažna korelacija između udjela glasova za te dvije stranke po općinama i gradovima (dio podrške SDP-u premjestio se u podršku ORAH-u). Rezultat je prikazan u posljednjem stupcu tabele. Agregirani podatak za čitavu Hrvatsku dobije se zbrajanjem po regijama uz uvažavanje udjela glasača koje svaka regija ima u ukupnom broju glasača u Hrvatskoj.

Za drugi krug izbora napravljen je isti postupak i rezultati su u tabeli ispod. Razlika je jedino što smo se sada morali zadovoljiti sa zahtjevom da R2 bude barem oko 0.7, i to nije postignuto za regiju Sjeverozapadne Hrvatske. Međutim, i dalje se radi o vrlo visokim korelacijama.

2. krug izbora

Izbori 2009 Ograničeni model (koristi samo izbore 2011) Kompletan model (izbori 2011 + socioekonomski parametri) Predikcija za predsjedničke izbore: Josipović
Regija % glasova 2009 % glasova 2009 R2 % glasova 2009 R2 % glasova
Sjeverozapadna 74.7 74.7 0.49 74.7 0.56 65.2
Zagrebačka 60.9 61.0 0.37 60.5 0.70 53.0
Središnja i gorska 57.9 58.6 0.75 57.8 0.77 46.4
Slavonija 58.1 58.5 0.75 58.4 0.79 47.6
Istra i primorje 78.3 78.0 0.85 78.0 0.85 73.3
Dalmacija 52.0 53.5 0.86 52.0 0.88 43.2
HRVATSKA 62.2 62.3 0.66 61.7 0.76 52.9