Već smo naviknuti da se u tjednima koji predhodne političkim izborima objavljuju rezultati raznih istraživanja raspoloženja birača u svrhu predviđanja uspjeha kandidata na nadolazećim izborima. Upravo smo u jednom takvom periodu priprema za predsjedničke izbore. Zanimljivo je, međutim, da je u svijetu zadnjih desetak godina došlo do velikog procvata metoda kojima se takva predviđanja rade koristeći matematičke modele koji uzimaju sve dostupne ankete zajedno ili čak ne koriste ankete uopće!
U ovom prilogu opisujemo, po prvi puta u Hrvatskoj, jednu takvu metodu predviđanja nadolazećih hrvatskih predsjedničkih izbora koristeći isključivo razultate prethodnih predsjedničkih, parlamentarnih i EU izbora, te razne socioekonomske podatke o stanovništvu.
Razlog zašto je takav matematički model moguće kreirati krije se u vrlo čvrstim i sporo promijenjivim političkim stavovima većine birača u Hrvatskoj. Ti stavovi su u vrlo jakoj korelaciji s nizom socioekonomskih parametara koji opisuju biračko tijelo. To se zorno može vidjeti u rezultatima analize izbora za EU parlament, koju je izradio Institut sinergije znanosti i društva. Ta analiza daje nam smjernice kako izgraditi model koji će tražiti pravilnosti u ponašanju birača i na temelju toga pružati predikcije njihovih budućih odluka.
Sažeti opis metode i rezultata
Cilj našeg modela nije samo odrediti pobjednika, nego i što preciznije odrediti postotak glasova koje će taj kandidat dobiti u prvom i potencijalno drugom krugu izbora. Ulazni podatak u model su razni podaci po općinama i gradovima: rezultati predsjedničkih izbora 2009. godine, parlamentarnih 2011, EU izbora 2014, razne komponente popisa stanovništva 2011, nezaposlenost po podacima Zavoda za zapošljavanje, te neto masa plaća i mirovina po podacima Porezne uprave. Model se zasebno primjenjuje na 6 različitih regija kako bi se mogao prilagoditi regionalnim razlikama u stavovima birača u Hrvatskoj.
Mr.sc. Vuk Vuković komentira ovo predviđanje predsjedničkih izbora bez korištenja anketiranja birača. |
Na predstojećim izborima Josipović je glavni kandidat “lijevog centra”, te možemo očekivati da će prikupiti glasove koji su se na izborima 2009. raspršili na nekoliko kandidata – Josipovića, Pusić, Kajina, Vidoševića i Mikšića. Kombinacijom njihovih glasova kreirali smo proto-kandidata čiji uspjeh na izborima 2009. prvo modeliramo samo s udjelima glasova za SDP i HDZ koalicije na izborima 2011. Zanimljivo je kako rezultat pokazuje da se na ovaj način može objasniti od 64% (Zagrebačka regija) do čak 93% (Istra i primorje) ponašanja birača na predsjedničkim izborima. Zatim se modelu dodaju i socioekonomski podaci po općinama i gradovima kako bi po svim regijama mogli objasniti barem oko 80% ponašanja birača, a uspjeh proto-kandidata na izborima 2009. pogađati unutar 1% glasova. Kada je model dosegao tu razinu točnosti, zamijenjeni su podaci o izborima 2011. s podacima o izborima za EU parlament 2014., što je dovelo do promjene u postotku glasova za proto-kandidata na predsjedničkim izborima. Sumiranjem tih rezultata po regijama došli smo do konačnog broja glasova koje očekujemo da će Josipović dobiti u prvom krugu izbora. Za drugi krug postupak je bio isti, samo što se od početka koristi udio glasova za Josipovića u drugom krugu izbora 2009.
- Regija: Sjeverozapadna Županije: Krapinsko-zagorska, Varaždinska, Koprivničko-križevačka, Međimurska Predviđanje glasova za kandidata: Josipović: 1.krug: 47.3%; 2. krug: 65.2%
- Regija: Zagrebačka Županije: Zagrebačka, Grad Zagreb Predviđanje glasova za kandidata: Josipović: 1.krug: 45.9%; 2. krug: 52.9%
- Regija: Središnja i gorska Županije: Sisačko-moslavačka, Karlovačka, Bjelovarsko-bilogorska, Ličko-senjska Predviđanje glasova za kandidata: Josipović: 1.krug: 37.9%; 2. krug: 46.4%
- Regija: Slavonija Županije: Virovitičko-podravska, Požeško-slavonska, Brodsko-posavska, Osječko-baranjska, Vukovarsko-srijemska Predviđanje glasova za kandidata: Josipović: 1.krug: 36.5%; 2. krug: 47.6%
- Regija: Istra i primorje Županije: Istarska, Primorsko-goranska Predviđanje glasova za kandidata: Josipović: 1.krug: 66.3%; 2. krug: 73.3%
- Regija: Dalmacija Županije: Zadarska, Šibensko-kninska, Splitsko-dalmatinska, Dubrovačko-neretvanska Predviđanje glasova za kandidata: Josipović: 1.krug: 37.8%; 2. krug: 43.2%
- Regija: Hrvatska Predviđanje glasova za kandidata: Josipović: 1.krug: 44.0%; 2. krug: 52.9%
Očekivanu pogrešku procjenjujemo na oko 1%, jer je to bio i zahtjev na preciznost prilagodbe modela na izbore 2009. Vrlo dobro poklapanje s dosad objavljenim istraživanjima raspoloženja birača pokazuje da model uspijeva predvidjeti barem rezultate tih istraživanja.
Opširniji opis metode i rezultata
Za one koje zanima više detalja, evo i nešto opširnijeg opisa modela. Prvo je pitanje kako generirati proto-kandidata kombinirajući glasove za Josipovića, Pusić, Kajina, Vidoševića i Mikšića. Posljednja dva kandidata ne pokazuju trend korelacije s glasovima za stranke na izborima 2011, pa smo se stoga odlučili uključiti samo 50% njihovih glasova, tako da je formula za proto-kandidata u prvom krugu izbora: Josipović + Pusić + Kajin + 1/2 Vidošević + 1/2 Mikšić.
Idući korak je “ograničeni” model koji povezuje uspjeh proto-kandidata na izborima 2009. po općinama i gradovima s uspjehom SDP i HDZ koalicija na izborima 2011. Koristeći višestruku regresiju dobiveni su slijedeći rezultati po regijama (vidi stupac “Ograničeni model” u Tabeli i grafove na slici ispod):
1. krug izbora |
Izbori 2009 | Ograničeni model (koristi samo izbore 2011) | Kompletan model (izbori 2011 + socioekonomski parametri) | Predikcija za predsjedničke izbore: Josipović | ||
Regija | % glasova 2009 | % glasova 2009 | R2 | % glasova 2009 | R2 | % glasova |
Sjeverozapadna | 59.3 | 58.0 | 0.68 | 58.5 | 0.78 | 47.3 |
Zagrebačka | 52.0 | 48.2 | 0.64 | 54.4 | 0.82 | 45.9 |
Središnja i gorska | 46.2 | 45.3 | 0.74 | 46.2 | 0.83 | 37.9 |
Slavonija | 44.9 | 42.9 | 0.73 | 45.2 | 0.78 | 36.5 |
Istra i primorje | 71.0 | 70.8 | 0.93 | 70.8 | 0.93 | 66.3 |
Dalmacija | 43.2 | 42.1 | 0.90 | 42.7 | 0.92 | 37.8 |
HRVATSKA | 51.7 | 49.4 | 0.76 | 51.7 | 0.84 | 44.0 |
Vidimo da je već i taj limitiran pristup omogućio jako dobro preklapanje modeliranog postotka glasova i stvarne vrijednosti na izborima 2009. To je dokaz kako su predsjednički izbori vrlo čvrsto vezani uz podršku strankama, pogotovo u Istri, primorju i Dalmaciji. No, mi želimo biti još točniji u predikcijama, pa si zadajemo cilj da se model mora preklopiti s izborima 2009. unutar 1%, a R2 neka bude barem oko 80% u svim regijama. Istra i primorje su ta dva kriterija zadovoljili već samo s ograničenom modelom, pa nećemo dalje tu regiju modelirati.
Model kompletiramo tako da mu dodajemo socioekonomske podatke po općinama i gradovima i uključejmo ih kao varijable u višestruku (multipla) regresiju. Zatim izbacujemo iz modela one varijable koje nisu statistički značajne (pratimo njihovu p-vrijednost), s ciljem da po modelu ostavimo samo po dvije ili tri socioekonomske varijable, a da pritom zadovoljimo cilj na točnost modela. Konačni uspjeh takvog modeliranja prikazan je u tabeli pod stupcem “Kompletan model”. Cilj oko točnosti uspjeli smo postići u svim regijama, osim u Zagrebačkoj regiji gdje je odstupanje veće od 1% glasova. To je vjerojatno posljedica toga što Grad Zagreb tretiramo kao jednu cjelinu, a ne uključujemo značajne statističke i izborne razlike koje postoje unutar Grada Zagreba. To ćemo unaprijediti u budućim modelima.
Konačno, sada možemo zamjeniti varijablu izbora 2011. s podacima izbora za EU parlament 2014. Pritom ne mijenjamo koeficijente koje smo dobili višestrukom regresijom. Glasove za SDP i ORAH na izborima 2014. zbrajamo budući da postoji vrlo snažna korelacija između udjela glasova za te dvije stranke po općinama i gradovima (dio podrške SDP-u premjestio se u podršku ORAH-u). Rezultat je prikazan u posljednjem stupcu tabele. Agregirani podatak za čitavu Hrvatsku dobije se zbrajanjem po regijama uz uvažavanje udjela glasača koje svaka regija ima u ukupnom broju glasača u Hrvatskoj.
Za drugi krug izbora napravljen je isti postupak i rezultati su u tabeli ispod. Razlika je jedino što smo se sada morali zadovoljiti sa zahtjevom da R2 bude barem oko 0.7, i to nije postignuto za regiju Sjeverozapadne Hrvatske. Međutim, i dalje se radi o vrlo visokim korelacijama.
2. krug izbora |
Izbori 2009 | Ograničeni model (koristi samo izbore 2011) | Kompletan model (izbori 2011 + socioekonomski parametri) | Predikcija za predsjedničke izbore: Josipović | ||
Regija | % glasova 2009 | % glasova 2009 | R2 | % glasova 2009 | R2 | % glasova |
Sjeverozapadna | 74.7 | 74.7 | 0.49 | 74.7 | 0.56 | 65.2 |
Zagrebačka | 60.9 | 61.0 | 0.37 | 60.5 | 0.70 | 53.0 |
Središnja i gorska | 57.9 | 58.6 | 0.75 | 57.8 | 0.77 | 46.4 |
Slavonija | 58.1 | 58.5 | 0.75 | 58.4 | 0.79 | 47.6 |
Istra i primorje | 78.3 | 78.0 | 0.85 | 78.0 | 0.85 | 73.3 |
Dalmacija | 52.0 | 53.5 | 0.86 | 52.0 | 0.88 | 43.2 |
HRVATSKA | 62.2 | 62.3 | 0.66 | 61.7 | 0.76 | 52.9 |