Z UPORABO MATEMATIKE ZA PREVERJANJE IRANSKIH REZULTATOV VOLITEV | ZNANOST | SMITHSONIAN - ČLANKI, BLOGI, PRESENETLJIVA ZNANOST, ZNANOST, ČLOVEŠKO VEDENJE

Statistiki in politologi imajo terenski dan z rezultati iranskih volitev v začetku tega meseca. So bile volitve ponarejene? Morda nikoli ne bomo vedeli, toda dovolj je pokopanega v matematiki, da bi si mislili, da bi bilo morda tako. Čeprav je tudi takrat dovolj, nas lahko prepriča, da je vse zakonito. Tu je nekaj analiz, ki so se mi zdele še posebej zanimive:

Čisti podatki

Takoj po volitvah so se pojavili dvomi v legitimnost podatkov, ker vsakič, ko se objavi nova serija rezultatov glasovanja (izidejo v kosih v Iranu, podobno kot v ZDA), odstotek glasov odide predsedniku Mahmudu Ahmadinedžadu je bilo enako: 67 odstotkov. Podatki običajno niso čisti in nekateri so se začeli spraševati, ali so bili rezultati izmišljeni.

Analiza profesorja matematike Univerze v Wisconsinu Jordana Ellenberga iz Slate pa se poglobi v podatke, da bi pokazala, da je bil v resnici manjši, kot bi morda pričakovali. Rezultati niso izstopali po mestih, ampak v velikih serijah, ki so združevale podatke z več področij, kar pomeni, da so skupni glasovi Ahmadinedžada resnično povprečni. In zakon velikih številk narekuje, kot je Ellenberg zapisal:

Povprečne vrednosti zelo različnih količin lahko prinesejo rezultate, ki so skoraj popolnoma enotni. Glede na dovolj podatkov se odpuščaji navadno odpovedo drug drugemu.

Ellenberg ugotavlja, da so podatki "vsekakor dovolj zmedeni, da so resnični."

Benfordov zakon

Več analiz je pregledalo prve števke rezultatov volitev v Iranu, da bi ugotovili, ali so skladni z Benfordovim zakonom, ki je:

V seznamih števil iz številnih (vendar ne vseh) resničnih virov podatkov je vodilna številka razporejena na točno določen, neenakomeren način. Po tem zakonu je prva številka 1 skoraj tretjina časa, večje številke pa se pojavljajo kot vodilna številka z nižjo in nižjo frekvenco, do točke, ko se 9 kot prva številka pojavi manj kot enkrat v dvajsetih. Ta porazdelitev prvih števk se pojavi logično, kadar je niz vrednosti logaritmično razporejen.

Ena analiza, ki jo je uporabil Boudewijn Roukema z univerze Nicolaus Copernicus na Poljskem, je ugotovila, da je bilo Mehdija Karroubija skoraj dvakrat več od štetja glasov, kot bi bilo pričakovati z Benfordovim zakonom. Poleg tega je Roukema posumil, da bi bili rezultati za Ahmadinedžada, v katerem je bilo manj 1 in več 2 in 3, kot je bilo pričakovano, verjetno, če bi se kdo odločil, da bo rezultate manipuliral tako, da bo na začetku glasovanja spremenil 1 na 2 in 3s. To bi tudi privedlo do precenjevanja skupnih vrednosti Ahmadinedžada z več milijoni glasov.

Walter Mebane, politolog in statistik z univerze v Michiganu, je pri svoji analizi uporabil tudi Benfordov zakon, v katerem najdemo tudi več nepravilnosti pri rezultatih volitev v Iranu. Toda tudi sam priznava, da so njegovi rezultati "združljivi s široko goljufijo" in "združljivi s tem, da je Ahmadinedžad dejansko zmagal."

Zadnji dve števki

Dva diplomirana študenta politologije na univerzi Columbia sta vzela tretji podatek. V analizi, ki so jo povzeli v poročilu Washington Post, so preučili zadnje dve števki štetja glasov iz 29 provinc za vsakega od štirih kandidatov (npr. Če je nekdo prejel 14.579 glasov, se šteje, da sta bili le 7 in 9 analiza).

Zadnji dve števki volilnih izidov sta naključni šum, porazdelitev števk pa mora biti dokaj enakomerna - vsaka številka mora biti približno 10 odstotkov časa. Ljudje pa smo slabi generatorji naključnih števil in kadar sestavljamo številke, si nekatere številke izberemo pogosteje kot druge. V iranskih rezultatih se le štiri odstotne številke končajo v številki 5, medtem ko se številka 7 pojavi 17 odstotkov časa. Rezultate, ki toliko odstopajo, bi bilo pričakovati na približno štirih od vsakih 100 volitev.

Ljudje imajo tudi težave pri ustvarjanju številk, ki imajo sosednje števke (tj. Manjša je verjetnost, da jih boste imeli 72 kot 23), vendar bi morale te številke slediti tudi naključnim vzorcem, približno 70 odstotkov parov pa bi moralo biti sestavljeno iz sosednjih števk. Vendar v iranskih rezultatih le 62 odstotkov tega stori. Ponovno bi te rezultate pričakovali na približno 4 od vsakih 100 volitev. Toda kombinacijo obeh rezultatov bi pričakovali le na 1 od vsakih 200 volitev. Morda nemogoče, vendar ni nemogoče.

Kje nas to pusti? Morda nikoli ne bomo vedeli, ali so poročani rezultati resnični ali ne. Moj osebni najljubši delček podatkov iz vsega tega pa ne zahteva nobenih izračunov, ki bi vodili k vprašanjem legitimnosti volitev. Ta citat Abbas-Alija Kadkhodaeija, predstavnika iranskega sveta varuhov, bi skoraj vsakogar pomislil:

Statistični podatki Mohsena Resaeija, v katerih trdi, da je več kot 100% upravičencev glasovalo v 170 mestih, niso natančni - incident se je zgodil le v 50 mestih.

(Več o analizah rezultatov volitev v Iranu si oglejte Nate Silver na spletnem mestu petthirtyeight.com)