Фальсифікація парламентських виборів в 2014 році (про чистоту виборів)

  1. Метод # 1. Явка виборців і відсоток тих, хто проголосував за партію
  2. Метод # 2. Явка виборців і вплив «екстремальних ділянок»
  3. Метод # 3. Закон Бенфорда
  4. дані

26 жовтня 2014 року, в Україні проводилися дострокові вибори до Верховної Ради, український парламент. Головною метою дострокових виборів було відновити легітимність парламенту після того, як йдуть у відставку члени Парламенту проголосували за так звані диктаторські диктаторські закони 16 січня 2014. Легітимність новообраного парламенту залежить від чесності виборів. Не дивлячись на те, що ряд авторитетних організацій, таких як ОБСЄ , Повідомили про відсутність шахрайства на виборах, чутки про фальсифікацію виборів продовжують поширюватися в ЗМІ.

У цій статті за допомогою статистичних методів ми оцінюємо, чи мають підстави ці чутки.

Зокрема, ми використовуємо три статистичних методу для ідентифікації будь-яких порушень пов'язаних з фальсифікацією виборів. Результати не підтвердили той факт, що шахрайство мало місце, але деякі сумніви залишилися, що залишає питання незакритих для подальших досліджень. Оскільки дані важко інтерпретувати абсолютному значенні - ми використовуємо Парламентські вибори 2012 в якості орієнтира в нашому дослідженні, так як їх результати були сумнівними .

Метод # 1. Явка виборців і відсоток тих, хто проголосував за партію

Мабуть, найбільш поширена форма фальсифікації полягає в киданні бюлетенів за партію. Сенс цього «трюку» полягає в тому, щоб побачити співвідношення між явкою виборців і відсотком голосів за певну партію. Однак важко пояснити їх співвідношення, коли розподіл виборців і їх активність не є випадковістю. Наприклад, люди в області А можуть бути більш активними, ніж люди в області В. Ми будемо спостерігати кореляцію між явкою виборців і відсотком голосів за партію Y в тій же мірі, в якій більшість людей в області А підтримують партію Х, а не партію Y , більш популярну в області В. для контролю такого співвідношення в різних областях використовується формула для регресивного аналізу:

де p, r, s - індекси партії, області (ми використовуємо окружні виборчі комісії) та виборчої дільниці, - відсоток голосів за партію р на виборчій дільниці s, в області r, - явка виборців на дільниці s, в області r. Константа сr - індивідуальна для кожної області і вміщує всі особливості цього регіону. Якщо немає фальсифікації - то число b буде близьке до нуля.

Ми бачимо загальну картину по результату регресійного аналізу на даних парламентських виборів 2012 і 2014гг. Для виборів 2012 року простежується позитивна зв'язок між явкою виборців і часткою людей, які проголосували за Партію регіонів - переможця виборів 2012 року - партію одіозного Віктора Януковича. Зокрема, оцінюючи результат b можна сказати, що підвищення явки виборців на 1% пов'язане з підвищенням частки людей, що проголосували за Партію Регіонів на 0.24%. Ми виключаємо той факт, що це випадково. Число b для всіх інших партій, за винятком Свободи, негативно. Цей результат підтверджує те, що Партія регіонів «крала» голоси у інших партій. Зверніть увагу, що цей коефіцієнт в комуністичній партії є найбільш негативним і це означає, що Комуністична партія найбільш постраждали від таких «крадіжок».

На відміну від цього, між кількістю голосів за Народний фронт, переможця виборів 2014 року, і явкою виборців дисбалансу не виявлено. Блок Порошенко, друга найпопулярніша партія на виборах 2014 року, має невідповідність між кількістю голосів відданих за цю партію і явкою виборців. Цей факт насторожує, але це всього нічого в порівнянні з тим, що спостерігалося з голосами за Партію регіонів в 2012 році. Більш того, за БПП проголосували більш ніж в 5 разів менше, ніж за Партію регіонів. Загальні результати виборів 2014 року показують, що випадків фальсифікації було набагато менше, ніж в 2012 році.

Таблиця 1. Результати регресійного аналізу

Список A: вибори 2012

Партія регіонів Блок Тимошенко Удар Комуністична партія Свобода (1) (2) (3) (4) (5) Явка виборців 0.244 *** -0.062 *** -0.065 *** -0.115 *** 0.025 *** (0.020 ) (0.012) (0.006) (0.009) (0.008) Результати 33,474 33,474 33,474 33,474 33,474

Список B: вибори 2014

Народний фронт Блок Порошенко Самопоміч Опозиційний блок Радикальна партія Батьківщина (Тимошенко) Свобода (1) (2) (4) (5) (6) (7) (8) Явка виборців 0.003 0.049 *** -0.006 -0.028 *** - 0.016 *** 0.020 *** -0.003 (0.008) (0.015) (0.004) (0.008) (0.005) (0.005) (0.003) Результати 29,497 29,497 29,497 29,497 29,497 29,497 29,497

Метод # 2. Явка виборців і вплив «екстремальних ділянок»

Фальсифікація, ймовірно, буде зосереджена на відносно невеликій кількості ділянок, але ці ділянки можуть принести значне число голосів в національному масштабі. Підозріло, якщо більшість голосів за певну партію приходить від невеликих виборчих дільниць з високою явкою. Очевидно, що деякі виборчі дільниці можуть мати високу явку виборців, але статистично, вони не повинні складати великий, або навіть значний відсоток, в загальній кількості голосів за певну партію. Інтуїція підказує, що, статистично, висока явка виборців цілком можлива на ділянках з невеликою кількістю зареєстрованих виборців, але це малоймовірно для ділянок з великою кількістю виборців. Наприклад, якщо на дільниці зареєстровано 5 виборців, то цілком можна очікувати, що всі 5 прийдуть на вибори і проголосують. Але при 10 000 потенційних виборців, вкрай малоймовірно, що всі 10000 прийдуть голосувати.

Один із способів виявити таку невідповідність - вивчити сукупний внесок виборчих дільниць як функцію від явки виборців. Якщо все чесно, то з наближенням явки до 100 відсотків, кількість голосів за кожну окремо взяту партію має згладжуватися. Іншими словами, плоска частина узагальненого розподілу - це сигнал того, що ці «екстремальні» виборчі дільниці не мають ніякого ефекту на результати на національному рівні. З іншого боку, якщо кількість голосів за конкретну партію разом з явкою виборців буде 100% -ими - то це вже привід для хвилювання: ці виборчі дільниці відрізняються не просто статистично малоймовірними вигинами, але і нетиповою концентрацією голосів у даній партії

На малюнку 1 показано узагальнене розподіл голосів для наступних політичних сил: Партія регіонів у 2012 році, Народний фронт в 2014 році, і Блок Петра Порошенка в 2014 році. Відзначимо, що для останніх двох партій криві виглядають плоскими десь після позначки 90% явки виборців. На відміну від цього, крива Партії регіонів продовжує рости аж до 100%. Це явно свідчить про потенційну фальсифікації: на великих ділянках, виборці були надзвичайно активні, і в той же час там спостерігається сильний перекіс на користь Партії регіонів. Таким чином, якщо порівнювати вибори 2014 за виборами 2012 року - то фактів фальсифікації в 2014 році менше.

Малюнок 1. Внесок екстремальних виборчих дільниць

Внесок екстремальних виборчих дільниць

Метод # 3. Закон Бенфорда

Приблизно в 1938р фізик Френк Бенфорд виявив, що розподіл перших чисел в реальних даних можна описати простим співвідношенням. Зокрема, приблизно в 30% випадків, перша цифра в реальних даних дорівнює «1»; в 18% випадків - перша цифра «2», і так далі. Цей зв'язок була названа законом Бенфорда . Хел Варіан , Відомий економіст (зараз головний економіст Google) і колишній колега одного з авторів, сказав, що закон може бути використаний для виявлення фальсифікації виборів. Зокрема, якщо та чи інша партія отримує кількість голосів більше ніж зазвичай, порушується закон Бенфорда, тому слід бути більш уважним до цих областей. Інтуїтивно зрозуміло, що порушники на виборчих дільницях не припускають, що з маніпуляції змінюють розподіл агрегованих даних і роблять його несумісний з законом Бенфорда.

Малюнок 2 показує розподіл перших цифр по закону Бенфорда (чорна лінія) і розподілу для Партії регіонів в 2012 (синя лінія з квадратами) і суми голосів для Народного фронту і блоку Порошенко в 2014 (червона лінія з кружками). Зверніть увагу, що червона лінія близька до чорної лінії, яка відповідає мінімальній маніпуляції результатами виборів. З іншого боку, синя лінія відходить чітко від чорної лінії. Зокрема, існує занадто багато «1», «7», «8», «9», і занадто мало «2» з «3» і «4». Хоча важко пояснити ці цифри самі по собі, відхилення від закону Бенфорда в 2012 було явно більше, ніж в 2014, що дозволяє припустити, що масштаби фальсифікації виборів в 2014 були значно менше, ніж на виборах 2012 року.

Малюнок 2. Закон Бенфорда

Марк Твен якось сказав фразу, що стала відомою, про те, що є три типи брехні: «Брехня, нахабна брехня і статистика». Мабуть, він не був обізнаний про вибори в Україні, де результати виборів можуть брехати набагато гірше, ніж статистика. Статистичні інструменти дозволяють припустити, що масштаб фальсифікації виборів в 2014 був значно менше, ніж в 2012. У тій мірі, в якій Ви довіряєте статистикою, Ви можете сприймати отримані нами результати, як знак схвалення наукою результатів виборів 2014 р

Післямова. В Україні змішана виборча система - 53,2% місць розподіляються за партійними списками і 46,8% - по 198 виборчих округах. Наш аналіз був проведений тільки для партійних списків. Частина обговорень в Україні зосереджені на тому, чи слід Україні перейти на 100% голосування за партійними списками, нібито, щоб уникнути порушень в окремих округах. Отже, було б корисно доповнити дослідження аналізом інших 198 виборчих округів. Крім того, було б цікаво розглянути контрафактний склад нового українського парламенту, якби по всій Україні явка була б до тієї ж мірою порушена кризою безпеки, як і на Сході.

дані

2014: 99,52% виборчих дільниць покриті, станції розташовані за кордоном, не включені
2012: 99,59% виборчих дільниць покриті, станції розташовані за кордоном, не включені

Дані за 2014 рік:

доступ: 30.10.2014

Дані за 2012 рік:

доступ: 03.11.2012 , В даний час не доступні через технічні причини

Файли, які використовуються для аналізу доступні тут

Увага

Автори не працюють, не консультують, не володіють акціями і не отримують фінансування від компанії або організації, яка б мала користь від цієї статті, а також жодним чином з ними не пов'язані