О недействительных бюллетенях
Nov. 14th, 2016 11:47 pm![[personal profile]](https://www.dreamwidth.org/img/silk/identity/user.png)
Коллега
corbulon мощно втопил за аномально низкую долю недействительных бюллетеней как критерий фальсификации: 1, 2, 3, 4, 5, 6, 7, 8 9 (sorry, если чего пропустил). Внесу свои 5 копеек.
Мне показалось правильным строить не графики среднего, а посмотреть условные распределения для явки и доли недействительных (NB: обратная величина к той, которую использует
corbulon).

Здесь показана зависимость квантилей доли недействительных бюллетеней от явки (т.е., скажем, жёлтый график даёт вероятность того, что при заданной абсциссой явке в четверти случае наблюдается доля недействительных бюллетеней, не меньшая ординаты). Участки входят с весом, равным числу зарегистрированных избирателей. Обработка проводилась в окне в 3000 участков.
Как можно видеть, при явке 45%– графики более-менее горизонтальны, как и должно быть, а далее постепенно начинается лажа. Крючок на правой части графиков соответствует спецучасткам, среди которых больницы, что закономерно поднимает долю недействительных.
Теперь перевернём оси и посмотрим на зависимость квантилей явки от доли недействительных бюллетеней. Способ обработки – тот же.

Тут всё и сложнее, и интереснее. Каких-либо выделенных значений ни у явки, ни у доли недействительных, которые могли бы однозначно свидетельствовать о фальсификациях, не просматривается. Однако точки излома графиков ложатся на прямую, проходящую через начало координат. Так что если доля недействительных меньше 3% от явки, есть повод задуматься.
К сожалению, это – шаткая основа для реконструкции. Если выкинуть все участки, где доля недействительных меньше 3% от явки, и распространить результаты оставшихся на всю страну, получится 9,5 млн вброса и 0,6 млн переброса голосов, что меньше реального объёма фальсификаций. Причём как и в случае отсечения просто по величине явки, результат такого расчёта неустойчив по используемому параметру.
UPD:
Сделал отдельный анализ для достоверных и недостоверных участков (подозрительные не учитываются). В окне 1500 участков.
Сначала – аналог первой картинки – распределение доли недействительных.


Как можно видеть, поведение всех участков полностью определяется поведением недостоверных, которых большинство. Для достоверных распределение доли недействительных практически не зависят от явки.
Теперь – аналог второй картинки – распределение явки.


Same balls, right view.
![[livejournal.com profile]](https://www.dreamwidth.org/img/external/lj-userinfo.gif)
Мне показалось правильным строить не графики среднего, а посмотреть условные распределения для явки и доли недействительных (NB: обратная величина к той, которую использует
![[livejournal.com profile]](https://www.dreamwidth.org/img/external/lj-userinfo.gif)

Здесь показана зависимость квантилей доли недействительных бюллетеней от явки (т.е., скажем, жёлтый график даёт вероятность того, что при заданной абсциссой явке в четверти случае наблюдается доля недействительных бюллетеней, не меньшая ординаты). Участки входят с весом, равным числу зарегистрированных избирателей. Обработка проводилась в окне в 3000 участков.
Как можно видеть, при явке 45%– графики более-менее горизонтальны, как и должно быть, а далее постепенно начинается лажа. Крючок на правой части графиков соответствует спецучасткам, среди которых больницы, что закономерно поднимает долю недействительных.
Теперь перевернём оси и посмотрим на зависимость квантилей явки от доли недействительных бюллетеней. Способ обработки – тот же.

Тут всё и сложнее, и интереснее. Каких-либо выделенных значений ни у явки, ни у доли недействительных, которые могли бы однозначно свидетельствовать о фальсификациях, не просматривается. Однако точки излома графиков ложатся на прямую, проходящую через начало координат. Так что если доля недействительных меньше 3% от явки, есть повод задуматься.
К сожалению, это – шаткая основа для реконструкции. Если выкинуть все участки, где доля недействительных меньше 3% от явки, и распространить результаты оставшихся на всю страну, получится 9,5 млн вброса и 0,6 млн переброса голосов, что меньше реального объёма фальсификаций. Причём как и в случае отсечения просто по величине явки, результат такого расчёта неустойчив по используемому параметру.
UPD:
Сделал отдельный анализ для достоверных и недостоверных участков (подозрительные не учитываются). В окне 1500 участков.
Сначала – аналог первой картинки – распределение доли недействительных.


Как можно видеть, поведение всех участков полностью определяется поведением недостоверных, которых большинство. Для достоверных распределение доли недействительных практически не зависят от явки.
Теперь – аналог второй картинки – распределение явки.


Same balls, right view.