Nov. 13th, 2016

tov_y: (Winking)
В ходе возни с результатами российских выборов мне окончательно разонравились методы, опирающиеся на нулевую гипотезу о независимости относительного результата от явки. Фундаментальной проблемой этой гипотезы является то, что даже в тех случаях, когда она, возможно, выполняется, на практике её невозможно проверить, поскольку наблюдаемые отклонения от неё могут быть обусловлены не только субъективными (фальсификации), но объективными (структура электората) факторами, неразличимыми в рамках однопараметрической гипотезы.
Например, если в городе явка и поддержка власти низкие, а на селе – высокие, то в целом результат власти будет нарастать с явкой. Однако такая их честная корреляция, вызванная социальной неоднородностью населения, неизбежно будет списана на фальсификации. Чтобы избежать таких ошибок для проверки и реконструкции следует выбирать регионы, достаточно маленькие, чтобы можно было быть уверенным в их преимущественной однородности, но вместе с тем достаточно большие, чтобы давать поддающуюся анализу выборку. Некоторые субъекты федерации заведомо не удовлетворяют первому условию, а территориальные избирательные комиссии – второму. Оптимальным размером обладают избирательные округа (их средний размер в 2016 г. составил 0,43(16) тыс. участков, на которых было зарегистрировано в среднем 0,5(1) млн избирателей).
Другим объективным фактором, приводящим к отклонению от тривиальной нулевой гипотезы, является, как будет показано далее, существование избирателей-зомби, которые поддерживают власть вне зависимости от активности и симпатий остальной части электората. Простейшее предположении, что зомби составляют некоторую часть электората, специфичную для каждого региона, имеет следствием не постоянство, убывание относительного результата власти по мере роста явки за счёт растворения зомби в массе более живых избирателей.
Разделение электората на две части и эффективный учёт остаточной неоднородности предполагает использование двухпараметрической нулевой гипотезы. Наиболее удобным её видом представляется предположение о линейной связи между явкой и антирезультатом власти (абсолютным результатом оппозиции). Гипотетическая прямая имеет положительный наклон, но не обязана проходить через начала координат, отсекая на оси абсцисс долю избирателей-зомби.
Существует два принципиальных способа фальсификаций результатов выборов – вброс голосов за власть (жульничество) и переброс их от оппозиции (воровство). Произвольное рисование цифр является лишь комбинацией этих способов, однако думать о них лучше по отдельности. Вброс голосов увеличивает явку, но не меняет антирезультата, переброс, наоборот, не меняете явки, но уменьшает антирезультат. Таким образом, в координатах явка–антирезультат фальсификации сдвигают точки в одну сторону от честной прямой (вправо и/или вниз). Участки округа, принадлежащие к её ближайшей окрестности считаются достоверными, а отстающие от неё далеко, – недостоверными. Квалификация участков проводится вручную, исходя из представлений о прекрасном, но со следующим формальным ограничением. Если какой-то участок признан достоверным (недостоверным), то достоверными (недостоверными) принудительно признаются и все участки, отклоняющиеся от текущего положения регрессионной прямой меньше (больше), чем он. Точки лежащие слева и сверху от прямой имеют отрицательное отклонение и автоматически считаются достоверными, независимо от абсолютной величины расстояния. Изменение списка достоверных участков может привести к смещению регрессионной прямой, поэтому подвергшийся переквалификации участок перебрасывается туда-сюда до тех пор, пока её положение не установится.
Подразделение участков на достоверные и недостоверные может быть неоднозначным, поэтому пробуются его различные варианты. При этом вводится промежуточная квалификация для участков, хотя бы по разу попадавшие как в доверенные, так и в недостоверные. Они считаются подозрительными. Впоследствии отнесение подозрительных участков к достоверным или к недостоверным даёт верхнюю и нижнюю оценку объёмов фальсификаций.
Дополнительные соображения )
Верификация методики )
Важные замечания )
Для выборов 2016 г. получились следующие результаты.
Явка: 35,4÷36,4% против официальной цифры в 47,8% – завышена на 31÷35% (на треть).
Антирезультат партии власти: 22,8% против официальной цифры в 21,9% – занижен на 4% (это объясняет, почему для этих выборов неплохо работает ГСС, для которой переброс голосов – нож острый).
Абсолютный результат партии власти: 12,5÷13,6% против официальной цифры в 21,9% – завышен на 90÷107% (т.е. вдвое).
Относительный результат партии власти: 35,4÷37,4% против официальной цифры в 54,2% – завышен на 45÷53% (т.е. в полтора раза).
Проголосовали: 38,9÷40,1 млн чел. против официальной цифры в 52,6 млн чел.
Проголосовали за партию власти: 13,8±15,0 млн чел. против официальной цифры в 28,5 млн чел.
Вброшено голосов за партию власти: 12,6÷13,7 млн, или 44÷48% от её официального результата.
Переброшено голосов партии власти: 1,0 млн, или 3,5% от её официального результата.
Доля избирателей-зомби (по регрессии для достоверных участков): 5,3±3,2%.
Общая достоверность результатов: 40÷52%. Полностью недостоверными являются результаты по 18 округам следующих субъектов федерации: Дагестан (все 3), Ингушетия (1), Кабардино-Балкария (1), Карачаево-Черкесия (1), Кемеровская область (3 из 4), Татарстан (все 6), Тюменская область (все 2), Чечня (1). Спорадические достоверные участки удалось сыскать в некоторых округах Северной Осетии, Кемеровской области, Башкортостана, Мордовии, Крыма, Тывы и даже во всех округах Саратовской области. Общая зависимость доли населения в достоверных участках от общего охвата избирателей по стране представлена на картинке. При её построении округа сортировались по достоверности результатов, которая откладывалась по ординате, а по абсциссе откладывалась с накоплением доля зарегистрированных избирателей.


UPD-1 для [livejournal.com profile] tivi_2: Классификация участков на примере Северо-западного округа Санкт-Петербурга, в котором у меня самый низкий разброс точек вокруг прямой. Возможно, я здесь напрасно записал некоторые участки в подозрительные.

Я взял только кусок картинки для лучшего разрешения, но в оставшейся части – только недостоверные участки.

UPD-2: Из-за стремления работать с крупномасштабной картинкой, я в некоторых случаях утрачивал правильное ощущение масштаба и напрасно записывал некоторые участки в подозрительные. Исправился (теперь всегда обязательно снимаю увеличение перед фиксацией результата и не забываю поглядывать на величину разброса точек вокруг прямой). Обсуждаемый УИК №1739 из СПб стал достоверным. Картинка переделана.

September 2017

S M T W T F S
     12
345 6789
10111213141516
17181920212223
24252627282930

Style Credit

Expand Cut Tags

No cut tags
Page generated Sep. 24th, 2017 07:19 pm
Powered by Dreamwidth Studios