tov_y: (Winking)
[personal profile] tov_y
В ходе возни с результатами российских выборов мне окончательно разонравились методы, опирающиеся на нулевую гипотезу о независимости относительного результата от явки. Фундаментальной проблемой этой гипотезы является то, что даже в тех случаях, когда она, возможно, выполняется, на практике её невозможно проверить, поскольку наблюдаемые отклонения от неё могут быть обусловлены не только субъективными (фальсификации), но объективными (структура электората) факторами, неразличимыми в рамках однопараметрической гипотезы.
Например, если в городе явка и поддержка власти низкие, а на селе – высокие, то в целом результат власти будет нарастать с явкой. Однако такая их честная корреляция, вызванная социальной неоднородностью населения, неизбежно будет списана на фальсификации. Чтобы избежать таких ошибок для проверки и реконструкции следует выбирать регионы, достаточно маленькие, чтобы можно было быть уверенным в их преимущественной однородности, но вместе с тем достаточно большие, чтобы давать поддающуюся анализу выборку. Некоторые субъекты федерации заведомо не удовлетворяют первому условию, а территориальные избирательные комиссии – второму. Оптимальным размером обладают избирательные округа (их средний размер в 2016 г. составил 0,43(16) тыс. участков, на которых было зарегистрировано в среднем 0,5(1) млн избирателей).
Другим объективным фактором, приводящим к отклонению от тривиальной нулевой гипотезы, является, как будет показано далее, существование избирателей-зомби, которые поддерживают власть вне зависимости от активности и симпатий остальной части электората. Простейшее предположении, что зомби составляют некоторую часть электората, специфичную для каждого региона, имеет следствием не постоянство, убывание относительного результата власти по мере роста явки за счёт растворения зомби в массе более живых избирателей.
Разделение электората на две части и эффективный учёт остаточной неоднородности предполагает использование двухпараметрической нулевой гипотезы. Наиболее удобным её видом представляется предположение о линейной связи между явкой и антирезультатом власти (абсолютным результатом оппозиции). Гипотетическая прямая имеет положительный наклон, но не обязана проходить через начала координат, отсекая на оси абсцисс долю избирателей-зомби.
Существует два принципиальных способа фальсификаций результатов выборов – вброс голосов за власть (жульничество) и переброс их от оппозиции (воровство). Произвольное рисование цифр является лишь комбинацией этих способов, однако думать о них лучше по отдельности. Вброс голосов увеличивает явку, но не меняет антирезультата, переброс, наоборот, не меняете явки, но уменьшает антирезультат. Таким образом, в координатах явка–антирезультат фальсификации сдвигают точки в одну сторону от честной прямой (вправо и/или вниз). Участки округа, принадлежащие к её ближайшей окрестности считаются достоверными, а отстающие от неё далеко, – недостоверными. Квалификация участков проводится вручную, исходя из представлений о прекрасном, но со следующим формальным ограничением. Если какой-то участок признан достоверным (недостоверным), то достоверными (недостоверными) принудительно признаются и все участки, отклоняющиеся от текущего положения регрессионной прямой меньше (больше), чем он. Точки лежащие слева и сверху от прямой имеют отрицательное отклонение и автоматически считаются достоверными, независимо от абсолютной величины расстояния. Изменение списка достоверных участков может привести к смещению регрессионной прямой, поэтому подвергшийся переквалификации участок перебрасывается туда-сюда до тех пор, пока её положение не установится.
Подразделение участков на достоверные и недостоверные может быть неоднозначным, поэтому пробуются его различные варианты. При этом вводится промежуточная квалификация для участков, хотя бы по разу попадавшие как в доверенные, так и в недостоверные. Они считаются подозрительными. Впоследствии отнесение подозрительных участков к достоверным или к недостоверным даёт верхнюю и нижнюю оценку объёмов фальсификаций.
Дополнительным преимуществом использования такого представления данных является то, что числа по обеим осям измеряются в одних и тех же единицах (процентах от списочного состава избирателей), что позволяет использовать регрессию Деминга (минимизация суммы квадратов отклонений в направлении, перпендикулярном к регрессионной прямой, а не по ординате, как делается для обычных регрессий), не задумываясь, какую из переменных считать объясняющей, а какую – объясняемой (обычный регрессионный анализ требует отсутствия погрешности у объясняющей переменной, что в данном случае невыполнимо). Практика показывает, что среднеквадратичный разброс достоверных участков вокруг регрессивной прямой обыкновенно лежит в диапазона 0,6÷1,1%, что находится в разумном согласии со средней численностью избирательных участков около 1 тыс. чел.
Наконец, если проведение осмысленной прямой оказывается невозможным, результаты выбора во всём округ следует считать полностью фальсифицированным, не изобретая специальных методов отлова массовых фальсификаций. Однопараметрическая нулевая гипотеза ни в постановке Собянина–Суховольского, ни в постанове Шпилькина такой возможности не предоставляет. Разумеется, сказанное не означает, что не следует проверять регионы на общую достоверность с помощью альтернативных критериев (распределение последних цифр, разброс внутри территорий, сгустки, доля недействительных, динамика голосования и т.п.), просто это – другая задача.
Для проверки гипотезы были использованы данные по выборам в Госдуму по Москве в 2011 г. (здесь спецучастки не учитываются), для которых имеется реконструкция (основывающаяся на результатах образцово-показательных выборов 2012 и 2013 гг.). Тогда было переброшено около 0,32 млн голосов и вброшено не менее 0,63 млн.
Для каждого из 10 избирательных округов города анализ и реконструкция проводились независимо. на картинке представлен интегральный результат.

В 2011 г. всего по Москве было 624 достоверных, 279 подозрительных и 2471 недостоверных участков, в которых были зарегистрировано соответственно 1,39, 0,55 и 5,25 млн избирателей. Общая достоверность результатов выборов, т.е. охват электората достоверными участками, составляла 19±27% (в зависимости от отнесения подозрительных участков к достоверным или недостоверным). Было переброшено 0,37 млн голосов и вброшено 0,80÷0,87 млн.
Таким образом, предложенный метод даёт несколько большую оценку воровства и существенно большую оценку жульничества по сравнению с прошлым расчётом. Значительный прирост оценки вброса обусловлен скорее, всего тем, что для его величина ранее была получена лишь нижняя оценка, которая, следует признать, оказалась далека от истины. А общее увеличение размеров фальсификаций по обоим каналам связано, по видимому, с тем, что ранее реконструкция проводилась на уровне территориальных избирательных комиссий. Учитывая крайне низкий общий уровень достоверности результатов, разумно предположить, что на каждой территории были недостоверные участки, однако при их малой доле территория воспринималась как достоверная. Кроме того, как можно видеть из рисунка, некоторые результаты некоторых участков на фоне города вызывают большее доверие, чем на фоне лишь своего округа, что тоже могло привести к недооценке фальсификаций.
Резюмируя, методику можно счесть удовлетворительной и применить к сентябрьским выборам.
Перед этим следует сделать два замечания – техническое и принципиальное.
Для большинства участков, расположенных за рубежом (номера 8000+), нет заранее не составленных списков избирателей, что не позволяет определить явку и делает на них невозможной проверку результатов с помощью используемой гипотезы. Такие участки принудительно заносятся в подозрительные. Общее число избирателей, проголосовавших за рубежом, 0,23 млн человек или 0,2% от списочного состава избирателей.
Принципиальным аспектом является то, что если для Москвы можно предполагать, что её жители, которым не повезло проголосовать на мошеннических участках, характеризуются примерно такими же электоральными активностью и настроениями, как те, чьи голоса честно посчитаны, то для всей страны это заведомо не так. Например, жители национальных республик, где результаты выборов фальсифицируются чуть более чем полностью, более склонны к поддержке действующей власти, чем жители крупных русских городов, где результаты выборов иногда подсчитывают и честно.
Задача реконструкция результатов выборов имеет две постановки, очень похожие по форме, но принципиально различающихся по содержанию. Решение этой задачи в её слабой постановке дает ответ на вопрос «Какой результат получился бы, если бы голоса сразу честно посчитали?», а в сильной – на вопрос «Какой результат получится, если голоса всё-таки честно пересчитать?».
Различие постановок связано с тем обстоятельством, что власть, оставленная без общественного контроля, не может не искажать волеизъявление народа в свою пользу. Поэтому изначально честный подсчет возможен лишь там, где в достаточной мере развито гражданское общество, что среди прочего предполагает наличие минимально успешной оппозиции, потенциально способной поднимать своих избирателей на защиту их интересов. Там же, где это условие не выполнено, выяснить мнение избирателя с помощью процедуры голосования оказывается в принципе невозможно. Таким образом, имеется положительная корреляция между поддержкой оппозиции и достоверностью официальных результатов голосования, вследствие чего реконструкция в слабой постановке оказывается менее благоприятной для власти, чем в сильной.
Удивляться тому, что в условиях целенаправленных искажений возникают две «истинных» картины электоральных предпочтений, не следует. Если сильная постановка задачи, будучи по своей сути юридической, ориентирована на восстановление справедливости и отправление правосудия, то слабая, относясь к области социологии, возвращает выборам функционал инструмента, измеряющего взгляды политически-активной части населения.
Для реконструкции выборов в сильной постановке необходим хотя бы однократный (а лучше – неоднократный) честный подсчёт их результатов для рассматриваемого региона. Поскольку во многих субъектов федерации это условие не выполнено, для страны в целом имеет смысл говорить только о реконструкции в слабой постановке. Коль скоро жители некоторых регионов не готовы отстаивать свои избирательные права, их мнение при реконструкции заменяется мнением тех, кто хотя бы отчасти готов на это.
Аналогична ситуация со спецучастками, голосующие на которых избиратели ограничены либо в своих физических возможностях, либо в доступе к информации, либо в свободе выбора голосовать им или нет, а главное – в возможности добиваться уважения к своему волеизъявлению. Поэтому хотя результаты на каких-то спецучастках могут быть подсчитаны честно, используемая методика может записать их в недостоверные. И это справедливо.
Для выборов 2016 г. получились следующие результаты.
Явка: 35,4÷36,4% против официальной цифры в 47,8% – завышена на 31÷35% (на треть).
Антирезультат партии власти: 22,8% против официальной цифры в 21,9% – занижен на 4% (это объясняет, почему для этих выборов неплохо работает ГСС, для которой переброс голосов – нож острый).
Абсолютный результат партии власти: 12,5÷13,6% против официальной цифры в 21,9% – завышен на 90÷107% (т.е. вдвое).
Относительный результат партии власти: 35,4÷37,4% против официальной цифры в 54,2% – завышен на 45÷53% (т.е. в полтора раза).
Проголосовали: 38,9÷40,1 млн чел. против официальной цифры в 52,6 млн чел.
Проголосовали за партию власти: 13,8±15,0 млн чел. против официальной цифры в 28,5 млн чел.
Вброшено голосов за партию власти: 12,6÷13,7 млн, или 44÷48% от её официального результата.
Переброшено голосов партии власти: 1,0 млн, или 3,5% от её официального результата.
Доля избирателей-зомби (по регрессии для достоверных участков): 5,3±3,2%.
Общая достоверность результатов: 40÷52%. Полностью недостоверными являются результаты по 18 округам следующих субъектов федерации: Дагестан (все 3), Ингушетия (1), Кабардино-Балкария (1), Карачаево-Черкесия (1), Кемеровская область (3 из 4), Татарстан (все 6), Тюменская область (все 2), Чечня (1). Спорадические достоверные участки удалось сыскать в некоторых округах Северной Осетии, Кемеровской области, Башкортостана, Мордовии, Крыма, Тывы и даже во всех округах Саратовской области. Общая зависимость доли населения в достоверных участках от общего охвата избирателей по стране представлена на картинке. При её построении округа сортировались по достоверности результатов, которая откладывалась по ординате, а по абсциссе откладывалась с накоплением доля зарегистрированных избирателей.


UPD-1 для [livejournal.com profile] tivi_2: Классификация участков на примере Северо-западного округа Санкт-Петербурга, в котором у меня самый низкий разброс точек вокруг прямой. Возможно, я здесь напрасно записал некоторые участки в подозрительные.

Я взял только кусок картинки для лучшего разрешения, но в оставшейся части – только недостоверные участки.

UPD-2: Из-за стремления работать с крупномасштабной картинкой, я в некоторых случаях утрачивал правильное ощущение масштаба и напрасно записывал некоторые участки в подозрительные. Исправился (теперь всегда обязательно снимаю увеличение перед фиксацией результата и не забываю поглядывать на величину разброса точек вокруг прямой). Обсуждаемый УИК №1739 из СПб стал достоверным. Картинка переделана.
From:
Anonymous( )Anonymous This account has disabled anonymous posting.
OpenID( )OpenID You can comment on this post while signed in with an account from many other sites, once you have confirmed your email address. Sign in using OpenID.
User
Account name:
Password:
If you don't have an account you can create one now.
Subject:
HTML doesn't work in the subject.

Message:

 
Notice: This account is set to log the IP addresses of everyone who comments.
Links will be displayed as unclickable URLs to help prevent spam.

January 2017

S M T W T F S
1234567
891011121314
151617 18192021
22232425 262728
293031    

Style Credit

Expand Cut Tags

No cut tags
Page generated Jul. 26th, 2017 08:42 am
Powered by Dreamwidth Studios