tov_y: (Winking)
[personal profile] tov_y
В ходе возни с результатами российских выборов мне окончательно разонравились методы, опирающиеся на нулевую гипотезу о независимости относительного результата от явки. Фундаментальной проблемой этой гипотезы является то, что даже в тех случаях, когда она, возможно, выполняется, на практике её невозможно проверить, поскольку наблюдаемые отклонения от неё могут быть обусловлены не только субъективными (фальсификации), но объективными (структура электората) факторами, неразличимыми в рамках однопараметрической гипотезы.
Например, если в городе явка и поддержка власти низкие, а на селе – высокие, то в целом результат власти будет нарастать с явкой. Однако такая их честная корреляция, вызванная социальной неоднородностью населения, неизбежно будет списана на фальсификации. Чтобы избежать таких ошибок для проверки и реконструкции следует выбирать регионы, достаточно маленькие, чтобы можно было быть уверенным в их преимущественной однородности, но вместе с тем достаточно большие, чтобы давать поддающуюся анализу выборку. Некоторые субъекты федерации заведомо не удовлетворяют первому условию, а территориальные избирательные комиссии – второму. Оптимальным размером обладают избирательные округа (их средний размер в 2016 г. составил 0,43(16) тыс. участков, на которых было зарегистрировано в среднем 0,5(1) млн избирателей).
Другим объективным фактором, приводящим к отклонению от тривиальной нулевой гипотезы, является, как будет показано далее, существование избирателей-зомби, которые поддерживают власть вне зависимости от активности и симпатий остальной части электората. Простейшее предположении, что зомби составляют некоторую часть электората, специфичную для каждого региона, имеет следствием не постоянство, убывание относительного результата власти по мере роста явки за счёт растворения зомби в массе более живых избирателей.
Разделение электората на две части и эффективный учёт остаточной неоднородности предполагает использование двухпараметрической нулевой гипотезы. Наиболее удобным её видом представляется предположение о линейной связи между явкой и антирезультатом власти (абсолютным результатом оппозиции). Гипотетическая прямая имеет положительный наклон, но не обязана проходить через начала координат, отсекая на оси абсцисс долю избирателей-зомби.
Существует два принципиальных способа фальсификаций результатов выборов – вброс голосов за власть (жульничество) и переброс их от оппозиции (воровство). Произвольное рисование цифр является лишь комбинацией этих способов, однако думать о них лучше по отдельности. Вброс голосов увеличивает явку, но не меняет антирезультата, переброс, наоборот, не меняете явки, но уменьшает антирезультат. Таким образом, в координатах явка–антирезультат фальсификации сдвигают точки в одну сторону от честной прямой (вправо и/или вниз). Участки округа, принадлежащие к её ближайшей окрестности считаются достоверными, а отстающие от неё далеко, – недостоверными. Квалификация участков проводится вручную, исходя из представлений о прекрасном, но со следующим формальным ограничением. Если какой-то участок признан достоверным (недостоверным), то достоверными (недостоверными) принудительно признаются и все участки, отклоняющиеся от текущего положения регрессионной прямой меньше (больше), чем он. Точки лежащие слева и сверху от прямой имеют отрицательное отклонение и автоматически считаются достоверными, независимо от абсолютной величины расстояния. Изменение списка достоверных участков может привести к смещению регрессионной прямой, поэтому подвергшийся переквалификации участок перебрасывается туда-сюда до тех пор, пока её положение не установится.
Подразделение участков на достоверные и недостоверные может быть неоднозначным, поэтому пробуются его различные варианты. При этом вводится промежуточная квалификация для участков, хотя бы по разу попадавшие как в доверенные, так и в недостоверные. Они считаются подозрительными. Впоследствии отнесение подозрительных участков к достоверным или к недостоверным даёт верхнюю и нижнюю оценку объёмов фальсификаций.
Дополнительным преимуществом использования такого представления данных является то, что числа по обеим осям измеряются в одних и тех же единицах (процентах от списочного состава избирателей), что позволяет использовать регрессию Деминга (минимизация суммы квадратов отклонений в направлении, перпендикулярном к регрессионной прямой, а не по ординате, как делается для обычных регрессий), не задумываясь, какую из переменных считать объясняющей, а какую – объясняемой (обычный регрессионный анализ требует отсутствия погрешности у объясняющей переменной, что в данном случае невыполнимо). Практика показывает, что среднеквадратичный разброс достоверных участков вокруг регрессивной прямой обыкновенно лежит в диапазона 0,6÷1,1%, что находится в разумном согласии со средней численностью избирательных участков около 1 тыс. чел.
Наконец, если проведение осмысленной прямой оказывается невозможным, результаты выбора во всём округ следует считать полностью фальсифицированным, не изобретая специальных методов отлова массовых фальсификаций. Однопараметрическая нулевая гипотеза ни в постановке Собянина–Суховольского, ни в постанове Шпилькина такой возможности не предоставляет. Разумеется, сказанное не означает, что не следует проверять регионы на общую достоверность с помощью альтернативных критериев (распределение последних цифр, разброс внутри территорий, сгустки, доля недействительных, динамика голосования и т.п.), просто это – другая задача.
Для проверки гипотезы были использованы данные по выборам в Госдуму по Москве в 2011 г. (здесь спецучастки не учитываются), для которых имеется реконструкция (основывающаяся на результатах образцово-показательных выборов 2012 и 2013 гг.). Тогда было переброшено около 0,32 млн голосов и вброшено не менее 0,63 млн.
Для каждого из 10 избирательных округов города анализ и реконструкция проводились независимо. на картинке представлен интегральный результат.

В 2011 г. всего по Москве было 624 достоверных, 279 подозрительных и 2471 недостоверных участков, в которых были зарегистрировано соответственно 1,39, 0,55 и 5,25 млн избирателей. Общая достоверность результатов выборов, т.е. охват электората достоверными участками, составляла 19±27% (в зависимости от отнесения подозрительных участков к достоверным или недостоверным). Было переброшено 0,37 млн голосов и вброшено 0,80÷0,87 млн.
Таким образом, предложенный метод даёт несколько большую оценку воровства и существенно большую оценку жульничества по сравнению с прошлым расчётом. Значительный прирост оценки вброса обусловлен скорее, всего тем, что для его величина ранее была получена лишь нижняя оценка, которая, следует признать, оказалась далека от истины. А общее увеличение размеров фальсификаций по обоим каналам связано, по видимому, с тем, что ранее реконструкция проводилась на уровне территориальных избирательных комиссий. Учитывая крайне низкий общий уровень достоверности результатов, разумно предположить, что на каждой территории были недостоверные участки, однако при их малой доле территория воспринималась как достоверная. Кроме того, как можно видеть из рисунка, некоторые результаты некоторых участков на фоне города вызывают большее доверие, чем на фоне лишь своего округа, что тоже могло привести к недооценке фальсификаций.
Резюмируя, методику можно счесть удовлетворительной и применить к сентябрьским выборам.
Перед этим следует сделать два замечания – техническое и принципиальное.
Для большинства участков, расположенных за рубежом (номера 8000+), нет заранее не составленных списков избирателей, что не позволяет определить явку и делает на них невозможной проверку результатов с помощью используемой гипотезы. Такие участки принудительно заносятся в подозрительные. Общее число избирателей, проголосовавших за рубежом, 0,23 млн человек или 0,2% от списочного состава избирателей.
Принципиальным аспектом является то, что если для Москвы можно предполагать, что её жители, которым не повезло проголосовать на мошеннических участках, характеризуются примерно такими же электоральными активностью и настроениями, как те, чьи голоса честно посчитаны, то для всей страны это заведомо не так. Например, жители национальных республик, где результаты выборов фальсифицируются чуть более чем полностью, более склонны к поддержке действующей власти, чем жители крупных русских городов, где результаты выборов иногда подсчитывают и честно.
Задача реконструкция результатов выборов имеет две постановки, очень похожие по форме, но принципиально различающихся по содержанию. Решение этой задачи в её слабой постановке дает ответ на вопрос «Какой результат получился бы, если бы голоса сразу честно посчитали?», а в сильной – на вопрос «Какой результат получится, если голоса всё-таки честно пересчитать?».
Различие постановок связано с тем обстоятельством, что власть, оставленная без общественного контроля, не может не искажать волеизъявление народа в свою пользу. Поэтому изначально честный подсчет возможен лишь там, где в достаточной мере развито гражданское общество, что среди прочего предполагает наличие минимально успешной оппозиции, потенциально способной поднимать своих избирателей на защиту их интересов. Там же, где это условие не выполнено, выяснить мнение избирателя с помощью процедуры голосования оказывается в принципе невозможно. Таким образом, имеется положительная корреляция между поддержкой оппозиции и достоверностью официальных результатов голосования, вследствие чего реконструкция в слабой постановке оказывается менее благоприятной для власти, чем в сильной.
Удивляться тому, что в условиях целенаправленных искажений возникают две «истинных» картины электоральных предпочтений, не следует. Если сильная постановка задачи, будучи по своей сути юридической, ориентирована на восстановление справедливости и отправление правосудия, то слабая, относясь к области социологии, возвращает выборам функционал инструмента, измеряющего взгляды политически-активной части населения.
Для реконструкции выборов в сильной постановке необходим хотя бы однократный (а лучше – неоднократный) честный подсчёт их результатов для рассматриваемого региона. Поскольку во многих субъектов федерации это условие не выполнено, для страны в целом имеет смысл говорить только о реконструкции в слабой постановке. Коль скоро жители некоторых регионов не готовы отстаивать свои избирательные права, их мнение при реконструкции заменяется мнением тех, кто хотя бы отчасти готов на это.
Аналогична ситуация со спецучастками, голосующие на которых избиратели ограничены либо в своих физических возможностях, либо в доступе к информации, либо в свободе выбора голосовать им или нет, а главное – в возможности добиваться уважения к своему волеизъявлению. Поэтому хотя результаты на каких-то спецучастках могут быть подсчитаны честно, используемая методика может записать их в недостоверные. И это справедливо.
Для выборов 2016 г. получились следующие результаты.
Явка: 35,4÷36,4% против официальной цифры в 47,8% – завышена на 31÷35% (на треть).
Антирезультат партии власти: 22,8% против официальной цифры в 21,9% – занижен на 4% (это объясняет, почему для этих выборов неплохо работает ГСС, для которой переброс голосов – нож острый).
Абсолютный результат партии власти: 12,5÷13,6% против официальной цифры в 21,9% – завышен на 90÷107% (т.е. вдвое).
Относительный результат партии власти: 35,4÷37,4% против официальной цифры в 54,2% – завышен на 45÷53% (т.е. в полтора раза).
Проголосовали: 38,9÷40,1 млн чел. против официальной цифры в 52,6 млн чел.
Проголосовали за партию власти: 13,8±15,0 млн чел. против официальной цифры в 28,5 млн чел.
Вброшено голосов за партию власти: 12,6÷13,7 млн, или 44÷48% от её официального результата.
Переброшено голосов партии власти: 1,0 млн, или 3,5% от её официального результата.
Доля избирателей-зомби (по регрессии для достоверных участков): 5,3±3,2%.
Общая достоверность результатов: 40÷52%. Полностью недостоверными являются результаты по 18 округам следующих субъектов федерации: Дагестан (все 3), Ингушетия (1), Кабардино-Балкария (1), Карачаево-Черкесия (1), Кемеровская область (3 из 4), Татарстан (все 6), Тюменская область (все 2), Чечня (1). Спорадические достоверные участки удалось сыскать в некоторых округах Северной Осетии, Кемеровской области, Башкортостана, Мордовии, Крыма, Тывы и даже во всех округах Саратовской области. Общая зависимость доли населения в достоверных участках от общего охвата избирателей по стране представлена на картинке. При её построении округа сортировались по достоверности результатов, которая откладывалась по ординате, а по абсциссе откладывалась с накоплением доля зарегистрированных избирателей.


UPD-1 для [livejournal.com profile] tivi_2: Классификация участков на примере Северо-западного округа Санкт-Петербурга, в котором у меня самый низкий разброс точек вокруг прямой. Возможно, я здесь напрасно записал некоторые участки в подозрительные.

Я взял только кусок картинки для лучшего разрешения, но в оставшейся части – только недостоверные участки.

UPD-2: Из-за стремления работать с крупномасштабной картинкой, я в некоторых случаях утрачивал правильное ощущение масштаба и напрасно записывал некоторые участки в подозрительные. Исправился (теперь всегда обязательно снимаю увеличение перед фиксацией результата и не забываю поглядывать на величину разброса точек вокруг прямой). Обсуждаемый УИК №1739 из СПб стал достоверным. Картинка переделана.

Date: 2016-11-13 10:14 am (UTC)
From: [identity profile] oude-rus.livejournal.com
Дима Кобак делал разделение на город-село по каждому субъекту федерации. Сумма отклонений по Шпилькину действительно получается меньше, что отклонение по всей стране -- что совершенно ожидаемо.

А как ваши результаты сравниваются со Шпилькиным?

Date: 2016-11-13 02:01 pm (UTC)
From: [identity profile] tov-y.livejournal.com
>Дима Кобак делал разделение на город-село по каждому субъекту федерации.
Город и село – это лишь один из примеров. Например, в Красноярском крае Норильск – одно, а Красноярск – совсем другое, хотя оба – города.

> Сумма отклонений по Шпилькину действительно получается меньше, что отклонение по всей стране -- что совершенно ожидаемо.
Да, ожидаемо. Шпилькин получает ничтожные значения объёмов фальсификации в национальных республиках, которые мой метод целиком записывает в недостоверные. В этих регионах просто нет опоры для реконструкции. Но это намёк на то, что метод Шпилькина может частично лажать там, где пусть искажено не всё, но многое. Если мы ожидаем одинакового распределения голосов за всех партии при определённой явке, что делать, если в этом диапазоне часть голосов у оппозиции украли? Получается, что мы реконструируем к неверному шаблону.

Со Шпилькиным мои результаты по своей инициативе не почти сравниваются – я не понимаю, как это изобразить (но на любой конкретный вопрос я отвечу – в единую табличку я себе собрал тех и этих). Интеграл фальсификации: у него 12,1 млн, у меня общий – 13,5÷14,8 млн, из которых чуть более 1 млн - вброс.

Date: 2016-11-13 02:30 pm (UTC)
From: [identity profile] oude-rus.livejournal.com
то есть ваша оценка более агрессивная.

Date: 2016-11-13 02:32 pm (UTC)
From: [identity profile] tov-y.livejournal.com
Да. Но метод Шпилькина, так же как метод Собянина–Суховольского вообще не позволяют нормально работать с перебросом голосов. Впрочем, я агрессивнее даже по вбросу.

Date: 2016-11-13 02:55 pm (UTC)
From: [identity profile] termometr.livejournal.com
"Агрессивный, бестия,
Чистый фараон, —
Ну, а где агрессия —
Там мне не резон."

Date: 2016-11-13 03:09 pm (UTC)
From: [identity profile] tov-y.livejournal.com
Тигр я али не тигр?!

Date: 2016-11-18 08:39 pm (UTC)
From: [identity profile] termometr.livejournal.com
не поясните противоречие между гипотезой и официозом? -
http://termometr.livejournal.com/832835.html?view=4638275#t4638275

(no subject)

From: [identity profile] tov-y.livejournal.com - Date: 2016-11-19 04:39 am (UTC) - Expand

(no subject)

From: [identity profile] termometr.livejournal.com - Date: 2016-11-19 10:52 am (UTC) - Expand

(no subject)

From: [identity profile] tov-y.livejournal.com - Date: 2016-11-19 10:57 am (UTC) - Expand

(no subject)

From: [identity profile] termometr.livejournal.com - Date: 2016-11-19 11:17 am (UTC) - Expand

(no subject)

From: [identity profile] tov-y.livejournal.com - Date: 2016-11-19 11:36 am (UTC) - Expand

(no subject)

From: [identity profile] termometr.livejournal.com - Date: 2016-11-19 11:41 am (UTC) - Expand

(no subject)

From: [identity profile] tov-y.livejournal.com - Date: 2016-11-19 11:46 am (UTC) - Expand

(no subject)

From: [identity profile] termometr.livejournal.com - Date: 2016-11-19 11:57 am (UTC) - Expand

(no subject)

From: [identity profile] tov-y.livejournal.com - Date: 2016-11-19 12:02 pm (UTC) - Expand

(no subject)

From: [identity profile] termometr.livejournal.com - Date: 2016-11-19 12:18 pm (UTC) - Expand

(no subject)

From: [identity profile] tov-y.livejournal.com - Date: 2016-11-19 12:36 pm (UTC) - Expand

(no subject)

From: [identity profile] termometr.livejournal.com - Date: 2016-11-19 12:56 pm (UTC) - Expand

(no subject)

From: [identity profile] tov-y.livejournal.com - Date: 2016-11-19 12:57 pm (UTC) - Expand

(no subject)

From: [identity profile] termometr.livejournal.com - Date: 2016-11-19 01:02 pm (UTC) - Expand

(no subject)

From: [identity profile] tov-y.livejournal.com - Date: 2016-11-19 01:14 pm (UTC) - Expand

(no subject)

From: [identity profile] termometr.livejournal.com - Date: 2016-11-19 01:23 pm (UTC) - Expand

(no subject)

From: [identity profile] tov-y.livejournal.com - Date: 2016-11-19 01:27 pm (UTC) - Expand

(no subject)

From: [identity profile] termometr.livejournal.com - Date: 2016-11-19 01:32 pm (UTC) - Expand

(no subject)

From: [identity profile] tov-y.livejournal.com - Date: 2016-11-19 01:38 pm (UTC) - Expand

(no subject)

From: [identity profile] termometr.livejournal.com - Date: 2016-11-19 02:05 pm (UTC) - Expand

(no subject)

From: [identity profile] tov-y.livejournal.com - Date: 2016-11-19 02:44 pm (UTC) - Expand

(no subject)

From: [identity profile] termometr.livejournal.com - Date: 2016-11-19 02:57 pm (UTC) - Expand

(no subject)

From: [identity profile] tov-y.livejournal.com - Date: 2016-11-19 03:04 pm (UTC) - Expand

(no subject)

From: [identity profile] termometr.livejournal.com - Date: 2016-11-19 03:08 pm (UTC) - Expand

(no subject)

From: [identity profile] tov-y.livejournal.com - Date: 2016-11-19 03:09 pm (UTC) - Expand

(no subject)

From: [identity profile] termometr.livejournal.com - Date: 2016-11-19 03:16 pm (UTC) - Expand

Date: 2016-11-13 02:55 pm (UTC)
From: [identity profile] corbulon.livejournal.com
Если делать реконструкцию по недействительным бюллетеням, то заниженная интегральная оценка по России получается (округленно) такой: к явке приписано 12 млн, к ЕР - 11 млн.
То есть различия в интегральной оценке вашим методом, по Шпилькину и по недействительным невелики и не существенны.
(Детали у меня в ЖЖ, если вы их пропустили)

Date: 2016-11-13 03:09 pm (UTC)
From: [identity profile] tov-y.livejournal.com
Это, кстати, вообще любопытное обстоятельство, что как ни считай, получается почти одно и то же. Вопрос лишь в точности и обоснованности метода. Кстати, методика, основанная на доле недействительных бюллетеней мне очень нравиться тем, что она совершенно другая. Правда, нет никакой уверенности, что в разных регионах нормальная доля недействительных одинакова. Так что и здесь хорошо было бы мельчить рассмотрение.

Date: 2016-11-13 03:23 pm (UTC)
From: [identity profile] corbulon.livejournal.com
>>нет никакой уверенности, что в разных регионах нормальная доля недействительных одинакова

Меня лично удивило, что эта "нормальная" доля оказалась такой устойчивой в разных регионах и даже в Швеции оказалась такой же.
Причем Швеция подтвердила, что прямые имеют небольшой, но заметный отрицательный наклон, который как раз понятен (я этого наклона в расчетах интегральной оценки не учитывал вообще, то есть и тут тоже сознательно занижал оценку).

>> Вопрос лишь в точности и обоснованности метода
Это верно, но вопрос еще и в наглядности представления результатов. Чем наглядней, тем тоже убедительнее, что не справедливо, но такова селява.
Edited Date: 2016-11-13 03:39 pm (UTC)

Date: 2016-11-13 03:29 pm (UTC)
From: [identity profile] corbulon.livejournal.com
Чтобы любопытным читателям не искать, повешу кривые для России и Швеции прямо здесь.
(Картинки раскрываются по клику. Другие регионы уже в ЖЖ...)
РоссияЛинейн.png

Швеция2010.png
Edited Date: 2016-11-13 03:30 pm (UTC)

Date: 2016-11-13 12:09 pm (UTC)
From: [identity profile] termometr.livejournal.com
Поэтому хотя результаты на каких-то спецучастках могут быть подсчитаны честно, используемая методика может записать их в недостоверные. И это справедливо.
***
"справедливо" или неустранимо в рамках методики?

Общая зависимость доли населения в достоверных участках от общего охвата избирателей по стране представлена на картинке.
***
Если можно, объясните, плз, на понятном языке что же все-таки изображено на нижнем графике и какие из него следуют выводы?

Date: 2016-11-13 02:15 pm (UTC)
From: [identity profile] tov-y.livejournal.com
> "справедливо" или неустранимо в рамках методики?
Вот я был почему-то уверен, что именно Вы зацепитесь именно за это слово. Разумеется, корректно следовало сказать, что это адекватно идеологии слабой реконструкции. Но на мой частный взгляд это и справедливо тоже. И это устранимо, хотя с трудом, т.к. вылавливать спецучастки приходится вручную для каждого субъекта по-отдельности. Для одной Москвы я это делал, но делать это для десятков субъектов я не могу.

> Если можно, объясните, плз, на понятном языке что же все-таки изображено на нижнем графике и какие из него следуют выводы?
Что изображено, дополнительно пояснил в тексте. А выводы? 10% населения страны живёт там, где выборы фальсифицируются тотально, ещё 15% - где очень сильно, по остальной части населения фальсификации разбросаны более-менее равномерно (не географически, а демографически). Общий уровень достоверности результатов этих выборов – ниже 50%.

Date: 2016-11-13 03:34 pm (UTC)
From: [identity profile] termometr.livejournal.com
Вот я был почему-то уверен, что именно Вы зацепитесь именно за это слово.
***
Вы будете смеяться, но я подозревал, что вы написали это именно для меня.


Что изображено, дополнительно пояснил в тексте. А выводы? 10% населения страны живёт там, где выборы фальсифицируются тотально...
***
Цитирую из сказанного вами выше: "Шпилькин получает ничтожные значения объёмов фальсификации в национальных республиках, которые мой метод целиком записывает в недостоверные."

Это сказано об этих 10%?


И еще два вопроса, ИМХО принципиальных:
1. Если появится человек, наблюдатель на конкретном УИК от "Яблока", уверенный, что на данном УИК нарушений не было, то можно ли по данному образцовому УИК как-то настроить вашу модель (хотя бы по тому же городу, где этот УИК)?

2. Как верифицировать-то результат моделей, если выборы тайные?

Date: 2016-11-13 04:34 pm (UTC)
From: [identity profile] tov-y.livejournal.com
> Вы будете смеяться, но я подозревал, что вы написали это именно для меня.
А вот это, если Вы всерьёз, уже зачётно! :)

>Цитирую из сказанного вами выше: "Шпилькин получает ничтожные значения объёмов фальсификации в национальных республиках, которые мой метод целиком записывает в недостоверные."
>Это сказано об этих 10%?
Да.
Замечу также, что Шпилькин отыгрывается при рассмотрении данных по всей стране, на фоне которой эти регионы уже выглядят однозначно лажовыми.

>И еще два вопроса, ИМХО принципиальных:
>1. Если появится человек, наблюдатель на конкретном УИК от "Яблока", уверенный, что на данном УИК нарушений не было, то можно ли по данному образцовому УИК как-то настроить вашу модель (хотя бы по тому же городу, где этот УИК)?
В каком-то смысле я это и делал в той работе, когда реконструировал результаты думских выборов 2011 г. по Москве. Сначала по данным наблюдателей были проверены результаты выборов мэра Москвы в 2013 г., потом используя эти, уже доверенные, результаты – выборы Президента, а затем – на основе представлений о том, куда могут уползти ТИКи за год, а также с привлечение данных о наличии коибов (крайне затрудняющих перебросы голосов), были реконструированы и выборы 2011 г.
Сейчас я размышляю над тем, как бы подмешать в алгоритм не учёт наблюдателей (они где есть, где нет), а данные о недействительных бюллетенях. Это могло бы сократить долю подозрительных участков и дать возможность отнести их либо в достоверные, либо в недостоверные,

>2. Как верифицировать-то результат моделей, если выборы тайные?
Для сильной реконструкции – проводя выборы без подтасовок. Тогда реконструированные результаты отобразятся на истинные.
Для слабой реконструкции этот вопрос не имеет смысла, т.к. восстанавливается не то, что было, а то, что могло бы быть. Здесь надо ставить вопрос о зависимости результатов решения этой задачи от используемой модели. Поэтому и ценна альтернативная методология, которую развивает [livejournal.com profile] corbulon, опирающийся на данные о доле недействительных бюллетеней. Другой подход – изучение связи результатов с динамикой явки. Я свою деятельность на ниве электоральной статистики именно с этого (http://tov-y.livejournal.com/4396.html) и начинал. Однако там метод получился столь сложным, что его, по-моему, никто не понял.

Date: 2016-11-13 07:44 pm (UTC)
From: [identity profile] tivi-2.livejournal.com
На всякий случай свидетельствую: участок 1739, Санкт-Петербург, Приморский район. Фальсификаций и вбросов точно не было, возможно, была карусель с открепительными. Но это максимум 4-5 голосов.

Date: 2016-11-13 08:08 pm (UTC)
From: [identity profile] termometr.livejournal.com
спасибки!

Вот теперь возникает вопрос к авторам различных методик: что следует из такого утверждения?

Date: 2016-11-14 06:21 am (UTC)
From: [identity profile] tov-y.livejournal.com
Из какого именно утверждения?

(no subject)

From: [identity profile] termometr.livejournal.com - Date: 2016-11-14 11:58 am (UTC) - Expand

Date: 2016-11-14 10:00 am (UTC)
From: [identity profile] corbulon.livejournal.com
А что тут неясного??
Из этой информации (о 5 вброшенных бюл.) следует, что число голосов явившихся на выборы и число голосов за победителя (в расчете на один НДБ !!) возрастет.
Edited Date: 2016-11-14 10:01 am (UTC)

(no subject)

From: [identity profile] termometr.livejournal.com - Date: 2016-11-14 11:40 am (UTC) - Expand

Date: 2016-11-14 06:20 am (UTC)
From: [identity profile] tov-y.livejournal.com
Слушайте, а Вы – матёрый человечище! С первой попытки попали в округ, для которого я построил самую узкую область достоверных участков – среднеквадратичное отклонение от прямой всего-навсего 0,51%. Возможно, я с этим округом несколько погорячился, но у меня УИК №1739 Северо-Западного округа Санкт-Петербурга отнесён к подозрительным. Надо подумать. Пока ничего не меняю, но приделал в конец текста апдейт с картинкой для этого округа, чтобы было что предметно обсуждать.

Date: 2016-11-14 11:35 am (UTC)
From: [identity profile] tivi-2.livejournal.com
В любом случае я ручаюсь за чистоту результатов на участке. Я, кстати, не наблюдатель, а член УИК с ПРГ. Вижу процесс с самого начала работы УИК и отслеживаю все,начиная со списков и журнала телефонограмм. А в день выборов во все глаза смотрю за дополнительным списком и считаю проголосовавших на участке.

(no subject)

From: [identity profile] tov-y.livejournal.com - Date: 2016-11-14 01:31 pm (UTC) - Expand

Date: 2016-11-14 11:37 am (UTC)
From: [identity profile] termometr.livejournal.com
Точка уик плохо различима на нижнем графике - УИК №1739 это примерно
явка - 34, антирезультат - 21 ? Я правильно ее разглядел?

У вас есть результаты голосования по этому УИК? можете их дать тут?

Если взять эту точку как достоверную, то поможет ли это верифицировать вашу модель и как изменятся конечные результаты?

PS
tivi_2 я доверяю полностью.

(no subject)

From: [identity profile] tov-y.livejournal.com - Date: 2016-11-14 01:37 pm (UTC) - Expand

(no subject)

From: [identity profile] termometr.livejournal.com - Date: 2016-11-14 02:09 pm (UTC) - Expand

Date: 2016-11-15 06:17 am (UTC)
From: [identity profile] barouh.livejournal.com
А как ваш УИК подходил к определению недействительных? Бывают разные подходы. Одни комиссии формальничают и любой бюллетень, в котором можно углядеть признаки недействительности (галочка криво поставлена, что-нибудь сбоку приписано) относят к недействительным. Другие же более человечны и любой бюллетень, в котором однозначно понятно волеизъявление человека, голосованием признают действительным

Понятно, что средняя доля недействительных при двух подходах будет отличаться

(no subject)

From: [identity profile] tivi-2.livejournal.com - Date: 2016-11-19 01:21 pm (UTC) - Expand

Date: 2016-11-15 10:55 am (UTC)
From: [identity profile] barouh.livejournal.com
Общее ощущение - что все-таки наличие фальсификаций это в значительной степени переменная уровня ТИКа, а не УИКа. Есть много ТИКов, где все чисто (даже если есть 1-2 участка с какими-то странными результатами - они скорее всего объясняются какими-то объективными факторами). А если уж есть фальсификации - то это как правило заметная часть участков ТИКа (десятки процентов)

Так что на мой взгляд имеет смысл пробовать искать автоматические критерии разделения участков. Если посчитать количество ТИКов, которые полностью или на 9х% (или за исключением не более чем 1-2 участков) укладываются в коридоры нормальности той или иной ширины, то скорее всего станет виден предел, после которого дальнейшее расширение коридора неэффективно - количество нормальных ТИКов при этом будет расти куда медленнее, чем до этого

P.S. На мой взгляд, вполне уместно предполагать, что ширина "нормального" коридора примерно одинаковая по всей стране. Другое дело, что для небольших участков (сельских) выше вероятность случайных отклонений от линии тренда. Так что может быть имеет смысл считать отклонение не в процентах, а в абсолютных голосах. Или в синтетических промежуточных единицах, типа количество абсолютных голосов, деленное на корень от списочной численности избирателей на участке
Edited Date: 2016-11-15 11:02 am (UTC)

Date: 2016-11-15 01:08 pm (UTC)
From: [identity profile] tov-y.livejournal.com
> Общее ощущение - что все-таки наличие фальсификаций это в значительной степени переменная уровня ТИКа, а не УИКа. Есть много ТИКов, где все чисто (даже если есть 1-2 участка с какими-то странными результатами - они скорее всего объясняются какими-то объективными факторами). А если уж есть фальсификации - то это как правило заметная часть участков ТИКа (десятки процентов)
Это так лишь отчасти. Если бы каждая ТИК почти целиком была честной или почти целиком лажовой, то для всех бы ТИК был примерно одинаков разброс результатов по участкам вокруг среднего. Однако именно его аномальная (как очень большая, так и очень малая) величина является одним из критериев массовых фальсификаций.

> Так что на мой взгляд имеет смысл пробовать искать автоматические критерии разделения участков. Если посчитать количество ТИКов, которые полностью или на 9х% (или за исключением не более чем 1-2 участков) укладываются в коридоры нормальности той или иной ширины, то скорее всего станет виден предел, после которого дальнейшее расширение коридора неэффективно - количество нормальных ТИКов при этом будет расти куда медленнее, чем до этого
Даже при однородных по честности ТИК без исключения спецучастков не проканает, т.к. их доля разная по разным ТИК. А автоматически я их исключать не умею. Но вообще мысль дискриминировать ТИК целиком или одобрять целиком потенциально перспективна.

> P.S. На мой взгляд, вполне уместно предполагать, что ширина "нормального" коридора примерно одинаковая по всей стране.
Таки да!

> Другое дело, что для небольших участков (сельских) выше вероятность случайных отклонений от линии тренда.
И это – да. В дискриминируемой области может быть какое-то количество убежавших малых УИК. Увы, помочь нечем. Разве что дополнительно дискриминировать малые УИК, убежавшие в противоположную сторону.

> Так что может быть имеет смысл считать отклонение не в процентах, а в абсолютных голосах.
Нельзя. Разные части графика будут иметь разный вес.

> Или в синтетических промежуточных единицах, типа количество абсолютных голосов, деленное на корень от списочной численности избирателей на участке
Так я же беру участки с весом, равным списочной численности. А метод наименьших квадратов и делает из неё корень ;)

September 2017

S M T W T F S
     12
345 6789
10111213141516
17181920212223
24252627282930

Style Credit

Expand Cut Tags

No cut tags
Page generated Sep. 24th, 2017 07:09 pm
Powered by Dreamwidth Studios