tov_y: (Winking)
[personal profile] tov_y
В основе методов реконструкции Собянина–Суховольского и Шпилькина лежит эмпирическое установление некоторой статистической закономерность, которой подчиняются результаты всех партий, кроме партии власти. Это позволяет высказать разумное предположение о фальсификации выборов в её пользу и в его рамках реконструируется истинный результат путём устранения отклонения от установленной закономерности.
Беда этих методов состоит в недоказуемости исходного предположения. Теоретического обоснования оно заведомо не имеет, поскольку гипотетически возможны ситуации, когда оно нарушается (хотя их применимость к российским выборам сомнительна). Практическое его обоснование также проблематично, поскольку все используемые данные «расходуются» на расчёт размеров фальсификации. И мы уже не имеем возможности выяснить, до какой же степени всё-таки верно наше предположение, если оно, вдруг, верно не вполне.
Таким образом, необходимо привлечение дополнительных данных, не связанных непосредственно с результатами голосования.В качестве таких данных предлагается использовать динамику явки избирателей.
Для почти всех избирательных участков имеются данные о доле избирателей, проголосовавших к 10, 12, 15 и 18 часам местного времени. Отнормируем её на итоговую явку и рассмотрим распределение полученных величин (участки берутся с весами, равными числу зарегистрированных на них избирателей). Среднеквадратичное отклонение квантильных уровней отнормированной явки от медианного значения (далее – отклонение) выберем в качестве характеристики избирательного участка.
Update (06/02/12): Расчёты делаются отдельно для городских и сельских населённых пунктов. Судовые ТИК из рассмотрения исключены.
Никакого прямой связи между величиной отклонения и активностью избирателей или их политическими симпатиями, по идее, быть не должно. Однако, как видно из рисунка, она есть и весьма существенная.

Наиболее активный народ почему-то приходит на участки наименее типичным образом. Считать свободным от искажений можно только горизонтальный участок графика, соответствующий низким отклонениям. Таким образом, истинная явка составляет примерно 52÷53% (против официальных 60%). Примечательно, что эта величина совпадает для всех участков и для участков, оборудованных сканерами – комплексами обработки избирательных бюллетеней или комплексами электронного голосования. Использование этих устройств не препятствует фальсификации процедуры выборов, но осложняет фальсификацию их результатов.
На врезке даны результаты по всем участкам, на которых отклонение не превышает абсциссы. Интегральное представление позволяет иметь дело с более гладкими графиками, для которых легче визуально оценить то максимальное отклонение (примерно 15÷20%), при котором уже несущественны флуктуации, но ещё несущественны фальсификации. Именно в таком виде будет представлены все дальнейшие графики.

Сравним зависимости от максимального отклонения результатов партии власти и суммарного результата 6 оппозиционных партий. Здесь уже графики для участков со сканерами и без них не совпадают, поскольку если явка фальсифицируется только реальным или виртуальным вбросом бюллетеней, то результат – ещё и кражей голосов. Расстояние между графиками позволяет очень приблизительно (не будем забывать, что одинаковые абсциссы у графиков соответствуют разным наборам избирательных участков) оценить масштабы кражи в 3÷5% от числа избирателей.
Истинные результаты партии власти и оппозиционных партий составляют, соответственно, примерно 17% и 35% от числа избирателей (и ещё чуть менее 1% досталось поросёнку Нах-Нах). В пересчёте к доле избирателей, принявших участие в голосовании, эти цифры превратятся в 32% и 66%. Таким образом, уровень поддержки власти на выборов не достигает и 1/3, что даже меньше результатов социологических опросов.

Сравнение истинных результатов партий с официальными позволяет отдельно оценить масштабы фальсификации процедуры выборов и масштабы фальсификации их результатов. Горизонтальные участки графика дают 8 млн голосов, полученных партией власти в результате вброса бюллетеней, несвободного голосования и приписок, и еще 6 млн – как результат передачи ей голосов, реально отданных за оппозиционные партии. В сумме – 14 млн голосов, или примерно 80% от истинного результата.

Очень любопытным образом распределились кражи голосов по партиям. Больше всего обидели бабл-боя этих выборов – «Яблоко». У него в процентом отношении спёрли в 2÷3 раза больше, чем у партий прошедших в Думу, и даже больше, чем у аутсайдеров. Честный подсчёт голосов всё равно не позволил бы «Яблоку» преодолеть 7%-барьер (хотя избавил бы Явлинского от необходимости собирать подписи), но психологически феномен очень показательный.


UPD-1: Теперь посмотрим, что происходит с распределениями вероятности.
Приведённые ниже гистограммы построены с бинами 0,25% для всех участков и 1% для участков, оборудованных КОИБ/КЭГ. Все участки учитывались с весом, равным числу зарегистрированных избирателей. Чтобы устранить артефакты, возникающие из-за рассмотрения отношения целых чисел, неабсолютные результаты подвергались дизерингу посредством добавления к числителю случайной величины, равномерно распределённой на промежутке (–½;+½). Данная процедура повторялась 100 раз и результаты усреднялись.
Отдельно приведены результаты для участков с высоким (>25% – High) и низким (≤25% – Low) значением отклонения.

Видно, что по мере устранения из выборки сомнительных участков распределение по явке становится всё более узким и островерхим. Однако, как можно видеть из динамики коэффициентов асимметрии и эксцесса, то, что получается после реконструкции, – это не только не гауссово распределение, но и дальше от него, чем было исходное распределение (хотя визуально и может показаться, что получилась гауссиана). Дело в том, что очистка от «мусора» не устраняет из выборки всех участков с высокой явкой. Соответственно, центральные моменты уменьшаются не очень сильно (тем более, что смещение математического ожидания влево дополнительно препятствует их уменьшению). А вот среднеквадратичное отклонение уменьшается сильно. В результате коэффициенты асимметрии и эксцесса возрастают. Таким образом, чем дальше, тем сильнее график плотности скашивается влево и становится избыточно островерхим. Это дополнительный довод не требовать от «честных» распределений гауссова вида.

Аналогичная ситуация, только ещё в большем масштабе, имеет место для доли голосов, набранных партией власти. Следует отметить, что для участков с низким отклонением сохраняются пики на красивых процентах. Впрочем, это неудивительно, поскольку такие цифры, творимые на этапе заполнения протоколов, никак не связаны с динамикой явки.


UPD-2:
Теперь посмотрим на зависимость доли голосов набранных партиями, от явки. Как и в предыдущем фрагменте отдельно рассмотрены участки с высоким (>25% – High) и низким (≤25% – Low) значением отклонения, а все участки учитываются с весом, равным числу зарегистрированных на них избирателей.

В отличие от распределений по явке и результату, эта зависимость почти не чувствительна к динамике активности.

Аналогичным образом, наличие или отсутствие сканеров почти не сказывается на зависимости результата партии от явки. Хотя происходит некоторое уширение горизонтальных областей в левых частях зависимостей.
Эти результаты могут показаться противоречащими выводам о масштабах фальсификации. Однако противоречие это кажущееся. По мере очистки выборки от фальшивых замеров правые части зависимостей, соответствующие большой явке, теряют свою значимость. Вместе с тем, поскольку все фальшивые замеры вычистить всё равно не удаётся, отклонение графиков от горизонтального вида в этих частях сохраняется.


UPD-3:
По просьбам трудящихся выкладываю распределение участков по среднеквадратичному отклонению квантильных уровней отнормированной явки от медианного значения.

Красная линия соответствует участкам, взятым с единичным весом, синяя – с весом, равным числу зарегистрированных избирателей.
Из того, что пик красной кривой не воспроизводится на синей, можно заключить, что он соответствует очень маленьким участкам, на которых возможны чудовищные флуктуации в динамике явки.


UPD-4: [livejournal.com profile] oude_rus обнаружил ещё один признак липовых результатов ЕР – нулевое количество недействительных бюллетеней. Посмотрим на то, как данный критерий сказывается на распределении участков по отклонению явки.

Т.е. нулевой уровень недействительных бюллетеней добавляет 6 процентных пунктов к отклонению.


UPD-5: Истинный результат ЕР, или усреднённым экспертам посвящается
Поскольку, как я узнал у экспертов имеется консенсус относительно истинного результата ЕР на уровне 38-41%, выкладываю график зависимости её результата от максимального отклонения:

Как можно видеть, нижняя граница экспертных оценок чуть выше той цифры, которая получается, если вообще не исключать участки с сильно нетипичной динамикой явки. Видимо, я не вполне эксперт, но лично я ориентируюсь на полочку графика при абсцессе 15-20%.



Date: 2012-02-03 01:34 pm (UTC)
From: [identity profile] winpooh.livejournal.com
> Никакого прямой связи между величиной отклонения и активностью избирателей или их политическими симпатиями, по идее, быть не должно.

Неочевидно. Идею - в студию.

Date: 2012-02-03 01:41 pm (UTC)
From: [identity profile] tov-y.livejournal.com
Если кто-то сумеет предложить сценарий систематического изменения явки/результата с ростом отклонения, тогда можно будет что-то обсуждать. Но думаю, что предложить такой сценарий не удастся, что и обозначено оборотом «по идее».

Date: 2012-02-03 01:51 pm (UTC)
From: [identity profile] winpooh.livejournal.com
Представим себе, например, предприятие непрерывного цикла, рабочие которого работают посменно. Допустим, они в своей массе голосуют за партию А. Смена закончилась в пять вечера, все рабочие твёрдым шагом двинулись на избирательный участок. Вот и систематическое отклонение нарисовалось.

(no subject)

From: [identity profile] tov-y.livejournal.com - Date: 2012-02-03 02:15 pm (UTC) - Expand

Date: 2012-02-03 01:36 pm (UTC)
From: [identity profile] winpooh.livejournal.com
Да, и где на графике голоса, украденные у Единой России?

Date: 2012-02-03 01:43 pm (UTC)
From: [identity profile] tov-y.livejournal.com
Нигде. Если её истинный результат меньше официального, значит у неё ничего не украдено (разумеется, речь идёт об интегральных показателях), а ей добавлено.

(no subject)

From: [identity profile] winpooh.livejournal.com - Date: 2012-02-03 01:47 pm (UTC) - Expand

(no subject)

From: [identity profile] tov-y.livejournal.com - Date: 2012-02-03 01:57 pm (UTC) - Expand

Date: 2012-02-03 02:29 pm (UTC)
From: [identity profile] kobak.livejournal.com
1. Интересно!

2. Несколько раз перечитал вводный абзац

"Для почти всех избирательных участков имеются данные о доле избирателей, проголосовавших к 10, 12, 15 и 18 часам местного времени. Отнормируем её на итоговую явку и рассмотрим распределение полученных величин (участки берутся с весами, равными числу зарегистрированных на них избирателей). Среднеквадратичное отклонение квантильных уровней отнормированной явки от медианного значения (далее – отклонение) выберем в качестве характеристики избирательного участка"

-- но всё равно не уверен, что правильно понял, как Вы считаете отклонение. Напишите поподробнее, пожалуйста. Но если я правильно, понял общую идею, то "отклонение" характеризует величину максимального скачка между двумя отметками явки.

3. На втором графике у Вас в легенде синяя и красная кривые не перепутаны? Если нет, то ничего не понятно.

4. Общий разультат (32%) кажется преуменьшенным. Возможно, это потому, что Вы все калибруете по коибам, а они стояли по большей части в городах и тд.

5. Любопытно было бы еще посмотреть на диаграммы рассеяния (а не только средние линии): отклонение-явка и отклонение-результат ЕР...

Date: 2012-02-03 02:30 pm (UTC)
From: [identity profile] kobak.livejournal.com
По поводу (3): либо я ошибся, либо Вы уже исправили. В любом случае, теперь всё в порядке.

(no subject)

From: [identity profile] tov-y.livejournal.com - Date: 2012-02-03 03:30 pm (UTC) - Expand

Date: 2012-02-03 03:30 pm (UTC)
From: [identity profile] tov-y.livejournal.com
2. Для каждого момента ti времени имеется официальная цифра явки pi. И имеется финальная явка p. Берутся отнормированные отношения pi/p. Строится их распределение по всем участкам, для которых есть данные о динамике явки. Участки берутся с весом, равным числу избирателей. Соответственно, для каждого участка возникает набор квантильных уровней qi, определяемых как процент участков, для которых отношение pi/p меньше, чем у данного. Дальше вычисляется среднеквадратичное отклонение qi от 50%. С ним и работаем.
В целом, таки да, отклонение более-менее «характеризует величину максимального скачка между двумя отметками явки». Но только и явка нормированная, и отклонение может не сводиться к одному скачку…

4. Общий результат (32%), скорее всего, является преуменьшенным. Но не из-за расположения КОИБ/КЭГ (я, скорее, поверю, что они завышают результат ЕР, т.к. были умышленно расположены в местах с её высоким рейтингом, дабы мухлёж был менее заметен). Дело тут вот в чём. Есть у нас зоны «особой электоральной культуры», где поддержка ЕР действительно выше, чем в целом по стране. Но поскольку это ещё и зоны тотальной фальсификации, то избирательные участки из этих зон имеют очень высокие шансы быть исключенными из анализа, что сместит его результаты в строну неособых зон. Однако я не считаю это дефектом метода. Он даёт реконструкцию по тем участкам, для которых она в принципе возможна, а остальные просто приравнивает к ним, ибо нефиг мухлевать.

5. Диаграммы – в планах. Но сначала хочется плотности вероятности. И, видимо, уже завтра.

(no subject)

From: [identity profile] kobak.livejournal.com - Date: 2012-02-03 05:45 pm (UTC) - Expand

(no subject)

From: [identity profile] kobak.livejournal.com - Date: 2012-02-03 05:56 pm (UTC) - Expand

Date: 2012-02-03 07:45 pm (UTC)
From: [identity profile] tov-y.livejournal.com
С диаграммами рассеяния – облом. Если брать по УИК, получаются абсолютно бесструктурные пятна точек. Если брать ТИК, то тоже не фонтан. Лишь на уровне регионов (субъекты с разбивкой село/город что-то видно).

Date: 2012-02-03 03:04 pm (UTC)
From: [identity profile] kireev.livejournal.com
Спасибо за исследование. Помимо уже сказанного, что КОИБы стояли преимущественно в городах, я бы еще добавил, что фальсифицировали чаще там, где у ЕР был и честно бы выше результат, и это искажает оценку фальсификаций.

Date: 2012-02-03 03:32 pm (UTC)
From: [identity profile] tov-y.livejournal.com
Угу: http://tov-y.livejournal.com/4396.html?thread=16172#t16172
Пункт 4 и мой ответ.

Date: 2012-02-04 05:52 pm (UTC)
From: [identity profile] kobak.livejournal.com
А нарисуйте гистограмму кол-ва участков по отклонению, а то непонятно, где сколько. Лучше даже не участков, в суммы голосов по участкам с данным отклонением.

Date: 2012-02-04 06:54 pm (UTC)
From: [identity profile] tov-y.livejournal.com
Я не вполне понимаю, что Вы там ожидаете увидеть. Но пусть будет – см. Update-3.
P.S. Разумеется, я не рисовал гистограмму для суммы голосов (что толку анализировать распределение, построенное со случайными весами точек?), а рисовал для суммы числа избирателей (впрочем, они очень близки).

(no subject)

From: [identity profile] kobak.livejournal.com - Date: 2012-02-04 07:15 pm (UTC) - Expand

(no subject)

From: [identity profile] tov-y.livejournal.com - Date: 2012-02-05 01:49 pm (UTC) - Expand

Date: 2012-02-06 01:05 pm (UTC)
From: [identity profile] barouh.livejournal.com
Спасибо. Очень интересно

Но с базовым предположением - что отклонения в почасовой динамике явки от среднего никак не связаны с активностью и политическими предпочтениями - не соглашусь

Поддержка ЕР выше на селе (насколько выше - открытый вопрос), там же меньше средний размер участков (что повышает вероятность естественных отклонений распределения явки от "нормы", в т.ч. в сторону активного утреннего голосования) и ниже уровень квалификации членов избиркомов - соответственно, выше вероятность небрежности и ошибок при подсчете и сообщении наверх цифр по промежуточной явке

Даже в Москве наблюдаются очень большие различия между участками (в т.ч. с 25%-ным результатом ЕР) по почасовой явке - обусловленные, видимо, не различиями в поведении избирателей, а ошибками УИКов. Что уж говорить про малые города и село

Я согласен, что отклонения по почасовой явке связаны с фальсификациями, но эта связь не жесткая и не линейная. И через сопоставление одного и другого оценивать реальные результаты выборов ИМХО нельзя

Было бы интересно применить Ваш метод к большим относительно однородным массивам участков - например, московские участки (за вычетом спецучастков), или аналогично по Питеру, Екатеринбургу, Нижнему
Edited Date: 2012-02-06 01:16 pm (UTC)

Date: 2012-02-06 07:32 pm (UTC)
From: [identity profile] tov-y.livejournal.com
[livejournal.com profile] tsirel в привате уже высказал предположение, что может быть существенным, имеем ли мы дело с городом или деревней. Я всё переделал с разбивкой, т.е. мы смотрим отклонение от медианы распределения, соответствующего типу ТИК – городская или сельская. Кроме того, полностью исключены из рассмотрения все судовые ТИК, где данные о динамике явки – заведомая туфта (не потому что специально врут, а потому что то ли не собирают данных, то ли не имеют списков избирателей). Все рисунки обновлены. Что-то, конечно, поменялось, но, имхо, не принципиально.
P.S. О крупных городах – подумаю, но я не умею вычленять спецучастки.

(no subject)

From: [identity profile] barouh.livejournal.com - Date: 2012-02-06 08:29 pm (UTC) - Expand

(no subject)

From: [identity profile] tov-y.livejournal.com - Date: 2012-02-07 03:15 am (UTC) - Expand

(no subject)

From: [identity profile] barouh.livejournal.com - Date: 2012-02-07 06:47 am (UTC) - Expand

(no subject)

From: [identity profile] barouh.livejournal.com - Date: 2012-02-06 08:50 pm (UTC) - Expand

(no subject)

From: [identity profile] tov-y.livejournal.com - Date: 2012-02-07 03:13 am (UTC) - Expand

(no subject)

From: [identity profile] barouh.livejournal.com - Date: 2012-02-07 06:53 am (UTC) - Expand

(no subject)

From: [identity profile] tov-y.livejournal.com - Date: 2012-02-07 07:33 am (UTC) - Expand

(no subject)

From: [identity profile] barouh.livejournal.com - Date: 2012-02-07 07:52 am (UTC) - Expand

Date: 2012-02-06 01:49 pm (UTC)
From: [identity profile] barouh.livejournal.com
Больше скажу. Если вдуматься в Ваш график про зависимость результата ЕР от явки для двух групп участков (повторяю его ниже для наглядности), то получается, что "дихотомия" участков с большим и маленьким разбросом почасового распределения явки является по большей части следствием базовой "дихотомии" на участки с нормальной и аномально высокой явкой

И какая-то небольшая самостоятельная объясняющая (результаты выборов) сила у такого параметра, как отклонение почасового распределения по явке, появляется только в той зоне, где смешиваются участки с высокой естественной явкой и слегка завышенный явкой (50-65%)



Я примерно такой же вывод получил по Москве. Сначала вдохновился, что мол отклонения по почасовой явке все наглядно показывают - а потом оказалось, что почти столь же четкий "прогноз" результата ЕР можно получить из общей за весь день явки на участке

Date: 2012-02-06 07:53 pm (UTC)
From: [identity profile] tov-y.livejournal.com
Этот график специально нарисован, чтобы продемонстрировать тот факт, что типичная у нас динамика явки или атипичная, но зависимость явка–результат для партий будет одной и той же. В отличие от плотностей она не меняется. А вот по плотности изменения существенные – мы съезжаем в область умеренных явок.
Разумеется, можно просто сказать, что мы не доверяем высоким явкам и потому их отбрасываем. Можно, но это нехорошо, т.к. получается, что мы сначала предполагаем фальсификацию по определённому типу, а потом лишь убеждаемся, что наше предположение не приводит к противоречию. Да, численный результат при этом получается более-менее разумным (см. мой декабрьский пост (http://tov-y.livejournal.com/4006.html)), но сам метод доказательной силой не обладает, поскольку гипотеза Собянина–Суховольского в общем случае неверна…
И кстати, я общую за весь день явку использую для нормировки, т.е. работаю с относительными величинами. А то, если брать явку как таковую, то, конечно, у нас участки с большой явкой сразу окажутся атипичными. Но это – получение запрограммированного ответа. Тогда уж проще их сразу отбросить, сказав, что, вот, не верим мы им и всё тут.

(no subject)

From: [identity profile] barouh.livejournal.com - Date: 2012-02-06 08:25 pm (UTC) - Expand

(no subject)

From: [identity profile] tov-y.livejournal.com - Date: 2012-02-07 03:07 am (UTC) - Expand

(no subject)

From: [identity profile] barouh.livejournal.com - Date: 2012-02-07 06:42 am (UTC) - Expand

(no subject)

From: [identity profile] tov-y.livejournal.com - Date: 2012-02-07 07:27 am (UTC) - Expand

Date: 2012-02-11 08:27 pm (UTC)
From: [identity profile] tsirel.livejournal.com
Андрей, решил ответить в блоге.

СЦ - у ЕР в среднем по России 38-41%.
ЭТО ЧИСЛО ПОЛУЧИЛОСЬ И У МЕНЯ, И У КОБАКА, И КИРЕЕВА.
ПРИ ЭТОМ НИКТО НЕ ПОЛУЧИЛ ЕГО С ПОМОЩЬЮ СТРОГО ОПРЕДЕЛЕННЫХ ВЫЧИСЛЕНИЙ
ПО ВНЯТНО СФОРМУЛИРОВАННОЙ МЕТОДИКЕ.
И, ТЕМ НЕ МЕНЕЕ, ВСЕ ТРОЕ НЕЗАВИСИМО ДРУГ ОТ ДРУГА ПРИШЛИ К ПРИМЕРНО
ОДИНАКОВОМУ РЕЗУЛЬТАТУ.
В ОБЩЕМ СЧИТАЙТЕ, ЧТО ЭТО КОНСЕНСУСНАЯ ЭКСПЕРТНАЯ ОЦЕНКА

АП.- Насколько я понимаю, во всех случаях эта оценка возникает как
результат частичного анализа (рассмотрение отдельных регионов,
отдельных типов фальсификации, смешение вброса и переброса).
В конце концов, анализируя данные участков с/без КОИБ/КЭГ по тем
территориям, где такой анализ возможен (методика не обнародовалась, а
результаты я постил кому-то в каменты), я получил близкую цифру
(37,2%). Как верхняя граница диапазона истинных результатов величина
40-% мне представляется разумной и обоснованной (полку экспертов
прибыло). Как оценка положения середины этого интервала - нет.

Ответ – посмотрите данные у Киреева (и не только у него)

М и СПб – 26-28%
Большие и средние русские города 30-35%
Малые русские города 35-40%
Села от 40% на севере до 45 и более % на юге
Национальные республики 40-60%
Спецокруга 50-100%.

Ну не получится в среднем 32%

Date: 2012-02-11 09:22 pm (UTC)
From: [identity profile] tov-y.livejournal.com
Здесь есть два важных момента – очевидный и неочевидный.
Очевидный – способ определения истинного результата голосования для конкретного региона. Если какой-то тип искажений не удалось отловить/скомпенсировать, то результат считается истинным. Но при анализе данных в розницу никогда и не удастся отловить/скомпенсировать все типы искажений – уж больно они разнообразны.
Неочевидный – понимание того, а что такое на самом деле истинный результат выборов. Наивно думать, что это то, что получится, если мы проведём в регионе голосование и подсчёт его результатов без нарушений. Во многих регионах такое возможно лишь в том случае, если туда войдут войска НАТО (да и то, скорее всего, в какой-нибудь Чечне всё равно будет 99,9%, только наберёт их Демократическая партия США). Честность выборов неразрывно связана с развитостью гражданского общества, каковая – вот незадача! – у нас находится в обратной зависимости от рейтинга партии власти. Чем выше истинный уровень поддержи ЕР в регионе, тем вероятнее и масштабнее в нём подтасовки в её пользу. Реконструкция истинного результата в регионе предполагает распространение на него тех условий, которые обеспечивают честность выборов и неизбежно сопряжены с некоторым снижением результатов партии власти. Поэтому неудивительно, что моя реконструкция даёт цифры ниже экспертных оценок и данных опросов. Эти оценки и опросы измеряют величину, которая на честных выборов никогда не может быть зарегистрирована, поскольку высокое её значение в некоторых регионах в принципе исключает возможность проведения там честных выборов.

(no subject)

From: [identity profile] tsirel.livejournal.com - Date: 2012-02-11 09:57 pm (UTC) - Expand

(no subject)

From: [identity profile] tov-y.livejournal.com - Date: 2012-02-12 05:54 am (UTC) - Expand

Date: 2012-02-11 08:27 pm (UTC)
From: [identity profile] tsirel.livejournal.com
О методе
Сама идея остроумная.
Метод реализации неочевидный и неединственный,
Но я не буду его обсуждать, наверняка Вы перепробывали разные варианты.

При этом Вы исходите из того, что фальсификации очень тесно связаны с порядком явки,
а сама выборка однородная. Прежде всего в ней нет корреляций результатов
голосования с порядком явки.

Утверждение сомнительное - наверняка есть различия порядка явки,
завмсящие от др. факторов, причем б-во таких отклонений еще в той или иной
степени коррелировано с явкой и результатом ЕР. Город/село - самое
напрашивающееся различие, но есть и другие -
в Питере образ жизни более "совиный", чем в Москве, рабочие города более
"жаворонковые" и т.д.
Последние различия невелики, но они могут перебросить фальсифицированные результаты в большим городам в категорию Low, а честные и почти честные результаты по селам - в категорию High.

Есть еще важный вопрос – как заполнялись данные по явке по часам.
- честно и точно (как при этом учитывались открепительные и голосование на дому?)
- на глазок,
- абы как
- подсчитывались с тем, чтобы учесть вбросы.
От распределения по эти типам зависит допустимость самого метода.

Date: 2012-02-11 09:32 pm (UTC)
From: [identity profile] tov-y.livejournal.com
Часть заданных Вами здесь вопросов уже рассматривалась в переписке – не буду повторяться. Я как не видел факторов, связанных с уровнем активности населения или его политическими симпатиями, систематически (а не случайно) смещающих отклонение динамики явки, так и не вижу их.

Данные по часам заполнялись чаще всего на глазок. Причём для тех регионов, где указана и пятая временная отсечка (на момент закрытия участка), её значение может не совпадать с итоговой явкой – тем сильнее, чем больше доля бюллетеней в переносных ящиках. Т.е. временнАя привязка голосования на дому вообще может быть произвольной.

(no subject)

From: [identity profile] tsirel.livejournal.com - Date: 2012-02-11 09:59 pm (UTC) - Expand

(no subject)

From: [identity profile] tov-y.livejournal.com - Date: 2012-02-12 06:00 am (UTC) - Expand

Date: 2012-02-11 08:28 pm (UTC)
From: [identity profile] tsirel.livejournal.com
По графикам

График с плотностью вероятности.
Видно, что процент за ЕР резко падает низком отклонении,
Но тип распределения сохраняется.
Совсем нехорошо, что сохраняются пики у круглых процентов.
ПОДОЗРЕНИЕ – низкое отклонение характеризует не только фальсификацию и другие факторы, сильно коррелированные с кол-вом голосов за ЕР.
См. выше подозрение, что это географический фактор и тип поселения.

Графики доли голосов от явки у Low & High.
Очень плохо, что различия малы. Значит фальсификация ничего не исказила?
Подозреваю, что другие факторы больше влияют на отклонение, чем фальсификация.

Графики плотности распределения отклонения.
Распределение гладкое, почти симметричное и режете Вы его
практически по моде – слева от моды, справа от моды.
Совершенно неубедительно. Вот если оно было двухмодальным!

Вывод: идея остроумная, но, к сожалению, себя не оправдала. Ваш показатель не меньше (а м.б и больше) зависит от др. факторов, чем от фальсификации.

Более общий вывод – выборка очень неоднородна и невозможен чисто математический метод ловли фальсификаций без учета электоральной географии.

Date: 2012-02-11 10:04 pm (UTC)
From: [identity profile] tov-y.livejournal.com
1) Фальсификации можно типировать на фальсификацию процедуры выборов (сюда входят вбросы, карусели, принудительное и несвободное голосование) и фальсификацию результатов голосования (рисование в протоколах цифр, никак не связанных с физически находящимися в урнах бюллетенями).
Именно второй тип фальсификаций рождает пики на красивых цифрах. Но он не может быть отловлен с помощью анализа динамики явки, т.к. никто не мешает передавать Единой России голоса других партий в рамках реально имевшей место явки и её временнОй динамики (ловить фальсификации результатов голосования помогают данные с участков, оборудованных сканерами). Кроме того, не любая фальсификация по первому типу будет выявлена нетипичной явкой. Найдутся места, где бюллетени вбрасывали примерно в том же ритме, что и живые люди приходили (поэтом графики доли голосов от явки и сохраняют свой вид после реконструкции – просто вес их правых частей существенно убывает).

2) Когда я режу, я режу не график распределение отклонения. Я режу график явки от отклонения по точке, где более-менее горизонтальный участок сменяется отчётливо растущим.
Так же – см. UPD-5.

Date: 2012-02-12 04:50 pm (UTC)
From: [identity profile] tsirel.livejournal.com
Кратко отвечу на все комментарии
1) Разные виды фальсификаций, фальсификации и явка, явка и реальный % за ЕР и др. коррелированы между собой. Это надо учитывать.
2) Вы режете, основываясь на конце более или менее горизонт. участка, но само распределение все режется через его моду.
3) Кобак насчитал, что КОИБы с разбивкой по регионам снижают кол-во голосов ЕР всего на 6-7% - http://kobak.livejournal.com/103331.html. Не смотрел, насколько это верно, но участки с КОИБами всяко не образуют репрезентативной выборки.
4) Реконструкции поддается очень многое (есть еще экзит-пол, соц. опросы и др.), только с разной степенью достоверности.
5) Идею об отметании электоральной географии даже обсуждать не хочется, настолько она противоречит сути самой социолгической задачи. Кстати, деление город/село и наличие особых регионов Вы признаете.
6) Имея опыт точного подсчета, более грамотный человек лучше сделает приближенную оценку, чем малообразованный. Ирония здесь совершенно неуместна. Если бы Вы ходили в походы, то Вы бы знали, как плохо местные жители указывают расстояния в километрах в прекрасно знакомой им местности.

Date: 2012-02-12 05:28 pm (UTC)
From: [identity profile] tov-y.livejournal.com
1) Да. И это проблема. Иначе можно было бы затачивать разные алгоритмы на отдельные типы искажений, применять порознь, а потом тем или иным образом суммировать результаты. Но приходиться сразу ставить двойное сито – и то мало!
2) Ну, где разрезалось, там разрезалось.
3) Сильно занижено! Я это делал сам и получил цифру в 14,1% (как процент от явки) и 10,9% (как процент от числа избирателей). А делал я следующим образом. Брал данные по всем ТИК, в которых как на участки с КОИБ/КЭГ, так и на участки без оных приходилось не менее 2,5% зарегистрированных на всей территории избирателей. Порог отсечения выбирался так, чтобы суммарные результаты по всем рассматриваемым ТИК минимально отличалась от показателей по стране (это и есть своего рода репрезентативность). При указанном значении порога среднеквадратичное отклонение результатов партий (как доля числа избирателей) составило 0,2% (главным образом за счёт КПРФ), отклонение явки – 0,1%. Никакие данные по динамике явки, разумеется, не использовались. Кстати, по результатам такой реконструкции, не учитывающий целый пласт различных способов фальсификаций, я получил 10 млн липовых голосов за ЕР и оценку её истинного результата в 37,2% (что ниже минимума диапазона экспертных оценок, но, несомненно, выше истинного результата).
4) Экзит-полы и соцопросы сами нуждаются в реконструкции. Вам причины перечислить?
5) Я не отметаю электоральную географию. Я просто чётко различаю анализ в розницу и оптом. Обосновывать массовость, разнообразие и наглость фальсификаций и даже делать какие-никакие выводы социологического плана уместней в розницу. Считать общий результат – оптом. Странно было бы полагать антагонистами уравнения динамики и законы сохранения. Но надо понимать, что от какой стенки гвоздь.
6) Я думаю, что у человека, который хотя бы раз считал бюллетени, опыт подсчёта куда больше, чем у просто грамотного человека. Что же до походов, то если хотите получить ответ в километрах, то и спрашивайте, давая человеку карту, а если всё-таки предполагаете идти ногами, а не только скользить взглядом по карте, спрашивайте, как оно в часах пути. Формулировать вопрос не том языке, на котором говорит собеседник, означает гарантировать себе искажённый ответ.

(no subject)

From: [identity profile] kobak.livejournal.com - Date: 2012-02-12 06:40 pm (UTC) - Expand

(no subject)

From: [identity profile] tov-y.livejournal.com - Date: 2012-02-12 07:42 pm (UTC) - Expand

(no subject)

From: [identity profile] kobak.livejournal.com - Date: 2012-02-12 08:17 pm (UTC) - Expand

(no subject)

From: [identity profile] tov-y.livejournal.com - Date: 2012-02-15 03:33 am (UTC) - Expand

(no subject)

From: [identity profile] tov-y.livejournal.com - Date: 2012-02-20 08:04 am (UTC) - Expand

(no subject)

From: [identity profile] tsirel.livejournal.com - Date: 2012-02-12 06:51 pm (UTC) - Expand

(no subject)

From: [identity profile] tov-y.livejournal.com - Date: 2012-02-12 08:03 pm (UTC) - Expand

(no subject)

From: [identity profile] tsirel.livejournal.com - Date: 2012-02-12 06:58 pm (UTC) - Expand

(no subject)

From: [identity profile] tov-y.livejournal.com - Date: 2012-02-12 08:09 pm (UTC) - Expand

(no subject)

From: [identity profile] tsirel.livejournal.com - Date: 2012-02-12 08:23 pm (UTC) - Expand

(no subject)

From: [identity profile] tov-y.livejournal.com - Date: 2012-02-15 03:35 am (UTC) - Expand

(no subject)

From: [identity profile] tsirel.livejournal.com - Date: 2012-02-15 09:26 am (UTC) - Expand

(no subject)

From: [identity profile] tov-y.livejournal.com - Date: 2012-02-15 09:27 am (UTC) - Expand
Page generated Jul. 13th, 2025 10:17 am
Powered by Dreamwidth Studios