|
|
|||||||||||||
Железный аргумент для ЦИКа: статистика не докажет фальсификацииСкопируйте код в ваш блог
Статья будет выглядеть вот так:
Как сделать так, чтобы сотрудники вашей компании работали дружно и эффективно?
Подавляющие число распространенных в сети методов опирается на серьезные теоретические допущения и ограничения, без которых выстраивать какие-либо графики и модели, демонстрирующие фальсификации, вообще не имеет никакого смысла. К сожалению, зачастую самими авторами по целому ряду соображений эти допущения и ограничения либо упоминаются вскользь, либо совсем игнорируются. Так что рядовой читатель, как правило, находится в сложном для себя положении: вроде как все графики убедительно научно выстроены, и линии с кривыми красиво проведены, но непонятно, верить всему этому или нет (как правило, все же, очень хочется верить, убедившись, в том, что выборы были украдены). Итак, насколько попытки доказать факт наличия фальсификаций соответствуют современному научному знанию в данной области? Ответ на этот вопрос очень непростой. Я постараюсь на него ответить, изложив вкратце логику научного метода, а также отдельно затронув три любопытных наблюдения, всколыхнувших российское интернет-сообщество: 1) отсутствие на российских выборах «нормального» гауссовского распределения явки и голосования; 2) визуальное наличие пиков-спайков-зубцов в распределениях явки и голосования; и 3) существование положительной взаимосвязи между явкой и голосованием за «Единую Россию». Все эти три наблюдения, три своеобразных кита, на которых строится отечественный фальсификационный анализ, по-своему интересны и по-своему спорны. Использование этих трех методов отечественными «сталкерами», исследующими фальсификации, во многом уникальны и в будущем, как мне кажется, способны привнести серьезный вклад в данную исследовательскую сферу. Однако на сегодняшний день с сожалением приходится констатировать, что данные поиски не отвечают требованиям современного научного метода: а значит, к ним стоит относиться с высокой степенью осторожности, как говорится, без излишнего фанатизма. Из трех аргументов, которыми пользуются исследователи, чтобы доказать фальсифицированность выборов, в реальности рабочим оказывается только один: Аргумент: отсутствие «нормального» гауссовского распределения явки и голосования за конкретные партии.
Почему не работает: даже в демократических странах на честных выборах распределение голосов, отданных за партии, не всегда гауссовское.
Многие исследователи-блогеры оценивают наличие и масштабы электоральных фальсификаций, выстраивая графики одномерных распределений для явки и голосования (так называемые графики плотности, обычно понимаемые как гистограммы). При этом они исходят из того, что эмпирические данные обязательно должны описываться с помощью «нормального» гауссовского распределения, которое, действительно, в данном измерении считается эталонным, хотя и не единственным в своем роде. Так, обнаружение любых расхождений между гауссовским «нормальным» распределением и наблюдаемым распределением, с их точки зрения, свидетельствует о явном присутствии электоральных фальсификаций. Для явки это допущение мне кажется весьма правдоподобным: в демократических странах (например, Канаде, Германии или Мексике), действительно наблюдается распределение явки, хорошо описываемое «Гауссом». Однако, если мы начнем выстраивать подобные графики для партийного голосования в различных странах, нормальное распределение в некоторых из них, считающихся вполне себе демократическими, как рукой снимет. Допустим, в Канаде на последних парламентских выборах 2008 г., распределения партийного голосования за различные политические партии имеют разнообразные причудливые очертания, которые можно было бы запросто списать на фальсификации. Однако о канадских фальсификациях, во всяком случае, пока нам ничего неизвестно. Отсюда следует один важный вывод: гауссовское распределение может служить скорее ориентиром при анализе фальсификаций с явкой, но вряд ли работает для выявления фальсификаций и приписок для конкретных партий. Затронув канадские выборы, я тут же открыл ящичек Пандоры, знакомый большинству исследователей, занимающихся статистикой: проблема неоднородности данных вообще подрывает абсолютную веру в одномерные, либо двумерные графики. Для читателей, не знакомых со статистикой, поясню: на явку либо голосование избирателей в каждом отдельном УИКе может влиять большое число факторов с различной степенью выраженности (нормальное распределение предполагает, что большое число факторов приблизительно оказывает равное по силе воздействие на голосование на всех участках). В качестве подобных факторов могут выступать принадлежность УИКов к областям или республикам, городам или селам и т.д. Как раз построение одномерных графиков игнорирует этот очевидный факт, до известной степени упрощая и огрубляя анализ многомерных данных, вписывая их только в одно измерение. Иными словами, наличие аномалий в распределениях может свидетельствовать не столько о фальсификациях как таковых, сколько о сложной структуре электоральных данных, их многомерной природе. Использование правильного научного метода позволяет приблизиться к решению этой проблемы вплотную, посредством исключения альтернативных объяснений наблюдаемых числовых аномалий, связанных с явкой или голосованием. Допустим, существование участков с почти стопроцентной явкой может объясняться особенностями электорального поведения жителей малых поселений и военных гарнизонов, пациентов медицинских учреждений и прочее. К сожалению, данные об особенностях этих УИКов практически недоступны, поэтому научно доказать фальсификационную природу данных участков – сложная задача. При этом тут же отмечу, что в демократических странах УИКи со столь высокой явкой и еще к тому же голосованием преимущественно за «партию власти», нам неизвестны. Если подобное возможно в России и связано с неоднородностью российских данных, а не фальсификациями, то, пожалуй, ЦИК РФ должен быть первой организацией, заинтересованной в предоставлении этих данных команде западных и отечественных специалистов, и настаивании на проведении независимой статистической экспертизы, результаты которой стали бы доступны широкой общественности. По-моему, это замечательный способ сохранить всем лицо и восстановить доверие к институту российских выборов многих наших сограждан. К сожалению, пока такого рода политики не наблюдается… Еще один важный момент, который следует отметить отдельно: не стоит исключать из внимания и того факта, что выявленные статистические аномалии на графиках могут не соотноситься с реальными наблюдениями, зафиксированными очевидцами фальсификаций. Пожалуй, лучшим доказательством того, что статистические аномалии все-таки связаны с фальсификациями, является соотнесение результатов статистического анализа с данными, полученными в ходе полевых экспериментов. Наиболее полезен в данном случае недавний проект «Гражданин-Избиратель», которому удалось с помощью полевого эксперимента оценить масштабы электоральных фальсификаций в Москве. Так как технические детали организации эксперимента пока не публиковались, сложно судить о научной валидности опубликованных результатов. Однако, если все основные требования к проведению подобного рода полевого эксперимента были соблюдены, целесообразно использовать эти данные не только при оценке объема электоральных фальсификаций, но при объяснении наблюдаемых аномалий голосования в Москве, увязав данные полевого эксперимента с выстроенными графиками. Отмечу, что только при сведении воедино данных о зафиксированных наблюдателями нарушениях на избирательных участках или ТИКах с имеющимся массивом электоральных данных по всей стране, можно судить не просто о зонах аномалий на выстроенных графиках, а вполне конкретных электоральных фальсификациях. Аргумент: пики, спайки и зубцы на одномерных графиках Почему работает: единственный факт, который нельзя объяснить ничем, кроме фальсификации. Пики не могут возникать случайным образом.
Наличие пиков, спайков или зубцов на круглых значениях явки и голосованиях за партию власти служит, на мой взгляд, более основательным аргументом в доказательстве о наличии или отсутствии фальсификаций. Согласно нашему анализу, как правило, эти зубцы для явки являются статистически значимыми, то есть возможность их случайного возникновения исключается. Более того, эти аномальные области, к примеру, характеризуются статистически значимым ростом поддержки партии власти. Любопытно, что с середины 90-х и на протяжении 2000-х в России отмечается довольно устойчивый рост пиков и спайков именно на «круглых» значениях явки. Наше исследование совместно c Волтером Мебейном последних значащих цифр в числах проголосовавших избирателей дополнительно подталкивает к выводу о фальсифицированном характере явки. Если бы числа проголосовавших избирателей отражали совокупность естественных процессов, побуждающих людей к голосованию или отказу от голосования, то последние значащие цифры в числах должны характеризоваться равномерным распределением (то есть появление любой цифры от 0 до 9 равновероятно), однако в России этого не наблюдается. Присутствие подобных цифровых аномалий нуждается в политологическом объяснении и соответствующей эмпирической проверке. Теоретическое обоснование этому феномену было разработано нами в Мичигане, используя математический аппарат теории игр. Теоретические выводы были подтверждены результатами анализа эмпирических данных президентских выборов 1996, 2000, 2004 и 2008 гг. Согласно сигнальной теории фальсификаций, рост политической централизации власти в России закономерным образом способствовал изменению рациональных стратегий губернаторов: если в середине 1990-х Кремль и политически автономные губернаторы выстраивали свои отношения в виде торга, при котором благоприятные электоральные результаты обменивались на политические/экономические ресурсы; то последующая политическая рецентрализация 2000-х побудила губернаторов к смене стратегий на сигнальные. В данном случае сигнал под собой подразумевает демонстрацию лояльности губернатора Кремлю с помощью «круглых» значений явки, которая вознаграждалась межбюджетными трансфертами, а также гарантиями политического выживания, то есть сохранением губернаторами своих постов. Аргумент: Положительная взаимосвязь между явкой и голосованием за «Единую Россию», и отрицательная за остальные партии. Почему не работает: если явка фальсифицирована и голосование фальсифицировано, то невозможно ни диагностировать фальсификации, ни оценить их масштаб.
Помимо графиков одномерных распределений, (см. выше), отечественные исследователи предлагают графики двумерных распределений, которые должны иллюстрировать наличие взаимосвязи (корреляции) между явкой и голосованием за различные партии. При этом теоретическое обоснование подобного рода графиков простое: в случае фальсификаций будет наблюдаться (и наблюдается) положительная взаимосвязь между явкой и голосованием за «Единую Россию», и отрицательная – за остальные партии. Интерпретация подобной взаимосвязи, как правило, увязывается со вбросами и перебросами бюллетеней от одной партии к другой. При отсутствии подобного рода фальсификаций взаимосвязь между явкой и голосованием наблюдаться не должна.
Несмотря на, казалось бы, безупречный регрессионный анализ, с базовыми двумерными регрессиями и корреляциями существует ряд проблем, о которых стоит говорить отдельно. Вкратце отмечу несколько важных пунктов. Во-первых, вполне возможно, что наблюдаемая взаимосвязь между явкой и голосованием связана с упомянутой мной неоднородностью данных и исключением важных объяснительных факторов из моделей: административных, политико-поведенческих, социально-демографических и т.д. Если взять данные стран западных демократий, и выстроить подобного рода регрессии, то для большинства стран можно получить свой изящный набор положительных и отрицательных бета-коэффициентов для многих партий. Во-вторых, данный подход чувствителен только к определенным видам фальсификаций: вбросам и перебросам, и не способен учесть иные виды фальсификаций, в частности, рандомизацию явки и голосования, то есть способа, при котором обе величины берутся с потолка, скажем, потолка того же ТИКа. В-третьих, при использовании регрессионных моделей существование тесной взаимозависимости между явкой и голосованием (а именно, неясность в вопросе того, что на что, собственно, влияет: явка на голосование или голосование на явку), порождает ошибку спецификации модели и недостоверности получаемых результатов. При решении подобного рода проблем, как правило, используются более сложные статистические модели. Наконец, так как показатели явки и голосования, как правило, оба «заражены» фальсификациями, то диагностика и измерение масштабов фальсификаций является не просто сложной, а скорее всего, просто невыполнимой задачей. Согласитесь, если явка фальсифицирована и голосование фальсифицировано, то невозможно ни диагностировать фальсификации, ни оценить их масштаб. Выложенные в сеть графики, оценивающие масштабы фальсификаций, как правило, строятся на идее несфальсифицированной истиной явки, что является слишком сильным допущением. Очевидно, что для диагностики электоральных фальсификаций нужны дополнительные объяснительные переменные и инструменты, которые могли бы быть сравнительно чистыми, то есть лишенными фальсификационной примеси. Только в этом случае, как мне кажется, мы можем отделить зерна от плевел, фальсификации от нормального голосования. Таким образом, диагностика электоральных фальсификаций сама по себе весьма сложная и трудоемкая процедура, подразумевающая разработку методов анализа данных и построение объяснительных теорий фальсификаций. Ее успешная научная реализация невозможна без последовательного исключения альтернативных объяснений всем наблюдающимся статистическим аномалиям, т.к. любым отклонениям, которым мы склонны приписывать ярлык фальсификаций. Только исключив большинство альтернативных объяснений, можно будет говорить о наблюдаемых статистических аномалиях как о научно доказанных электоральных фальсификациях. На мой взгляд, из множества приведенных статистических свидетельств электоральных фальсификаций, именно растущее присутствие пиков, спайков и зубцов на круглых значениях, как правило, явки, а в последнее время и партийного голосования, является наиболее «странным», неподдающимся альтернативному объяснению наблюдением. Это наблюдение, скорее всего, говорит о существовании электоральных фальсификаций и может объясняться наличием сигнальных стратегий губернаторов в отношении Кремля. Вот список просмотренных мною блогов: http://podmoskovnik.livejournal.com/ http://oude-rus.livejournal.com/ http://kobak.livejournal.com/ http://esquire.ru/elections Следите за обновлениями Slon.ru в вашей социальной сети: ВКонтакте или Facebook.
|
Быстрый Slon
|
||||||||||||
|
25.05.2012 19:59
|
|
25.05.2012 18:53
|
|
25.05.2012 18:53
|
|
25.05.2012 18:25
|
|
25.05.2012 17:18
|

Кирилл Калинин 

Гора родила мышь.
ЧТД
"...Таким образом, диагностика электоральных фальсификаций сама по себе весьма сложная и трудоемкая процедура..."
Господин аспирант! Это мы и без вас знаем! Надо либо что-то конкретное предлагать, либо не писать ничего. Незачет вам! Увы! Приходите в следующий раз!
Браво, Слон. Очень объективная статья, но несколько наукообразная, многие ни черта не поймут.
По поводу спайков у меня есть гипотеза, что это либо эффект округления, либо эффект методики подсчета голосов, поройте в этом направлении. Было бы слишком глупо если это намеренный рукотворный эффект, не верю.
Доказать отсутствие или наличие фальсификаций можно путем статистической обработки опроса, проведенного по выборке из списка избирателей. Этим методом всегда пользуются аудиторы когда массив данных велик. Например, для оценки качества выпускаемой продукции при массовом выпуске сплошной контроль делать не нужно, достаточно проверить определенное количество готовой продукции, что бы с уверенностью, например 95 или 99% процентов сказать что брак в пределах какой-либо нормы.
В случае с выборами, нужно провести независимый аудит. Для аудита одного участка нужно сделать случайную выборку избирателей в количестве, которое определяется специальной формулой. Затем провести опрос ходили ли они на выборы и если да, то за кого голосовали.
Обработка ответов на первый вопрос покажет были ли вбросы, на второй — распределение голосов.
Пример возможного результата аудита по первому пункту:
«С 95% уверенностью можно сказать, что на участке ХХХХ участие избирателей в голосовании составило 35-37%.»
Если официальные данные показывают, что проголосовало 62%, то на лицо явные приписки и необходимо провести повторное голосование. Если официальные данные дают 36.5%, то можно считать что, во всяком случае, вбросов не было.
Аналогичная выборка производится и среди избирательных участков региона и делается анализ по региону.
Нечто подобное сделал Левада центр, проведя опрос. Результаты говорят сами за себя.
Если будет интерес к моему посту, можно развить тему дальше, например, прикинуть сколько избирателей нужно опросить, и т. п.
Это называется экзит-полл, их делали на выборах и они совпали с результатами выборов. Левада-центр не сделало свой экзит-полл в день выборов (это говорит о том, что им невыгодно было доказывать честность выборов), а затаилось до поры и сделало новую фишку - пост-опрос, через две недели после выборов, который ни о чем не говорит. Вот так и работает либерастня: лжет, передергивает и подтасовывает, а недалекие люди на это ведутся.
Конечно, хотелось бы разобраться и сделать анализ с помощью хорошо обоснованных предположений. Пока же замечу, что на некоторые из упомянутых здесь альтернативных толкований уже были даны ответы в разных публикациях. При этом альтернативные теории часто требуют гораздо более сильных предположений нежели гипотеза о существовании "несфальсифицированной явки". Например, придётся предположить наличие связи "политико-поведенческих и социально-демографических" характеристик избирателей с наличием КОИБов или независимых наблюдателей на участках в пределах одного города. Далее, я согласен, что можно обосновать и негауссовы распределения для одной партии, но как тогда быть с целыми регионами, где всё же наблюдаются нормальные кривые (Питер)? Надо ли тогда думать, что они представляют собой отдельные экосистемы, живущие по совершенно другим законам и смотрящие в другой телевизор, нежели страна в целом и Москва в частности?
По сути, дискуссия начнётся, когда альтернативные модели позволят включить неучтённые факторы, описать распределения и провести хоть какие-то оценки, чтобы можно было определить наиболее правдоподобную гипотезу стандартными методами. Я готов поучаствовать. Вбрасывайте модели.
@Nologin, это не только Левада. есть уже упомянутый автором расчёт группы "Гражданин Наблюдатель". Есть также экзит-полл ФОМ по 47 участкам в Москве от 4 декабря, который был быстро удалён с сайта ФОМ, но его легко нагуглить при желании. Они согласуются друг с другом, но не с официальными данными ЦИК.
"Допустим, в Канаде на последних парламентских выборах 2008 г., распределения партийного голосования за различные политические партии имеют разнообразные причудливые очертания,..." (c)
Далее идет ссылка на
http://narod.ru/disk/34795552001/Canada_graphs.pdf.html
В файле приведены картинки без ссылок на первоисточники. Нет описания графиков. Автор либо некомпетентен, либо умышленно вешает лапшу. Разнообразия в данных не заметно. Короче - детский лепет.
Проверил ТИК, где я проголосовал. Заняла процедура 15 минут. Нарушений не заметил.
Методика проста: Построить гистограмму - количество УИК/процент за ЕР. Интервал 10%.
К гистограмме добавить минимальный процент за ЕР, максимальный процент и средний процент по ТИК. В ТИК входило 68 УИК. Колтчество избирателей - 120 000 человек.
Увидел обычную картину при измерении физических величин. Если бы у меня не было веры в честность избирательной комиссии, то проверил бы УИК с минимальным и максимальным значением поданных голосов за ЕР. Для контроля посмотрел на ТИК "Москва - район Арбат". Сказочный результат.
Математика - математикой, а подозрительные УИК надо проверять с графологической экспертизой. И это не представляет труда. Если один человек ставит крестики, то это легко выявить. Вообщем, к выборам президента ЦИК во главе с Чуровым должен сильно поработать. Не думаю, что они смогут что-то придумать. Хотя была заготовка по типу "Южная Осетия". Гаттаров приготовил пакет из 7500 нарушений ( все партии, кроме ЕР ).
http://www.youtube.com/watch?v=zV1Y30Q4yjk
Короче, очевидно, что нас дурят, но доказать математически в суде это вряд ли удастся. С другой стороны - зачем сразу в суд? Есть же следственный комитет - пусть проверяют. Может чего и накопают.
чуркина заставить подтереться его дипломом физика... атмосферы
Хотя, научился из воздуха делать...
Это муд...к, конешно - не идиот. И в курсах про принципиальную нерешаемость общей задачи трех тел в физике.
Потому, в курсах про невозможность в реальном времени (типа, "по телефону") централизованно регулировать на местах правильный %, не палясь и выдавая "нормальное распределение".
Самая большая проблемма - в самой протяженной территории и часовых поясах.
Когда в нескольких регионах(по поясам) параллельно идет голосование (та самая задача трех тел).
И прямое вмешательство напрямую же приводит к коллизиям, размером в "146% по ... области".
Поэтому, чуркину ничего не оставалось, как дать команду "грабь награбленное!". А там уже надеяться как раз на массовость фальсификаций. Которая и вытянет "среднюю линию треугольника"(гауссово распределение) в целом "повыше".
Как грится - "вам чай с молоком?... или молоко с чаем?".
Если бы,наоборот, было сфальсифицировано больше, чем реально - то реальность, попросту, растворилась бы в фальсификации. И все было бы красиво.
Но, подвела тупость администрации на местах на тему "круглых циферь".
Реально, щас даже в БТИ девочки тупо не могут площадь помещений правильно посчитать, округлить и т.д.
Фурсенковщина рулит по-черному.
А чиновники вообще отупели, попросту, вконец.
Им сказали - "нужно 65%".
Они, идиоты, 65% и нарисовали.
Вместо,например, 64.2% или 66.4%
+
хотя, прижучить чуркина проще простого
позвать вот этих хлопцев
http://www.3dnews.ru/offsyanka/621533
И этот туда же, вслед за польскими графиками.
В Канаде мажоритарная избирательная система, принипиально отличная от нашей. Это означает, что избранным считается тот кандидат, который набрал голосов больше каждого из соперников. Выборы в Канаде проводятся по одномандатным избирательным округам, каждый кандидат, хоть и может принадлежать к партии, на выборы приходит как частное лицо. То есть голосуют не за партию, а за кандидатов. И проходит в каждом округе только один. Никто не смотрит там на проценты, которые набрала партия. Никто не делит мандаты по этим процентам. Если на участке два кандидата, один набрал 30 процентов, второй - 31 процент, то в парламент пройдет второй, первый не пройдет совсем. Соответственно сравнивать какие-бы то ни было графики не имеет никакого смысла. Это графики принципиально разных процессов. А статья - просто-напросто вброс, рассчитанный на тех, кто не хочет разобраться в предмете.
"Аргумент: пики, спайки и зубцы на одномерных графиках
Почему работает: единственный факт, который нельзя объяснить ничем, кроме фальсификации. Пики не могут возникать случайным образом."
Похоже это единственный аргумент, который действительно работает. Но здесь тоже не всё так просто, как кажется на первый взгляд. Некоторые пики на "круглых" значениях (20%, 25%, 40%, 50%, 60%, 75% и 80%) как раз таки объясняются "естественными" причинами, они появляются даже на совершенно случайных исходных данных. Пояснения здесь http://magic-ex.livejournal.com/8523.html?thread=148043#t148043 Другие пики (например 85% и 95%) действительно выглядят странно и больше похожи на приписки. А может быть, действительно, этот "сигнал под собой подразумевает демонстрацию лояльности губернатора Кремлю с помощью «круглых» значений"?
Чуров обрушился с критикой на УИК №174.
Голосование за ЕР по ТИК (Москва,Центральный,Хамовники):
УИК № 172 ЕР=27.6%
УИК №173 ЕР=39.2%
УИК №174 ЕР=24.49% Вызвал недовольство Чурова!
УИК №175 ЕР=85.92% Одобпил, одобрил!
УИК №176 ЕР=22.61% Печаль, печаль ...
Голосование за ЕР по ТИК (Москва,Центральный,Хамовники):
%% - процент голосов за ЕР
кол.УИК - количество УИК в ТИК в 10% интервале.
__%%__кол.УИК
0 - 10 : 0
10 - 20 : 3
20 - 30 : 8
30 - 40 : 8
40 - 50 : 3
50 - 60 : 3
60 - 70 : 3
70 - 80 : 1
80 - 90 : 3 Отчаянные ребята!
90 -100 : 0
Голосование за ЕР по ТИК (Москва,Центральный,Хамовники):
Минимальный, максимальный и средний процент за ЕР по ТИК:
min=14.7%
max=86.2%
сред.=43.5%
@Dmitry Maruschenko, твой вброс не защитан
уж скока раз твердили миру...
То, что ты написал - типичный пример "квантового распределения". К которому,например, относятся правила расположения электронов вокруг атомов. И самого вещества в веществе. Которое действует в материальном мире. Который состоит из всего сущего - материалы, процессы, кандидаты, выборы...
И весь этот квартет преспокойно описывается математическим аппаратом - теорией вероятностей.
Там тоже монетка "проходит" либо только решкой, либо только орлом.
и ни тем, ни другим одновременно.
Продолжать дальше, чем описывается распределение этих самых вероятностей?
"...Нормальное распределение играет важнейшую роль во многих областях знаний, особенно в статистической физике. Физическая величина, подверженная влиянию значительного числа независимых факторов, могущих вносить с равной погрешностью положительные и отрицательные отклонения, вне зависимости от природы этих случайных факторов, часто подчиняется нормальному распределению, поэтому из всех распределений в природе чаще всего встречается нормальное (отсюда и произошло одно из названий этого распределения вероятностей)..."
Вывод?
Чуркины с медвепутами - инопланетяне. Не от мира сего.
не из нашей природы
+
и существуют по другим законам...
что и подтверждается наблюдениями