В поисках идеальной кривой.jpg | Коммунистический феномен.
Perpetum
In the article an approach presented to calculate country-specific ideal election curves. Each country has its own single curve. In the images with congress elections the country-specific curve(thin) is simple scaled to fit first and last points of each party's line. As a result you can see that the calculated curves for each country are really country-specific. For ex.: The AFA curve in USA is far from country-specific, because of europeans.
Глядя на графики выборных процессов, можно задаться вопросом: как оценить естественность(без примесей чего-либо) линий. Основным шагом к решению данной задачи является поиск некой среднестатистической линии, характерной для всей страны в целом. Далее представлен подход определения данной линии.
Если опустить детали, то вкратце - первые два графика - поиск искомой кривой. Остальные - выборы в некоторых странах с наложенными на них получеными кривыми. Тонкие линии на них можно интерпретировать следующим образом: какая должна быть государственно-специфичная кривая для партии Х, чтобы в итоге получить столько же итоговых голосов.
Попробуем определить линию голосования, характерную для конкретной страны следующим образом. Возьмем "приведенный к общему знаменателю" график выборов(см. предыдущую статью). В нем, в каждый промежуток времени есть набор [a,b,c,d,e] нормализованных голосов, отданных за партии А, B, C, D, E. Поступим крайне просто: выбросим из набора 2 максимальных значения(уберем гиперактивность), и 2 минимальных(уберем пассивность), в итоге останется одно значение, его и возьмем для нашей среднестатистической линии. Те, на примере: есть набор [6.5, 7, 6.2, 6.6, 6.3], отбросим 7 и 6.6, 6.2 и 6.3 => останется 6.5.
Посмотрим что из этого получится(желтая линия):
Вполне неплохо, но, как видим, ночью данный подход не работает: желтая линия совсем неестественно прямая. Причина в том, что ночью ввиду низкой активности наборы выглядят следующим образом: либо все нули, либо [0, 0, 0, x, y], либо [0, 0, 0, 0, x]. Для решения данной проблемы применим следующую эвристику: если набор вида [0, 0, 0, x, y], то возьмем 4/5 от x, если набор вида [0, 0, 0, 0, x], то если x>1 - возьмем 0(отсекаем вбросы), в противном случае возьмем 0.2 (пятая часть голоса). Получим следующий результат:
Искомая кривая найдена.
Теперь спроецируем найденную кривую на графики выборов. Сделаем это для несколиких стран для оценки эффективности(для каждой страны используется своя специфичная кривая). Далее в графиках - тонкие линии это и есть эти самые кривые.
Вот такие вот результаты.
Посмотрим какая ситуация по партиям в России.
Comrades - в выборах применили самую агрессивную нестандартную стратегию голосования.
Russian Will Party и Constitutional Democrats - довольно близко к стандартной кривой, если бы не скачки(в основном ночью), было бы все почти идеально.
Mason's Lodge - почти идеально, повышенная гиперактивность в начале дня.
Communist Party. Коммунистическая линия выпадает из общероссиийских закономерностей (камрадов в счет не берем, тк есть ощущение что комрады просто отожгли на этих выборах). У нее нет ярко выраженной пиковой активности в начале голосований, своё(определяющее отрыв) коммунисты берут где-то с 16 до 24. К примеру, в США также есть выделяющаяся необычная кривая AFA, что объясняется очень просто: в AFA много европейцев. Какая особенность у наших коммунистов?
UPD. Тут подумал, если доработать статью, убрать лишнее, полить соусом социальной симуляции реального мира, сакцентировать на том, что в данном социальном мире при наличии статистических данных не нарушающих анонимность можно вести борьбу с нечестными выборами (мол, властьимущие, уберите свои веб-камеры с участков, лол, лучше введите онлайн подсчет голосов, инет-кабеля-то уже проложены, предоставьте оценивать легитимность результатов математикам, а не хоттабычу-кудеснику); и опубликовать все это на каком-нить специфичном ресурсе, с ненавязчивой рекламой ерепаблика, то, возможно, можно устроить ББ.
Comments
[removed]
Без Юкрейна не цiкаво
Хорошо))
Да, большая работа проведена
[removed]
Интересно было бы посмотреть на статистику по кол-ву голосов в минут/10 минут или что-то в этом роде, кривая должна быть близка к нормальному распределению в этом случае, вот и хотелось бы сравнить реальные данные с т.с. теоретическими ( :
Чистого нормального распределения там не будет, например из-за утра (:
Да и гладкости там никакой нет, график строил, особо интересным он не выглядит, к сожалению сейчас не под рукой. Там даже в начале голосового дня,есть случаи что-то типо 9-0-6 голосов в 3х последовательных интервалах.
Но сама идея хорошая, аппроксимировать некой теоретической функцией. Сейчас ничего не могу сделать, сижу на чемоданах. Президентских графиков, кстати, не будет.
Жаль : ) . Энивей, статистика - всегда интересна, спасибо за проделанную работу.
П.C. Если не трудно - можешь расшарить таблички с циферками?
не трудно, только после 9го
UPD добавлен
Когда в 2009 году я первый раз голосовал на выборах, недоумевал по поводу кипиша насчет сибиряков, которые голосуют в три ночи по Москве. Обижался.
И это — у партий с примерно равным числом членов хрен разглядишь графики
16-24 ночи — это ж не московское время, а ереп? Ок, короче. Давай еще.
1. как-нить расширить графики сейчас не смогу, на работу попаду только 9го
2. время везде указно питерское (:
Насчет коммунистической линии. В целом ничего криминального не видно в ней.
На поставленный вопрос у меня есть 2 предположения. Первый - тихий старт можно объяснить, например, небольшим/пассивным активом партии.
Занятные графики.
"Причина в том, что ночью ввиду низкой активности наборы выглядят следующим образом: либо все нули, либо [0, 0, 0, x, y], либо [0, 0, 0, 0, x]."
Может взять для ночного времени бОльшие временные интервалы?
16-24 взято из следующих соображений:
в общем примерно 70 голосов коммунисты набрали с 12 по 14 (все примерно, можно на графике посмотреть более точно)
следующие 70 голосов с 14 по 18
следующие 70 - с 18 по 24
так вот,
а КДП/РВП
с 12 по 14 сколько там, 60?
с 14 по 18 - 40
с 18 по 20 - 30
Поэтому, как видим, у коммунистов эдак с-по 16-24 какая-то повышенная активность, не свойственная другим партиям.
Так вот второе предположение:
А не накладывается ли на это все фактор восприятельный, тукликеров и прочих новичков.
Типо ничего не сведующий в ерепе разве будет голосовать за, например, russian will patry или constitutional democrats, от которых, чисто на уровне восприятия, попахивает чем-то западным. А может быть за камрадов и массонов с игрушечными названиями. Вот и жмет тукликер кнопку за коммунистов, по меньшей мере - они родные, уж наверное не навредят.
Но это только предположение.
DartSlon, сначала как-то так и сделал, но что-то не прокатило, возможно из-за моей криворукости.
Верное предположение на счет активности, всем известно, что комми - партия для туклика, типа Трупартиота в МЮ.
Это даже более грубо и бессмысленно, чем простое взятие среднего.
Работа ради работы.
oDdkID, кривая полученная простым путем взятия среднего(усредненного) учтет в себе в тч вбросы. Получится какая-то другая линия, которая будет существенно отличаться от описанной в статье.
Вот и поговорили.
Супер.
voted!