Газета "Своими Именами" №11 от 13.03.2012
Шрифт:
В статистике есть несколько функций плотности, которые постоянно выплывают в разных задачах приложений, однако нас будет интересовать так называемое нормальное (или ещё говорят гауссово) распределение. Оно задаётся непростой формулой, а график полученной плотности - это своего рода колокол. Надо сказать, что такое распределение возникает в задачах сплошь и рядом - отчасти из-за разного рода предельных теорем, которые сводят изучение суммы большого количества случайных величин к изучению нормального распределения.
В этом смысле поиск статистических особенностей данных выглядит следующим образом: массив экспериментальной
Что же можно анализировать, когда речь заходит о выборах? Вся приведенная ниже методология описывается по работам Сергея Шпилькина. По результатам анализа выборов с 2007 по 2009 годы он написал в “Троицкий вариант” прекрасную заметку. Она приобрела известность и даже вызвала волну своего рода критики.
Простейшим параметром (надо сказать, не единственным, которые анализируют Шпилькин и прочие энтузиасты) является явка избирателей. В частности, в качестве случайной величины можно рассматривать явку избирателей на участок. В этом случае плотность этой величины легко нарисовать - откладываем по оси абсцисс явку от нуля до ста процентов с шагом, скажем, в пять процентов. В соответствующей точке на оси ординат ставим количество избирательных пунктов, в которых процент явки лежал в заданных пределах.
Оказывается, что в результате подобной манипуляции возникает распределение, очень похожее на гауссов колокол. Точнее, такое распределение возникает, если брать выборы в Мексике, Польше, Болгарии, Швеции, на Украине и даже в некоторых случаях в России прошлых лет, поэтому мы будем считать, что это и есть нормальная ситуация.
Выборы в Польше, 2005 год. Иллюстрация А.Шеня
Ничего подобного, однако, не наблюдается, если брать данные важных российских выборов, включая данные по выборам 4 декабря. Главных отличий два - это пик в конце графика, обусловленный наличием участков со 100-процентной явкой (сюда попадают, например, воинские части). Кроме того, справа от максимального (за исключением крайнего стопроцентного пика) значения имеется дополнительное “плечо” из пунктов с большей явкой.
Ещё одно графическое представление, которое поддается анализу, - это соотношение между явкой и количеством голосов за конкретную партию. Для этого по оси абсцисс откладываются, как и раньше, проценты явки, а по ординатам - процент, который на данном участке получила партия. В отличие от предыдущего графика, каждой точке по оси абсцисс будет соответствовать сразу несколько точек по оси ординат. Здесь нормой мы считаем то, что эти два параметра независимы. В этом случае полученный рисунок должен быть ориентирован примерно горизонтально. В нашем случае ничего такого нет и рисунок оказывается направленным вдоль биссектрисы координатного угла.
Следующий шаг в анализе самый сложный - необходимо представить внятную и убедительную гипотезу, объясняющую особенности полученных распределений. Так как речь идёт о какой-никакой науке, то фразой “у России особый путь” ограничиться не получится. “Плечо”, скажем,
можно объяснить различной доступностью участков для голосования. Однако, уже беглый взгляд на графики позволяет обнаружить, что, например, участки с высокой посещаемостью почему-то демонстрируют высокий показатель за “Единую Россию”. То есть явка оказывается связанной с успехом правящей партии.Объяснений тут, конечно, может быть много. Например, может так случиться, что голосующие за остальные партии тверды в своих убеждениях - они идут на участки, определившись с выбором. В свою очередь, значительная часть людей решает, за кого голосовать, прямо на избирательном участке. В этом случае не очень понятно, почему подобные нерешительные избиратели оказываются преимущественно на участках с большой явкой. Хотя все может быть проще - за “Единую Россию” голоса добавлялись в ручном режиме.
Проблема с нашими рассуждениями одна - статистический анализ, о котором идет речь выше, доказательством сам по себе не является. Фактически, анализ такого рода позволяет рассуждать только на физическом уровне строгости - появление некоторой дополнительной информации вполне может опровергнуть то или иное утверждение (в то время как доказанное математически утверждение остается после доказательства истинным вне зависимости от каких-либо дополнительных данных).
В дополнение к этому подобный анализ расценивается разного рода специалистами по выборам как нечто недостойное рассмотрения. Например, Виталий Иванов, вице-президент Центра политической конъюнктуры России, так прокомментировал Polit.ru данные анализа выборов 2009 года: “Не надо математикам со своими моделями лезть в политику, анализировать выборы, придумывать какие-то свои версии. Это просто смешно, когда математик рассуждает о выборах. Давайте еще биолога спросим! Или узнаем, что по поводу результатов выборов думает физик-ядерщик!”
В общем, юридической силы математические закономерности не имеют пока не доказано противное. Несмотря на столь существенные недостатки и отсутствие теоретической ценности, мотивацию к такого рода исследованиям по поиску статистических неувязок можно описать цитатой из Льва Ландау (по книге Иоффе “Без ретуши. Портреты физиков на фоне эпохи”): “Люди, услышав о каком-то необыкновенном явлении, начинают предлагать для его объяснения малоправдоподобные гипотезы. Прежде всего, рассмотрите простейшее объяснение - что всё это - вранье”.
Андрей КОНЯЕВ
ИНТЕРВЬЮ С «БАНДЕРЛОГОМ»
Каждый выбирает по себе…
Путин распорядился, чтобы «бандерлоги» направились к нему. И «бандерлоги» повиновались. Только многие из нас неправильно поняли очередной «казарменный» (наравне с «чем-то из носа», что «размазывают по столу») «перл» ельцинского наследника. Мы почему-то решили, что Путин обратился к нам, нас назвал «бандерлогами» и нам приказал ползти к нему. На самом деле ВВП подразумевал совсем других «бандерлогов». И они, эти «бандерлоги», его прекрасно поняли и поспешили выполнять приказ. Все они дисциплинированно записались в «доверенные лица» кандидата «№1». Так что не мы «бандерлоги», а они. Не мы, а они откликнулись на «призыв» Путина. «Бандерлоги», все 499 штук, заняли свое место.