Саратовский феномен (занимательная статистика)

Борис Штерн

Борис Штерн

Веро­ят­но, боль­шая часть чита­те­лей «Тро­иц­ко­го вари­ан­та — Нау­ка» слы­ша­ла о Сара­тов­ской ано­ма­лии. При­мер­но на 140 участ­ках из 1885 доля голо­сов, подан­ных за «Еди­ную Рос­сию», лежит в диа­па­зоне 62,1–62,3%. Этот фено­мен обна­ру­жил Алек­сандр Кире­ев [1]. Люди, при­част­ные к под­сче­ту резуль­та­тов в Сара­тов­ской обла­сти, назва­ли ано­ма­лию «мате­ма­ти­че­ским сов­па­де­ни­ем». Дру­гие люди оце­ни­ли веро­ят­ность это­го «мате­ма­ти­че­ско­го сов­па­де­ния» — оцен­ки колеб­лют­ся от 10 -55 до 10-100, в зави­си­мо­сти от под­хо­да. Мы же исхо­дим из того, что из любо­го постыд­но­го явле­ния нашей жиз­ни мож­но сде­лать инте­рес­ный позна­ва­тель­ный мате­ри­ал. Поэто­му рас­ска­зы­ва­ем о том, как оце­нить веро­ят­ность сара­тов­ско­го «мате­ма­ти­че­ско­го сов­па­де­ния» и как ее интер­пре­ти­ро­вать.

Веро­ят­ность ста­ти­сти­че­ско­го выбро­са зави­сит от так назы­ва­е­мой нуле­вой гипо­те­зы — как долж­но выгля­деть истин­ное рас­пре­де­ле­ние без выбро­са. Допу­стим, у нас нет разум­ной нуле­вой гипо­те­зы, и мы хотим поста­вить огра­ни­че­ние свер­ху: како­ва мак­си­маль­ная веро­ят­ность сара­тов­ско­го выбро­са при про­из­воль­ных нуле­вых гипо­те­зах, не про­ти­во­ре­ча­щих зако­нам при­ро­ды. Такую оцен­ку сде­лал Борис Овчин­ни­ков [2]. Для нее тре­бу­ют­ся два пред­по­ло­же­ния:

  1. 62,2% — истин­ная доля изби­ра­те­лей Сара­тов­ской обла­сти, голо­су­ю­щих за «Еди­ную Рос­сию».
  2. Эти изби­ра­те­ли рав­но­мер­но пере­ме­ша­ны по всем участ­кам и голо­су­ют неза­ви­си­мо друг от дру­га и от внеш­них фак­то­ров.

Тогда рас­пре­де­ле­ние голо­сов за «ЕР» на каж­дом участ­ке будет с хоро­шей точ­но­стью гаус­сов­ским (более точ­но — бино­ми­наль­ным) со сред­ним 62,2 и шири­ной, рав­ной кор­ню квад­рат­но­му из чис­ла про­го­ло­со­вав­ших за «ЕР» на участ­ке (на самом деле участ­ки раз­ные, поэто­му рас­пре­де­ле­ние будет сум­мой гор­бов раз­ной шири­ны). У́же рас­пре­де­ле­ние быть в прин­ци­пе не может, это азы мате­ма­ти­че­ской ста­ти­сти­ки. Но и такой горб, близ­кий к гаус­сов­ско­му, всё рав­но намно­го шире сара­тов­ско­го пика, и, по оцен­ке Бори­са Овчин­ни­ко­ва, веро­ят­ность подоб­но­го выбро­са — 10-55. Каза­лось бы, на этом мож­но оста­но­вить­ся: верх­няя оцен­ка исче­за­ю­ще мала, мож­но воз­буж­дать уго­лов­ное дело о злост­ной фаль­си­фи­ка­ции. Но мы, как при­ня­то у физи­ков, пой­дем даль­ше и попро­бу­ем дать реа­ли­стич­ную оцен­ку, пусть и не столь стро­го обос­но­ван­ную.

На реаль­ных выбо­рах гаус­сов­ских рас­пре­де­ле­ний с дис­пер­си­ей «корень из N» не быва­ет — они шире, из-за того что голо­су­ю­щие не неза­ви­си­мы друг от дру­га (семьи, сосед­ские ком­па­нии) и от объ­ек­тив­ных внеш­них фак­то­ров (уро­вень жиз­ни на участ­ке, исто­рия рай­о­на и т. п.). Мы можем попы­тать­ся поза­им­ство­вать нуле­вую гипо­те­зу из жиз­ни. Самое про­стое и самое есте­ствен­ное — взять резуль­та­ты выбо­ров в Сара­тов­ской обла­сти, выре­зав из рас­пре­де­ле­ния пре­сло­ву­тый пик. Это будет наша нуле­вая гипо­те­за, а пик — ста­ти­сти­че­ский выброс, веро­ят­ность кото­ро­го будем оце­ни­вать. «Но ведь и осталь­ная часть кри­вой может быть сфаль­си­фи­ци­ро­ва­на», — ска­жет про­ни­ца­тель­ный чита­тель. Конеч­но, но нуле­вая гипо­те­за как раз заклю­ча­ет­ся в пред­по­ло­же­нии о чест­но­сти выбо­ров.

Рис. 1

Рис. 1

Реаль­ное рас­пре­де­ле­ние возь­мем из рис. 1, постро­ен­но­го Сер­ге­ем Роман­чу­ком. В два бина 62,1–62,3 попа­ли 140 участ­ков. По оцен­ке Роман­чу­ка, в близ­ле­жа­щих бинах в сред­нем по три участ­ка, то есть под выбро­сом долж­но быть при­мер­но 6 участ­ков (луч­шая точ­ность нам не нуж­на вви­ду абсурд­но­сти зада­чи). А наблю­да­ем 140. Веро­ят­ность выбро­са хоро­шо опи­сы­ва­ет­ся рас­пре­де­ле­ни­ем Пуас­со­на (когда общее чис­ло участ­ков мно­го боль­ше их чис­ла в выбро­се). Вот это рас­пре­де­ле­ние:

214-0013

Здесь a – ожи­да­е­мое сред­нее, N — выпав­шее чис­ло. При a = 6 и N = 140 име­ем веро­ят­ность ~10-135 (Роман­чук, не поль­зу­ясь рас­пре­де­ле­ни­ем Пуас­со­на, полу­чил «на паль­цах» 10-100, что мож­но счи­тать хоро­шим сов­па­де­ни­ем).

Что такое 10-135? Как пред­ста­вить зна­че­ние подоб­но­го «мате­ма­ти­че­ско­го сов­па­де­ния»? При­бег­нем к мыс­лен­но­му экс­пе­ри­мен­ту. Что­бы с боль­шой веро­ят­но­стью про­изо­шло подоб­ное сов­па­де­ние, нуж­но сде­лать при­мер­но 10135 рав­но­цен­ных испы­та­ний. То есть про­ве­сти имен­но столь­ко выбо­ров в мил­ли­он­ных реги­о­нах, раз­би­тых на тыся­чу участ­ков. На Зем­ле их про­во­ди­лось мно­го, толь­ко в этих дум­ских выбо­рах участ­во­ва­ло 102 реги­о­нов (округ­ля­ем до поряд­ков). А по все­му миру еже­год­но про­во­дят­ся деся­ток выбо­ров, рефе­рен­ду­мов и голо­со­ва­ний подоб­но­го мас­шта­ба (наки­ды­ва­ем еще поря­док). И так про­ис­хо­дит боль­шую часть XX века — при­мем за 100 лет. Беря чис­ла с боль­шим запа­сом, мы получим105 подоб­ных голо­со­ва­ний за всю зем­ную исто­рию. Не хва­та­ет 130 поряд­ков вели­чи­ны.

Про очень боль­шие чис­ла, такие как, напри­мер, 1013, гово­рят «аст­ро­но­ми­че­ское чис­ло». Тогда 10135 — уже нечто гипе­рас­тро­но­ми­че­ское. Перей­дем на сле­ду­ю­щий, кос­мо­ло­ги­че­ский мас­штаб. В наблю­да­е­мой части Все­лен­ной при­мер­но 1012 галак­тик. В каж­дой из них 1011 звезд (берем с избыт­ком). Ито­го 1023 звезд в наблю­да­е­мой части Все­лен­ной. Кста­ти, это боль­ше, чем пес­чи­нок на всех пля­жах Зем­ли — при­мер­но 10 тыс. км3 пес­ка. Из них поряд­ка 1022 звезд близ­ки по сво­ей све­ти­мо­сти и мас­се к Солн­цу. Из них, по дан­ным теле­ско­па «Кеплер», одна деся­тая, или при­мер­но 1021, име­ют пла­не­ты зем­но­го типа в зоне оби­та­е­мо­сти. Пред­по­ло­жим, что на всех таких пла­не­тах появ­ля­ет­ся жизнь и эво­лю­ци­о­ни­ру­ет до разум­ных существ, дозре­ва­ю­щих до демо­кра­тии, тре­бу­ю­щей регу­ляр­ных голо­со­ва­ний. Исто­рия зем­ной демо­кра­тии едва насчи­ты­ва­ет 100 лет, но, может быть, циви­ли­за­ции живут и про­во­дят выбо­ры очень дол­го — в сред­нем мил­ли­ард лет. Тогда за всю исто­рию Все­лен­ной в ее наблю­да­е­мой части про­шло 1021(пла­нет) х 103 (в год) х 109(лет) = 1033 голо­со­ва­ний, подоб­ных по мас­шта­бу тому, что име­ло место в Сара­тов­ской обла­сти. Но нам нуж­но гораз­до боль­ше — не хва­та­ет еще 102 поряд­ков!

Рис. В. Кийко

Рис. В. Кий­ко

Неуже­ли такая веро­ят­ность физи­че­ски не реа­ли­зу­е­ма?

На самом деле не всё так пло­хо. Тео­рия кос­мо­ло­ги­че­ской инфля­ции гла­сит, что наблю­да­е­мая область внут­ри гори­зон­та — лишь мик­ро­ско­пи­че­ская часть от всей гигант­ской Все­лен­ной, кото­рая в свои пер­вые мгно­ве­ния рос­ла по экс­по­нен­те, и где эта экс­по­нен­та обо­рва­лась — одно­му Богу извест­но. Она может быть и в 100 раз, и на 50 поряд­ков боль­ше раз­ме­ров наше­го гори­зон­та. Если нам не хва­та­ет 102 поряд­ков, то доста­точ­но пред­по­ло­жить, что раз­мер Все­лен­ной при­мер­но на 34 поряд­ка боль­ше рас­сто­я­ния до гори­зон­та (насколь­ко рас­сто­я­ние до гори­зон­та боль­ше мел­кой бак­те­рии). И в такой Все­лен­ной, плот­но обжи­той мил­ли­ар­до­лет­ни­ми циви­ли­за­ци­я­ми, при­леж­но при­дер­жи­ва­ю­щи­ми­ся демо­кра­ти­че­ских про­це­дур, с веро­ят­но­стью поряд­ка еди­ни­цы за вре­мя ее суще­ство­ва­ния где-то на выбо­рах выпа­дет подоб­ный резуль­тат. И эта честь доста­лась Сара­тов­ской обла­сти! А Элла Пам­фи­ло­ва гово­рит, что этот факт не сто­ит и выеден­но­го яйца. Ниче­го себе яйцо!

Борис Штерн

1. http://kireev.livejournal.com/tag/Саратов

2. http://barouh.livejournal.com/421828.html

Если вы нашли ошиб­ку, пожа­луй­ста, выде­ли­те фраг­мент тек­ста и нажми­те Ctrl+Enter.

Связанные статьи

Оценить: 
Звёзд: 1Звёзд: 2Звёзд: 3Звёзд: 4Звёзд: 5 (Пока оценок нет)
Загрузка...
 
 

Метки: , , , , , , , , , , , , , , , ,

 

12 комментариев

  • Яхвеакбар:

    Ах вы нехри­сти сата­нин­ские! Это было чуу­у­у­до божие! ялли­лу­у­у­у­уйййяяяя

  • Ash:

    «А Элла Пам­фи­ло­ва гово­рит, что этот факт не сто­ит и выеден­но­го яйца.»

    «Так… А выво­ды? Фор­му­лы… Опять фор­му­лы… мас­са­ракш, сно­ва фор­му­лы…»

    Что делать оппо­зи­ции?

    • Максим Борисов:

      «Опять про­кля­тая неопре­де­лен­ность» (с).

      • Ash:

        Вот имен­но! Вы посмот­ри­те на наших поли­ти­ков – до жира­фа рань­ше дохо­дит. Им нуж­но писать откры­тым тек­стом абсо­лют­ные баналь­но­сти.

        1. Нуж­но выяс­нить, что это за участ­ки. Что в них обще­го? Чем они отли­ча­ют­ся?

        2. Како­вы были резуль­та­ты голо­со­ва­ния рань­ше на этих участ­ках?

        и т.д. и т.п.

        Тупые они все – неуже­ли не вид­но?

      • Ash:

        «Опять про­кля­тая неопре­де­лен­ность»

        http://tass.ru/politika/3776089

        «Груп­па депу­та­тов фрак­ции ЛДПР внес­ла на рас­смот­ре­ние Гос­ду­мы зако­но­про­ект об отмене досроч­но­го голо­со­ва­ния на выбо­рах, а так­же голо­со­ва­ния по откре­пи­тель­ным удо­сто­ве­ре­ни­ям. Это, по мне­нию либе­рал-демо­кра­тов, повы­сит про­зрач­ность изби­ра­тель­но­го про­цес­са и предот­вра­тит нару­ше­ния. По мне­нию авто­ров зако­но­про­ек­та, в чис­ле кото­рых Яро­слав Нилов, Вадим День­гин, Алек­сей Диден­ко, аль­тер­на­тив­ные фор­мы голо­со­ва­ния при­во­дят к фаль­си­фи­ка­ции резуль­та­тов выбо­ров.»

        Вот какие выво­ды сде­ла­ли наши поли­ти­ки отно­си­тель­но фаль­си­фи­ка­ций.

        Ещё раз повто­ряю – им нуж­но всё объ­яс­нять пря­мым тек­стом, на уровне млад­ших клас­сов и мно­го раз. Ина­че все эти мате­ма­ти­че­ские иссле­до­ва­ния не будут иметь прак­ти­че­ских при­ло­же­ний.

  • Poма:

    Ува­жа­е­мые уче­ные. Так сколь­ко вбро­ше­но в сара­тов­ской обла­сти бюл­ле­те­ней и в Рос­сии?
    К меня полу­чи­лось око­ло 5 мил­ли­о­нов голо­сов.

  • Любитель астрономии:

    Ува­жа­е­мый Борис Евге­нье­вич!
    Если, на осно­ва­нии тех же сооб­ра­же­ний гаус­со­во­сти,
    при­ки­нуть веро­ят­ность фор­ми­ро­ва­ния галак­ти­ки,
    вме­сто рав­но­мер­но­го рас­пре­де­ле­ния звезд в про­стран­стве,
    то мы тоже уви­дим явные фаль­си­фи­ка­ции :(

    Зна­чит модель что-то не учи­ты­ва­ет

    • Ash:

      А здесь совер­шен­но не нуж­но гаус­со­во­сти. Доста­точ­но раз­ли­чий по реги­о­нам сре­ди изби­ра­те­лей, голо­со­вав­ших за ЕДРО и сход­ства сре­ди изби­ра­те­лей, голо­со­вав­ших за дру­гие пар­тии.

    • Б.Штерн:

      Доро­гой Люби­тель аст­ро­но­мии,

      Обра­зо­ва­ние галак­тик опи­са­но от и до. Там как раз игра­ет роль гаус­со­вость, но не та. Воз­му­ще­ния, из кото­рых вырос­ли галак­ти­ки воз­ник­ли в пери­од инфля­ции, как кван­то­вые флут­ку­а­ции. Без низ не было бы ни галак­тик, ни звезд. Это вам книж­ки почи­тать надо.

      • Максим:

        «От и до»- не слиш­ком ли? Да и инфля­ци­он­ной тео­рии ещё дале­ко­ва­то до под­твер­жде­ния.

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *

Недопустимы спам, оскорбления. Желательно подписываться реальным именем. Аватары - через gravatar.com