Эпидемиология и бонистика

Михаил Гельфанд

Миха­ил Гель­фанд

Одна из клю­че­вых про­блем при изу­че­нии эпи­де­мий — учет пере­дви­же­ний людей. Клас­си­че­ские диф­фу­зи­он­ные моде­ли хоро­шо опи­сы­ва­ют эпи­де­мии про­шло­го, но лома­ют­ся с появ­ле­ни­ем быст­рых и мас­со­вых путе­ше­ствий на боль­шие рас­сто­я­ния: авто­мо­би­лем, поез­дом и тем более само­ле­том.

Кра­си­вый цикл работ в этой обла­сти был сде­лан в 2000-х годах Лар­сом Хуф­на­ге­лем (Lars Hufnagel) из Инсти­ту­та дина­ми­ки и само­ор­га­ни­за­ции (Max-Planck-Institut für Strömungsforschung, Гёт­тин­ген) и Дир­ком Брок­ман­ном (Dirk Brockmann), так­же рабо­тав­шим в Гёт­тин­гене, а затем пере­ехав­шим в США, в Севе­ро-Запад­ный уни­вер­си­тет (Northwestern University, Илли­нойс). Для того что­бы оце­нить интен­сив­ность путе­ше­ствий людей, они исполь­зо­ва­ли дан­ные о пере­ме­ще­ни­ях банк­нот. Дан­ные для это­го были взя­ты с неофи­ци­аль­но­го сай­та по отсле­жи­ва­нию аме­ри­кан­ских купюр «Где Джордж?» [1] (рис. 1).

Рис. 1. Джордж следит за тобой

Рис. 1. Джордж сле­дит за тобой

Где Джордж?

Сайт сде­лал аме­ри­ка­нец Хэнк Эскин, «пото­му что это при­коль­но и никто рань­ше тако­го не делал» [1, FAQs]. Идея очень про­ста: кто угод­но может достать купю­ры раз­но­го досто­ин­ства из сво­е­го бумаж­ни­ка и зане­сти в про­стую фор­му их номе­ра и поч­то­вый индекс места, где он нахо­дит­ся.

Еще мож­но поста­вить на эти банк­но­ты печать с адре­сом сай­та. Легаль­ность тако­го дей­ствия неоче­вид­на — аме­ри­кан­ский закон запре­ща­ет пор­тить банк­но­ты, но «пор­тить» опре­де­ля­ет­ся как делать непри­год­ны­ми для исполь­зо­ва­ния; авто­ры сай­та очень акку­рат­но воз­дер­жи­ва­ют­ся от каких-либо реко­мен­да­ций, вме­сто это­го при­во­дя ссыл­ку на соот­вет­ству­ю­щую стра­ни­цу аме­ри­кан­ско­го Каз­на­чей­ства (мол, sapienti sat). Они не про­да­ют штам­пов (в пер­вые годы — про­да­ва­ли, одна­ко это вошло в про­ти­во­ре­чие с зако­ном о запре­те рекла­мы на день­гах), но наме­ка­ют, что их лег­ко зака­зать в Интер­не­те или в пис­че­бу­маж­ном мага­зине по сосед­ству.

Сайт был открыт 23 декаб­ря 1998 года, и за про­шед­шие почти два­дцать лет на нем было заре­ги­стри­ро­ва­но 270 млн банк­нот на сум­му 1,45 млрд долл. (это 0,13% от общей сум­мы дол­ла­ров в обра­ще­нии), из них 31 млн боль­ше одно­го раза. На сай­те заре­ги­стри­ро­ва­лось более 8 млн поль­зо­ва­те­лей, три чет­вер­ти из кото­рых занес­ли хотя бы по одной купю­ре; в сред­нем заре­ги­стри­ро­ван­ный поль­зо­ва­тель занес номе­ра 37 купюр; при­мер­но чет­верть купюр занес­ли неза­ре­ги­стри­ро­ван­ные поль­зо­ва­те­ли.

Эта ста­ти­сти­ка пока­зы­ва­ет, что идея понра­ви­лась поль­зо­ва­те­лям Интер­не­та. Види­мо, в зна­чи­тель­ной сте­пе­ни — как все­гда — ска­зал­ся эффект сорев­но­ва­ния: на сай­те ведет­ся акку­рат­ный под­счет актив­но­сти всех «джор­дже­ров», как они себя назы­ва­ют. Лидер (Девуш­ка Игу­а­на из горо­да Пиджен-Фордж, штат Тен­нес­си, — ник был взят в честь домаш­ней игу­а­ны, к сожа­ле­нию уже покой­ной) за пят­на­дцать лет, с мар­та 2002 года, занес­ла номе­ра более мил­ли­о­на банк­нот, из кото­рых при­мер­но 300 тыс. (26%) побы­ва­ли на сай­те не один раз.

В сред­нем полу­ча­ет­ся чуть более 20 банк­нот в день; мож­но пред­по­ло­жить, что Девуш­ка Игу­а­на, как и дру­гие лиде­ры, рабо­та­ет кас­си­ром или еще как-то свя­за­на с обо­ро­том налич­но­сти, посколь­ку для обыч­но­го чело­ве­ка такой поток пред­став­ля­ет­ся слиш­ком боль­шим. Кро­ме того, на сай­те функ­ци­о­ни­ру­ет форум, на кото­ром есть раз­де­лы и про рас­про­стра­не­ние купюр, и про их куп­лю-про­да­жу (нико­му не нуж­на банк­но­та с номе­ром 88844448 или 90003000? А 19681967? А начи­на­ю­щи­е­ся с 666? Или с четы­рех нулей? Тогда вам туда…).

Доллары и вирусы

Опи­сав эпи­де­мию ати­пич­ной пнев­мо­нии 2003 года с исполь­зо­ва­ни­ем кар­ты марш­ру­тов меж­ду­на­род­ных авиа­ли­ний [2], авто­ры осо­зна­ли, что, хотя их модель хоро­шо рабо­та­ет в боль­шом мас­шта­бе, но для опи­са­ния рас­про­стра­не­ния эпи­де­мии на уровне одной стра­ны, ска­жем, США, надо учи­ты­вать и дру­гие виды транс­пор­та, а доступ­ных дан­ных для это­го нет.

И тогда они обра­ти­ли вни­ма­ние на сайт, на кото­ром отсле­жи­ва­ет­ся пере­ме­ще­ние бумаж­ных денег. Ясно, что это было прак­ти­че­ски то что надо: пере­да­ча купю­ры про­ис­хо­дит при лич­ном кон­так­те, как и пере­да­ча виру­са. Авто­ры напи­са­ли Хэн­ку Эски­ну и, так не дождав­шись отве­та, соору­ди­ли про­стой скрипт, кото­рый начал выка­чи­вать дан­ные с сай­та [3]. Эскин заме­тил необыч­ный всплеск актив­но­сти и закрыл доступ, на вся­кий слу­чай, для все­го Гёт­тин­ге­на, одна­ко дан­ные о мил­ли­оне пере­ме­ще­ний уже были ска­ча­ны, и это­го ока­за­лось доста­точ­но для ста­ти­сти­че­ско­го ана­ли­за [4].

Как ожи­да­лось, рас­сто­я­ния, на кото­рые банк­но­ты пере­дви­га­ют­ся за неболь­шое вре­мя, были рас­пре­де­ле­ны по сте­пен­но­му зако­ну (рис. 2 сле­ва). Такое рас­пре­де­ле­ние харак­тер­но, в част­но­сти, для попу­ляр­ной моде­ли «поле­та Леви» со сте­пен­ны­ми интер­ва­ла­ми меж­ду изме­не­ни­я­ми направ­ле­ния. Одна­ко при более вни­ма­тель­ном рас­смот­ре­нии ока­за­лось, что дина­ми­ка рас­про­стра­не­ния банк­нот от исход­ной точ­ки про­ти­во­ре­чит и этой моде­ли, и про­стой дву­мер­ной диф­фу­зии (рис. 2 спра­ва): они раз­бе­га­ют­ся слиш­ком мед­лен­но.

Рис. 2. Путе­ше­ствия Джор­джа и его дру­зей [2]. Сле­ва: Рас­пре­де­ле­ние рас­сто­я­ний, на кото­рые банк­но­ты пере­ме­ща­ют­ся за 1–4 дня. На вклад­ке — то же рас­пре­де­ле­ние в зави­си­мо­сти от исход­ной точ­ки. Спра­ва: веро­ят­ность вый­ти за круг с ради­у­сом 20 км за дан­ное вре­мя. Типы точек: □— все горо­да, ∆ — боль­шие горо­да, ◊ — сред­ние горо­да, ○ — малые горо­да. Пунк­тир: синий — наблю­да­е­мая экс­по­нен­та t–η (с пока­за­те­лем η = 0,6), чер­ный — экс­по­нен­та, ожи­да­е­мая при дву­мер­ной диф­фу­зии (η = 1,0), крас­ный — ско­рость рас­про­стра­не­ния в моде­ли поле­та Леви (η = 3,3)

Авто­ры пред­по­ло­жи­ли, что дело в том, что пере­ме­ще­ния совер­ша­ют­ся не непре­рыв­но друг за дру­гом и необ­хо­ди­мо учи­ты­вать вре­мя, кото­рое купю­ра про­во­дит в бумаж­ни­ке оче­ред­но­го вла­дель­ца; оно так­же рас­пре­де­ле­но по сте­пен­но­му зако­ну. Модель, учи­ты­ва­ю­щая оба пара­мет­ра — дли­ну пере­ме­ще­ния и вре­мя меж­ду пере­ме­ще­ни­я­ми, ока­за­лась очень точ­ной.

А теперь, раз мы зна­ем ста­ти­сти­ку кон­так­тов жите­лей США, мы можем под­ста­вить ее в стан­дарт­ные эпи­де­мио­ло­ги­че­ские моде­ли, учи­ты­ва­ю­щие так­же инку­ба­ци­он­ный пери­од болез­ни, сред­нюю плот­ность кон­так­тов, веро­ят­ность зара­же­ния при кон­так­те, и полу­чить, напри­мер, пред­ска­за­ние того, как будет раз­ви­вать­ся эпи­де­мия сви­но­го грип­па 2009 года (по чис­лу забо­лев­ших в раз­ных гео­гра­фи­че­ских точ­ках) — не зад­ним чис­лом, а в реаль­ном вре­ме­ни [5].

Карта путешествий


Рис. 3. Горо­да и дол­ла­ры [6]. Сле­ва: гори­зон­таль­ная ось — при­ток банк­нот, вер­ти­каль­ная ось — отток банк­нот. Спра­ва: гори­зон­таль­ная ось — насе­ле­ние горо­да, вер­ти­каль­ная ось — при­ток банк­нот. Двой­ные лога­риф­ми­че­ские коор­ди­на­ты; цвет точек — коли­че­ство наблю­де­ний. Пунк­ти­ром пока­за­на линей­ная зави­си­мость

Но дан­ные о пере­ме­ще­ни­ях банк­нот мож­но исполь­зо­вать и для того, что­бы понять, как вооб­ще устро­е­ны вза­и­мо­дей­ствия меж­ду попу­ля­ци­я­ми. Вот, напри­мер, про­стой факт: чем боль­ше город, тем мощ­нее поток про­хо­дя­щих через него денег, при­чем при­ток равен отто­ку (рис. 3) [6]. Мож­но посчи­тать сум­мар­ные пото­ки банк­нот меж­ду шта­та­ми и нари­со­вать кла­стер­ное дере­во, на кото­ром бли­же все­го будут шта­ты, интен­сив­но обме­ни­ва­ю­щи­е­ся дол­ла­ра­ми, потом чуть даль­ше и так далее (рис. 4).

Рис. 4. Штаты и доллары [6]. Кластеризация штатов по величине суммарных потоков банкнот между ними. Слева: кластерное дерево; справа: то же дерево, спроецированное на карту США

Рис. 4. Шта­ты и дол­ла­ры [6]. Кла­сте­ри­за­ция шта­тов по вели­чине сум­мар­ных пото­ков банк­нот меж­ду ними. Сле­ва: кла­стер­ное дере­во; спра­ва: то же дере­во, спро­еци­ро­ван­ное на кар­ту США

Одна­ко кто ска­зал, что есте­ствен­ные гра­ни­цы обще­ния сов­па­да­ют с гра­ни­ца­ми шта­тов? Пра­виль­нее было бы посмот­реть, как стра­на сама раз­де­ля­ет­ся на обла­сти, внут­ри кото­рых люди вза­и­мо­дей­ству­ют часто, а меж­ду кото­ры­ми — ред­ко.

Рас­смот­рим граф, в кото­ром вер­ши­на­ми будут горо­да, а веса­ми на реб­рах — часто­ты пере­ме­ще­ний банк­нот меж­ду эти­ми горо­да­ми. Разо­бьем этот граф на моду­ли, т. е. такие плот­ные под­гра­фы, в кото­рых сум­мар­ный вес ребер велик, а меж­ду кото­ры­ми, как пра­ви­ло, про­хо­дят реб­ра мало­го веса.

Ясно, что это зави­сит от кон­крет­ных опре­де­ле­ний плот­но­сти под­гра­фа; про­бле­ма в том, что для любых содер­жа­тель­ных опре­де­ле­ний зада­ча вычис­ли­тель­но очень слож­на и не может быть реше­на точ­но — мы не можем постро­ить опти­маль­ное раз­би­е­ние гра­фа на ком­по­нен­ты за разум­ное вре­мя. Поэто­му исполь­зу­ют раз­лич­ные эври­сти­че­ские и веро­ят­ност­ные алго­рит­мы, кото­рые не гаран­ти­ру­ют точ­но­го реше­ния, но стро­ят хоро­шее при­бли­же­ние к нему. Один из веро­ят­ност­ных алго­рит­мов исполь­зо­вал всё тот же Дирк Брок­манн в сво­ей сле­ду­ю­щей рабо­те [7].

Пер­вая хоро­шая новость: полу­чен­ные моду­ли хоро­шо про­еци­ру­ют­ся на гео­гра­фи­че­скую кар­ту. Алго­ритм ниче­го не зна­ет о гео­гра­фии, а учи­ты­ва­ет толь­ко пото­ки банк­нот; вполне мог­ло бы полу­чить­ся, что горо­да кла­сте­ри­зо­ва­лись бы, напри­мер, по эко­но­ми­че­ским пока­за­те­лям. Вто­рая: хотя при каж­дом запус­ке веро­ят­ност­но­го алго­рит­ма полу­ча­ют­ся, вооб­ще гово­ря, раз­ные моду­ли, они похо­жи. Есте­ствен­но счи­тать, что те гра­ни­цы, кото­рые устой­чи­во вос­про­из­во­дят­ся при (почти) каж­дом раз­би­е­нии, и явля­ют­ся пра­виль­ны­ми (рис. 5 сле­ва).

Рис. 5. Разбиение США на компактные модули по потокам банкнот [7]. Сверху: границы модулей показаны синим, интенсивность цвета соответствует частоте, с которой граница воспроизводится при различных запусках алгоритма. Круговые диаграммы показывают, что 44% границ штатов являются также и границами модулей (слева), но 64% границ модулей не совпадают с границами штатов (справа). Внизу: примеры несовпадения границ штатов и модулей. Слева: разбиение штата Миссури на области Канзас-Сити (запад) и Сент-Луиса (восток); справа: разбиение по Аппалачам, разделяющее Пенсильванию на области Питтсбурга (к западу от гор) и Филадельфии (к востоку от гор)

Рис. 5. Раз­би­е­ние США на ком­пакт­ные моду­ли по пото­кам банк­нот [7]. Свер­ху: гра­ни­цы моду­лей пока­за­ны синим, интен­сив­ность цве­та соот­вет­ству­ет часто­те, с кото­рой гра­ни­ца вос­про­из­во­дит­ся при раз­лич­ных запус­ках алго­рит­ма. Кру­го­вые диа­грам­мы пока­зы­ва­ют, что 44% гра­ниц шта­тов явля­ют­ся так­же и гра­ни­ца­ми моду­лей (сле­ва), но 64% гра­ниц моду­лей не сов­па­да­ют с гра­ни­ца­ми шта­тов (спра­ва). Вни­зу: при­ме­ры несов­па­де­ния гра­ниц шта­тов и моду­лей. Сле­ва: раз­би­е­ние шта­та Мис­су­ри на обла­сти Кан­зас-Сити (запад) и Сент-Луи­са (восток); спра­ва: раз­би­е­ние по Аппа­ла­чам, раз­де­ля­ю­щее Пен­силь­ва­нию на обла­сти Питтс­бур­га (к запа­ду от гор) и Фила­дель­фии (к восто­ку от гор)

Сопо­став­ле­ние исход­но­го гра­фа и полу­чен­ных моду­лей пока­зы­ва­ет, что у каж­до­го моду­ля есть «центр» — вер­ши­на, через кото­рую и идут основ­ные пото­ки банк­нот. Авто­ры пред­ло­жи­ли ори­ги­наль­ную фор­ма­ли­за­цию это­го сооб­ра­же­ния. Гру­бо гово­ря, реб­ро явля­ет­ся важ­ным, если его уда­ле­ние раз­ру­ша­ет крат­чай­шие пути ко мно­гим вер­ши­нам; при этом рас­сто­я­ни­ем меж­ду парой вер­шин счи­та­ет­ся вели­чи­на, обрат­ная пото­ку банк­нот меж­ду ними.

Теперь, если оста­вить толь­ко важ­ные реб­ра, мы уви­дим, что струк­ту­ра гра­фа — это сеть, состо­я­щая из «звезд» с цен­тра­ми, как пра­ви­ло, в боль­ших горо­дах; в каж­дом моду­ле есть один или несколь­ко таких цен­тров.

Рис. 6. Сеть потока банкнот в США [7]. Синим цветом показаны важные ребра, красным — границы модулей, желтые квадраты — большие города

Рис. 6. Сеть пото­ка банк­нот в США [7]. Синим цве­том пока­за­ны важ­ные реб­ра, крас­ным — гра­ни­цы моду­лей, жел­тые квад­ра­ты — боль­шие горо­да

Sic transit

В исто­рии нау­ки быва­ет так, что какой-то кра­си­вый при­ем ока­зы­ва­ет­ся полез­ным очень недол­го, пото­му что его вытес­ня­ют новые мето­ды. Так и с моде­ли­ро­ва­ни­ем пере­дви­же­ний людей при помо­щи дан­ных о пере­ме­ще­нии банк­нот — сей­час для этой цели про­ще все­го исполь­зо­вать инфор­ма­цию от сото­вых теле­фо­нов [8]. Это хоро­шо рабо­та­ет даже в бед­ных стра­нах, где риск эпи­де­мий осо­бен­но велик, и такой под­ход был успеш­но при­ме­нен, напри­мер, для ана­ли­за эпи­де­мии холе­ры на Гаи­ти [9] и рас­про­стра­не­ния маля­рии [10] и крас­ну­хи [11] в стра­нах Афри­ки.

Миха­ил Гель­фанд

1. wheresgeorge.com

2. Hufnagel L., Brockmann D., Geisel T. Forecast and control of epidemics in a globalized world /​/​ Proc. Natl. Acad. Sci. 2004. 101: 15124–15129.

3. Brockmann D. The origin of Wheresgeorge research

4. Brockmann D., Hufnagel L., Geisel T. The scaling laws of human travel /​/​ 2006. 439: 462–465.

5. Computational quantitative projections for H1N1 flu dynamics in the United States (June 3, 2009).

6. Brockmann D., Theis F. Money circulation, trackable items, and the emergence of universal human mobility patterns /​/​ IEEE Pervasive Computing. 2008. 7: 26–35.

7. Thiemann C., Theis F., Grady D., Brune R., Brockmann D. The structure of borders in a small world /​/​ PLoS One. 5: e15422. DOI: 10.1371/journal.pone.0015422.

8. Williams N. E., Thomas T. A., Dunbar , Eagle N., Dobra A. Measures of human mobility using mobile phone records enhanced with GIS data /​/​ PLoS One. 2015. 10:e0133630. DOI: 10.1371/journal.pone.0133630.

9. Bengtsson L., Gaudart J., Lu X., Moore S., Wetter E., Sallah K., Rebaudet S., Piarroux R. Using mobile phone data to predict the spatial spread of cholera /​/​ Sci. Rep. 2015. 5: 8923. DOI: 10.1038/srep08923.

10. Buckee C. O., Wesolowski A., Eagle N. N., Hansen E., Snow R. W. Mobile phones and malaria: modeling human and parasite travel /​/​ Travel Infect. Dis. 2013. 11: 15–22. DOI: 10.1016/j.tmaid.2012.12.003.

11. Wesolowski A., Metcalf C. J., Eagle N., Kombich J., Grenfell B. T., Bjørnstad O. N., Lessler J., Tatem A. J., Buckee C. O. Quantifying seasonal population fluxes driving rubella transmission dynamics using mobile phone data /​/​ Proc. Natl. Acad. Sci. 2015. 112): 11114–11119. DOI: 10.1073/pnas.1423542112.

Если вы нашли ошиб­ку, пожа­луй­ста, выде­ли­те фраг­мент тек­ста и нажми­те Ctrl+Enter.

Связанные статьи

Оценить: 
Звёзд: 1Звёзд: 2Звёзд: 3Звёзд: 4Звёзд: 5 (Пока оценок нет)
Загрузка...
 
 

Метки: , , , , , , , , , , , , , , , , , , , , , , ,

 

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *