Сигнал и шум. Почему одни прогнозы сбываются, а другие - нет
Шрифт:
Теоретически любая болезнь с R0 > 1 распространится со временем (при отсутствии вакцин и карантинов) на все население. Однако порой значение R0 бывало обманчивым: оно приближалось к 3 для «испанки», к 6 для оспы и к 15 для кори. В случае малярии, одной из самых смертельно опасных болезней в истории цивилизации, до сих пор отвечающей примерно за 10 % смертей в некоторых уголках мира, значение этого показателя может достигать сотен {500} (табл. 7.1).
500
Richard Carter and Kamini N. Mendis, table 4 in «Evolutionary and Historical Aspects of the Burden of Malaria», Clinical Microbiology Reviews, 15, no. 4, pp. 564–594, October 2002.
Таблица 7.1. Медианные значения [94] R0 для различных заболеваний {501}
Проблема состоит в невозможности сформулировать надежные расчеты R0 до тех пор, пока болезнь не распространится по всему сообществу и пока у вас не появится достаточно времени для тщательного изучения статистики. Поэтому эпидемиологи вынуждены делать экстраполяции, основываясь
94
Медианным, или срединным, значением (Ме) называют такое значение случайной величины, при котором половина результатов имеет меньшее, а другая – большее значение, чем Me.
501
Стоит отметить, что в профессиональной литературе значение RO часто приводится в виде диапазона; для простоты повествования я указываю среднее значение этого диапазона. Источники: David L. Smith, F. Ellis McKenzie, Robert W. Snow, and Simon I. Hay, малярия: «Revisiting the Basic Reproductive Number for Malaria and Its Implications for Malaria Control», PLoS Biology, 5, no. 3, March 2007.Эбола: G. Chowell, N. W. Hengartner, C. Castillo-Chavez, P. W. Fenimore, and J. M. Hyman, «The Basic Reproductive Number of Ebola and the Effects of Public Health Measures: The Cases of Congo and Uganda», Journal of Theoretical Biology, 229, no. 1, pp. 119–126, July 7, 2004. math.lanl.gov/~gchowell/publications/ebolaJTB.pdf; 1918 грипп: Marc Lipsitch, Christina Mills, and James Robins, «Estimates of the Basic Reproductive Number for 1918 Pandemic Influenza in the United States: Implications for Policy», Global Health Security Initiative, 2005. www.ghsi.ca/documents/Lipsitch_et_al_Submitted%2020050916.pdf; грипп в 2009 г. и сезонный грипп: Todd Neale, «2009 Swine Flu More Transmissible Than Seasonal Flu», MedPage Today, May 11, 2009.HIV/AIDS: R. M. Anderson and R. M. May, «Population Biology of Infectious Diseases: Part I», Nature, 280, pp. 361–367, August 2, 1979; SARS: J. Wallinga and P. Teunis, «Different Epidemic Curves for Severe Acute Respiratory Syndrome Reveal Similar Impacts of Control Measures», American Journal of Epidemiology, 160, no. 6, pp. 509–516, 2004; другие заболевания: «History and Epidemiology of Global Smallpox Eradication» в «Smallpox: Disease, Prevention, and Intervention» Centers for Disease Control and Prevention. http://www.bt.cdc.gov/agent/smallpox/training/overview/pdf/eradicationhistory.pdf.
Данные о первых вспышках инфекционных заболеваний часто бывают искаженными. Например, приведенные выше цифры о первых поставленных диагнозах СПИДа в США стали доступными лишь через несколько лет после заражений. Но даже скорректированные статистические данные не позволили улучшить качество прогнозов. Однако если бы мы были вынуждены положиться на данные, реально доступные ученым в то время {502} , то результаты могли оказаться еще хуже. Это связано с тем, что в первые годы своего развития СПИД плохо воспринимался и вызывал чувство стыда как у пациентов, так и у врачей {503} . Множество странных синдромов с симптомами, напоминавшими СПИД, оставались без диагноза или диагностировались неправильно – иногда причиной смерти считались другие инфекции, вызываемые СПИДом. Лишь многие годы спустя, когда врачи начали заново открывать старые истории болезней, им удалось лучше оценить развитие СПИДа в первые годы.
502
«Acquired Immunodeficiency Syndrome (AIDS) Weekly Surveillance Report», Centers for Disease Control, December 31, 1984. http://www.cdc.gov/hiv/topics/surveillance/resources/reports/pdf/surveillance84.pdf.
503
Gregory M. Herek and John P. Capitanio, «AIDS Stigma and Sexual Prejudice», American Behavioral Scientist, 42, pp. 1126–1143, 1999. http://psychology.ucdavis.edu/rainbow/html/abs99_sp.pdf.
Неточные данные также послужили причиной плохих прогнозов распространения свиного гриппа в 2009 г. Смертность, связанная с H1N1, была, по всей видимости, достаточно высокой в Мексике, однако оказалась невероятно низкой в США. Хотя отчасти это было связано с различиями в эффективности здравоохранения в каждой стране, значительная часть различий представляла собой на самом деле статистическую иллюзию.
Само понятие смертности представляет собой простое отношение количества смертельных случаев, вызванных болезнью, к количеству случаев заболеваний. Однако оба элемента этого соотношения вызывают целый ряд вопросов. С одной стороны, в Мексике имелась тенденция относить к жертвам H1N1 людей, умерших от других форм гриппа или вообще других болезней. Лабораторные тесты показали, что не менее четверти смертей, ранее связывавшихся с действием вируса H1N1, в реальности не имели никаких черт, присущих гриппу. С другой стороны, в ряде случаев данные о заболеваниях, вызванных вирусом H1N1, передавались не в полном объеме. В таких развивающихся странах, как Мексика, не развиты ни такая сложная система отчетов, как в Соединенных Штатах, ни культура посещения врача при первых признаках заболевания {504} . Факт быстрого распространения заболевания после того, как оно оказалось на территории США, заставляет предположить, что в Мексике имелись десятки, а то и десятки тысяч заболевших, о которых не было известно властям.
504
Marc Lacey and Elisabeth Malkin, «First Flu Death Provides Clues to Mexico Toll», New York Times, April 30, 2009. http://www.nytimes.com/2009/05/01/health/01oaxaca.html?scp=28&sq=h1n1&st=nyt.
Фактически вирус H1N1 мог циркулировать по южной и центральной Мексике на протяжении ряда месяцев, пока на него не обратила внимание медицинская общественность (занятая в то время поисками следов птичьего гриппа в Азии). Отчеты о вспышке респираторного заболевания появились сначала в небольшом городке Ла Глория, штат Веракрус, в начале марта 2009 г., после того как гриппом заболело большинство жителей, однако поначалу мексиканские власти полагали, что это вызвано более привычным штаммом вируса под названием H3N2 {505} .
505
Jo Tuckman and Robert Booth, «Four-Year-Old Could Hold Key in Search for Source of Swine Flu Outbreak», The Guardian, April 27, 2009. http://www.guardian.co.uk/world/2009/apr/27/swine-flu-search-outbreak-source.
Напротив, свиной грипп был навязчивым объектом множества публикаций в СМИ с момента его появления на территории США. Только несколько случаев могло бы остаться без внимания. Так как в США используются более высокие стандарты отчетности, показатель смертности там был более надежным и позволял исключить некоторые плохие сценарии из дальнейшего рассмотрения – но лишь до тех пор, пока не оказалось слишком
поздно отказываться от некоторых пугающих прогнозов, ставших доступными широкой публике.Самореализующиеся и самоотменяющиеся предсказания
Во многих случаях, связанных с предсказаниями деятельности человека, сам факт создания предсказания может повлиять на поведение людей. Иногда, как и в экономике, эти изменения в поведении могут повлиять и на результат прогноза, либо аннулировав его, либо, напротив, повысив его точность. Прогнозы, касающиеся гриппа и других инфекционных заболеваний, затрагивают обе стороны этой проблемы. Случай, при котором предсказание приводит к событиям, его подтверждающим, называется самореализующимся предсказанием или самоисполняющимся пророчеством. Примером его может служить выпуск результатов политического опроса в гонке с множеством кандидатов, например, первичные выборы на президентский пост.
В таких случаях избиратели могут из тактических соображений поддержать кандидата, потенциально способного выиграть (а не растратить зря свой голос), и раскрученные результаты опроса часто лучше всего показывают, какому кандидату это по силам. Например, на последних этапах политической гонки республиканцев в Айове в 2012 г. канал CNN выпустил результаты опроса, показывавшие, что Рик Санторум может рассчитывать на 16 % голосов, а не на 10 %, как это было раньше {506} . Этот опрос выбивался из общего ряда – другие исследования общественного мнения не показывали, что Санторум набирает обороты, даже после выпуска опроса CNN {507} . Тем не менее благодаря опросу Санторум получил значительную и позитивную поддержку СМИ, и некоторые избиратели, ранее поддерживавшие кандидатуры других, близких по идеологическим взглядам кандидатов типа Мишель Бахманн и Рика Перри, перешли на его сторону. Через некоторое время опрос сделал свое дело, Санторум выиграл в Айове, а Бахманн и Перри остались далеко позади.
506
CNN/Time/ORC International poll of Iowa Republican voters, December 21–27, 2011. http://i2.cdn.turner.com/cnn/2011/images/12/28/topstate3.pdf.
507
Selzer & Company poll of Iowa Republican voters, Des Moines Register, December 27–30, 2011. http://www.desmoinesregister.com/assets/pdf/FullTopLineResults.pdf.
Более тонкие примеры этого подхода можно найти в таких областях, как дизайн и развлечения, где компании, в сущности, соревнуются друг с другом в том, что смогут предугадать вкусы потребителей. Но они также способны влиять на потребителей определенным образом через толковые маркетинговые планы. Что касается моды, то специалисты в этой области пытаются угадать, какие цвета будут популярными в следующем сезоне {508} – это нужно делать заранее, примерно за год, поскольку именно такой срок требуется для переналадки производственных линий.
508
Marshall L. Fisher, Janice H. Hammon, Walter R. Obermeyer, and Ananth Raman, «Making Supply Meet Demand in an Uncertain World», Harvard Business Review, May 1994. http://hbr.org/1994/05/making-supply-meet-demand-in-an-uncertain-world/ar/1.
Допустим, группа влиятельных модельеров решит, что в следующем году популярным будет коричневый цвет, и начнет выпускать большое количество одежды коричневого цвета. Если модели и знаменитости начнут носить коричневое, а в каталогах и витринах магазинов будет преобладать одежда коричневых тонов, то велики шансы на то, что публика последует за этой тенденцией. Однако в данном случае она просто реагирует на маркетинг коричневого цвета, а не выражает какое-либо глубинное предпочтение к нему. Дизайнер может показаться настоящим провидцем, угадавшим цвет, хотя, если бы он выбрал белый, черный или лавандовый, произошло бы примерно то же самое {509} .
509
Со сходным случаем я столкнулся, консультируя крупную голливудскую киностудию в 2009 г. Руководство этой студии, обладавшей сложной структурой и на протяжении многих лет управлявшейся с помощью данных, верило, что определенный уик-энд, скажем, первый уик-энд октября, – особенно хороший момент для начала показа потенциального блокбастера, даже если не было связи ни с какими другими факторами. Это произошло из-за того, что студия в прошлом выпустила фильм, показ которого начался в это время и который оказался на редкость удачным (возможно, просто из-за того, что это был очень хороший фильм). Однако студия приписала часть успеха периоду начала показа. Поэтому в каждом следующем году она приберегала свои лучшие релизы на один и тот же уик-энд октября, а затем изо всех сил начинала заниматься его продвижением. Разумеется, хороший и активно рекламируемый фильм будет финансово успешным вне зависимости от того, когда он выходит в прокат. Тем не менее происходившее лишь подтверждало их предсказание о том, что начало октября – самое лучшее время для выпуска фильма.
Заболевания и другие медицинские обстоятельства также могут обладать свойствами самореализации. Когда те или иные медицинские аспекты широко обсуждаются в СМИ, люди чаще начинают находить у себя соответствующие симптомы, а врачи чаще диагностируют ту или иную болезнь. Наиболее известный пример такого случая, наблюдаемый в последние годы, связан с аутизмом.
Если вы сравните количество детей, которым поставлен диагноз «аутизм» {510} , с частотой использования термина аутизм в американских газетах {511} , то обнаружите почти идеальное соответствие по модели «один-к-одному» (рис. 7.3), причем оба значения в недавние годы выросли. И хотя аутизм не всегда воспринимается как заболевание, можно провести определенные параллели с гриппом. «Мы наблюдаем поразительное явление. Для заболеваний, не имеющих четкого механизма возникновения, новости сами по себе начинают способствовать появлению все новых случаев постановки такого диагноза», – рассказал мне доктор Алекс Озонофф из гарвардской Школы здравоохранения. Озонофф серьезно изучал математику и довольно свободно разбирается в вопросе управляемых данных, однако сейчас он в основном концентрируется на использовании тщательного статистического анализа при исследовании гриппа и других инфекционных заболеваний. «Мы раз за разом обнаруживаем, что чем чаще люди думают и обсуждают конкретный диагноз или болезнь, тем чаще его начинают ставить, и корреляция доходит почти до 100 %».
510
Это расчет основан на количестве детей, отнесенных к аутистам и тем самым получивших право на обучение по особой программе в государственных школах в соответствии с федеральным законом IDEAS Act. «Table 45. Children 3 to 21 Years Old Served Under Individuals with Disabilities Education Act, Part B, by Type of Disability: Selected Years, 1976–77 through 2008–09», Digest of Educational Statistics, National Center for Education Statistics, Institute of Education Sciences, 2010. http://nces.ed.gov/programs/digest/d10/tables/dt10_045.asp.
511
По данным NewsLibrary.com. На рис. 7.3 приведены цифры количества статей с обсуждением темы аутизма, отражающие общее количество статей в базе данных NewsLibrary.com на конкретный год, а затем проиндексированные таким образом, чтобы соответствовать по масштабу количеству учеников государственных школ, обучавшихся по специальным программам в области аутизма в соответствии с законом IDEAS Act.