Сигнал и шум. Почему одни прогнозы сбываются, а другие - нет, Сильвер Нейт

Сигнал и шум. Почему одни прогнозы сбываются, а другие - нет

на обложку

Сильвер Нейт

Шрифт:

Определенные преимущества метеорологов обусловлены и тем, что они хорошо понимают физику погодной системы, управляемую сравнительно простыми и легко наблюдаемыми законами. В принципе, это же может считаться преимуществом и для прогнозистов климата. Мы можем наблюдать за облаками и довольно хорошо представлять себе их поведение; проблема состоит лишь в том, как перевести наши знания на математический язык.

Один их наиболее успешных примеров климатического прогнозирования – удачное предсказание траекторий движения некоторых огромных облаков – тех, которые образуют ураганы. Офис Эмануэля в МТИ под номером 54–1814 довольно сложно найти (мне помог исключительно интересный уборщик, который, возможно, послужил прототипом героя фильма «Умница Уилл Хантинг» («Good Will Hunting»)). Однако его явным плюсом является отличный вид на Чарльз-ривер. Легко представить себе, как где-то вдалеке зарождается ураган – направится ли он в сторону Кембриджа или улетит в сторону Северной Атлантики?

Эмануэль

описал мне различие между двумя типами прогнозов ураганов. Один из них в чистом виде статистический. «У вас имеется довольно длительная история описаний интересующего вас явления. Есть у вас и информация о том, что вы считаете достаточно серьезными предикторами, в числе которых масштабное перемещение ветра в верхних слоях атмосферы или температура океана. И вы просто-напросто используете статистику для того, чтобы связать то, что вы пытаетесь предсказать, с этими предикторами».

Представьте, что в Мексиканском заливе зарождается ураган. Вы можете создать базу данных прошлых ураганов и изучить их скорость ветра, долготу и широту, температуру воды в океане и т. д. Это дает вам возможность найти среди них ураганы, более всего похожие на зарождающийся. Как они себя вели? Какая часть из них дошла до густонаселенных областей типа Нового Орлеана, а какая – бесследно исчезла? По сути, чтобы создавать подобные прогнозы, вам не нужны глубокие метеорологические знания, достаточно лишь хорошей базы данных.

Подобные техники могут использоваться для довольно грубых, но применимых на практике прогнозов. В реальности еще 30 лет назад статистические модели были основным методом, основываясь на котором служба погоды предсказывала траектории движения ураганов.

Но такой метод имеет существенные недостатки. Ураганы возникают довольно часто, однако самые серьезные из них накрывают территорию Соединенных Штатов примерно один раз в год. А если вы используете большое количество переменных, связанных с довольно редким явлением, то рискуете повысить степень оверфиттинга в своей модели и ошибочно принять шум в исторических данных за сигнал.

Однако возможен и альтернативный вариант: вам нужно понимать, какая именно структура лежит в основе системы. По сути, речь идет о создании физической модели определенного участка Вселенной. Для ее создания требуется выполнить значительно больший объем работы, чем при использовании статистического метода. Вы должны более четко понимать первопричины явления. Однако потенциально этот метод способен обеспечить вам более точные результаты.

Модели такого рода уже используются в настоящее время для прогнозирования движения ураганов и доказали свою успешность. Как я уже говорил в главе 4, с 1980-х гг. произошло примерно трехкратное улучшение правильности предсказаний траекторий ураганов, а точка около Нового Орлеана, в которой ураган «Катрина» должен был обрушиться на землю, была предсказана более чем за 48 часов {840} (хотя к этому прогнозу прислушались не все). Статистические системы в наши дни используются, скорее, как основа, с которой сравниваются другие, более точные прогнозы.

840

«KATRINA Graphics Archive», National Hurricane Center, National Weather Service. http://www.nhc.noaa.gov/archive/2005/KATRINA_graphics.shtml.

Прогнозирование – это не книга готовых рецептов

Критика, которой Армстронг и Грин подвергают климатические прогнозы, связана с их эмпирическим изучением дисциплин, подобных экономике, в которых мало физических моделей такого рода {841} . Суть причинно-следственной связи понимается достаточно плохо. Слишком амбициозные подходы к прогнозированию в этих областях часто терпели крах, и поэтому Армстронг и Грин полагают, что они окажутся неудачными и в случае прогнозировании климата.

841

Gavin Schmidt, «Green and Armstrong’s Scientific Forecast», RealClimate.org, July 20, 2007. http://www.realclimate.org/index.php/archives/2007/07/green-and-armstrongs-scientific-forecast/.

Цель любой предсказательной модели состоит в том, чтобы захватить максимально возможный объем сигнала и минимально возможный объем шума. Достигнуть оптимального соотношения между ними можно далеко не всегда, и на нашу способность сделать это будут влиять сила теории, а также качество и объем данных. В прогнозах в сфере экономики недостаточно данных, а теория слаба, вот почему Армстронг и считает, что «чем более сложной вы делаете модель, тем хуже становится прогноз».

Когда речь заходит о прогнозировании климата, ситуация становится еще более сомнительной: теория парникового эффекта достаточно сильна, и этот факт поддерживает более комплексную модель. Однако температурные данные переполнены шумом, и это ей мешает.

Кто одержит победу? На этот вопрос мы можем дать эмпирический ответ, оценивая успех и неудачу различных видов предсказаний в науке о климате. Однако, как и всегда, самое главное – это то, насколько хорошо предсказания отражают происходящее в реальном мире.

Я бы не хотел сводить процесс прогнозирования до набора простых лозунгов. Конечно, эвристические правила типа «бритвы Оккама» («при прочих равных условиях более простое объяснение всегда лучше более сложного» {842} ) звучат достаточно привлекательно, однако их трудно реализовать на практике. Нам доводилось видеть случаи довольно простых и элегантных предположений (например, в моделях SIR, использовавшихся для прогнозирования всплесков болезней). Однако при этом они слишком наивны, чтобы на их основе можно было сделать толковый прогноз. Также (как в случае предсказания землетрясений) мы видели, как невероятно сложные схемы прогнозирования, отлично смотревшиеся в рамках компьютерной программы, терпели на практике унизительное поражение.

842

«Occam’s Razor», Wikipedia.org. http://en.wikipedia.org/wiki/Occam%27s_razor.

Признание, подобное выражению «чем более сложной вы делаете модель, тем хуже становится прогноз», можно сравнить с фразой «не пересолите блюдо». С какого уровня сложности вы начали (сколько соли вы насыпали с самого начала)? Если вы хотите добиться успеха в прогнозировании, то вам нужно заставить себя погрузиться в эксперименты и доверять собственным рецепторам.

Неопределенность в климатических прогнозах

Знать ограничения прогнозов – уже наполовину выиграть сражение, и в этом направлении дела прогнозистов климата идут довольно хорошо. Эти ученые остро осознают суть неопределенности – различные варианты понятий неуверенность и неопределенность использовались в одном из отчетов МГЭИК за 1990 г. 159 раз {843} . Авторы отчета МГЭИК смогли найти массу различных способов объяснения степени согласия или определенности при формулировке того или иного вывода. Например, фраза «скорее всего» в отчете МГЭИК предполагает, что вероятное значение точности предсказания не менее 66 %, а фраза «практически наверняка» предполагает степень согласованности на 99 % и более {844} .

843

John Theodore Houghton, G. J. Jenkins, J. J. Ephraums, eds. Climate Change: The IPCC Scientific Assessment (Cambridge: Cambridge University Press, 1990). http://www.ipcc.ch/ipccreports/far/wg_I/ipcc_far_wg_I_full_report.pdf.

844

«1.6: The IPCC Assessments of Climate Change and Uncertainties» в книге Contribution of Working Group I to the Fourth Assessment Report of the Intergovernmental Panel on Climate Change; 2007. http://www.ipcc.ch/publications_and_data/ar4/wg1/en/ch1s1%E2%80%936.html.

Тем не менее одно дело – понимать суть неопределенности, и совсем другое – реально правильно ее оценить. Когда дело заходит о политических опросах, мы можем полагаться на достаточно широкую базу данных исторических свидетельств. Если кандидат лидирует по итогам опроса на десять пунктов за месяц до выборов, то насколько велики его шансы на победу? Для получения эмпирического ответа на этот вопрос мы можем изучить данные, полученные при проведении десятков прошедших выборов.

Модели, которые создаются прогнозистами климата, не могут полагаться на эту методику. У нас есть только одна планета, и прогнозы ее дальнейшего развития создаются на интервалы, захватывающие десятилетия. Хотя климатологам и приходится много думать о неопределенности, нужно помнить и о том, что существует неопределенность и в отношении того, сколько неопределенности у нас есть. С проблемами такого рода встречаются прогнозисты в любой дисциплине.

Тем не менее мы вполне можем анализировать неопределенность климатических прогнозов, учитывая три ее составные части. Для обсуждения этого вопроса я встретился с коллегой Хансена по НАСА, саркастичным лондонцем, соавтором блога RealClimate.org Гэвином Шмидтом. Встреча состоялась в пабе неподалеку от его офиса, расположенного в нью-йоркском районе Морнингсайд-Хайтс в Нью-Йорке.

Во время разговора Шмидт нарисовал на салфетке для коктейлей график, который был похож на тот, что вы видите на рис. 12.3. На нем отображены три значимые проблемы, с которыми сталкиваются ученые, и различные типы неопределенности, начинающие занимать более-менее главенствующее положение в процессе создания климатического прогноза.

1-95 96 97 98 99 100 101 102 103 104 105 106 107 108 109-120

Поделиться с друзьями:

Чтение онлайн

КНИГИ

АВТОРЫ

ЖАНРЫ

Деловая литература

Детективы

Детские

Документальная литература

Дом и Семья

Драматургия

Жанр не определен

Компьютеры и Интернет

Любовные романы

Научно-образовательная

Поэзия

Приключения

Проза

Прочее

Религия и эзотерика

Справочная литература

Старинная литература

Техника

Фантастика

Фольклор

Юмор

Сигнал и шум. Почему одни прогнозы сбываются, а другие - нет

Сильвер Нейт

Шрифт: