Сигнал и шум. Почему одни прогнозы сбываются, а другие - нет
Шрифт:
Тем не менее эта книга побуждает читателей задуматься о сигнале и шуме и стремиться к использованию прогнозов, основанных на процентных или вероятностных показателях. Такие прогнозы более честно указывают границы наших способностей к предсказаниям. Когда предсказание какого-то сложного явления высказывается с явной убежденностью, это может считаться признаком того, что прогнозист недостаточно глубоко продумал проблему, что его статистическая модель обладает определенным оверфиттингом или что он больше заинтересован не в истине, а в создании себе имени.
Ни Армстронг, ни Шмидт не пытались придавать слишком большое значение своим прогнозам, касающимся температурного тренда. «Мы провели ряд симуляций за период с 1850 по 2007 г., – рассказал мне Армстронг. – Поэтому когда я изучил данные на 100 лет вперед, то посчитал, что практически наверняка выиграю свое пари» {893} . При этом Шмидт был
893
Армстронг был готов признать, что в краткосрочной перспективе имелись шансы на то, что его прогноз «без изменений» окажется ошибочным. В разговоре со мной он заметил, что, по его расчетам, шансы выиграть пари у Гора, смотревшего на данные о повышении температуры в ближайшем десятилетии, а не в следующем столетии, составляли около 70 %.
Помочь в разрешении спора могут методы статистического прогнозирования, о которых я упоминал выше. Именно они способны доказать, что ни Армстронг, ни Шмидт не были совершенно правы. Если вы будете измерять температурный тренд в масштабе десятилетий, то увидите, что тенденция к потеплению с 1900 г. проявлялась в течение 75 % времени, а в остальные периоды наблюдалось похолодание. По мере роста в атмосфере концентрации CO2, приводящей к усилению парникового эффекта, периоды стабильных или понижающихся температур должны становиться более редкими. Тем не менее они не являются невозможными, и вряд ли против этого исхода стоит заключать пари со ставками 100 к 1. Если вы вместо этого предположите, что уровни CO2 будут повышаться такими же темпами, то есть около 2 ppm в год, то вероятность того, что в рамках заданного десятилетия не будет наблюдаться потепление, составит примерно 15 % {894} .
894
Этот расчет основан на векторе ошибок коэффициента, связанного с ростом температуры в регрессионной модели. Он предполагает, что нам известен точный объем диоксида углерода и что он будет повышаться ежегодно в той же пропорции, что и между 2002 и 2011 гг. На практике модель немного недооценивает величину ошибки и, следовательно, недооценивает шансы на охлаждение в течение десятилетия, как из-за того, что точный объем CO2 неизвестен, так и в связи с неопределенностью, присущей самой модели.
Еще одна причина, по которой так важно учитывать неопределенность
Неопределенность представляет собой важнейшую и необсуждаемую часть прогноза. Мы замечаем, что порой именно честное и точное заявление о неопределенности помогает спасти имущество и жизни людей. В других же случаях, как, например, при торговле опционами на акции или ставках на команду НБА, вы можете делать ставки на свою способность точно прогнозировать неопределенность.
Однако есть и еще одна причина для тщательной и всесторонней количественной оценки неопределенности. Это крайне важно для научного прогресса, особенно при применении теоремы Байеса.
Предположим, в 2001 г. вы были априорно глубоко убеждены в правильности гипотезы о том, что промышленные выбросы углерода будут и дальше приводить к росту температуры. (С моей точки зрения, на тот момент подобное убеждение вполне может быть оправданным вследствие нашего хорошего понимания причинно-следственной связи между теорией парникового эффекта и эмпирических свидетельств.) Предположим, что вы оцениваете шансы на истинность гипотезы глобального потепления в 95 %.
Однако затем появились некоторые новые факты. В том числе тот, что в течение следующего десятилетия, с 2001 по 2011 г., глобальные температуры не росли. На самом деле они даже снижались, хотя и незначительно. В соответствии с теоремой Байеса вы должны уменьшить рассчитанные вами значения вероятности истинности гипотезы глобального потепления; вопрос лишь в том насколько.
Если вы правильно рассчитали степень неопределенности в краткосрочных температурных закономерностях, то это уменьшение не будет особенно большим. Как мы обнаружили выше, имеется примерно 15 %-ная вероятность того, что в течение десятилетия не произойдет итогового потепления (даже если гипотеза о глобальном потеплении верна). Причиной этого может быть вариабельность климата. Напротив, если считать температурные изменения совершенно случайными и непредсказуемыми, то вероятность, что в течение десятилетия произойдет охлаждение, составит 50 %, поскольку повышение и снижение температуры
вероятны в равной степени. Согласно теореме Байеса (табл. 12.2), десятилетие без потепления заставит вас изменить свои расчеты правильности гипотезы глобального потепления с 95 на 85 %.Таблица 12.2. Пример расчета вероятности глобального потепления по теореме Байеса
С другой стороны, если вы ранее утверждали, что вероятность того, что температура в течение десятилетия не повысится, составляет не более 1 %, то теперь вы оказываетесь в более сложном положении. Согласно теореме Байеса, вероятность истинности гипотезы глобального потепления снижается до 28 %.
Когда мы делаем достаточно четкие заявления, которые впоследствии не сбываются, это означает, что против нашей гипотезы появляются сильные аргументы. В этом случае нам некого винить за потерю веры в наши прогнозы; происходящее вполне точно определяется байесовской логикой.
Так для чего мы выступаем с конкретными заявлениями, особенно когда они не подкрепляются статистическими свидетельствами? Причин для этого может быть довольно много. Так, в ходе споров на тему климата участникам может показаться, что конкретные заявления выглядят более убедительными. И это действительно так, но лишь в тех случаях, когда заявления оказываются истинными. Попытки объяснить каждую погодную аномалию рукотворными изменениями климата, а не эффектом повышения температур, в честь которого и появился термин «глобальное потепление», – пример еще одной игры с высокими ставками, корни которой кроются скорее в политике, а не в науке. Мало найдется тех, кто согласен с высказыванием, что изменения климата выражаются только в повышении температуры и возможном повышении уровня моря. Но при этом довольно глупо считать, что каждый снегопад представляет собой свидетельство неверности теории в целом.
«Наши отношения с этими людьми – это состояние постоянной драки»
Фундаментальная дилемма, стоящая перед климатологами, заключается в том, что глобальное потепление представляет собой долгосрочную проблему, которая требует, однако, быстрого решения. Поскольку диоксид углерода остается в атмосфере очень длительное время, действия, предпринятые нами сегодня, повлияют на жизнь будущих поколений.
В идеально рациональном и доброжелательном мире это не было бы основанием для беспокойства. Однако наши политические и культурные учреждения просто не приспособлены для эффективного решения подобных проблем: Конгресс Соединенных Штатов должен думать о выборах, проходящих каждые два года, а компании вынуждены стремиться к тому, чтобы каждый квартал соответствовать ранее созданным прогнозам о доходах. Климатологи реагируют на эту ситуацию по-разному. Кто-то начинает активнее участвовать в политических дебатах, а кто-то, напротив, воздерживается от публичности.
Майкл Манн, директор Центра изучения систем Земли Пенсильванского университета, в какой-то момент оказался в самом центре противостояния, получившего название «Климатгейт». Причиной его стал взлом сервера отделения климатологии (Climatic Research Unit (CRU)) Университета Восточной Англии {895} с данными о температурах, которые используются метеорологической службой Великобритании. Скептики утверждали, что Манн и другие ученые вступили в заговор с целью манипуляции температурными данными CRU.
895
«Climatic Research Unit E-Mail Controversy»; Wikipedia.org. http://en.wikipedia.org/wiki/Climatic_Research_Unit_email_controversy.
Через какое-то время другие профессионалы полностью опровергли предположение о недобросовестности своих коллег-ученых {896} , и было доказано, что температурные данные CRU вполне соответствуют данным из других источников {897} . Однако преданная гласности электронная переписка показала, что Манн и остальные ученые уделяли большое внимание «маркетинговой» точке зрения на научную область своих занятий. Манн с удовольствием обсуждает эту проблему. Для этого я и приехал в его университетский офис холодным осенним днем, и мы проговорили примерно два часа.
896
Henry Chu, «Panel Clears Researchers in ‘Climategate’ Controversy», Los Angeles Times, April 15, 2010. http://articles.latimes.com/2010/apr/15/world/la-fg-climate-data15%E2%80%932010apr15.
897
Включая спутниковые данные, обработанные частными компаниями.