Чтение онлайн

ЖАНРЫ

Как предсказать курс доллара. Эффективные методы прогнозирования с использованием Excel и EViews
Шрифт:

Судя по тому, что коэффициент асимметрии (Skewness) в табл. 6.16 положителен, можно прийти к выводу, что в распределении остатков, полученных по стационарной модели, наблюдается положительная асимметрия. Отсюда можно сделать вывод, что в динамике курса доллара к рублю чаще наблюдались резкие (вполне очевидно, что незначительные плавные колебания курса легко поддаются прогнозированию) подъемы, чем аналогичные падения. В свою очередь величина коэффициент эксцесса (Kurtosis) существенно выше 3, что свидетельствует об «островершинном» распределении остатков. По сути, это означает, что в этом распределении имеется ярко выраженное ядро плотности распределения, внутри которого диапазон колебаний величины остатков незначителен, и рассеянное «гало», где разброс колебаний величины остатков весьма значителен. Поскольку величина тестовой статистики Жарка — Бера составила 11990,08, а уровень ее значимости (Probability) оказался равен нулю, то, следовательно, мы вынуждены

отвергнуть гипотезу о нормальном распределении остатков. Поскольку, как мы уже говорили нашим читателям, при уровне значимости критерия Жарка — Бера (Probability) меньше 0,05 нулевая гипотеза о нормальном распределении отклоняется.

В EViews есть возможность посмотреть в графическом виде оценку ядра плотности распределения с помощью опций DISTRIBUTION/ KERNEL DENSITY GRAPHS… (распределение/графики ядра плотности распределения). В появившемся мини-окне KERNEL DENSITY (ядро плотности распределения) установим опцию EPANECHNICOV. В результате получим рис. 6.11, наглядно показывающий «островершинный» характер распределения остатков с правосторонней асимметрией.

Для проверки остатков на стационарность воспользуемся расширенным тестом Дикки — Фуллера. Следует заметить, что проверку остатков на стационарность также целесообразно проводить относительно логарифмических остатков. После проведения тестирования мы убедились, что получили стационарные остатки (табл. 6.17). Поскольку статистика теста Дикки — Фуллера в этом случае составила -15,61466, а ее значимость (Probability) равна 0,0000, то нулевая гипотеза о том, что D(RESID) имеет единичный корень, отвергается. Следовательно, мы можем принять альтернативную гипотезу о стационарности полученных остатков.

Несмотря на то что остатки, полученные по стационарной модели, нельзя считать нормально распределенными, мы тем не менее уже знаем, что при больших выборках можно строить интервальные прогнозы исходя из их нормального распределения. Поэтому нашим следующим шагом будет расчет интервальных прогнозов не только на июль 2010 г. (курс доллара по этому месяцу не включен в базу данных), но и для всех наблюдений, на основе которых составлена статистическая модель log(USDollar) = с + а x log(USDollar(-1)) + МА(1). Это поможет нам проверить соответствие составленных интервальных прогнозов нормальному распределению, поскольку уровень надежности для интервальных прогнозов рассчитывался исходя из предположения о нормальном распределении остатков. Попутно заметим, что интервальные прогнозы будут построены начиная с июля 1992 г., поскольку первое наблюдение во временном ряде нам потребовалось для создания факторной переменной log(USDollar(-l).

После того как на основе алгоритма действий № 12 будут составлены соответствующие интервальные прогнозы, у нас появится возможность сопоставить заданные уровни надежности с фактической долей точных интервальных прогнозов. Судя по табл. 6.18, доля точных прогнозов оказалась незначительно ниже заданного уровня надежности при 99,9 %-ном и 99 %-ном уровнях надежности и практически ему равна при 95 %-ном (отклонение на -0,1 процентного пункта). Однако при 90 %-ном уровне надежности и более низких уровнях доля фактических прогнозов становится выше заданного уровня. Причем эта положительная разница растет при снижении уровня надежности, достигая своего максимума при 40 %-ном уровне надежности, когда она равна 36 процентным пунктам.

Однако если сравнить табл. 6.18, характеризующую точность интервальных прогнозов для стационарной модели log(USDollar) = с + а x log(USDollar(-l)) + МА(1), с табл. 4.8, которая характеризует их точность для нестационарной модели USDOLLAR= а х USDOLLAR(-l) + а x USDOLLAR(-2), то выяснится, что последняя модель с этой точки зрения несколько точнее.

Еще более серьезным минусом интервальных прогнозов, составленных по стационарной модели log(USDollar) = с + а x log(USDollar(-l)) + + МА(1) за весь период наблюдений (т. е. на основе данных с июля 1992 г. по июнь 2010 г.), являются слишком широкие интервалы прогнозов для большей части временного ряда, начиная с октября 1999 г. Так, при прогнозе на июль 1992 г. общий диапазон интервального прогноза (верхняя граница интервального прогноза минус нижняя граница интервального прогноза) при 95 %-ном уровне надежности составил лишь 4 коп. (табл. 6.19), в то время как фактическое значение курса доллара было равно лишь 16,12 коп. В свою очередь при прогнозе на июль 2010 г. общий диапазон интервального прогноза был равен 8 руб. 32,27 коп., а фактический курс доллара составил 30 руб. 18,69 коп. При этом в июле 1992 г. диапазон интервального прогноза составлял 25,77 % от фактического курса доллара, а в июле 2010 г. его доля в стоимости курса американской валюты равнялась 27,57 %, в то время как для нестационарной модели доля интервального прогноза для последнего наблюдения равнялась 10,62 %.

6.6. Построение стационарной модели ARMA с оптимизированным временным рядом

Чем

же объясняется слишком широкий диапазон интервальных прогнозов для большей части наблюдений, полученных по модели log(USDollar) = с + а x log(USDollar(-l))? Ведь мы уже знаем, что если временной ряд является слабо стационарным, то это означает отсутствие, во-первых, тренда; во-вторых, строго периодических колебаний; в-третьих, систематических изменений дисперсии; в-четвертых, каких-либо иных систематических изменений во временном ряде (см. главу 1). Если систематические изменения дисперсии отсутствуют, то, следовательно, и абсолютная величина диапазона интервального прогноза не должна с течением времени существенно изменяться. Тем не менее по абсолютной величине интервальные прогнозы существенно изменились, что очевидно связано с неправильной спецификацией статистической модели.

Правда, если мы будем составлять интервальные прогнозы относительно логарифмического ряда данных, то в этом случае разница в их диапазоне относительно первого и последнего наблюдения будет не столь значительной. Так, для июля 1992 г. доля диапазона интервального прогноза составит 3,71 % от логарифмического фактического курса доллара, а в июле 2010 г. — 1,97 %.

Почему же стационарная модель log(USDollar) = с + а x log(USDollar(-l)) + МА(1) не позволяет построить прогнозы с оптимальной шириной интервальных прогнозов при переходе к исходному временному ряду? В главе 1 (см. 1.2) мы уже научились распознавать стационарность временного ряда с помощью построения его графика. Попробуем построить аналогичный график для логарифмических остатков (за период с июля 1992 г. по июнь 2010 г.), полученных в результате решения уравнения регрессии по стационарной модели log(USDollar) = с + а x log(USDollar(-l)) + МА(1). В результате получится диаграмма, изображенная на рис. 6.12.

Исходя из рис. 6.12 можно сделать следующие выводы: во-первых, большая часть логарифмических остатков, полученных по стационарной модели log(USDollar) = с + а x log(USDollar(-l)) + МА(1), колеблется примерно в одном диапазоне вокруг нулевого уровня; во-вторых, с течением времени волатильность логарифмических остатков постепенно снижается; в-третьих, на графике видны три значительных всплеска волатильности остатков, однако последний всплеск по сравнению с предыдущими явно незначительный. Отсюда можно сделать вывод, что логарифмические остатки стационарной (точнее сказать, слабо стационарной) статистической модели асимптотически стремятся к относительно узкому диапазону колебаний, т. е. становятся все более стационарными, однако на начальном этапе временного ряда эти колебания еще довольно велики.

Таким образом, чтобы получить оптимальную ширину интервальных прогнозов для стационарной модели log(USDollar) = с + а x log(USDollar(-l)) + МА(1), необходимо убрать из базы данных часть временного ряда с наиболее волатильными остатками. Для отсечения наиболее волатильной части остатков будем использовать тест Чоу на точность прогноза. Исходя из рис. 6.12 и с учетом данных табл. 5.4 «Рейтинг наблюдений по величине скачка курса доллара», которые показывают максимальный рост волатильности после дефолта августа 1998 г., проведем тест на точность прогноза относительно сентября 1998 г. В результате получим табл. 6.20, согласно которой нельзя сделать однозначный вывод о наличии структурного изменения. Дело в том, что уровень значимости (Probability) F– критерия получился больше 0,05, что свидетельствует в пользу нулевой гипотезы об отсутствии структурных изменений. Однако уровень значимости LRстатистики равен 0,001354, что существенно меньше 0,05 и однозначно говорит о наличии структурного изменения. В этой ситуации более надежна LR-статистика, поскольку F– критерий предполагает наличие независимых и нормально распределенных остатков, чего не может быть по определению при решении уравнений авторегрессии. Поэтому нулевая гипотеза о стабильности временного ряда, включающего наблюдения с сентября 1998 г. по июнь 2010 г., отвергается.

Далее проведем тест на точность прогноза относительно октября 1998 г. В результате получим табл. 6.21, согласно которой можно сделать однозначный вывод о структурной стабильности выделенного временного ряда. Поскольку уровень значимости (Probability) F– критерия получился больше 0,05 и уровень значения LR– статистики оказался равен 1,0, что однозначно говорит об отсутствии структурного изменения, нулевая гипотеза о стабильности временнoго ряда, включающего наблюдения с октября 1998 г. по июнь 2010 г., принимается.

Исходя из результатов теста Чоу на точность прогноза построим статистическую модель log(USDollar) = с + а x log(USDollar(-l)) + МА(1) на основе данных за период с октября 1998 г. по июнь 2010 г. Вывод итогов после решения этого уравнения представлен в табл. 6.22, из которой следует, что уровень значимости у всех переменных, включенных в модель, оказался равен нулю и все они оказались статистически значимыми, как при 5 %-ном, так и при 1 %-ном уровне значимости.

Поделиться с друзьями: