Как предсказать курс доллара. Эффективные методы прогнозирования с использованием Excel и EViews
Шрифт:
В алгоритме действий № 8 «Как оценить точность статистической модели в EViews» в самом общем виде уже говорилось об интерпретации параметров, характеризующих уровень точности статистической модели. Однако далее все желающие могут более подробно ознакомиться со спецификой параметров, содержащихся в табл. 3.6. «Оценка точности уравнения регрессии (статистической модели) с параметрами USDollar = 0,2260 + 1,2980 USDollar(-l) — 0,3047 USDollar(-2)».
В частности, Root Mean Squared Error (квадратный корень средней ошибки предсказания)
где Yt — фактические значения курса доллара;
^Yt — предсказанные значения курса доллара;
п — количество наблюдений;
е — ошибки (остатки) или разница между расчетным и фактическим значением курса доллара.
На основе имевшихся у нас данных квадратный корень средней ошибки предсказания по курсу доллара имеет следующее значение:
При этом следует иметь в виду, что величина квадратного корня средней ошибки предсказания всегда чуть больше стандартной ошибки, представленной, например, в «Выводе итогов в Excel для уравнения авторегрессии 2-го порядка AR(2)» (см. табл. 3.2). Это объясняется тем, что квадратный корень средней ошибки предсказания находится путем деления суммы квадратов остатков на общее количество наблюдений. В то время как стандартная ошибка находится путем деления суммы квадратов остатков на число степеней свободы. Так, в нашем случае квадратный корень средней ошибки предсказания равен 0,805567 (при общем числе наблюдений, равном 213), а стандартная ошибка равна 0,811301 (при 210 степенях свободы). Причем число степеней свободы для нашей статистической модели находят следующим образом:
df = п — k — 1 = 213 -2 -1 = 210,
где k — количество факторных переменных в статистической модели.
Mean Absolute Error (средняя ошибка) по модулю представляет собой абсолютную (без учета знака) сумму остатков (ошибок), деленную на общее количество наблюдений. Поскольку при сложении сумма остатков стремится к нулю, для нахождения средней ошибки приходится использовать их модульные значения. Средняя ошибка по модулю вычисляется по формуле
Для нашей статистической модели средняя ошибка по модулю равна:
Mean Absolute Percentage Error (средняя ошибка по модулю, %) равна сумме относительных ошибок (остатков), деленной на общее количество наблюдений. Средняя ошибка по модулю находится следующим образом:
В этом случае средняя ошибка по модулю имеет следующее значение:
Как мы уже говорили, по трем перечисленным выше параметрам — Root Mean Squared Error, Mean Absolute Error и Mean Absolute Percentage Error — выбор обычно делается в пользу той статистической модели, у которой значения этих параметров стремятся к нулю. Вполне очевидно, что чем меньше квадратный корень средней ошибки предсказания, средняя ошибка по модулю и средняя ошибка по модулю (%), тем выше прогностическая ценность модели. При этом следует иметь в виду, что все три перечисленных выше параметра имеют диапазон значений от нуля до бесконечности.
Несколько особняком стоят четыре остальных параметра,
представленных в табл. 3.6. Из них главным является Theil Inequality Coefficient (коэффициент неравенства Тейла), в то время как три других можно назвать производными от первого. При этом значения этих четырех параметров изменяются в пределах от нуля до единицы.Theil Inequality Coefficient служит для общей оценки качества прогностической модели. Как мы уже говорили, идеальным для статистической модели считается значение коэффициента Тейла, равное нулю. Таким образом, чем ближе этот коэффициент к нулю, тем ценнее предсказание.
Коэффициент неравенства Тейла находится по следующей формуле:
В нашем случае коэффициент Тейла имеет следующее значение:
Квадратный корень средней ошибки предсказания может быть разложен на слагаемые по следующей формуле:
где ^Yt — средняя величина фактических значений курса доллара;
S^y — стандартное отклонение предсказанных значений курса доллара;
Sy — стандартное отклонение фактических значений курса доллара;
r — коэффициент корреляции между фактическими и предсказанными значениями курса доллара.
Если мы найдем долю (относительно квадратного корня средней ошибки) каждого из трех слагаемых (см. формулу (3.30)), то в этом случае нам удастся вычислить еще три важных параметра, характеризующих качество прогноза, рассчитанного с помощью исследуемой статистической модели.
Так, Bias Proportion (доля систематической ошибки прогноза) служит своего рода индикатором, показывающим, насколько средняя величина прогнозируемого значения, например средняя величина прогноза по курсу доллара, отклоняется от средней величины его фактического значения. Причем идеальной считается ситуация, когда доля систематической ошибки предсказания равна нулю. При этом доля систематической ошибки находится по следующей формуле:
Чтобы найти долю систематической ошибки в предсказаниях, сделанных при помощи этой прогностической модели, нам пришлось проделать следующие вычисления:
Индикатор Variance Proportion (доля вариации) показывает, насколько отличаются друг от друга вариации фактических и предсказываемых значений, например курса доллара. Чем меньше доля этой вариации, тем лучше, а в идеале она должна быть равна нулю. Доля вариации находится по следующей формуле:
В Excel дисперсию и стандартное отклонение для генеральной совокупности данных можно вычислить с помощью соответствующих функций ДИСПР и СТАНДОТКЛОНП.
В нашей статистической модели доля вариации в предсказаниях оказалась равна:
Индикатор Covariance Proportion (доля ковариации) показывает долю несистематической ошибки в общей величине дисперсии ошибки предсказания. Поскольку этот индикатор показывает долю несистематической, остаточной ошибки в предсказаниях, которая присутствует во всех статистических моделях, то ее наличие не требует отказа от использования этого уравнения регрессии. Доля несистематической ошибки прогноза изменяется в диапазоне от 0 до 1. Причем в идеале этот показатель должен быть равен единице, чем он и отличается от всех остальных индикаторов, представленных в табл. 3.6.