Кaким бы простым ни кaзaлось дело, обрaтись к профессионaлу! Получится быстрее, качественнее, a главное, - дешевле!

Лабораторная работа по анализу качества модели и прогнозированию
ЗАДАНИЕ 


Используя результаты предыдущей лабораторной работы, провести анализ точности и адекватности построенных сезонных моделей, выбрать лучшую модель и построить по ней прогноз.

Сделать выводы по каждому пункту. 

Цена: 1000 руб.

Краткая теория

Поскольку определение оценок коэффициентов модели производится, как правило, по искаженным помехами экспериментальным данным, то естественно, это отражается на их точности. Точность характеризует близость рассчитанных по модели показателей фактическим на периоде аппроксимации. Считается, что модели с меньшим расхождением между фактическими и оцененными по модели значениями показателей лучше описывают исследуемый процесс.
Источником ошибок также может явиться несоответствие кривой роста, описывающего изменение временного ряда, и действительным характером этого процесса. В этом случае говорят о неадекватности представления временного ряда данной моделью.
Оценивание качества модели заключается в проверке ее адекватности и точности. Для оценивания качества модели используют показатели, основанные на анализе остатков. При выделении регулярных компонент предполагается, что нерегулярная компонента, удовлетворяет определенным условиям, а именно: случайности, нормальности, равенства нулю математического ожидания и неавтокоррелированности.
Как уже отмечалось, точность модели характеризует близость рассчитанных по модели показателей фактическим на периоде аппроксимации, т.е. чем ближе аппроксимирующая функция к реальным значениям показателя, тем модель точнее.
Для получения точных оценок число наблюдений должно значительно превосходить число оцениваемых коэффициентов модели.
Для оценки точности модели могут быть использованы следующие показатели [11,16,34,42]:
1.Дисперсия остатков модели (дисперсия адекватности). Также может быть использовано среднеквадратичное отклонение остатков.
2. Стандартная ошибка.
3.Относительная ошибка аппроксимации.
Модель считается достаточно точной, если ɛ меньше 10…20%.
4.Коэффициент сходимости.
5.Коэффициент детерминации.
6.Индекс корреляции (корреляционное отношение).
Показатели 4,5 имеют F-распределение с n – q и n – 1 степенями свободы. Модели считаются более точными, если показатели 1-4 имеют минимальное значение, а 5,6 – максимальное.
Проверка равенства математического ожидания остатков нулю. Проверка нуль-гипотезы осуществляется с помощью t-критерия Стьюдента [11].
Проверка на случайность. Проверка случайности колебаний уровня остаточной компоненты состоит в оценке гипотезы о ее независимости от времени. Проверка осуществляется по критерию пик.
Определяем – число пик в анализируемом временном ряде. Наличие пика характеризуется условиями:
Математическое ожидание числа пиков и дисперсия определяется по следующим формулам:
Условие независимости выглядит следующим образом:
где t - квантиль распределения Стьюдента.
Проверка на нормальность. Эта проверка состоит в определении соответствия распределения остаточной компоненты нормальному закону распределения [3,11,36,42]. Для этой цели обычно используются коэффициенты асимметрии и эксцесса. Эти коэффициенты позволяют сделать предварительные заключения о близости изучаемого распределения к нормальному.
Коэффициент асимметрии (выборочная характеристика асимметрии) характеризует смещение распределения остатков относительно математического ожидания и определяется по формуле:
СКО коэффициента асимметрии:
Показатель эксцесса (выборочная характеристика эксцесса) характеризует остроконечность распределения по сравнению с нормальной кривой и определяется следующим образом:
СКО коэффициента эксцесса:
Для нормального распределения эти коэффициенты равны нулю. Распределение принято считать нормальным, если выполняются условия:
Если выполняется хотя бы одно из неравенств:
то данные не являются даже приблизительно нормальными и их применение в дальнейшем не рекомендуется.
Степень близости остатков к нормальному распределению также можно оценить визуально, построив гистограмму остаточной компоненты и сравнив ее с ожидаемым нормальным распределением (с нулевым математическим ожиданием и дисперсией).
Проверка на неавтокоррелированность. Проверка независимости значений ряда остаточной компоненты осуществляется на основе критерия Дарбина-Уотсона [11,16,27,36,42].
Значения критерия находятся в интервале [0..4]. Если значение DU близко к 2, то автокорреляция остатков отсутствует и оценка сглаживающей функции принимается.
Автокорреляцию остатков можно определить с помощью автокорреляциионных функций (АКФ или ЧАКФ).
Имея данные по отдельным показателям точности и адекватности модели, трудно сделать окончательный вывод о качестве модели в целом, тем более трудно из нескольких моделей выбрать лучшую. Гораздо удобнее использовать некий обобщенный критерий качества модели, который формируется, например, как взвешенная сумма интегрированного критерия точности с весом 0.75 и критерия адекватности с весом 0.25. Для определения критерия точности возможно использование нормированного значения относительной ошибки аппроксимации, коэффициента детерминации, а для критерия адекватности - критерий Дарбина-Уотсона, показатели близости к нормальному распределению….
Перед тем, как использовать отдельные показатели качества в обобщенном критерии требуется их нормировать. Нормированные критерии получаются из рассчитанных по формулам таким образом: нормированный критерий равен 100, если модель абсолютно точная (адекватная) и равен 0, если модель абсолютно неточная (неадекватная).
Числовое значение обобщенного критерия качества лежит в диапазоне от 0 до 100 (минимум соответствует абсолютно плохой модели, максимум – идеально отображающей развитие исследуемого процесса модели). Опыт применения этого показателя показывает, что достаточно надежными являются модели, имеющие оценку качества не менее 75
В результате анализа модели мы убеждаемся в адекватности построенной модели, а следовательно, в ее пригодности для дальнейшего использования.
Для того, чтобы построить прогноз по уравнению регрессии, необходимо располагать значениями независимых переменных. Прогнозы, полученные по регрессионной модели, подразделяются на условные (независимые переменные точно неизвестны и определяются на основе прогноза) и безусловные (независимые переменные известны точно).
Итак, подставив в уравнение регрессии конкретные значения независимых переменных, мы можем получить точечный прогноз.
Для прогнозирования по модели на основе декомпозиции временного ряда необходимо построить прогноз каждой компоненты и в соответствии с видом модели объединить.
Очевидно, что совпадение фактических данных в будущем и прогностических точечных оценок маловероятно. Поэтому необходимо построить доверительный интервал. Ширина доверительного интервала определяет точность модели. Чем уже доверительный интервал, тем более точная модель.
Величину доверительного интервала можно определить по формуле.