Кaким бы простым ни кaзaлось дело, обрaтись к профессионaлу! Получится быстрее, качественнее, a главное, - дешевле!

Лабораторная работа по декомпозиции временных рядов и построению тренда
ЗАДАНИЕ 

Используя средства OpenOffice.Calc (MS Excel) решить следующие задачи (в соответствии с вариантом 1-11): 

1 (по таблице 1). Для ряда динамики построить кривую роста (уравнение парной линейной регрессии, которое определяет зависимость переменной от условного фактора времени – порядковых номеров наблюдений), определить ее значимость, точность и адекватность.

2 (по таблице 2). Провести сглаживание скользящей средней и скользящей медианой с шириной окна 3, 7, 12, построить и сравнить соответствующие графики. Сделать выводы по каждому пункту 

Цена: 1000 руб.

Краткая теория

В общем случае временной ряд состоит из регулярной и нерегулярной составляющих. Назовем величину регулярных составляющих уровнем ряда в момент t, а закон эволюции уровня во времени – тенденцией. Он характеризует существующую динамику развития процесса в целом. Нерегулярная составляющая отражает случайные колебания или шумы процесса. Очевидно, что регулярные и нерегулярные компоненты временного ряда ненаблюдаемы. Они являются теоретическими величинами. Обобщенная модель временного ряда может быть представлена как композиция из следующих составляющих:
Y = F(T,S, C, ɛ, W) ,
где Y – исходный временной ряд, ;
T – тренд характеризует общую тенденцию развития процесса, является детерминированной составляющей, определяемой влиянием постоянно действующих факторов;
S – сезонная составляющая описывает периодически повторяющиеся колебания относительно тренда;
C – циклическая составляющая описывает колебания относительно тренда с большей или меньшей регулярностью. Разница между C и S состоит в том, что S имеет регулярную периодичность, тогда как C имеет большую временную протяженность и проявляется через неравные промежутки времени. В большинстве исследований рядов циклическую составляющую не выделяют;
ɛ – нерегулярная случайная (несистематическая) остаточная компонента, возникает в результате действия неизвестных исследователю причин;
W – управляющая компонента, с помощью которой воздействуют на члены временного ряда с целью формирования его будущей траектории (управляемый прогноз). В большинстве случаев она принимается равной нулю.
Очевидно, что все перечисленные компоненты зависят от времени и имеют ту же размерность, что и исходный временной ряд. Между компонентами временного ряда существуют специфические функциональные отношения. В анализе временных рядов принято рассматривать две формы взаимосвязи между элементами: аддитивную, мультипликативную, а так же смешанную. Любой ряд можно описать в виде одной из таких составляющих или комбинации нескольких из них, т.е. каждый элемент временного ряда может быть представлен как комбинация вышеперечисленных элементов.
Надо, однако, помнить, что приведенная выше операция разложения (декомпозиции), допустимая с математической точки зрения и часто полезная для осознания механизма формирования изучаемого явления, может в некоторых случаях ввести в заблуждение. В частности, при таком подходе упрощением может оказаться предположение о независимом действии составляющих ряда.
Исследование временных рядов осуществляется с различными целями, поэтому применяемые подходы и методы для анализа каждого конкретного временного ряда зависят от поставленных задач, от специфики изучаемого процесса. Однако можно определить некоторую обобщенную схему анализа временного ряда:
1. Вычисляется тренд.
2. Если необходимо, определяются сезонная, циклическая и управляющая компоненты.
3. Определяется оценка нерегулярной составляющей, на основании которой оценивается качество построенной модели.
Определение тенденции ряда
Во временных рядах можно наблюдать тенденции трех видов:
1) тенденции среднего уровня (аналитически выражаются в виде функции f(t), вокруг которой варьируются фактические значения временного ряда);
2) тенденции дисперсии (отражает изменение отклонений эмпирических значений временного ряда от значений, вычисленных по уравнению тренда);
3) тенденции автокорреляции (отражают изменения связи между отдельными уровнями временного ряда).
В зависимости от вида тенденции конкретного временного ряда осуществляется выбор той или иной модели для его описания. В статистике имеется множество методов выделения тенденции среднего и дисперсии временного ряда. К ним относятся аналитические и механические способы сглаживания.
Аналитические методы выравнивания. Аналитические методы выравнивания предполагают наличие тенденции на протяжении всего временного ряда. Выявить тенденцию изменений временного ряда - значит установить, какая математическая функция наиболее пригодна для описания изучаемого явления. А зная это, можно рассчитать с той или иной степенью точности уровень интересующего нас показателя в нужный момент.
Следует сразу, же отметить, что применение математических моделей для прогнозирования имеет смысл только тогда, когда исследователь может на основе теоретического анализа «предугадать» тенденции развития и длительность их существования, ведь, сами тенденции тоже подвергаются изменениям.
Итак, применение аналитических методов выравнивания сводится к построению кривой роста – функции, аппроксимирующей ряд и отображающей зависимость исследуемого показателя от времени. Построение кривой роста включает два этапа: идентификацию, т.е. определение вида аппроксимирующей математической функции, и расчет коэффициентов кривой роста, например, методом наименьших квадратов. Параметры подобранной кривой остаются неизменными для всей известной части ряда.
Следует отметить, что выбор конкретного типа кривой роста должен учитывать характер аппроксимируемого ряда и быть обоснованным. Особенно это актуально при исследовании социально-экономических процессов, в которых, как известно, нерегулярная составляющая может быть значительной. Так, применение сложных математических функций (например, полиномов высоких порядков) увеличивает точность модели, но при этом не достигается нужная степень выравнивания, может быть неадекватно описан исследуемый процесс.
Механические методы выравнивания. Аналитические методы сглаживания предполагают этап идентификации, во время которого исследователь выбирает вид модели, т.е. не существует "автоматического" способа обнаружения тренда во временном ряде. Тем не менее, в некоторых случаях целесообразным представляется использование механического выравнивания временного ряда (например, если временные ряды содержат значительную ошибку). Механические методы часто применяются на практике в силу простоты расчета и достаточно высокой точности и сводятся к использованию различных методов сглаживания (фильтрации).
Итак, достаточно простым методом выявления тенденции развития процесса является сглаживание временного ряда, т.е. замена фактических уровней расчетными, имеющими меньшую дисперсию, чем исходные данные. Сглаживание всегда включает некоторый способ локального усреднения данных, при котором несистематические (нерегулярные) компоненты взаимно погашают друг друга. В общем случае процедура сглаживания состоит в следующем: выбирается интервал временного ряда, с использованием элементов которого определяется выровненное значение элемента ряда; далее интервал сглаживания перемещается вправо и рассчитывается следующий член выровненного ряда и т.д. К наиболее популярным методам сглаживания относятся: метод скользящей средней, медианное сглаживание, простое экспоненциальное сглаживание.
Метод скользящих средних. Самый общий метод сглаживания - скользящее среднее, в котором каждый член ряда заменяется простым или взвешенным средним соседних членов, где k - ширина "окна". Окно – это временной интервал, по которому производится усреднение.
В зависимости от того, какой элемент заменяется, различают центрированное (симметричное) и нецентрированное (асимметричное) скользящее среднее. По способу вычисления различают простое, взвешенное и экспоненциальное скользящее среднее.
Так, при использовании центрированной скользящей средней, для построения оценки тренда в точке t по значениям ряда из временного интервала [t – h, t + h] рассчитывают теоретическое значение ряда – в данном методе это простая средняя элементов указанного интервала. При выполнении процедуры происходит скольжение окном шириной k = 2h + 1 по всему ряду от начала до конца. Ширину окна обычно берут нечетной, так как теоретическое значение рассчитывается для центрального значения: количество слагаемых 2h+1 с одинаковым числом элементов слева и справа от момента t.
Введение весов позволяет приписать большие значения отдельным наблюдениям, например, более поздним наблюдениям.
Важная практическая задача состоит в нахождении оптимальных сглаживающих окон для конкретных временных рядов. Очевидно, имеются два предельных случая для ширины окна: число усредняемых значений очень мало – маленькое окно, или велико – большое окно. В первом случае флуктации ряда сглаживаются слабо во втором – флуктации существенно уменьшаются, но в сглаженном ряде возникает смещение - полученный ряд сдвигается относительно исходного. Этот сдвиг может существенно исказить существующую тенденцию ряда.
Чем больше интервал сглаживания, тем сильнее усреднение данных и менее изменчива выделяемая тенденция.
Метод не дает значений тренда для первых и последних h членов ряда. Тем не менее, чтобы не сужать область определения сглаженного ряда по сравнению с исходным, для устранения этих краевых эффектов используют различные методы. Например, для таких точек, за исключением концевых, вычисляется значение скользящей средней меньшего, максимально возможного порядка.
Метод центрированной скользящей средней имеет один существенный недостаток: сигнал о смене тенденции существенно запаздывает во времени. Однако необходимо как можно раньше определить смену тенденции, что можно делать с использованием нецентрированной (асимметричной) скользящей средней. Чем больше окно, тем большее запаздывание в отражении тенденции наблюдается у сглаженного ряда.
Медианное сглаживание. Если в описанном выше методе вместо среднего использовать медиану значений, попавших в окно, то приходим к методу медианного сглаживания. Для того чтобы найти значение скользящей медианы в точке t, вычисляется медиана значений ряда во временном интервале [t – h, t + h]. Медиана ряда во временном интервале определяется как центральный член вариационного ряда - последовательности значений ряда, входящих в этот временной интервал, упорядоченной по возрастанию. Соответствующее значение называется (2h+1) точечной скользящей медианой (СМ).
Основное преимущество медианного сглаживания по сравнению со сглаживанием скользящим средним состоит в том, что результаты становятся более устойчивыми к выбросам (имеющимся внутри окна). Если в данных имеются выбросы, то сглаживание медианой обычно приводит к более гладким кривым по сравнению со сглаживанием скользящим средним с тем же самым окном.
Основной недостаток медианного сглаживания в том, что при отсутствии явных выбросов он приводит к более "зубчатым" кривым (чем сглаживание скользящим средним) и не позволяет использовать веса.
Простое экспоненциальное сглаживание. Экспоненциальная средняя является примером асимметричной скользящей средней, в которой учитывается степень старения данных: чем старее информация, тем с меньшим весом входит она в формулу для расчета сглаженного значения уровня ряда St:
St = αyt + (1 – α)St-1,
где St – экспоненциальная средняя (в сглаживании участвуют все данные, полученные к текущему моменту t),
α – параметр сглаживания, характеризующий вес текущего (самого нового) наблюдения, 0 < α < 1.
По мере удаления от текущего момента времени в прошлое вес соответствующего члена ряда быстро (экспоненциально) уменьшается и практически перестает оказывать какое-либо влияние на значение St.