Навігація
Головна
Декомпозиція генеральної метиКласична декомпозиціяДекомпозиція часового ряду за допомогою LOESSТеорема декомпозиції ВольдаСЕЗОННА декомпозиція і ТРЕНД-СЕЗОННІ МОДЕЛІ
 
Головна arrow Економіка arrow Методи соціально-економічного прогнозування. Т.2.
< Попередня   ЗМІСТ   Наступна >

Декомпозиція "Х-12"

Для того щоб вирішити частину проблем, властивих методу класичної декомпозиції, бюро перепису населення США (CENSUS) в 1967 р розробило метод Х-11 [1], який тривалий час вважався стандартом при декомпозиції часових рядів. У 1980-х рр. був розроблений метод Х-11 - ARIMA, заснований на Х-11 і застосуванні в декомпозиції моделей авторегресії зі ковзної середньої (про яку ми докладніше розповімо в гл. 8). На зміну методу Х-11 в 1990-х рр. прийшов метод Х-12, а вже наприкінці 1990-х його доповнив метод Х-12 - ARIMA [2], який і вважається стандартом на даний момент. Розповімо докладніше про метод Х-12.

У рамках даного підходу розглядається проста адитивна модель, що складається з наступних елементів:

(6.16)

Тут мається на увазі, що в трендовую компоненту крім самої функції тренда включається ще й додаткова регресійна компонента:

де f (t) - функція тренда; Z t - регресійна компонента, запроваджувана для того, щоб виловити ряд спеціальних ефектів; TD t - ефект "торгових днів" (вплив вихідних днів на підсумкове значення показника); Е t - ефект "Великодня" ; Про t - ефект "викидів". Ефект "Великодня" було вирішено ввести після того, як в 1986-му р великодні вихідні значно вплинули на імпорт продукції в США.

Звернемося до самого алгоритму декомпозиції. Так як метод розроблявся в першу чергу для декомпозиції місячних часових рядів, ми розглянемо його для прикладу даних з s = 12.

Для початку вихідний ряд даних піддається перетворенню Боксу - Кокса (що можливо у випадку, якщо всі елементи часового ряду позитивні) [3]:[3]

(6.17)

де x t - значення по вихідному ряду даних на спостереженні t.

Як ми зазначали раніше, мультиплікативна декомпозиція може бути записана у логарифмах (6.3). Тому дане перетворення дозволяє прийти до адитивної моделі у випадку, якщо λ = 1, або мультиплікативної, якщо λ = 0. Проміжні значення дають статечні перетворення вихідного ряду даних. На практиці значення λ підбирається так, щоб дисперсія результуючих помилок не змінювалася зі зміною рівня ряду.

Після перетворення Боксу - Кокса до вихідного ряду даних застосовується SMA (12), після чого відбувається повторне згладжування ковзної середньої другого порядку. Це дозволяє отримати більш гладкий ряд, що містить мінімальну кількість помилок, а також перше наближення до оцінки сезонної компоненти, яка розраховується за формулою (6.8). Варто зауважити, що якщо ряд даних після перетворення Боксу - Кокса був приведений до ряду в логарифмах, то використання формули (6.8) рівноцінно розрахунком сезонних компонент за наступною формулою: звідки фактично випливає формула (6.9).

Для позначення кроків, па яких виходять ті чи інші дані, ми будемо використовувати верхній індекс у формулах. Так, сезонні компоненти, отримані на даному кроці, ми позначимо як.

Отримані сезонні компоненти упорядковано за відповідними місяцями, і відбувається згладжування всіх місячних компонент (наприклад, спочатку - всіх січневих) простими легкими середніми третього порядку. Після цього згладжений ряд згладжується повторно такий же ковзної середньої для того, щоб позбутися від помилок в сезонних складових і отримати більш гладку тенденцію. У результаті виходить згладжений ряд сезонних коефіцієнтів, який можна позначити як. Відсутні па кінцях спостереження замінюються останніми отриманими значеннями.

Даний пункт вимагає пояснення. Якщо ми розглянемо сезонні компоненти деякого ряду даних (наприклад, розглянутий нами ряд № 2 568) у розрізі місяців, то побачимо, як змінюється з року в рік значення по кожному місяцю (рис. 6.12).

Зміна сезонних компонент для ряду № 2568 по роках в кожному місяці

Рис. 6.12. Зміна сезонних компонент для ряду № 2 568 по роках в кожному місяці

data-override-format="true" data-page-url = "http://stud.com.ua">

Як бачимо, практично за всіма місяцями спостерігається нерівномірне зміна значень ряду. Сезонні компоненти досить часто самі мають деяку тенденцію до зростання або зниження. Якщо використовувати просту середню (на рис. 6.12 вони позначені горизонтальними лініями), то будуть отримані некоректні оцінки сезонних компонент. Саме тому в даному методі пропонується їх згладити легкими середніми.

Після того як це зроблено перший раз, розраховуються помилки по сезонним коефіцієнтам за формулою

(6.18)

де - величина сезонної помилки.

В отриманому ряді помилок але місяцям зменшуються екстремальні значення так, щоб помилки по січень були порівнянні один з одним. Здійснюється це на основі розрахунку середньоквадратичного відхилення (СКО) але залишкам (σ). Всі значення, що виходять за межі, відкидаються. Це потрібно для того, щоб у підсумку отримати ряд сезонних коефіцієнтів без сильних "викидів" при повторному згладжуванні. В результаті цієї операції виходить ряд модифікованих помилок, які тепер вже складається з низкою, що дає новий набір сезонних коефіцієнтів. Далі операція зі згладжування сезонних коефіцієнтів по місяцях повторюється і виходить новий набір згладжених сезонних коефіцієнтів, що не містить на відміну від ряду екстремальні значення помилок.

На наступному кроці відбувається десезоналізація вихідного ряду даних за тією ж формулою, що і в (6.14), але вже з використанням нового отриманого ряду сезонних коефіцієнтів:

(6.19)

де - перший десезоналізірованний ряд даних, що включає в себе як трендовую компоненту, так і помилки.

Потім для більш точного виокремлення тренда до нового десезоналізірованному ряду застосовується не проста змінна середня, а фільтр Хендерсона, суть якого полягає в тому, щоб розподілити ваги між спостереженнями не рівномірно (як це здійснено в простий ковзної середньої), а по деякому алгоритму, в якому "середнім" спостереженнями задаються великі ваги, а спостереженнями "на краях" - менші. Приклад таких ваг для місячних даних представлений на рис. 6.13.

 Розподіл ваг Хендерсона між спостереженнями

Рис. 6.13. Розподіл ваг Хендерсона між спостереженнями

Як бачимо, найбільші ваги розподіляються між сусідніми 6, 7 і 8 спостереженнями, іншим спостереженнями задаються менші ваги. Спостереження 1, 2, 12 і 13 отримують негативні ваги. Цей фільтр дає більш гладкий ряд даних, але його використання продиктовано в першу чергу проблемою "кінцевих точок": в даному випадку можна використовувати "асиметричні ваги", виведені спеціально для отримання згладженого ряду на кінцях, так що ніякі спостереження не випадають з розгляду. Детальніше про фільтр Хендерсона і про те, як саме виводяться ці ваги, можна прочитати в статті М. Дохерті [4].[4]

Отримавши ряд, згладжений фільтром Хендерсона, повторюється алгоритм з розрахунком і згладжуванням сезонних коефіцієнтів і обчисленням сезонних помилок, описаний нами раніше, проте на даному етапі спочатку використовується SMA (5), а потім - SMA (3). В результаті цих трудомістких обчислень виходить новий ряд згладжених сезонних коефіцієнтів, який вже вважається фінальним. На його основі розраховується новий десезоналізірованний ряд даних:

Цей ряд так само згладжується фільтром Хендерсона, в результаті чого виходить кінцева оцінка тренда На основі цієї остаточної оцінки і десезоналізірованного ряду розраховується ряд фінальних помилок:

У результаті всіх цих розрахунків у розпорядженні дослідника виходить три ряди даних:

1) - ряд згладженою трендовою компоненти;

2) - ряд згладженої сезонної компоненти;

3) - ряд помилок, що містить в собі всі згадані раніше ефекти Z t.

Для виокремлення ефектів Z t по залишках будується регресійна модель виду:

(6.20)

Для виокремлення торгових днів у кожному місяці розраховується число днів тижня і записується у відповідні змінні: x 1t - число понеділків, x 2t - число вівторків і т.п. Регресорів х 7t забирається з моделі для уникнення пастки фіктивних змінних. Регресорів x 8t дорівнює нулю всюди, крім березня і квітня, в яких його значення дорівнює числу днів між пасхальним воскресінням і 22 березня (що вважається самій ранній теоретично можливою датою Великодня). Якщо Пасха випадає на квітень, березневе значення регресорів дорівнює нулю. Якщо ж на березень, то нулю дорівнюватиме вже квітневе значення. Останнє значення х it являє собою набір фіктивних змінних, що характеризують наявність в певних місцях таких ефектів, як різкий "викид", зміна рівня ряду, тимчасові різкі зміни тенденцій і т.п.

Після отримання всіх складових і оцінки регресійної компоненти прогнозист може підібрати підходящу модель для трендової компоненти, що дозволяє побудувати прогноз показника, після чого застосувати ряд сезонних коефіцієнтів і регресійну компоненту, що дозволить отримати більш точний прогноз для сезонного ряду.

Як бачимо, цей метод значно складніше методу класичної декомпозиції, проте на виході дослідник отримує трендовую і сезонну компоненти з мінімальним вмістом помилок. Головний же недолік методу полягає в тому, що для нормальної оцінки всіх компонент потрібна велика кількість спостережень. Так, щоб згладити ряд сезонних коефіцієнтів двома SMA (3) потрібно мати дані як мінімум за п'ять років, і то одержуваний в такому випадку результат буде незадовільним (через проблеми з кінцевими точками).

Можна помітити, що метод в цілому можна застосувати не тільки для оборотних, але й незворотне. Однак, незважаючи на можливість більш повної декомпозиції ряду, він не дозволяє будувати ефективні прогнози по незворотних процесів, оскільки не має на увазі адаптацію окремих компонент часового ряду - в його основі лежить припущення про те, що ніяких істотних змін у вихідному ряді даних за весь спостережуваний період не відбувається (крім описаних "статистично нестандартних" ситуацій з "викидами"),

У методі Х-12 - ARIMA для оцінки трендової і сезонної компонент використовується модель SARIМA (Seasonal

ARIMA - сезонна коінтегрірованная авторегресійна модель зі ковзної середньої), про яку докладніше буде розказано в параграфі 8.4. Побудова регресійної компоненти відбувається аналогічно тому, як це відбувається в методі Х-12.

На закінчення варто зауважити, що метод Х-12 - ARIMA вимагає наявності даних мінімум за три роки. При цьому в прогнозуванні компонент рекомендується користуватися моделями трендів. У разі наявності даних за 3-5 років ARIMA може бути побудована, проте оцінка ефектів торгових днів і Великодня в такому випадку буде малопотужною (через малу числа спостережень). Для найбільш ефективної роботи Х-12 - ARIMA потрібні дані не менш ніж за п'ять років.

Підводячи підсумок описаною методикою, можна виділити наступні переваги Х-12 - ARIMA:

1. Декомпозиція допускає зміну сезонних коефіцієнтів в часі.

2. Метод враховує можливі сплески показника, викликані святковими та вихідними днями.

3. Під час застосування методу перші й останні спостереження у ряді даних нс випадають з розгляду.

4. Метод робастен. "Викиди", що лежать за межами 2,5σ, відсікаються, що дозволяє прибрати їх вплив па фінальні значення компонент.

До недоліків можна віднести наступне:

1. Метод складний сам по собі і складається з величезного числа елементів, виведених на основі емпіричних досліджень. Пояснення тим чи іншим діям в методі немає, тому доводиться приймати на віру те, що після застосування однієї ковзної середньої високого порядку потрібно застосувати ще кілька ковзних середніх нижчого порядку.

2. Метод розрахований на роботу з місячними чи квартальними даними. Застосувати його, наприклад, для обліку сезонності у тижневих даних не представляється можливим.

3. Велика частина елементів методу автоматизована і не регулюється дослідником, через що, наприклад, немає можливості контролювати ступінь згладжування окремих компонент ряду.

Для автоматичної декомпозиції часового ряду за допомогою Х-12 - ARIMA бюро CENSUS розробило спеціальну програму, яку можна безкоштовно завантажити з їх сайту: census.gov/srd/www/xl2a/.

Розглянемо декомпозицію за допомогою Х-12 на прикладі ряду № +1683 з бази М3. Для декомпозиції ряду ми скористаємося комерційної програмою Eviews, в якій даний метод вже реалізований.

Ряд № 1 683 ми розглядали в параграфі 6.3 і прийшли до висновку, що найкраще даний ряд опише мультиплікативна сезонна модель. Ми дотримуватимемося цього висновку і трансформуємо вихідний ряд даних з λ = 0.

Фільтр Хендерсона залишимо таким, яким він заданий за замовчуванням. Це означає, що програма самостійно визначить, в яких випадках який фільтр застосувати. Зазвичай для цього розраховується відношення середньої по залишках до середньої по трендової компоненті. Якщо це відношення виявляється вище 3,49 (що говорить про те, що модель має систематичне заниження), то береться фільтр з 23 вагами (що в кращому ступені згладжує ряд і дозволяє дати більш точну оцінку трендової компоненти). Якщо відношення лежить в межах від 1 до 3,49, то береться фільтр з тринадцятого вагами. В інших випадках використовується фільтр з 9-ма вагами.

Що стосується регресійних складових, то ми спробуємо оцінити тільки вплив торгових днів і великодніх свят, які теоретично могли вплинути на відвантаження продукції. Викиди оцінювати ми не будемо, так як в явному вигляді їх немає і вказати їх наявність на даному етапі вкрай важко.

Всі розрахунки в Х-12 здійснюються автоматично по описаному вище алгоритму, тому в результаті ми отримуємо кілька рядів даних, що складаються з трендової, сезонної компонент і залишків (рис. 6.14).

У результаті декомпозиції за допомогою Х-12 ми отримали більш гладкий тренд, ніж у випадку з класичною декомпозицией, і інший набір сезонних коефіцієнтів, які, як легко помітити, змінюються з року в рік. Всі ці відмінності в першу чергу викликані тим, що метод Х-12 дозволяє сезонним коефіцієнтам мінятися в часі, на відміну від методу класичної декомпозиції. На рис. 6.15 показані сезонні компоненти, отримані за допомогою Х-12 в динаміці.

Як ми можемо помітити, практично у всіх сезонах спостерігаються деякі зміни в часі, що відбуваються не в одному напрямку: деякі сезонні компоненти зростають, у той час як інші - зменшуються. Це показує, що ми маємо справу з еволюційним поруч даних. Горизонтальними лініями на графіку показані середні величини - це приблизно ті ж значення, які ми отримали б, якби ввели допущення про те, що сезонні коефіцієнти з року в рік не змінюються (що лежить в основі класичної декомпозиції).

Сезонна декомпозиція ряду № +1683 за допомогою Х-12

Рис. 6.14. Сезонна декомпозиція ряду № +1683 за допомогою Х-12

Динаміка сезонних компонент після декомпозиції ряду № тисячі шістсот вісімдесят три методом Х-12

Рис. 6.15. Динаміка сезонних компонент після декомпозиції ряду № 1 683 методом Х-12

Крім компонент, зображених на рис. 6.14, була побудована регресія (6.20) по ефектах (рис. 6.16).

Регресія по ефектах торгових днів і Великодня в моделі Х-12 - ARIMA

Puc. 6.16. Регресія по ефектах торгових днів і Великодня в моделі Х-12 - ARIMA

Вибрані нами ефекти виявилися статистично незначущими: так як розрахункові значення t -Статистика (стовпець "t-value") виявилися по модулю менше критичного 5% -ного (1,98), у нас немає підстав відхилити гіпотезу про рівність відповідних коефіцієнтів нулю. Отже, таку регресію по залишках в нашому випадку не має сенс будувати.

Крім усього іншого програма автоматично спрогнозувала значення сезонних компонент на 1 рік вперед. Судячи з усього, це було здійснено за допомогою моделі авторегресії, однак жодної інформації про те, що було вибрано і як саме, програма не виводить. Для більш адекватного прогнозування значень ряду досліднику варто окремо розглянути динаміку кожної з сезонних компонент, динаміку трендової компоненти, після чого дати прогноз цих значень і, з'єднавши їх разом, дати фінальний прогноз значень по ряду даних.

  • [1] Shiskin J., Eisenpress Н., Young Л. H., Musgrave J. C. The X-ll Variant of Census Method II Seasonal Adjustment Program. Technical Paper No. 15, Bureau of the Census, US Dept, of Commerce, 1967.
  • [2] Bianchi Marco. Х-12 - ARIMA (Beta Version 1.1a) // The Economic Journal. Vol. 107. № 444. Sep. 1997. P. 1613-1620.
  • [3] Bar G. £ P., Cox D. R. An Analysis of Transformations // Journal of the Royal Statistical Society. Series В (Methodological). 1964. Vol. 26. № 2. P. 211-252.
  • [4] Doherty Mike. The Surrogate Henderson Filters in Xl 1 // Australian & New Zealand Journal of Statistics. 2001. № 43 (4). P. 901-999.
 
Якщо Ви помітили помилку в тексті позначте слово та натисніть Shift + Enter
< Попередня   ЗМІСТ   Наступна >
data-override-format="true" data-page-url = "http://stud.com.ua">

Cхожі теми

Декомпозиція генеральної мети
Класична декомпозиція
Декомпозиція часового ряду за допомогою LOESS
Теорема декомпозиції Вольда
СЕЗОННА декомпозиція і ТРЕНД-СЕЗОННІ МОДЕЛІ
 
Дисципліни
Агропромисловість
Аудит та Бухоблік
Банківська справа
БЖД
Географія
Документознавство
Екологія
Економіка
Етика та Естетика
Журналістика
Інвестування
Інформатика
Історія
Культурологія
Література
Логіка
Логістика
Маркетинг
Медицина
Нерухомість
Менеджмент
Педагогіка
Політологія
Політекономія
Право
Психологія
Релігієзнавство
Риторика
Соціологія
Статистика
Техніка
Страхова справа
Товарознавство
Туризм
Філософія
Фінанси
Пошук