Прогнозування за допомогою часових рядів в програмі Eviews

Задача 2.1

Провести графічний аналіз рядів даних. Визначити наявність трендового, сезонного компонентів.

  1. В вікні Workfile відкриваємо групу whole_data. Для побудови графіка використовуємо команду меню ViewGraph. У діалоговому вікні вказуємо необхідні для нас параметри відображення графіків.

Існує два методи представлення графічного аналізу сезонних компонентів:

а) Сезонно впорядкований графік (Paneled lines&means), який відображає графік часового ряду для кожного місяця окремо – значення часового ряду згруповані за номерами місяця і впорядковані за роком. Графіки слідують один за одним : спочатку графік першого місяця, потім другого , і т.д. На графіках також представлені середні значення часового ряду для кожного сезонуб) Сезонно впорядкований графік (Seasonal Split Line), який відображає графік часового ряду для кожного місяця окремо – значення часового ряду згруповані за номерами місяця і впорядковані за роком. Графіки розташовуються на одній річній осі.

1а

Рисунок 1 (а). Діалогове вікно методу Paneled lines&means

1б

Рисунок 1 (б). Діалогове вікно методу Multiple overlayed lines

2а

Рисунок 2 (а). Графік представлений методом Paneled lines&means

2б

Рисунок 2 (б). Графік представлений методом Multiple overlayed lines

3

Рисунок 3.  Гістограма -графік для визначення тренду

Задача 2.2. Для обраних рядів даних визначити основні числові характеристики:

  • вибіркове середнє;
  • середньоквадратичне відхилення
  • коваріацію перших 10 порядків.

Побудувати гістограми часових рядів

  1. Для розрахунку необхідних числових характеристик використовуємо команду меню ViewDescriptive StatisticsHistogram and Stats. В результаті цього програма виводить інформацію про найбільше та найменше значення змінної, вибіркове середнє, медіану ряду, середньоквадратичне відхилення, ступінь асиметричності ряду, виводить статистику Жарку-Бера, що перевіряє гіпотезу про нормальний розподіл ряду, імовірність прийняття гіпотези (наприклад, на рис. гіпотеза про нормальний розподіл приймається)
  2. Коваріацію перших 10 порядків знайдемо у задачі 2.3

3а

Рисунок 3 (а).  Гістограма індексу споживчих цін з розрахованими числовими характеристиками

3б

Рисунок 3 (б).  Гістограма індексу цін виробників з розрахованими числовими характеристиками

3в

Рисунок 3 (в).  Гістограма видатків державного бюджету з розрахованими числовими характеристиками

3г

Рисунок 3 (г).  Гістограма доходів державного бюджету з розрахованими числовими характеристиками

3д

Рисунок 3 (д).  Гістограма роздрібного товарообороту з розрахованими числовими характеристиками

Задача 2.3. Побудувати корелограму та часткову кореляційну функцію для рівнів часових рядів, їх перших та других різниць.

Покажемо розв’язання задачі 2.3 на прикладі роздрібної торгівлі

  1. За допомогою меню ViewCorrelogramбудуємо корелограми.
  2. В контекстному меню (Рис 4) вказуємо для яких значень змінної слід робити розрахунки: для самої змінної, для перших різниць, для других різниць.
  3. Кількість лагів визначає розмір самої корелограми.

4

Рисунок 4. Контекстне меню вибору параметрів побудови корелограми

5а

Рисунок 5 (а). Корелограма побудована для самої змінної

5б

Рисунок 5(б). Корелограма побудована для перших різниць

5в

Рисунок 5 (в). Корелограма побудована для других різниць

Задача 2.4. Перевірити Ваші часові ряди на випадковість за допомогою методу поворотних значень

  1. Для розв’язку цієї задачі побудуємо лінійні графіки.
  2. Порахуємо кількості впадин і піків у числовому ряді (Рис 6(а) – 6(д)) (практичне значеня)

6а

Рисунок 6 (а). Лінійний графік індексу споживчих цін (10 впадин і 9 піків)

6б

Рисунок 6 (б). Лінійний графік індексу цін виробників (9 впадин і 10 піків)

6в

Рисунок 6 (в). Лінійний графік доходів державного бюджету (3 впадини і 3 піки)

6г

Рисунок 6 (г). Лінійний графік видатків державного бюджету (3 впадини і 3 піки)

6д

Рисунок 6 (д). Лінійний графік роздрібної торгівлі (3 впадини і 3 піки)

Задача 2.5. Розбити всі ряди на дві однакові за розмірами вибірки. Перевірити гіпотезу про

  • рівність математичних сподівань;
  • диспесій
  1. Вибираємо меню View→Tests for Descriptive Stats→Equality Tests by Classification… для перевірки гіпотез
  2. В контекстному меню (Рис 6(а) і 6(б)) вибираємо необхідні нам параметри

7а

Рисунок 7 (а). Контекстне меню для визначення рівності математичних сподівань

7б

Рисунок 7 (б). Контекстне меню для визначення рівності дисперсій

8а

Рисунок 8 (а). Результат тесту про рівність математичних сподівань

8б

Рисунок 8 (б). Результат тесту про рівність дисперсій

Задача 2.6. Створити на основі змінних бази даних нові, що являють собою перші різниці відповідних часових рядів. На основі отриманих значень перевірити гіпотези:

  • про випадковість за допомогою методу поворотних значень;
  • про нормальний розподіл за допомогою декількох методів

Задача 2.7. Обчислити ряди других різниць початкових даних. Перевірити

гіпотези:

  • про випадковість за допомогою методу поворотних значень;
  • про нормальний розподіл за допомогою декількох методів;
  • про рівність вибіркового середнього 0

  1. Ряди перших різниць початкових даних можна побачити на корелограмі на

  1. Ряди других різниць початкових даних можна побачити на корелограмі на
  1. Перевірка гіпотез методом поворотних значень описана у висновках до

задачі 2.4

  1. Для визначення нормального розподілу застосуємо два методи
  • Графічний. У цьому нам допоможе меню ViewGraph. У підменю QuantileQuantile Graphs.
  • У вигляді “звіту”. Для того, щоб отримати звіт скористаємось меню View Tests for Descriptive Stats. Підменю Empirical Distribution Tests дозволяє перевірити гіпотезу про відповідність часового ряду заданому розподілу. Тестування основане на порівнянні емпіричної та теоретичної функцій розподілу.

9а

Рисунок 9 (а). Контекстне меню для перевірки теоретичного нормального розподілу

9б

Рисунок 9 (б). Графік теоритичного нормального розподілу

10

Рисунок 10. Контекстне меню Empirical Distribution Tests для перевірки гіпотези про нормальний розподіл

11а

Рисунок 11 (а). Результат тесту на нормальний розподіл індексу споживчих цін

11б

Рисунок 11 (б). Результат тесту на нормальний розподіл індексу цін виробників

11в

Рисунок 11 (в). Результат тесту на нормальний розподіл доходів державного бюджету України

11г

Рисунок 11 (г). Результат тесту на нормальний розподіл видатків державного бюджету України

11д

Рисунок 11 (д). Результат тесту на нормальний розподіл роздрібного товарообороту

  1. Для того щоб визначити чи дорівнює вибіркове середнє 0 скористаємось меню View→Tests for Descriptive Stats→Simple Hypothesis Tests

Покажемо розв’язання цієї задачі на прикладі індексу споживчих цін

12а 

Рисунок 12 (а). Проведення тестування гіпотези про рівність вибіркового середнього нулю на прикладі індексу споживчих цін

12б

Рисунок 12 (б). Результат тесту гіпотези про рівність вибіркового середнього нулю на прикладі індексу споживчих цін

Задача 2.8. Для „наївної” моделі (прогноз дорівнює останньому значенню часового ряду) підрахувати помилки прогнозування за критеріями:

  • MSE;
    • RMSE;
    • MAD;
    • RMSPE;
    • MAPE;

  1. Для розв’язання цієї задачі розглянемо Рис 11(а) -11 (д). Нас цікавитимуть два параметри mu (середнє відхилення ) і sigma (середнєьоквадратичне відхилення)
  2. За допомогою mu і sigma ми знайдемо необхідні помилки прогнозування. Використаємо такі формули з Рис 13
  3. Для розрахунку нам потрібно вибрати значення n (кількість років для прогнозу). Оскільки Україна стоїть на порозі змін, то важко робити довгострокові прогнози. Тому для розв’язку цієї задачі я вибрала n=2

13

Рисунок 13. Формули для розрахунку похибок

Розрахунки

  1. Визначимо похибки для індексу споживчих цін, якщо mu = 100.63, sigma =1.15
  2. Визначимо похибки для індексу цін виробників, якщо mu = 100.85, sigma =2.15

 

Висновки

Тренд — це напрям розвитку певного явища. Трендовий компонент неважко помітити, проаналізувавши графік часового ряду. Як правило, для економічних даних дуже типовим є повільне зростання чи падіння протягом тривалого періоду часу. Наявність тренду в економічних часових рядах можна пояснити демографічними змінами, технологічними змінами, змінами в структурі виробництва, попиту, тощо.

З (Рис 3, гістограми CPI і PPI) ми можемо побачити, що в індексі споживчих цін і в індексі цін виробників промислової продукції не спостерігається чітке виділення тренду, адже показники постійно коливаються. Найбільше збільшення індексу споживчих цін зафіксовано у травні 2014 року (103,8). Тому будемо вважати його трендом. Якщо брати до уваги індекс цін виробників промислової продукції, то його найбільше значення зафіксоване у квітні 2014 року (106,1). Тому будемо вважати його трендом.

З (Рис 3, гістограми NBI, NBO і RT) ми можемо побачити, що всі показники стабільно зростають під кінець кожного року. Тому трендами будуть декілька значень. Якщо брати до уваги роздрібний товарообіг, то трендовим компонентом буде місяць грудень 2012, 2013, 2014 років. І становитиме відповідно 404862,6 млн.грн; 429242,3 млн.грн; 437175 млн.грн. У видатках державного бюджету трендовим компонентом буде місяць грудень 2012, 2013, 2014 років. Значення якого становитимуть відповідно 395681,5 млн.грн; 403456,1 млн.грн; 430217,9 млн.грн. У доходах державного бюджету трендовм компонентом буде місяць грудень 2012, 2013, 2014 років. Значення якого становитимуть відповідно 346054 млн.грн; 339226,9 млн.грн; 357084,2 млн.грн.    

Сезонний компонент показує коливання навколо трендового компонента. Його наявність пояснюється сезонним характером виробництва і споживання.

З Рис 3 ( CPI і PPI) ми можемо побачити, що в індексі споживчих цін і в індексі цін виробників промислової продукції не спостерігається чітке виділення сезонного компоненту, адже показники постійно коливаються. Це можна пояснити тим, що люди кожного року літом і перед Новим роком більше споживають.

З Рис 3 (NBI, NBO і RT) ми можемо побачити, що всі показники ми можемо побачити, що всі показники стабільно зростають під кінець кожного року.

Корелограма це графік коефіцієнтів автокореляції для різних значень зрушень ряду у часі.

На Рис 5 (а) –5(в) Штрихові лінії на графіках показують надійний інтервал, в якому значення статично приймається рівним 0.

Метод поворотних значень зводиться до підрахунку кількості впадин і піків у числовому ряді  і порівнянні цієї кількості з теоретичним значенням, яке дорівнює математичному сподіванню кількості поворотних точок у «чисто випадковому» ряді, що складається з T спостережень.

Якщо розглянути Рис 6(а) – 6(д) і порівняти математичні сподівання з кількістю піків і спадів, то можна стверджувати, що дані числові ряди є не випадковими.

            Тест на рівність математичних сподівань заснований на підході, пов’язаним з аналізом дисперсій ( ANOVA ) різних підвибірок наявної вибірки: вважається, що якщо математичні сподівання підгруп збігаються, то сума квадратів різниць між математичними сподіваннями будь-якої підгрупи і математичним сподіванням , розрахованим по всій вибірці , повинна збігатися з сумою квадратів різниць між математичними сподіваннями всієї вибірки і кожним спостереженням.

З (Рис 7 (а)) ми можемо побачити, що при розбитті числового ряду на дві рівні частини гіпотеза про рівність математичних сподівань є хибною, оскільки імовірність такого явища становить 0%.

                    Тест на рівність дисперсій — дозволяє перевіряти гіпотезу про рівність між собою дисперсій різних підгруп наявної вибірки проти альтернативної гіпотези про те , що дисперсія принаймні однієї підгрупи відрізняється від інших.

З (Рис 7 (б)) ми можемо побачити, що при розбитті числового ряду на дві рівні частини гіпотеза про рівність дисперсій має право на існування, оскільки імовірність становить 0,87.

На Рис 9 (б) ми можемо побачити, що точки на графіках розкидані близько до прямої. Це дає нам підставу судити про те, що гіпотеза про нормальний розподіл вірна.

На Рис 11 (а) -11 (д) ми можемо побачити, що при аналізі за 4 методами гіпотеза про нормальний розподіл приймається, оскільки всі значення стовпчика Probability перевищують стандартний рівень 0,05.

            З Рис 12 (б). ми можемо побачити, що гіпотеза про рівність вибіркового середнього нулю не підтвердилась, оскільки в наших числових рядах немає жодного значення рівного 0.

         За результатами підрахунків із задачі 2.8 ми можемо побачити, що помилки при прогнозуванні є досить великими. Тому прогноз робити недоцільно. 

Виконала

Студентка групи ЕК-31

Панчук Надія

Прокоментуйте першими

Залишити коментар

Ваш e-mail не буде публікуватись.

*