АНАЛІЗ ЯКОСТІ СПЕЦИФІКАЦІЇ МОДЕЛІ

Після вивчення глави 6 студент повинен:

знати

  • • визначення поняття якості специфікації моделі (якість моделі):
  • • принцип, закладений в основу тестування;
  • • визначення поняття коефіцієнта детермінації;
  • • метод тестування моделі на якість специфікації і його особливості;
  • • як виявити статистично незначущі регресорів в моделі множинної лінійної регресії;
  • • зміст поняття "мультиколінеарності" і ознаки її наявності;
  • • методи відбору регресорів для усунення мультиколінеарності;

вміти

  • • обчислювати значення коефіцієнта детермінації;
  • • обчислювати значення статистики Fтест;
  • • використовувати табличний процесор EXCEL для обчислення коефіцієнта детермінації і необхідних статистик;
  • • тестувати економетричні моделі на якість специфікації;
  • • відбирати регресорів для включення в специфікацію моделі не викликаючи мультіколлінеарності;

володіти

  • • математичним апаратом перевірки статистичних гіпотез;
  • • навиком використання ознак наявності часткової мультіколлінеарності в моделях;
  • • прийомами відбору регресорів в специфікацію моделі;
  • • навичками використання програмного забезпечення персональних комп'ютерів, зокрема, використання табличного процесора EXCEL.

Якість специфікації моделі парної регресії

З попередніх глав випливає, що основним інструментом оцінювання параметрів лінійної моделі множинної регресії є процедури, сформульовані в теоремі Гаусса - Маркова. Також ми з'ясували, що недостатньо тільки обчислити значення оцінок входять в модель параметрів, необхідно ще підтвердити якість параметрів і моделі в цілому. Іншими словами, необхідно провести аналіз отриманих результатів.

Почнемо аналіз результату оцінювання моделі з відповіді на питання: наскільки якісно був виконаний перший етап побудови моделі, а саме, не допустили ми помилку, записуючи специфікацію моделі? На етапі специфікації моделі є можливість допустити дві помилки:

  • 1) неправильно вибрати вид поведінкової частини моделі (функції регресії);
  • 2) неправильно вибрати набір екзогенних змінних, введених в специфікацію моделі.

Дійсно, при специфікації моделі прийнято обмеження щодо використання тільки лінійних алгебраїчних рівнянь. Але цілком може виявитися, що модель істотно нелінійна (див. Виробничу функцію Кобба - Дугласа). Крім того, в результаті аналізу поведінки економічного об'єкта в специфікацію введемо набір екзогенних змінних, який за припущенням впливає на формування ендогенної змінної. Тут теж можлива поява помилок: може виявитися, що всі обрані змінні не впливають на величину ендогенної змінної або частина з них.

Тестування якості специфікації моделі направлено па виявлення чинників, що не роблять впливу на формування ендогенної змінної.

Почнемо обговорення проблеми з прикладу рівняння парної регресії.

Маємо специфікацію моделі у вигляді

( 6 . 1 )

і припускаємо, що передумови теореми Гаусса - Маркова виконані.

Тоді модель (6.1) можна записати у вигляді

(6.2)

де

У рівнянні (6.2) перший доданок - це внесок в значення , викликаний змінами регресорів , а друге - вплив випадкових факторів, які не пов'язані зі змінами регресорів.

Звідси, випливає ідея тестування. Необхідно встановити, яке з доданків вносить найбільший вклад в загальний розкид спостережуваних значень ендогенної змінної. Характеристикою розкиду випадкової змінної служить дисперсія. Отже, необхідно визначити, яке з доданків превалює в функції дисперсії ендогенної змінної. Знайдемо дисперсію функції (6.2):

(6.3)

Знайдемо значення останнього доданка (6.3):

(6.4)

Перший доданок (6.4) дорівнює нулю, так як коваріація між константою і випадковою величиною дорівнює нулю, другий доданок дорівнює нулю в силу четвертої передумови теореми Гаусса - Маркова.

В результаті отримуємо:

(6.5)

Вираз (6.5) можна представити у вигляді

(6.6)

Введемо наступні позначення:

  • - -Загальна сума квадратів (Total Sum Squares),
  • - регресійна сума квадратів (Regression Sum, Squars),
  • - сума квадратів помилок (Error Sum Squares).

Тоді вираз (6.6) можна записати як

(6.7)

Зауваження. Рівності (6.6) і (6.7) мають місце, якщо в моделі присутня параметр

В якості запобіжного впливу регресорів на формування значення ендогенної змінної у вводиться коефіцієнт детермінації як відношення регресійної суми квадратів до загальної суми квадратів:

(6.8)

Область визначення коефіцієнта детермінації - відрізок від нуля до одиниці

Коефіцієнт детермінації показує, яка частка зміни залежної змінної обумовлена змінами пояснює змінної.

Якщо , тобто RSS = TSS, означає, що регресорів д: повністю забезпечує весь розмах зміни змінної у. У цьому випадку говорять, що специфікація моделі, абсолютно якісна. Випадкове обурення у всіх спостереженнях дорівнює нулю.

Навпаки, якщо , тобто ESS = TSS тобто означає, що весь розмах зміни змінної у наслідком впливу неврахованих випадкових факторів. У цьому випадку говорять, що специфікація моделі абсолютно неякісна. Регресорів не впливає на формування ендогенної змінної.

З урахуванням зробленого вище зауваження необхідно мати на увазі, що коефіцієнт детермінації має сенс тільки при наявності вільного коефіцієнта в специфікації лінійно адитивної моделі. Якщо параметр відсутній в специфікації моделі, через невиконання тотожності (6.7), значення , обчислене за формулою (6.8), може бути і більшим одиниці і навіть негативним.

Можна показати, що в разі парної лінійної регресії коефіцієнт детермінації дорівнює квадрату коефіцієнта кореляції між змінними у та х.

Коефіцієнт детермінації - величина випадкова, тому що його значення обчислено за випадковою вибіркою. Отже, для тестування гіпотези про те, що обраний регресорів не робить вплив на формування значення ендогенної змінної, згідно з алгоритмом перевірки статистичних гіпотез, необхідно створити випадкову змінну, пов'язану з гіпотезою, закон розподілу якої був би відомий.

Можна показати, що якщо випадкове обурення розподілено нормально , то випадкова величина підпорядковується нормальному закону розподілу. Тоді для перевірки гіпотези в якості статистики приймається змінна , яка обчислюється за правилом:

(6.9)

Тут: п - обсяг вибірки; k - кількість регресорів в моделі (в нашому випадку ); - коефіцієнт детермінації.

Мінлива підкоряється закону розподілу Фішера з параметрами і ( ). Прийнявши значення довірчої ймовірності, наприклад, , обчислюється критичне значення для змінної

Якщо має місце нерівність

(6.10)

то гіпотеза про те, що регресорів х не впливає на формування значення ендогенної змінної у, приймається. Якщо умова (6.10) не виконується, то приймається альтернативна гіпотеза про те, що регресорів х істотно впливає на формування величини у.

Зауваження. Значення коефіцієнта детермінації і статистики обчислюються функцією "ЛИНЕЙН" (див. Табл. 5.1).

Приклад. Розглянемо модель залежності заощаджень громадян від розміру доходу на Великобританії.

Вихідні дані для побудови моделі (вибірка спостережень), а також результат роботи функції "ЛИНЕЙН" наведені в табл. 6.1.

Таблиця 6.1

Вибірка спостережень і результат роботи функції "ЛІНЕІН"

№ п / п

Дохід Y,

заощадження S

1

2

3

1

8,8

2

9,4

0,21

3

10

0,08

4

10,6

0,2

5

11

0,1

6

11,9

0,12

7

12,7

0,41

8

13,5

0,5

9

14,3

0,43

10

15,5

0,59

11

16,7

0,9

12

18,6

0,82

13

19,7

1,04

14

21,1

1,53

15

22,8

1,94

16

23,9

1,75

17

25,2

1,99

18

26

2,03

19

26,8

2,4

0,123447

-1,15358

0,00754

0,134067

R 2

0,940367

0,194935

F тест

268,0791

17

10 18687

0,645992

Оцінена модель має вигляд:

Значення коефіцієнта детермінації одно:

значення

значення

Значення багато більше , отже, оцінена модель має якісну специфікацію або, іншими словами, обраний регресорів впливає на формування значення ендогенної змінної. У цьому випадку ще говорять, що модель є статистично значущою.

 
< Попер   ЗМІСТ   Наст >