Навігація
Головна
 
Головна arrow Економіка arrow Економетрика
< Попередня   ЗМІСТ   Наступна >

Перевірка значущості моделі множинної регресії і її параметрів

Для оцінки значущості параметрів рівняння множинної регресії використовують критерій Стьюдента. Нагадаємо, що значимість параметрів означає їх відміну від нуля з високою часткою ймовірності. Нульовий гіпотезою в даному випадку є твердження

Фактичне значення t-критерію визначається за формулою

(2.27)

У формулі (2.27) під оцінкою параметра розуміється як коефіцієнт регресії, так і вільний член (при ). Величина середнього квадратичного відхилення оцінюваного параметра визначається як корінь з дисперсії , розрахованої за формулою (2.25). Величину називають стандартною помилкою параметра .

Формулу для оцінки коефіцієнта регресії (тобто для ) можна привести до виду

(2.28)

де - середнє відхилення результативної змінної ; - Середньоквадратичне відхилення пояснює змінної , що є співмножником коефіцієнта ; - Коефіцієнт детермінації, знайдений для рівняння залежності змінної від змінних , включаючи ; - Коефіцієнт детермінації, знайдений для рівняння залежності змінної від інших змінних , що входять в дану модель множинної регресії.

Теоретичне значення t-критерію знаходять по таблиці значень критерію Стьюдента для рівня значущості а і числа ступенів свободи . Рівень значущості а являє собою ймовірність помилки першого роду, тобто ймовірність відкинути гіпотезу , коли вона вірна. Як правило, а вибирають рівним 0,1; 0,05 або 0,01.

Нульова гіпотеза про незначущість параметра : відкидається, якщо виконується нерівність

(2.29)

де - теоретичне значення критерію Стьюдента.

На основі виразу (2.29) можна побудувати також довірчий інтервал для оцінюваного параметра :

(2.30)

Вираз (2.30) дозволяє як оцінити значимість параметра, так і дати його економічну інтерпретацію (якщо оцінюється коефіцієнт регресії). Очевидно, що параметр буде значущий, якщо в довірчий інтервал (2.30) не входить нуль, тобто з великою часткою ймовірності оцінюваний параметр не дорівнює нулю.

Так як коефіцієнт регресії є абсолютним показником сили зв'язку, межі довірчого інтервалу і для нього також можна інтерпретувати аналогічним чином: з ймовірністю при одиничному зміні незалежної змінної залежна змінна у зміниться не менш, ніж на , і не більше, ніж на .

Розглянемо результати оцінки значущості параметрів для прикладу 2.1. Стандартні помилки параметрів рівні

Нагадаємо, що під знаком кореня в квадратних дужках стоїть елемент матриці , який знаходиться на перетину

ванні j-го рядка і j-го стовпця, номер; дорівнює номеру оцінюваного параметра.

Фактичне значення критерію Стьюдента одно

Табличне значення t-критерію для і рівні значущості становить 2,0153, отже, всі параметри, крім вільного члена, значимі .

Знайдемо кордону довірчих інтервалів для коефіцієнтів регресії.

Відзначимо, що, керуючись значеннями меж довірчих інтервалів, можна зробити ті ж висновки про значущість коефіцієнтів регресії (так як нуль не влучає в довірчий інтервал). Висновки в даному випадку і не могли бути іншими, ніж при порівнянні фактичного і табличного значень критерію Стьюдента, так як формула (2.30) є наслідком формули (2.29). Дамо економічну інтерпретацію кордонів довірчих інтервалів для коефіцієнтів регресії.

Коефіцієнт є характеристикою сили зв'язку між обсягом надходження податків і кількістю зайнятих. З урахуванням значень меж довірчого інтервалу для можна сказати, що зміна кількості зайнятих на 1 тис. Чоловік призведе до зміни (з ймовірністю 0,95 ( )) надходження податків не менше ніж на 3,56 млн руб. і не більше ніж на 21,34 млн руб. при незмінному обсязі відвантаження в обробних виробництвах і виробництві енергії. Для двох інших коефіцієнтів регресії висновки будуть наступними.

Зміна обсягу відвантаження в обробних виробництвах на 1 млн руб. призведе до зміни (з ймовірністю 0,95 ( )) надходження податків не менш ніж на 0,028 млн руб. і не більше ніж на 0,092 млн руб. при незмінних значеннях кількості зайнятих і виробництва енергії.

При зміні виробництва енергії на 1 млн руб. надходження податків зміниться (з ймовірністю 0,95 ( )) не менше ніж на 0,13 млн руб. і не більше ніж на 0,18 млн руб. при незмінних значеннях кількості зайнятих і обсягу відвантаження в обробних виробництвах.

Як було відзначено в параграфі 2.2, при побудові моделі регресії з використанням зосереджених змінних коефіцієнти регресії не відрізняються від коефіцієнтів регресії в натуральній формі. Це твердження стосується також до величини стандартних помилок коефіцієнтів регресії і, отже, до фактичних значень критерію Стьюдента.

При використанні стандартизованих змінних змінюється масштаб їх вимірювання, що призводить до інших, ніж у вихідній регресії, значенням параметрів (стандартизованих коефіцієнтів регресії) і їх стандартних помилок. Однак фактичні значення критерію Стьюдента для параметрів рівняння в стандартизованном масштабі збігаються з тими значеннями, які були отримані за рівнянням в натуральному масштабі.

Для оцінки значущості всього рівняння регресії в цілому використовується критерій Фішера (F-критерій) , який в даному випадку називають також загальним F-критерієм . Під незначущості рівняння регресії розуміється одночасне рівність нулю (з високою часткою ймовірності) всіх коефіцієнтів регресії у генеральній сукупності:

Фактичне значення F-критерію визначається як співвідношення факторної і залишкової сум квадратів, розрахованих за рівнянням регресії і скоригованих на число ступенів свободи:

(2.31)

де - факторна сума квадратів; - Залишкова сума квадратів.

Теоретичне значення F-критерію знаходять по таблиці значень критерію Фішера для рівня значущості α, числа ступенів свободи і . Нульова гіпотеза відкидається, якщо

де - теоретичне значення критерію Фішера.

Відзначимо, що якщо модель незначущі, то незначущі і показники кореляції, розраховані по ній. Дійсно, якщо

то

і лінія регресії паралельна осі абсцис. Крім того, з системи нормальних рівнянь, отриманої за методом найменших квадратів (2.8), слід, що .

При нульових значення всіх коефіцієнтів регресії маємо вираз

тоді

тобто за однакової кількості всіх коефіцієнтів регресії нулю (їх статистичної незначущості) коефіцієнт детермінації також буде дорівнює нулю (статистично незначну).

Формулу (2.31) розрахунку F-критерію можна перетворити, розділивши факторну і залишкову суми квадратів на загальну суму квадратів:

Після простих перетворень отримуємо вираз

Розрахунок загального F-критерію можна оформити у вигляді таблиці дисперсійного аналізу (табл. 2.2).

Таблиця 2.2. Аналіз статистичної значущості моделі множинної регресії

джерела варіації

Число ступенів свободи df

Сума квадратів SS

Дисперсія на одну ступінь свободи MS = SS / df

F-критерій Фішера

фактичне значення

табличне значення для а = 0,05

Загальна

регрес

ця

Осту

точна

Аналогічну таблицю дисперсійного аналізу можна побачити в результатах комп'ютерної обробки даних. її відмінність

від наведеної вище таблиці полягає в утриманні останнього стовпчика. У нашому випадку це теоретичне значення критерію Фішера. У комп'ютерних варіантах в останньому стовпчику наводиться значення ймовірності припуститися помилки першого роду (відкинути вірну нульову гіпотезу), яка відповідає фактичним значенням F-критерію. В Excel ця величина називається "значимість F". Позначимо величину, що видається комп'ютером в таблиці дисперсійного аналізу, як . Її значення можна проінтерпретувати наступним чином: якщо теоретичне значення F-критерію одно його фактичним значенням, то ймовірність помилки першого роду (рівень значущості) дорівнює .

Вибираючи для визначення табличного значення критерію якийсь рівень значущості , ми погоджуємося на величину помилки, рівну . Отже, якщо , то фактична помилка буде менше запланованої і можна говорити про значимість рівняння регресії при заданому рівні значущості .

Перевіримо на статистичну значущість рівняння регресії, отримане в прикладі 2.1. Фактичне значення F-критерію одно

Табличне значення критерію Фішера для а = 0,05, числа ступенів свободи і так само 2,82. Так як фактичне значення F-критерію більше табличного, рівняння регресії значимо з ймовірністю Отже, значущим є також коефіцієнт детермінації, тобто він з великою часткою ймовірності відмінний від нуля.

При використанні опції "Регресія" в ППП Excel для даного прикладу отримана наступна таблиця дисперсійного аналізу (табл. 2.3).

Таблиця 2.3. Таблиця дисперсійного аналізу, отримана при застосуванні опції "Регресія" в ППП Excel

дисперсійний аналіз

df

SS

MS

F

значимість F

регресія

3

3 652 714 368

1 217 571 456

+40,31035571

1,10224Е -12

залишок

44

1 329 016 902

ЗО 204 929,59

Разом

47

4 981 731 270

Фактичне значення F-критерію міститься в передостанньому стовпці цієї таблиці. Відзначимо, що його значення відрізняється від наведеного вище через помилки округлення. В останньому стовпчику табл. 2.3 приведена ймовірність припуститися помилки першого роду. Вона дорівнює 1,10224Е -12, тобто +0,00000000000110224. Нами задана максимальна величина цієї ймовірності, що дорівнює 0,05. Так як фактичне значення ймовірності припуститися помилки першого роду менше (значно менше) встановленого нами максимального, нульова гіпотеза про незначущості рівняння регресії повинна бути відкинута.

 
Якщо Ви помітили помилку в тексті позначте слово та натисніть Shift + Enter
< Попередня   ЗМІСТ   Наступна >
 
Дисципліни
Агропромисловість
Аудит та Бухоблік
Банківська справа
БЖД
Географія
Документознавство
Екологія
Економіка
Етика та Естетика
Журналістика
Інвестування
Інформатика
Історія
Культурологія
Література
Логіка
Логістика
Маркетинг
Медицина
Нерухомість
Менеджмент
Педагогіка
Політологія
Політекономія
Право
Природознавство
Психологія
Релігієзнавство
Риторика
Соціологія
Статистика
Техніка
Страхова справа
Товарознавство
Туризм
Філософія
Фінанси
Пошук