ФІКТИВНІ ЗМІННІ

Особливості включення в моделі регресії некількісних показників

У попередніх розділах при розгляді рівнянь парної і множинної регресії ми припускали, що всі досліджувані змінні є кількісними, тобто приймають числові значення. У загальному випадку це припущення може не виконуватися. Значення залежної змінної у часто складається під впливом факторів, що описуються як кількісними, так і некількісними показниками. Наприклад, на величину надою з однієї фуражної корови (кількісний показник) впливає якість кормів - вища, 1 сорт, 2 сорт (Некількісні показник). Для відображення впливу Некількісні показника на результативний ознака використовують так звані фіктивні змінні ( dummy variables ).

Фіктивні змінні - це змінні бінарного типу, які мають лише два значення - одиниця і нуль:

Якщо Некількісні показник приймає лише два альтернативних значення, то необхідно ввести одну фіктивну змінну. Наприклад, висунута гіпотеза про різний рівень продуктивності праці для різних форм власності - державної та недержавної. Тоді кожній формі власності буде відповідати одне значення фіктивної змінної. наприклад:

Можливе й інше закріплення значень фіктивної змінної за категоріями Некількісні показника "форма власності":

У загальному випадку необхідно ввести на одиницю менше фіктивних змінних, ніж категорій Некількісні показника. Зокрема, для наведеного вище прикладу з якістю кормів (три можливі категорії) необхідно ввести дві фіктивні змінні.

Фіктивна змінна дорівнює одиниці, якщо Некількісні показник прийняв закріплене за цієї змінної значення. Значення Некількісні показника, не закріплене за жодною фіктивної змінної, називають базою порівняння значень залежної змінної при різних станах Некількісні фактора. Їй відповідає рівність всіх фіктивних змінних нулю:

де k - кількість значень Некількісні показника.

В якості базового значення Некількісні показника доцільно вибирати таке, яке, як передбачається, забезпечує мінімальні або максимальні значення залежної змінної. Для прикладу з якістю кормів

базовою категорією можна вибрати "2 сорт" як фактор, що дає мінімальні надої корів:

Якщо в моделі регресії необхідно врахувати кілька некількісних показників, то для кожного з них вводиться свій набір фіктивних змінних. В цьому випадку фіктивні змінні нумеруються подвійним індексом ji: Zjj, де; - Номер Некількісні показника, и - номер значення (категорії); -го Некількісні показника.

Специфікація моделей регресії з фіктивними незалежними змінними

У загальному випадку модель з фіктивними змінними має вид

де у - залежна змінна; - Кількісні незалежні змінні; zu, z12 - фіктивні змінні, відповідні категоріям першого Некількісні показника; z2J, z22 - фіктивні змінні, відповідні категоріям другого Некількісні показника; z; 1, z ) 2 - фіктивні змінні, відповідні категоріям; -го Некількісні показника; ε - випадковий залишок.

Включення фіктивних змінних в модель розширює коло питань, що підлягають вирішенню на етапі специфікації моделі.

Облік впливу Некількісні показника, що приймає три і більше значень, означає необхідність введення в рівняння регресії двох і більше фіктивних змінних, що призводить до значного збільшення кількості параметрів і має бути підкріплено відповідним обсягом спостережень (не менше семи на один параметр, не рахуючи вільного члена) .

При включенні в рівняння регресії фіктивних змінних виникає також питання про характер впливу кількісних незалежних змінних на результативну змінну при різних значеннях Некількісні показника. Нижче будуть розглянуті різні варіанти моделей регресії з фіктивними змінними.

 
< Попер   ЗМІСТ   Наст >