МОДЕЛІ ДИСПЕРСІЙНОГО АНАЛІЗУ

Специфіка якісних факторів

Основна проблема використання якісних чинників в ролі вхідних змінних - переклад якісної, вербальної інформації в кількісну.

Приклад. При аналізі впливу кольору автомобіля на його ціну необхідно визначити метод кількісного опису якісного фактора «колір автомобіля». Для простоти будемо вважати, що колір автомобіля може приймати тільки чотири значення: білий, синій, червоний, чорний (на практиці, природно, кількість можливих варіантів кольору значно більше). Просте кодування значень якісних факторів числовими значеннями хоча формально і дає можливість використовувати методи регресійного аналізу, але призводить до некоректних результатів. Зокрема, якщо в розглянутому прикладі для позначення квітів використовувати цифри 1, 2, 3, 4, то можливі 24 різних варіанти кодування. При цьому для кожного варіанта кодування буде побудована своя модель.

Розглянемо таку ситуацію докладніше. Нехай введена кодування кольорів:

1 - білий, 2 - синій, 3 - червоний, 4 - чорний і побудована найпростіша модель лінійної парної регресії

де у (х) - ціна автомобіля кольору х.

Згідно з моделлю (9.1), не проводячи ніяких обчислень (не маючи навіть вихідних даних для обчислень!), Можна відразу ж зробити ряд очевидних висновків:

• різниця в середній ціні між білими і синіми, синіми і червоними, червоними і чорними автомобілями однакова:

• різниця в середній ціні між білими і червоними, синіми і чорними автомобілями теж однакова:

Очевидно, що ці висновки не мають нічого спільного з реальністю і значно зміняться при переході до іншого кодуванні квітів.

 
Переглянути оригінал
< Попер   ЗМІСТ   ОРИГІНАЛ   Наст >