МЕТОДИ СТІЙКОГО ОЦІНЮВАННЯ РЕГРЕСІЙНИХ МОДЕЛЕЙ

Слід зауважити, що формальне використання критеріїв відбраковування викидів далеко не завжди дозволяє отримати бажані результати.

Приклад такого ефекту був описаний в роботі [1001. Розглянемо оцінювання моделі лінійної парної регресії по п'яти спостереженнями з кореляційним полем, представленим на рис. 8.2. Пряма лінія, що проходить через точку Л, являє собою справжню залежність. Припустимо, що в результаті будь-яких згаданих вище причин для того ж самого значення вхідної змінної, що відповідає точці Л, зафіксовано інше значення відгуку, відповідне точці В. В результаті оцінювання лінії регресії за цими даними вийде пряма, розташування якої істотно відрізняється від шуканого.

Застосування методів відбракування викидів в другому випадку (з точкою В) дозволить вирішити задачу оцінювання вірно. Однак застосування цього ж підходу в вихідної ситуації (з точкою Л) призведе до відбраковування точки Л, яка, як очевидно з рис. 8.2, насправді не є викидом і, отже, несе корисну

Вплив викиду на оцінювання лінійної

Рис . 8.2. Вплив викиду на оцінювання лінійної

регресії з точки зору статистичного оцінювання інформацію. У розглянутому прикладі нам вдається з'ясувати питання про аномальність того чи іншого спостереження за допомогою аналізу конфігурації кореляційного поля. При наявності великої кількості вхідних факторів такої спосіб виявиться непридатним внаслідок неможливості побудови графічної інтерпретації багатовимірних кореляційних полів. Виходом з такого становища може бути використання спеціальних методів оцінювання, стійких до наявності у вибірці аномальних спостережень [23,48, 99 1001.

З аналізу рис. 8.2 і наступних за ним міркувань очевидно, що при наявності у вибірці хоча б одного викиду відбувається істотне збільшення суми квадратів залишків ESS і, як наслідок, спотворення результатів оцінювання за допомогою МНК. Основною причиною такого негативного впливу викиду є зміна одиниць вимірювання відстані між оцінюваної функцією регресії і вихідними значеннями відгуку, оскільки залишки беруться в квадратах. Отже, підвищення якості оцінювання регресійних моделей можна домогтися шляхом зміни виду цільової функції критерію. Методи, засновані на оптимізації функціоналів, які відповідають таким умовам, отримали назву стійких методів оцінювання . До числа таких методів слід віднести:

  • • метод найменших модулів [64];
  • • усічений метод найменших квадратів [26 |, або LTS- метод;
  • • знаковий метод [23];
  • • метод найменших медіан, або LMS-мслщ [99], та ін.
 
Переглянути оригінал
< Попер   ЗМІСТ   ОРИГІНАЛ   Наст >