ПРОБЛЕМА АНОМАЛЬНИХ СПОСТЕРЕЖЕНЬ (ВИКИДІВ)

В процесі збору та аналізу статистичної інформації можуть виникати ситуації, коли ті чи інші результати різко виділяються з основної маси спостережень. Поява таких спостережень може мати різну природу, наприклад вони можуть бути результатами грубих помилок реєстрації, короткострокового впливу неконтрольованих факторів зовнішнього середовища, людського фактора і ін. Наявність викидів такого роду може призводити до різких змін не тільки звичайних статистичних характеристик [100] (типу математичного очікування , дисперсії [81], коефіцієнтів асиметрії та ексцесу [106] та ін.), але і результатів оцінювання регресійних моделей, а також відповідних їм прогнозних значень відгуків. При цьому слід зазначити, що наявність невеликого відсотка викидів зазвичай не робить вирішального впливу на форму розподілу досліджуваного фактора, що не дозволяє виявити їх присутність критеріями згоди типу Неймана - Пірсона та ін.

Обробка вибіркових значень з метою виявлення викидів (виявлення і виключення аномальних спостережень) являє собою, як зазначалося раніше, окрему економетричну завдання, коректне рішення якої дозволить поліпшити статистичні властивості вибірки і, отже, підвищити якість оцінюваних моделей регресії.

Для виділення аномальних значень можуть бути використані найрізноманітніші методи [7, 18, 50]. Найбільш простим є метод, заснований на використанні розподілу Стиодента, згідно з яким за наявною вибірці обчислюють статистику

де - спостереження, імовірно

є аномальним; х, S - середнє і середньоквадратичне відхилення відповідно. Величина т називається максимальним відносним відхиленням. Далі, згідно з даним методом, проводять порівняння т з критичними значеннями

де - критичне значення розподілу Стьюдента при різних значеннях рівня значущості а.

Максимальні відносні відхилення в процесі обчислення поділяють на три групи відповідно до умов: група 1:

група 2:

група 3:

Якщо значення т потрапляє в групу 1, то наглядом * не можна вважати аномальним. При попаданні значення т в групу 2 спостереження х * може бути визнано аномальним, якщо на користь цього є ще й інші міркування експериментатора (висновки, зроблені на основі властивостей досліджуваного явища). При попаданні значення т в групу 3 спостереження х * слід визнати аномальним.

Всі аномальні спостереження слід виключити з вибірки, і тільки після цього проводити економетричний аналіз в рамках розв'язуваної задачі.

 
Переглянути оригінал
< Попер   ЗМІСТ   ОРИГІНАЛ   Наст >