ТТУ-МЕТОД

Ідея отримання /// З'-оцінок [1] належить II. Дж. Рус- Сеу і описана в роботі [101]. Він запропонував обчислювати оцінки невідомих параметрів ітераційно, змінюючи на кожному кроці безліч спостережень, за яким проводиться оцінювання. При цьому передбачається виконання класичних умов регресійного аналізу (8.2).

Базовий алгоритм пошуку Ц ^ -оценок, який отримав назву С-крок ( C-step або Concentration-step), полягає в наступному. Вихідного безлічі спостережень { y v ..., z / v } моделі (8.1) ставиться у відповідність безліч індексів

I = {1, N). Обчислювальна схема З-кроку полягає

у виконанні наступних операцій:

  • 1) випадковим чином з безлічі I вибирається деяка підмножина індексів Н х с /, що містить h елементів, тобто потужність безлічі Н ] | = до;
  • 2) за допомогою звичайного МНК обчислюється оцінка

вектора 0 на безлічі спостережень, індекси яких входять в підмножина Н х

3) для всіх N спостережень обчислюються залишки регресії е х (г)

4) для спостережень з індексами з підмножини Я 1 обчислюється сума квадратів залишків

5) будується варіаційний ряд залишків, тобто проводиться їх упорядкування за абсолютною величиною

до, [я (1)] | <До, [тг (2)] | <... < e t [тг (Л г )] |,

де значення n (i) є номерами залишків у вихідній ряді; i - номер залишку в побудованому варіаційному ряду;

  • 6) формується безліч індексів Я 2 , до якого включаються номера перших h залишків варіаційного ряду Н 2 = {я (1), ..., я (Л)};
  • 7) за допомогою МНК обчислюється оцінка 0 (2) вектора 0 по h спостереженнями, індекси яких включені в підмножина # 2 ;

8) формується новий вектор залишків і обчислюється сума квадратів відхилень

Повторення З-кроків призводить до ітераційного процесу. Якщо Q X -Q 2де 5 - наперед задана досить мала величина (точність обчислення), то виконання алгоритму зупиняється; інакше виконується наступний С-крок, що призводить до Q v потім обчислюється | Q 2 -Q 3 | і т.д. Послідовність Q x > Q 2 > Q 3 ... є незростаюча, як показано в роботі [101], вона невід'ємна і тому з ростом числа ітерацій сходиться.

Самостійне значення має питання про вибір значення потужності h формованих підмножин, які називаються

концентрованими подмножествами. Очевидно, що занадто малі значення h будуть приводити до втрати ступенів свободи і, отже, до втрати точності, а надто великі - до включення аномальних спостережень в формуються підмножини, що призводить до нестійкості оцінок. За рекомендаціями II. Дж. Руссеу [1011 початкове значення потужності доцільно вибрати ([•] - операція взяття цілої частини числа) або h повинна приймати цілочисельні значення з відрізка

Однак якщо у дослідника є припущення про можливу частці викидів серед спостережень, то його необхідно враховувати при виборі значення h. Наприклад, якщо відомо, що в спостережуваних даних викиди складають менше 25%, то слід вибрати /? () = [0,75 л ]. Деякі результати досліджень розглянутих алгоритмів за допомогою обчислювальних експериментів можна знайти в роботі [75].

  • [1] Від англ. Least Trimmed Squares.
 
Переглянути оригінал
< Попер   ЗМІСТ   ОРИГІНАЛ   Наст >