ПРИВАТНА І МНОЖИННА КОРЕЛЯЦІЇ

Тепер перейдемо до більш складної ситуації, коли необхідно провести аналіз залежності між декількома ознаками. У цьому випадку основною характеристикою, використовуваної при вивченні лінійних зв'язків, є матриця, складена з парних коефіцієнтів кореляції (кореляційна матриця ):

де р = r xx ; i = 1, n; j = 1, ..., п.

Тут слід звернути особливу увагу на те, що використання в якості запобіжного лінійної залежності тільки парних коефіцієнтів кореляції може призводити до неправильних висновків.

Наприклад, розглянемо процес виробництва, який характеризується трьома ознаками: якість вихідної сировини (X,), якість продукту, що випускається (Х 2 ), кваліфікація персоналу підприємства (Х 3 ). Очевидно, що якість продукції пов'язано з якістю вихідної сировини і кваліфікацією персоналу, і припустимо, що цей зв'язок лінійна. Якщо тепер спробувати визначити парний коефіцієнт кореляції між ознаками Х { і Х 3 і він виявиться значним, то необхідно буде зробити висновок про наявність лінійної залежності між якістю вихідної сировини і кваліфікацією персоналу. Такий висновок, природно, викликає подив. У чому ж тут проблема? Справа в тому, що парний коефіцієнт кореляції ніяк не враховує наявність і непрямий вплив третьої ознаки (рис. 2.5). Якщо вплив цієї ознаки дуже істотно, то воно буде призводити до появи значущих парних

Кореляційні зв'язку трьох ознак

Мал. 25. Кореляційні зв'язку трьох ознак

коефіцієнтів кореляції навіть для тих пар ознак, між якими лінійного зв'язку немає.

Для того щоб коректно визначити наявність лінійної залежності між ознаками, необхідно виключити опосередкований вплив інших факторів. Це можливо здійснити, використовуючи приватні коефіцієнти кореляції.

Приватний коефіцієнт кореляції - міра лінійності залежності між двома ознаками при виключенні впливу інших ознак. Залежно від кількості ознак, вплив яких виключається, розрізняють приватні коефіцієнти кореляції першого, другого і більш високих порядків.

Окремі коефіцієнти кореляції мають власне позначення. Наприклад, для випадку трьох ознак { , Х 2 , Х 3 ) приватний коефіцієнт кореляції першого порядку між Х { і Х 2 при виключенні впливу Х 3 виглядає наступним чином:

де г 12 , г 13 , г 23 - елементи кореляційної матриці, розрахованої для ознак X v Х 2 , Х 3 .

Окремі коефіцієнти кореляції більш високих порядків позначаються, наприклад, r Xi x 2 . Xr .. x і обчислюються

значно складніше 11, 28).

Перевірка значущості приватних коефіцієнтів кореляції проводиться таким же чином, як і для парних коефіцієнтів кореляції. Відмінність полягає лише в тому, що число ступенів свободи у статистики Стьюдента скорочується. Обчислення ^ -Статистика проводиться за формулою

де р - порядок приватного коефіцієнта кореляції. Ця статистика має розподіл Стиодента з (Np - 2) ступенями свободи.

Для того щоб визначити тісноту спільного впливу даного безлічі ознак на деякий виділений ознака, використовують множинний коефіцієнт кореляції [1, 28]. Множинний коефіцієнт кореляції є мірою лінійності залежності між виділеним ознакою і набором інших ознак.

Як і приватні, множинні коефіцієнти кореляції мають своє позначення. Наприклад, для випадку трьох ознак множинний коефіцієнт кореляції між виділеним Х х і іншими ознаками Х 2 , Х. л виглядає наступним чином:

Для більшої кількості змінних способи обчислення множинних коефіцієнтів наводяться в [1, 28]. Наприклад, можна скористатися елементами зворотного матриці R ~ u .

де (г { ) jj - j-й діагональний елемент матриці R { .

 
Переглянути оригінал
< Попер   ЗМІСТ   ОРИГІНАЛ   Наст >