АНАЛІЗ МНОЖИННИХ ЗВ'ЯЗКІВ

Раніше аналізувалися парні зв'язку між випадковими кількісними змінними X і Y. Сила зв'язку оцінювалася за допомогою парного (повного) коефіцієнта кореляції г = г ^. При одночасному спостереженні над великим числом випадкових величин Ь Х 2 , ...) взаємозв'язок між змінними ускладнюється.

Приватний (умовний) коефіцієнт кореляції

Парний коефіцієнт кореляції г, -, - між випадковими змінними Х ( і X не можна використовувати як абсолютний показник тісноти зв'язку. Наявність кореляції ще не означає наявності причинно-наслідкових зв'язків між величинами. Наприклад, помилкова позитивна кореляція може виникнути в разі, коли обидві величини X t , Xj є наслідками єдиної причини - залежністю їх від Х ь в той час як при фіксованому Х до ці величини статистично незалежні.

Тому при вивченні зв'язку між двома величинами X it Xj з багатовимірної сукупності необхідно виключити вплив інших величин Х до , тобто встановити тісноту зв'язку при фіксованому значенні Х до . У цьому випадку використовується приватний, або умовний, коефіцієнт кореляції величин (Xj, X j), без врахування впливу Х до , інакше - приватний коефіцієнт першого порядку

де г, - ,, r ik , r ) k - парні коефіцієнти кореляції. Величина r i] k нормована і знаходиться в межах від -1 до +1. У разі незалежності X t і Xj від Х до маємо r ik = = 0 і Гц = r ij k .

Таким чином, приватний коефіцієнт кореляції між двома змінними дозволяє оцінити ступінь тісноти лінійного зв'язку, очищеної від опосередкованого впливу інших факторів.

Для чотирьох змінних можна обчислити приватні коефіцієнти кореляції другого порядку за рахунок виключення коефіцієнтів першого порядку.

Обчислення приватного коефіцієнта кореляції r yj X порядку р виконується після обчислення приватного коефіцієнта кореляції порядку р - 1 і в кінцевому рахунку - після обчислення парних коефіцієнтів кореляції. Величина г ^ х характеризує

частку залишкової дисперсії ознаки у, отриману додаванням змінної Xj до набору X.

Множинний (сукупний) коефіцієнт кореляції

Множинний коефіцієнт кореляції є мірою тісноти статистичного зв'язку будь-якої форми між однієї випадкової змінної Y і безліччю інших змінних Х ь Х 2 , ..., Х р . Вибіркове значення множинного коефіцієнта позначається через R y | X . Він визначається аналогічно измерителю парної зв'язку - індексу кореляції 1 у х - через множинний коефіцієнт детермінації

Величина R ^ x характеризує частку впливу обраних змінних ^, Х 2 , ..., Х р на загальну дисперсію змінної у. величина

ж є часткою стандартного відхилення у, яка

залежить від невідомих змінних не входять до складу X. Тому якщо R y | X = 0,9, то Таким чином, навіть

при досить високій силі зв'язку 44% стандартного відхилення у залишається непоясненим.

 
Переглянути оригінал
< Попер   ЗМІСТ   ОРИГІНАЛ   Наст >