КОЕФІЦІЄНТ КОРЕЛЯЦІЇ ТА ЙОГО ВЛАСТИВОСТІ
Об'єктивні висновки повинні спиратися на суворі математичні розрахунки. Одним з найпоширеніших способів вимірювання тісноти зв'язку між двома ознаками є парний коефіцієнт кореляції , який можна обчислити за такою формулою:
де
- оцінка
середнє відхилення відповідно для ознак х , у.
Середньоквадратичне відхилення визначається як квадратний корінь з дисперсії ознаки g x =
як правило, справжнє значення дисперсії сг невідомо, а за наявними даними визначається так звана вибіркова дисперсія ознаки. Обчислення вибіркової дисперсії можна проводити двома способами:
Вибіркова дисперсія (2.3) є несмещенной оцінкою величини сг., В той час як вибіркова дисперсія (2.2) зміщена щодо істинного значення а 2х на
величину
Очевидно,
що величини (2.2) і (2.3) пов'язані між собою співвідношенням
З цього співвідношення випливає, що оцінка (2.2) є більш ефективною, тобто має меншу дисперсією. Крім того, при досить великій кількості спостережень обидві ці оцінки дають дуже близькі результати.
Парний коефіцієнт кореляції має такі властивості.
- 1. Симетричність, тобто r xif = г ух .
- 2. Допустимі значення парного коефіцієнта: -1 < р <1.
- 3. Знак парного коефіцієнта кореляції вказує на тип залежності: г х { > 0 свідчить про позитивну залежності, г <0 - про негативну.
4. При наявності суворої функціональної лінійної залежності між ознаками х та у виконується рівність
5. При відсутності лінійної залежності між ознаками х та у коефіцієнт г = 0.
Таким чином, парний коефіцієнт кореляції є мірою лінійності зв'язку між двома ознаками. Іншими словами, чим ближче абсолютне значення коефіцієнта кореляції до одиниці, тим спостерігається залежність ближче до лінійної.