ЕТАПИ ФАКТОРНОГО АНАЛІЗУ

Проведення факторного аналізу можна умовно розділити на шість послідовно виконуваних етапів. Назви етапів і загальна схема дій представлені на рис. 11.1. Розглянемо кожен з цих етапів докладніше.

Етап 1. Попередній. Першим кроком факторного аналізу є перехід до стандартизованим змінним (11.3). Після цього необхідно обчислити кореляційну матрицю, яка з урахуванням властивостей (11.2) може бути розрахована за формулою

В силу властивостей коефіцієнта кореляції дана матриця збігається з кореляційної матрицею вихідних ознак. З урахуванням умов (11.2) можна вважати цю матрицю ковариационной матрицею для змінних Z.

Етан 2. Оцінка спільнот. У факторному аналізі спільнотами називають величини Етапи факторного аналізу

Мал. 11.1. Етапи факторного аналізу

Спільність є частку одиничної дисперсії стандартизованої змінної, обумовлену впливом латентних факторів.

Спільності необхідно визначити до оцінювання матриці факторних навантажень, так як вони повинні замінити діагональні елементи матриці R. Кореляційна матриця, на головній діагоналі якої стоять спільності, називається скороченої і позначається R fr Існує велика кількість методів оцінки спільнот, багато з яких є чисто евристичними [13 , 25]. Розглянемо чотири найбільш відомих способу оцінки спільнот.

1. Оцінка спільнот з використанням максимального коефіцієнта кореляції:

де г - елементи кореляційної матриці R.

2. Оцінка спільнот з використанням коефіцієнта множинної кореляції, визначення та способи обчислення якого були розглянуті раніше (див. Підпункті 2.1.5 та параграф 4.12):

3. Оцінка спільнот з використанням методу факторизації, алгоритм якого представлений на рис. 11.2.

Алгоритм методу факторизації

Мал. 11.2. Алгоритм методу факторизації

Цей алгоритм є ітераційним. Перший крок полягає у визначенні початкового наближення оцінки спільнот. Далі послідовно використовується метод головних компонент (він буде докладно розглянуто нижче) і проводиться обчислення спільнот за формулою (11.7). Якщо відмінності між оцінками, отриманими на двох послідовних ітераціях, стають менше наперед заданої точності, то процес закінчується.

4. Оцінка спільнот з використанням процедури Гутмана [25], яка подається у вигляді рекурентного співвідношення

де D ~ l (k ) - діагональна матриця, головна діагональ якої збігається з головною діагоналлю R ^ (k).

Якщо при деякому k відмінності між оцінками R h (k + 1) і R h (k ) стають менше наперед заданої точності, то процес закінчується.

При використанні третього або четвертого способу оцінки в якості початкового наближення можна використовувати будь-яку пряму оцінку спільнот, наприклад оцінку, отриману першим або другим способом.

Етап 3. Рішення проблеми чинників. Ега проблема полягає в знаходженні структури і компонент матриці А. Завдання можна розділити на дві: визначення елементів матриці факторних навантажень і визначення числа стовпців матриці А чи числа латентних факторів, які потрібно враховувати в моделі (11.5). Звичайно, ці завдання тісно пов'язані: неможливо визначити елементи матриці факторних навантажень без визначення її розміру, але, незважаючи на це, дані завдання мають самостійне значення і заслуговують окремого розгляду.

Розберемо завдання визначення елементів матриці Л. Припустимо, що в моделі будуть залишені всі т головних компонент, в цьому випадку А буде квадратної х ти) матрицею. Поставивши вираз (11.5) в формулу (11.6), отримаємо

де - кореляційна матриця, що відображає

зв'язку між латентними факторами.

Якщо припустити, що латентні фактори некоррелі- рова (ортогональні), то С-1 і

Існує кілька методів визначення матриці факторних навантажень А [13, 25]. Одним з перших в 1927 р Л. Терстоуна був розроблений центроїдного метод, однак з розвитком обчислювальної техніки найбільшого поширення набув метод головних компонент (запропонований К. Пірсоном в 1901 р), який в даний час реалізований практично у всіх економетричних пакетах прикладних програм ( SAS, SPSS, Statistica і ін.).

Латентні фактори, отримані в результаті використання методу головних компонент, є ортогональними, тобто некоррелірованнимі. Ідея методу полягає в тому, що вираз (11.9), будучи системою рівнянь щодо елементів матриці факторних навантажень А, має однозначне рішення за умови

де - сума квадратів навантажень 7-го фактора.

Цю суму квадратів можна інтерпретувати як емпіричний аналог поясненої суми квадратів RSSj, обумовленої вліяніем7-го латентного фактора.

Розглянемо процедуру пошуку факторних навантажень для першого фактора. З умови (11.10) випливає, що S { повинна бути максимальною:

Умова (11.9) може бути записане таким чином:

Оптимізаційна задача (11.11) з обмеженнями (11.12) має аналітичне рішення, для його пошуку найзручніше скористатися методом множників Лагранжа [70]. В даному випадку цільова функція залежить від т змінних при наявності обмежень. Відповідно

з методом множників Лагранжа складемо функцію

де р = {| Т.} - симетрична матриця множників Лагранжа.

Обчислимо всі приватні похідні функції L (A , р) і прирівняємо їх до нуля:

де 5 ~ - символ Кронекера (8 ; / = 0 при i Ф j і 8 ~ = 1 при i = j ).

Помножимо вираз (11.13) на а п і підсумуємо по i. В результаті отримаємо

З виразу (11.13) випливає, що Далі, вважаючи отримаємо

Помножимо вираз (11.14) на a jk і підсумуємо по k

скориставшись умовою (11.12), отримаємо систему з т лінійних рівнянь щодо т невідомих а п

У матричному вигляді цю систему можна записати в такий спосіб:

де

Необхідною і достатньою умовою існування рішення системи (11.15) є рівність нулю визначника матриці коефіцієнтів цієї системи, що призводить до характеристическому рівняння, добре відомому в лінійної алгебри | 43 |:

Рішенням рівняння (11.16) може бути будь-яке власне значення матриці R , по з урахуванням умови (11.11) і рівність

очевидно, що цим рішенням є максимальне з власних чисел матриці R.

З властивостей кореляційної матриці (симетричність і неотрицательная визначеність) слід, що все її власні значення будуть речовими і позитивними [42, 251. Цей факт побічно підтверджується співвідношенням (11.17).

Підставами знайдене в систему (11.15) і отримаємо систему однорідних лінійних рівнянь, яка має безліч рішень. Нехай а, = (а п , а 21 , ..., а ш1 ) 7 - одне з її рішень (один з власних векторів матриці 7 ?, відповідний Х { ). З властивостей вектора а, і визначення S j слід, що елементи матриці факторних навантажень, що відповідають першому з латентних факторів, визначаються наступним чином:

Для того щоб отримати навантаження для другого фактора, потрібно взяти друге за величиною власне значення кореляційної матриці R. Точно так же наступні власні значення і відповідні їм власні вектори визначають навантаження інших факторів.

На практиці процедура знаходження власних значень і векторів не носить послідовний характер. Зазвичай все власні числа знаходяться одночасно, і їх кількість співпадає з розмірністю матриці R , тобто з кількістю вихідних ознак.

Тепер розглянемо задачу визначення числа стовпців матриці А чи визначення числа факторів, що включаються в підсумкову модель, вирішити яку допомагає впорядкування. З одного боку, додавання в модель чергового додаткового фактора збільшує пояснене дисперсії, а з іншого - це збільшення з кожним наступним фактором убуває. Необхідно знайти компроміс між прагненням максимально повно описати вихідні дані і природним бажанням мати в моделі тільки чинники з хорошою пояснює здатністю. Існує велика кількість методів вирішення цього завдання, багато з яких носять евристичний характер і являють собою досить прості і зрозумілі правила. Розглянемо найбільш відомі з них.

• У моделі слід залишати тільки ті фактори, у яких відповідне власне значення більше одиниці. З огляду на, що кожна вихідна змінна Z j має одиничну дисперсію, це правило дозволяє виключити фактори, що пояснює здатність яких менше будь-якого з вихідних ознак.

• Число факторів моделі не повинно перевищувати

Це правило продиктовано звичайними міркуваннями простоти факторного відображення і, природно, носить досить загальний характер.

• У модель слід включити таку кількість факторів, щоб їх сумарний внесок в пояснення дисперсію становив не менше 90%:

• Визначення кількості латентних факторів може бути проведено на основі так званого АВС-аналізу 1631. Цей широко застосовуваний в економіці емпірікоаналітіческій метод виділення номенклатурних груп виявляється універсальним і тому може бути поширений на цілий ряд найрізноманітніших додатків, в тому числі і для вирішення завдань факторного аналізу . Основна ідея А ВС-аналізу полягає в побудові кумулятивної кривої Парето за значеннями упорядкованих за зменшенням власних чисел X .. Для цього обчислюється функція

де s - номер чергового чинника.

Очевидно, що F (m) = 1.

Оскільки функція F (s) є дискретною, то для отримання якісних висновків необхідно визначення аналітичного виду відповідної F (s) неперервної функції, який може бути описаний за допомогою так званих S-подібних кривих або кривих зростання [3, 63]. Найчастіше на практиці для цих цілей використовують:

1) ступеневу функцію

2) радикальну функцію

3) функцію Баллоу

4) функцію Гомперца

Оцінювання параметрів цих функцій може бути здійснено різними методами регресійного аналізу. Питання про вибір конкретної кривої зростання для апроксимації функції F (s) може бути вирішене шляхом порівняння якості отриманих регресійних моделей.

Найпростіший спосіб використання кумулятивної кривої, званий принципом Парето, був запропонований Дж. М. Джу- раном [91] в 1937 р Згідно з цим принципом кількість чинників може бути визначено як 20% від загального їх числа або як рішення рівняння

Однак на практиці застосування принципу Парето часто може приводити до некоректних результатів. Це пояснюється тим, що реальні криві зростання можуть не задовольняти умові Парето (проходити через точку (г, 0,8)). Для розв'язання цієї проблеми використовуються спеціальні

аналітичні та алгоритмічні методи визначення числа латентних факторів [63]. Найпростішим з таких методів є диференційний, згідно якому} 'шукане число чинників визначається як рішення рівняння

Відзначимо, що при застосуванні диференціального методу використовують аналітичні вирази кривих зростання, отримані за результатами регресійного аналізу.

Всі ці методи, як правило, не суперечать один одному і часто дають схожі результати, проте в ряді випадків, використовуючи будь-який з них, можна отримати результати, які мало стосуються дійсності [13].

Покажемо це на досить простому прикладі. Візьмемо в якості матриці вихідних даних Y матрицю випадкових чисел, розподілених за нормальним законом. Це означає, що стандартизовані змінні z tj матимуть багатовимірне нормальний розподіл. Матриця вибіркових коефіцієнтів кореляції R НЕ буде одиничною через присутність в ній випадкових кореляцій. Отже, матриця R матиме т різних власних значень.

Якщо їх зобразити на графіку (рис. 11.3), то нескладно помітити, що вони лежать практично на одній прямій,

Власні значення кореляційної матриці, побудованої за нормально розподіленим випадковим числах

Мал. 11.3. Власні значення кореляційної матриці, побудованої за нормально розподіленим випадковим числах

причому одна частина з них буде більше одиниці, друга - менше. Цей же результат описаний в роботі [13].

Якщо скористатися одним з перерахованих вище методів, то швидше за все потрібно буде включити в модель п'ять або більше факторів. Однак матриця вихідних даних складається з випадкових чисел, і ніякі латентні фактори там не діють. Цей простий приклад показує небезпеку сліпого наслідування формальними критеріями. При прийнятті рішень слід використовувати описані методи комплексно, спираючись на змістовний сенс одержуваних факторів і моделі в цілому.

Слід зазначити, що можливе застосування методу головних компонент і до скороченої кореляційної матриці R fj} в цьому випадку метод головних компонент часто називають методом головних чинників , але загальна схема обчислення залишається незмінною.

Етап 4. Рішення проблеми обертання. Одна зі специфічних особливостей факторного аналізу полягає в тому, що отримується в результаті факторний відображення не єдиний. З геометричної точки зору можна розглядати матрицю факторних навантажень як проекцію значень вихідних ознак на підпростір, яке визначається латентними факторами. Базис цього підпростору може бути визначений різними способами, і будь-яке його невироджене лінійне перетворення, відповідно до теорії лінійної алгебри [43], також дає новий базис.

Факторний відображення, отримане але методу головних компонент, можна розглядати або як остаточний результат, або як деяке проміжне рішення, яке підлягає уточненню. Подальше перетворення, що проводиться з метою отримання рішення, яке допускало б найбільш просту інтерпретацію, приводить нас до проблеми обертання.

Пошук деякого більш змістовного рішення грунтується на концепції простої структури , введеної Л. Терстоуна [13, 25]. Перелічимо основні положення цієї концепції, згідно з якою дані рішення повинно відповідати таким вимогам:

  • • в кожному рядку факторної структури повинен бути хоча б один нуль;
  • • в кожному стовпці структури чинника має бути принаймні г нулів;
  • • для кожної пари стовпців можна знайти принаймні г змінних, для яких елементи структури чинника дорівнюють нулю в одному з цих двох стовпців і не рівні в іншому;
  • • якщо кількість факторів більше або дорівнює чотирьом, то досить велика частка параметрів, що мають в будь-якій парі стовпців одночасно нульові коефіцієнти;
  • • для будь-якої пари стовпців знайдеться невелика кількість параметрів, відповідні елементи яких в обох стовпчиках відмінні від нуля.

Якщо факторний рішення задовольняє концепції простої структури, то геометрично в площині будь-яких двох факторів Fj і F 2 буде спостерігатися наступна ситуація:

  • • багато точки лежать поблизу осей (факторів);
  • • велика кількість точок розташовується поблизу початку координат;
  • • відносно мала кількість точок розташовується далеко від початку координат.

Одним з недоліків цієї концепції є те, що вона практично не допускає суворої математичної формалізації. Дослідниками постійно робилися спроби так чи інакше формалізувати поняття простої структури, що призвело до появи досить великої кількості різних способів отримання остаточного факторного рішення.

При виборі методу потрібно заздалегідь визначитися, чи буде фінальна система факторів ортогональної або косокутній, тобто чи будуть фактори корельованими або некоррелірованнимі між собою. Первісне факторний рішення зручно отримувати за допомогою методу головних факторів, так як це рішення завжди ортогонально. У будь-якому випадку лінійне перетворення вихідного базису полягає в повороті вихідної системи координат і, можливо, в зміні кутів між осями, тобто проводиться обертання (рис. 11.4). Результатом обертання, як показано на малюнку, стає те, що різко знижуються величини відхилень точок факторного простору від нових осей координат.

Всі подібні методи засновані на пошуку матриці Т перетворення факторного відображення:

де Л - факторна матриця до обертання; В - факторна матриця після обертання.

Обертання системи координат простору латентних факторів F  і F

Мал. 11.4. Обертання системи координат простору латентних факторів F { і F 2

Пошук матриці Г, як правило, здійснюється шляхом розв'язання оптимізаційної задачі, а методи обертання відрізняються видом цільової функції. Розглянемо деякі з них 113, 251.

Метод квартімакс заснований на максимізації функції де

При використанні цього методу виходить ортогональное рішення, в якому фактори мають приблизно однакові пояснюють здатності і кожен рядок матриці факторних навантажень прагне задовольнити вимоги концепції простої структури.

Метод ворімакс також дає ортогональное рішення і грунтується на максимізації функції

На відміну від методу квартімакс, тут відбувається спрощення стовпців відповідно до вимог простої структури. В отриманому факторному вирішенні максимальної пояснює здатністю буде володіти перший фактор.

Метод облімакс призводить до косокутній системі координат. Для отримання фінального рішення необхідно максимізувати функцію

Метод облімін має більшу гнучкість у виборі ступеня гостроти кутів між осями координат. Він заснований на мінімізації наступної функції:

де параметр у визначає вид одержуваного рішення: при у = 0 - найбільш Косокутна система; при у = 0,5 - менш Косокутна система; при у = 1 - найменш Косокутна система (ортогональна).

Більш докладний опис методів обертання як для ортогональних, так і косокутних факторів можна знайти в роботі [25].

Етап 5. Оцінка значень факторів. Завдання оцінки значень факторів часто називають вимірюванням факторів. Вимірювання виділених латентних факторів можна провести з використанням звичайного методу найменших квадратів.

Для цього запишемо рівняння (11.5) у вигляді

де Е - помилка моделі, викликана скороченням кількості латентних факторів в порівнянні з кількістю вихідних ознак.

Оцінити матрицю Р можна наступним чином: або

Якщо після виділення латентних факторів проводилася процедура обертання, то в вираз (11.18) замість матриці А слід використовувати матрицю В.

Етап 6. Інтерпретація результатів. Одна з найважливіших задач факторного аналізу - знайти пояснення отриманим результатам. Складність полягає в тому, що латентні фактори не спостережувані і існує безліч факторних відображень. Завдання дослідника - вибрати з декількох прийнятних за формальними ознаками рішень то, яке найкращим чином відповідає змістовний бік досліджуваної проблеми.

Основа інтерпретації - це значення факторних навантажень. Якщо розглядаються ортогональні рішення, то вони є нічим іншим, як парними коефіцієнтами кореляції між знайденими латентними факторами і вихідними ознаками. При косокутних рішеннях сенс цих коефіцієнтів може змінитися (стають можливі значення факторних навантажень, що перевищують по модулю одиницю), але близькі до нуля значення як і раніше вказують на слабкий зв'язок. Природно, що увагу слід зосереджувати на найбільш значущих навантаженнях. Як емпіричний правила перевірки значущості факторних навантажень можна скористатися критерієм Баргмана [13], згідно з яким незначними є навантаження, для яких виконується умова

Для кожного фактора можна підрахувати так зване число нульових навантажень, тобто кількість вихідних змінних Z, для яких виконується умова (11.19). Знайдене число нульових навантажень порівнюють з критичним значенням, що залежать від ймовірності помилки, кількості вихідних змінних і числа виділених факторів (див. Додаток). Якщо для деякого фактора отримане число нульових навантажень більше критичного, то можна вважати, що цей фактор досить визначено змінними і його можна інтерпретувати.

При проведенні інтерпретації слід враховувати матриці факторних навантажень до і після обертання, а також оцінки значень факторів. Слід пам'ятати, що рішення, отримані при різних числах факторів і різних методах обертання, можуть істотно відрізнятися один від одного. Тому бажано розглянути кілька можливих варіантів рішення і вибрати той, який найкраще піддається змістовної інтерпретації.

 
Переглянути оригінал
< Попер   ЗМІСТ   ОРИГІНАЛ   Наст >