МОДЕЛЬ ПАРНОЇ ЛІНІЙНОЇ РЕГРЕСІЇ

Після вивчення даного розділу студент повинен:

  • • знати
  • - основне завдання регресійного аналізу та методи її вирішення; основні припущення методу найменших квадратів (МНК); властивості МНК-оцінок;
  • • вміти
  • - перевіряти статистичні гіпотези щодо властивостей моделі парної регресії; інтерпретувати результати регресійного аналізу;
  • • володіти
  • - методом найменших квадратів; методами аналізу моделі лінійної парної регресії; методами побудови прогнозів по моделі парної регресії.

Основне завдання парного регресійного аналізу

Нехай є спостереження за двома ознаками X і Y. Припустимо, що проведений раніше кореляційний аналіз показав наявність значущої лінійного зв'язку між цими ознаками. Кожне ie спостереження можна зобразити на площині факторного простору у вигляді точки

Графічне представлення вихідних даних при побудові парної регресії

Мал. 3.1. Графічне представлення вихідних даних при побудові парної регресії

з координатами ( х г г / г ), як показано на рис. 3.1. Завдання полягатиме в тому, щоб знайти таке рівняння лінійної залежності, яке б «найкращим чином» описувало вихідні дані.

Для визначеності будемо вважати, що Y - це залежна змінна, а X - незалежна і постараємося знайти аналітичне рівняння, математично описує цю залежність. Тоді загальний вигляд моделі, яка описує кожне спостереження вихідних даних, можна записати в такий спосіб:

де N - загальне число спостережень; y i - значення ознаки (змінної) У в i -му спостереженні; x j - значення ознаки (змінної) X в i-м спостереженні; е. - випадкова величина (помилка спостереження); 0 Про , 0j - невідомі параметри.

Рівняння (3.1) називається рівнянням парної регресії , або регресійний рівнянням. Значення х { є детермінованими (невипадковими) величинами, a y i - стохастическими (випадковими) величинами в силу випадковості е г Присутність в регресійному рівнянні випадкової величини e j є обов'язковим. Цей факт можна пояснити рядом причин. Одна з них пов'язана з тим, що дана модель є спрощенням дійсності, і, отже, в ній можуть бути відсутні фактори, що впливають на відгук. Наприклад, оборот підприємства може залежати не тільки від цін на продукцію, а й від економічної ситуації в країні, дій конкурентів і цілого ряду інших факторів, які або не піддаються вимірюванню, або виявилися втрачені на постановочному етапі аналізу. Інша причина може бути пов'язана з наявністю помилок (похибок) при зборі та реєстрації статистичних даних.

Зауважимо, що на практиці при вивченні залежностей між змінними можуть одночасно розглядатися рівняння у = f (x, 0) і х = g (y , 0), звані прямий і зворотній регрессиями відповідно. Питання про вибір конкретного рівняння має вирішуватися на основі аналізу сутності досліджуваного об'єкта або явища.

Співвідношенням (3.1) визначається не тільки рівняння одній прямій, а ціле сімейство рівнянь. При цьому кількість можливих рівнянь в сімействі нескінченно, і кожне з них відрізняється від будь-якого іншого своїми значеннями параметрів 0 () , 0 ,. Таким чином, вибір

«Найкращого» рівняння зводиться до вибору конкретних значень параметрів 0 Про і 0 Г

 
Переглянути оригінал
< Попер   ЗМІСТ   ОРИГІНАЛ   Наст >