Навігація
Головна
 
Головна arrow Економіка arrow Економетрика
< Попередня   ЗМІСТ   Наступна >

АНАЛІЗ ПАНЕЛЬНИХ ДАНИХ

Панельні дані і їх переваги

Термін "панельні дані" (panel data) прийшов з обстежень індивідів, і в цьому контексті "панель" представляла собою групу індивідів, за якими регулярно здійснювали спостереження протягом певного періоду часу. В даний час методи аналізу панельних даних набули великого поширення, і розуміння панельних даних стало набагато ширше. Поряд з терміном "панельні дані" іноді також використовується термін " лонгітюдние дані " (longitudinal data ).

Панельні дані складаються з повітряних спостережень одних і тих же вибіркових одиниць, які здійснюються в послідовні періоди часу. Як об'єкти спостереження можуть виступати індивіди, домашні господарства, фірми, країни і т.д. Прикладом панельних даних можуть бути щорічні обстеження одних і тих же домашніх господарств або індивідів (наприклад, для визначення зміни їхнього добробуту), щоквартальні дані про економічну діяльність окремих компаній, щорічні соціально-економічні показники для регіонів однієї країни або для групи країн і т.д .

Панельні дані поєднують в собі як просторові дані, так і тимчасові ряди і поєднують гідності кожного з цих видів даних. Це дозволяє будувати більш адекватні і змістовні моделі для вивчення істинної причинно-наслідкового зв'язку між різними змінними, що є неможливим в рамках тільки тимчасових або тільки просторових даних. Виділяють наступні переваги використання панельних даних.

  • 1. Панельні дані дозволяють враховувати індивідуальну неоднорідність. Тимчасові ряди або просторові дані не завжди дозволяють врахувати неоднорідність індивідів, фірм, регіонів або країн, що може привести до зміщеним оцінками. Так, наприклад, в дослідженні Б. Балтагі і Д. Левіна [1] вивчався попит на сигарети в США. Попит моделювався як функція від лагов споживання, ціни і доходу. Ці змінні відрізнялися по штатах і контингентах в часі. Однак існувало безліч інших факторів, що розрізняються по штатах або в часі, які могли впливати на споживання, наприклад такі фактори, як релігія, освіту і реклама на телебаченні і радіо. При вимірюванні цих змінних для кожного штату і періоду часу виникають певні труднощі і дуже складно досягти того, щоб їх можна було включити в рівняння споживання. Однак пропуск цих змінних призведе до зміщення в оцінках. Панельні дані здатні враховувати змінні, що відрізняються по штатах і контингентах в часі, незалежно від того, вимірювані вони чи ні, в той час як тимчасові ряди або просторові дані не дозволяють цього зробити. Таким чином, панельні дані дають можливість уникнути помилки специфікації, що виникає через те, що істотні змінні не включені в модель.
  • 2. Панельні дані містять велику кількість спостережень і тим самим надають досліднику більшу кількість інформації, їм властива велика варіація і менша коллінеарність пояснюють змінних, вони дають більше число ступенів свободи і забезпечують більшу ефективність оцінок. При аналізі часових рядів дослідники часто стикаються з мультіколлінеарності факторів. Наприклад, в розглянутому вище випадку з попитом на сигарети існувала висока залежність між ціною і доходом в агрегованих тимчасових рядах для США. Висока коллінеарність між цими факторами буде менш імовірна при використанні панельних даних по штатах, так як просторовий вимір трохи збільшує варіацію факторів і робить більш інформативними дані за ціною і доходу. Дійсно, варіація в даних може бути розкладена на дві складові: варіацію між штатами різних розмірів і з різними характеристиками і варіацію всередині штатів, при цьому остання зазвичай завжди більше. До того ж більш інформативні дані можуть привести до більш надійним оцінками параметрів.
  • 3. Панельні дані надають можливість вивчати динаміку змін індивідуальних характеристик одиниць сукупності. Панельні дані добре підходять для вивчення зміни роботи, періоду безробіття, змін в доходах, для дослідження тривалості перебування в певному економічному стані, наприклад в бідності або в якості безробітного, а також можуть допомогти вивчити швидкість пристосування індивідів до змін в економічній політиці. Так, при вимірюванні безробіття просторові дані дозволяють оцінити, яку частку в сукупності складають безробітні в конкретний момент часу; тимчасові дані можуть показати, як ця частка змінювалася в часі; і тільки панельні дані дозволяють оцінити, яка частка тих, хто був безробітним в один період, залишиться безробітним в інший період. Панельні дані можуть використовуватися як для пояснення того, чому різні одиниці сукупності ведуть себе по-різному, так і для того, щоб визначити, чому конкретна одиниця сукупності поводиться по-різному в різні періоди часу.
  • 4. Панельні дані краще здатні ідентифікувати і виміряти ефекти, які просто не обумовлений тільки в тимчасових рядах або тільки в просторових даних. Як приклад може виступати дослідження того, чи відбувається збільшення або зменшення заробітної плати за рахунок членства в профспілці. На це питання найкраще відповісти, якщо ми спостерігаємо перехід працівника з роботи з профспілкою на роботу без профспілки або навпаки, а це можуть відобразити тільки панельні дані. Розглядаючи індивідуальну характеристику працівника в якості константи, можна буде визначити, чи робить вплив членство в профспілці на зарплату і наскільки. Подібний аналіз може також використовуватися для оцінки інших типів диференціації зарплати, наприклад, для оцінки премії, що виплачується за небезпечну або неприємну роботу.
  • 5. Панельні дані дозволяють конструювати і тестувати більш складні поведінкові моделі, ніж просторові дані і тимчасові ряди окремо. Наприклад, технічна ефективність краще вивчається і моделюється за панельними даними. Також в панелях може бути накладено менше обмежень на моделі розподіленого лага, які зазвичай розглядаються в тимчасових рядах.
  • 6. Панельні дані дозволяють уникнути зсуву, пов'язаного з агрегування даних, так як панельні дані, зібрані на мікрорівні (по індивідам, фірмам або домашнім господарствам), можуть бути виміряні більш точно, ніж аналогічні змінні, отримані на макрорівні. При цьому в тимчасових рядах розглядається зміна в часі характеристик деякої усередненої репрезентативною одиниці сукупності, а в просторових даних не враховуються неспостережувані індивідуальні характеристики одиниць сукупності.
  • 7. Панельні дані макрорівня мають довші часові ряди, і панельні тести на одиничний корінь мають стандартні асимптотические розподілу на відміну від проблеми нестандартних розподілів, типовою для тесту на одиничний корінь в аналізі часових рядів.

Однак у панельних даних є і недоліки. Певні проблеми пов'язані зі збором даних: проблема покриття, тобто неповний облік цікавить сукупності; відсутність відповіді, яке може бути пов'язане як з відсутністю взаємодії з респондентом, так і з помилкою інтерв'юера, спотворення, пов'язані з помилками вимірювання, які можуть виникнути через неправильної відповіді через неясною формулювання питання, помилок пам'яті, навмисного спотворення відповіді (престижне зміщення ), невідповідних інформантів, помилкового запису відповідей і ефектів інтерв'юера.

Відсутність даних може бути викликано різними причинами. Наприклад, якщо індивіди вибирають, що їм не варто працювати, тому що пропонована зарплата нижче мінімального розміру оплати праці, то в цьому випадку для цих індивідів будуть відсутні дані по зарплаті, але будуть матися дані по іншим характеристикам. Так як пропущена тільки їх зарплата, то вибірка буде цензурувати. Однак якщо ми не спостерігаємо всіх даних цих індивідів, то вибірка буде вже усіченої, і в результаті вийдуть зміщені оцінки. У першій хвилі панелі відсутність відгуку може бути пов'язано з тим, що обраний індивід або домогосподарство відмовилися брати участь в опитуванні або просто нікого не було вдома. Часткова відсутність відгуку виникає, коли не дано відповіді на один або кілька питань. У наступних хвилях панелі внаслідок відсутності відповіді може виникнути проблема виснаження даних, коли респондент, раніше брав участь в опитуваннях, може померти, переїхати на інше місце проживання або виявити, що витрати на участь в опитуванні для нього стали занадто великими, і відмовитися від подальшої участі .

В даний час панельні обстеження в різних формах проводяться в багатьох країнах. Вперше панельні дані почали формуватися в США в 1960-х рр. Серед найбільш відомих баз панельних даних США можна виділити PSID і NLS.

Панельне дослідження динаміки доходів ( The US Panel Study of Income Dynamics ( PSID ), psidonline.isr.umich.edu /) - база панельних даних по американських домогосподарств, що збирається Інститутом соціальних досліджень Мічиганського університету. База PSID з'явилася в 1968 році і включала дані по 4800 сім'ям. В даний час вона охоплює близько 9000 американських сімей. Дані містять більше 5000 змінних по економіці, демографії, здоров'ю та соціальної поведінки.

Національні лонгітюдние дослідження ( National Longitudinal Surveys ( NLS ), bls.gov / nls / horrktm) - панельні дослідження, спонсоровані Бюро трудової статистики США, які почали проводитися з 1966 р На прикладі декількох груп чоловіків і жінок вивчаються різні аспекти активності на ринку праці і інші значні події в житті цих людей.

Європейські панельні дані стали з'являтися тільки в 1980-х рр. Так, наприклад перша хвиля панельного обстеження Німецькій соціально-економічної панелі (Soziooekonomisches Panel ( SOEP ), diw.de/soep ), що формується Німецьким інститутом економічних досліджень ( Deutsches Institut fiir Wirtschaftsforschung ( DIW ), Berlin ), відбулася в 1984 р і охопила більше 5000 західнонімецьких домогосподарств. В даний час це обстеження містить дані близько 11 000 домогосподарств, які включають в себе демографічні змінні, зарплату, дохід, виплату допомог, рівень задоволеності різними аспектами життя, надії і страхи, політичну активність і т.д. З 1991 року Інститутом соціальних і економічних досліджень Ессекского університету проводиться панельне дослідження британських домогосподарств ( The British Household Panel Survey ( BHPS ), iser.essex.ac.uk/survey / bhps). Це національна репрезентативна вибірка 5500 домогосподарств і 10 300 індивідів, вибраних з 250 районів Великобританії. Ці дані відображають демографічні характеристики домогосподарств, ринок праці, здоров'я, освіту, житлові умови, споживання, дохід і т.д. У 1994- 2001 рр. за сприяння Євростату проводилося Європейське панельне обстеження домогосподарств ( The European Community Household Panel ( ECHP ), epunet.essex.ac.uk / echpphp), в рамках якого в країнах, які є членами Євросоюзу, збиралися дані домогосподарств за доходом, роботі та безробіття, бідності , житлу, здоров'ю і т.д.

У Росії панельні обстеження стали проводитися в 1990-х р Найбільш відомою базою панельних даних є РМЕЗ - Російський моніторинг економічного стану і здоров'я населення ( Russia Longitudinal Monitoring Survey (RLMS), cpc.unc.edu / projects / rims). РМЕЗ являє собою серію загальнонаціональних репрезентативних опитувань домогосподарств і індивідів, що проводилися в Росії з 1992 р Дані обстежень містять відповіді на більш ніж 3000 питань, що стосуються доходів і витрат, матеріального добробуту, зайнятості, рівня освіти, стану здоров'я і т.д.

  • [1] Baltagi В. Н . and Levin D. Cigarette taxation: Raising revenues and reducing consumption, Structural Change and Economic Dynamics. 1992. 3. Pp. 321-335.
 
Якщо Ви помітили помилку в тексті позначте слово та натисніть Shift + Enter
< Попередня   ЗМІСТ   Наступна >
 
Дисципліни
Агропромисловість
Аудит та Бухоблік
Банківська справа
БЖД
Географія
Документознавство
Екологія
Економіка
Етика та Естетика
Журналістика
Інвестування
Інформатика
Історія
Культурологія
Література
Логіка
Логістика
Маркетинг
Медицина
Нерухомість
Менеджмент
Педагогіка
Політологія
Політекономія
Право
Природознавство
Психологія
Релігієзнавство
Риторика
Соціологія
Статистика
Техніка
Страхова справа
Товарознавство
Туризм
Філософія
Фінанси
Пошук