Навігація
Головна
 
Головна arrow Маркетинг arrow Маркетингові дослідження
< Попередня   ЗМІСТ   Наступна >

Імовірнісні способи побудови вибірки

data-override-format="true" data-page-url = "http://stud.com.ua">
data-override-format="true" data-page-url = "http://stud.com.ua">

Розглянемо тепер основні принципи, що лежать в основі чотирьох імовірнісних способів побудови вибірки: двох способів випадкового відбору (простого і систематичного) і двох способів поліпшення результатів відбору (методів стратифікації та кластеризації).

Методи побудови імовірнісних вибірок характеризуються таким показником, як ефективність. Концепція ефективності методу відображає компроміс між витратами і точністю. Точність характеризує ступінь невизначеності щодо значень вимірюваних характеристик. Чим вище точність, тим вище витрати. Дослідник повинен постаратися вибрати найбільш ефективний план побудови вибірки, виходячи з розміру відпущених коштів. Ефективність імовірнісних методів можна оцінювати, порівнюючи точність їх роботи з точністю простий випадкової вибірки. При цьому перевищити ефективність простої випадкової вибірки вдається тільки тим дослідникам, які до початку дослідження вже володіють певними знаннями про досліджувану сукупності, апріорної інформацією про неї.

Проста випадкова вибірка (simple random sampling, або SRS). При побудові простої випадкової вибірки (SRS) кожен елемент досліджуваної сукупності має відому, причому однакову, ймовірність потрапити до вибірки. Більше того, відома і однакова ймовірність того, що в результаті відбору буде отриманий будь-який конкретний варіант вибірки даного розміру (n). Звідси випливає, що елементи витягуються з основи вибірки випадковим чином, причому незалежно один від одного. Цей метод можна представити як лотерею, в якій імена всіх можливих респондентів поміщаються в барабан і перемішуються, після чого без всяких зміщень витягуються імена "переможців".

Для вибору елементів досліджуваної сукупності раніше застосовували таблиці випадкових чисел, а зараз - комп'ютерні програми, генеруючі випадкові послідовності чисел.

Метод SRS володіє рядом достоїнств: він простий і легко пояснимо, вибіркові оцінки можуть бути узагальнені на всю досліджувану сукупність. Більшість статистичних висновків базуються на припущенні, що вибірка отримана саме з його допомогою.

Але цей метод має і дуже серйозні недоліки, що обмежують його застосування. По-перше, часто буває дуже важко сконструювати основу вибірки так, щоб можна було витягти з неї просту випадкову вибірку. Наприклад, не існує зібраних воєдино комп'ютеризованих списків усіх жителів Росії. І навіть якби такі списки існували, вони щомиті б застарівали. По-друге, вибірка, отримана даним методом, часто виявляється настільки розкиданої географічно, що дослідження стає неприйнятним як за вартістю, так і за термінами. (Так, може "випасти" по одному респонденту в сотнях далеких сіл, що потребують надзвичайно високих витрат на відрядження.) По-третє, при невеликому розмірі вибірки розглянутий метод може і не забезпечувати репрезентативності. Хоча в середньому такі вибірки добре наближають населення, кожна конкретна вибірка може містити сильні диспропорції.

Систематична випадкова вибірка (systematic sampling) будується так. Всі N одиниць відбору, що утворюють досліджувану сукупність, впорядковуються відповідно з яким-небудь показником, який відомий заздалегідь і якомога сильніше корелює з досліджуваними маркетинговими характеристиками. Отриманий список розділяється на n діапазонів, по числу одиниць, які слід відібрати у підсумку.

З кожного діапазону у вибірку включається по одній одиниці відбору, причому її номер всередині діапазону завжди один і той же. Він визначається одноразовим випадковим відбором в першому діапазоні. Наприклад, якщо на кожен діапазон довелося по 100 одиниць відбору і в першому діапазоні випадковим чином відібрана одиниця № 23, то вибірку складуть одиниці відбору № 23, 123, 223, 323 і т.д.

Якщо показник, за зростанням якого упорядковуються одиниці відбору перед побудовою вибірки, не пов'язаний з маркетинговими характеристиками, які повинні бути вивчені в ході опитування, наприклад якщо прізвищ людей, що складають досліджувану сукупність, упорядковані за алфавітом, методи систематичного відбору та простого випадкового відбору дають дуже близькі результати.

Але зазвичай одиниці відбору впорядковують за ознакою, який тісно корелює з досліджуваними маркетинговими характеристиками. Наприклад, власники кредитних карт можуть бути впорядковані за сумою неоплаченого кредиту, а фірми, що відносяться до певної галузі, - за сумою річних продажів. У таких випадках систематичний випадковий відбір опитування знижує випадкову похибку дослідження за рахунок гарантованого підтримки в структурі вибірки правильних пропорцій.

Зауважимо, що такого результату вдається домогтися за рахунок того, що дослідник щось заздалегідь знає про досліджувану сукупності.

Методи стратифікації і кластеризації теж дозволяють домогтися бажаних результатів (але, зауважимо, - різних) за рахунок використання дослідником апріорної інформації. Перший з цих методів призначений для зниження випадкової похибки дослідження, а другий - для зниження витрат.

Метод стратифікації (stratified sampling)

Приклад 9.8

Застосування методу стратифікації

Ідею методу стратифікації добре ілюструє наступний умовний приклад. Нехай нам потрібно оцінити середній заробіток на заводі, де працюють 20 тис. Чоловік. Припустимо, що, маючи доступ до інформації про посади працівника, ми з'ясували, що на цьому заводі є п'ять категорій працівників: один директор, три його заступника, п'ятнадцять начальників цеху, 250 майстрів, а інші робочі. Уявімо собі ідеальну для дослідника ситуацію, коли всі працівники однієї категорії отримують в точності однакову зарплату. Тоді у вибірку треба включити всього п'ять чоловік: директора, одного (причому неважливо, якого саме) заступника, одного начальника цеху і т.д. Дізнавшись з опитування їхню зарплату і взявши її з певними ваговими коефіцієнтами, які легко розрахувати, можна отримати ідеально точне уявлення про середній заробіток на заводі.

У реальності, звичайно, настільки ідеального результату досягти не вдається, але чим точніше дослідник розділить досліджувану сукупність на що істотно розрізняються між собою і як можна більш однорідні всередині частини, іменовані стратами, тим сильніше у результаті йому вдасться знизити випадкову похибку опитування.

Побудова стратифікованої вибірки являє собою двустадийному процес, в ході якого безліч елементів, що утворюють досліджувану сукупність, поділяється на підмножини або страти так, що кожен її елемент входить в одну і тільки одну страту. Потім у кожній страті відбирається потрібне число елементів. Формально для відбору в стратах повинна використовуватися процедура простого випадкового відбору (SRS). Практично ж іноді застосовують систематичний відбір або інші імовірнісні процедури. Таким чином, на відміну від методу квот, тут відбір здійснюється не на розсуд або виходячи зі згоди респондентів, а імовірнісними методами. Основна мета стратифікації - підвищити точність без збільшення ціни.

Перше рішення, яке приймає дослідник при використанні даного методу, стосується параметрів стратифікації, тобто змінних, на основі яких досліджувана сукупність ділиться на страти.

При відборі цих параметрів виходять з наступних міркувань. По-перше, елементи, складові кожну страту, повинні бути якомога більш схожими між собою. По-друге, елементи, що входять в різні страти, повинні бути як можна більш різними. По-третє, параметри стратифікації повинні бути якомога тісніше пов'язані з важливими дослідника характеристиками: чим тісніше цей зв'язок, тим точніше одержувані оцінки. Нарешті, по-четверте, змінні стратифікації повинні бути такими, щоб процес стратифікації був простим і зручним в роботі і, отже - дешевим.

Зазвичай для стратифікації, як і для квотування, використовують демографічні характеристики, тип споживача (наприклад, власники кредитних пластикових карт і пластикових карт, що не дають права кредитування), розмір фірми або галузь. Взагалі, можна вибирати дві і більше змінних стратифікації одночасно, але більше двох - вкрай рідко, так як це складно і дорого. Хоча число страт встановлюється на розсуд дослідника, зазвичай їх буває не більше шести. Якщо їх більше, то виграш у точності оцінок зазвичай виявляється менше, ніж зростання витрат на стратифікацію і побудова вибірки.

Приклад 9.9

Вибір параметрів стратифікації

В ряду щотижневих телефонних опитувань було проведено опитування 1 030 респондентів (525 жінок і 505 чоловіків), присвячений туризму [30]. Для стратифікації слугували чотири змінні: стать, вік, дохід і місце проживання. Дослідження показало, що відмінності у ставленні до подорожей спостерігаються тільки між людьми різного віку. Так, у віці 25-49 років, коли з найбільшою ймовірністю в сім'ї є діти, люди віддають перевагу поїздкам в місто Орландо або в штат Флорида. У тих, кому 65 років і більше, найбільш популярні поїздки в штат Вашингтон або центральний район (DC). Найбільш важливим пріоритетом подорожі є для осіб у віці від 18 до 34 років. Таким чином, корисним параметром стратифікації виявився тільки вік. Якби це було відомо заздалегідь, вартість дослідження можна було б знизити, не зменшуючи її точності.

Другим важливим рішенням, яке треба прийняти при побудові стратифікованої вибірки, - це вибір між пропорційним і непропорційним відбором. При пропорційному відборі число елементів, що витягають із кожної страти, пропорційно її розміром. При непропорційному відборі з кожної страти витягується число елементів, пропорційне добутку відносного розміру страти на стандартне відхилення розподілу цікавить дослідника характеристики на всіх елементах страти. Ідея, що лежить в основі непропорційного відбору, проста. З одного боку, чим більше відносний розмір страти, тим сильніше вона впливає на загальний середнє значення цікавить дослідника характеристики і для відображення її ролі з неї треба витягти більше елементів. З іншого боку, щоб підвищити точність, потрібно витягти більше елементів з тих страт, де сильніше коливання цікавить дослідника характеристики, і менше - з страт, де ці коливання малі. Наприклад, якщо значення досліджуваної характеристики на всіх елементах якої-небудь страти в точності однакові, з неї досить включити у вибірку лише один елемент. Таким чином, пропорційний відбір можна вважати окремим випадком непропорційного відбору, коли стандартні відхилення у всіх стратах апріорі вважаються рівними.

Як ми бачимо, непропорційний відбір можливий, коли можна заздалегідь хоч би приблизно оцінити стандартні відхилення досліджуваного параметра в кожній страті. Якщо такої інформації немає, то при визначенні частки вибірки, що припадає на кожну страту, дослідник може покладатися на логіку та інтуїцію. Наприклад, можна припустити, що великі магазини більше різняться в плані обсягу продажів якого-небудь товару, ніж дрібні.

Є ще один важливий окремий випадок: якщо дослідника цікавлять головним чином відмінності між стратами, то число елементів, що витягають із кожної страти, має бути однаковим.

При використанні стратифікованої вибірки можна бути впевненим, що всі важливі підгрупи респондентів присутні у вибірці. Це особливо важливо, коли розподіл вимірюваної характеристики в істотному ступені асиметрично. Так, оскільки річний дохід більшості американських сімей складає менше 50 тис. Дол., Розподіл доходу асиметрично. Дуже мало сімей мають дохід 125 тис. Дол. Або вище. При побудові простої випадкової вибірки цілком імовірно, що ця категорія родин не буде адекватно представлена у вибірці. Стратифікована ж вибірка гарантує пропорційне представництво високоприбуткових сімей. Таким чином, стратифікована вибірка поєднує в собі простоту побудови, властиву простий випадковою вибіркою, і потенційний виграш у точності. Цим і пояснюється популярність даного методу.

Метод кластеризації (cluster sampling). Говорячи про побудову простої випадкової вибірки, ми відзначали, що опитування по такій вибірці може зажадати занадто високих витрат за рахунок необхідності їхати окремо до кожного респондента. Метод кластеризації дозволяє істотно скоротити витрати на дослідження без істотного зростання похибки. Перше досягається завдяки тому, що потрапити у вибірку можуть тільки респонденти, які живуть у кластерах, відібраних на першому етапі відбору. В якості кластерів можуть виступати, наприклад, райони, населені пункти або виборчі дільниці.

Вимоги, які пред'являються до кластерам, діаметрально протилежні вимогам, пропонованим до стратам. Кластери повинні бути як можна більш схожі між собою, а кожен кластер повинен складатися з якомога більш різноманітних одиниць відбору. В ідеалі кожен кластер - зменшена копія всієї досліджуваної сукупності: тоді зовсім неважливо, які кластери будуть, а які - не будуть представлені у вибірці. Чим краще ці вимоги вдається дотримати, тим слабкіше проявляється негативна сторона економії витрат, що складається в деякому зростанні випадкової похибки дослідження.

При використанні методу кластеризації, як і при використанні методу стратифікації, безліч елементів, що утворюють досліджувану сукупність, поділяється на певне число непересічних підмножин, званих вже не стратами, а кластерами. При використанні методу стратифікації у вибірку обов'язково потрапляють представники всіх страт. Тут же, навпаки, проводиться випадковий (методом SRS) вибір кластерів, чиї елементи потім будуть включатися у вибірку. Якщо у вибірку включаються всі елементи відібраних кластерів, процедура називається одностадійної. Якщо з кожного кластера випадковим чином витягуються і включаються у вибірку деякі елементи, процедура називається двустадийному. Якщо перед відбором окремих елементів усередині обраних на першій стадії кластерів спочатку виділяються дрібніші кластери, певне число яких знову відбирається випадковими методами, процедура називається трьох- або більше стадийной.

Кластери можна відбирати або з рівною ймовірністю за допомогою простого випадкового відбору (simple two-stage cluster sampling), або з імовірністю, пропорційної розміру кластерів (PPS - probability proportionate to size sampling).

Кластеризація спрямована на економію витрат без істотного зниження точності, а не на підвищення точності без збільшення витрат.

Відносно ж гомогенності і гетерогенності вимоги до кластерів діаметрально протилежні тим, які пред'являються до стратам. Елементи усередині кластера повинні бути як можна більш різноманітними, гетерогенними, а самі кластери - якомога більш схожими між собою.

Важливою перевагою методу є те, що будувати основу вибірки необхідно не для всієї досліджуваної сукупності, лише для відібраних шляхом випадкової процедури кластерів.

Кластери найчастіше виділяються за територіальною ознакою, тобто являють собою райони, вулиці, багатоквартирні будинки і т.д. Такий метод побудови вибірки природно назвати територіальним (area sampling).

Приклад 9.10

Використання методу кластеризації з наступним відбором однакового числа респондентів з кожного кластера

Метою маркетингового дослідження було вивчити поведінку заможних людей. Для цього на першому кроці з мікрорайонів, середній дохід жителів яких за даними перепису перевищує 50 тис. Дол. На рік, була витягнута проста випадкова вибірка з 800 мікрорайонів. Потім в комерційної організації були придбані списки прізвищ та адрес приблизно 95% сімей, які проживають в цих 800 мікрорайонах. Ці домогосподарства були пронумеровані від 1 до 213 000; +9000 З них були відібрані за допомогою простого випадкового відбору (SRS).

Такий механізм відбору придатний, якщо все кластери приблизно однакового розміру. Якщо це не так, можуть виникати зміщення оцінок. Тому іноді розміри кластерів намагаються зробити приблизно рівними шляхом злиття або поділу деяких з них. Якщо це неможливо, необхідно застосовувати не простий випадковий відбір (SRS), а відбір, пропорційний розміром кластерів (PPS), причому розмір кластера вимірюється числом містяться в ньому одиниць відбору.

Отже, на першому кроці ймовірність того, що кластер буде відібраний, прямо пропорційна його розміру. На другому кроці з кожного обраного кластера витягується приблизно однакове число одиниць відбору. Тому ймовірність того, що на другому кроці буде обрана одиниця відбору, що входить в один з відібраних раніше кластерів, назад пропорційна розміру останнього. Завдяки такій процедурі кожен елемент досліджуваної сукупності може потрапити у вибірку з однаковою ймовірністю.

Метод кластеризації має дві важливі переваги: гнучкість і невисока вартість. Часто єдина доступна основа вибірки - це перелік кластерів, а не елементів цільової сукупності. Наприклад, не можна за розумний час і в межах наявних коштів скласти список всіх квартир в місті. Вважаючи ж кластерами виборчі дільниці міста і знаючи чисельність їх населення, можна випадковим чином відібрати кілька ділянок і скласти список знаходяться там квартир. Метод кластеризації - найдешевший і тому найефективніший з усіх імовірнісних методів побудови вибірки.

Є у методу кластеризації та два серйозні недоліки. По-перше, нерідко вибірка виходить відносно неточною, оскільки на практиці дуже складно сформувати гетерогенні кластери. Наприклад, люди, що живуть в одному будинку, скоріше схожі, чим не схожі один на одного. По-друге, при використанні методу кластеризації буває скрутним побудова статистик для оцінки точності результатів.

 
Якщо Ви помітили помилку в тексті позначте слово та натисніть Shift + Enter
< Попередня   ЗМІСТ   Наступна >
data-override-format="true" data-page-url = "//stud.com.ua">
 
Дисципліни
Агропромисловість
Аудит та Бухоблік
Банківська справа
БЖД
Географія
Документознавство
Екологія
Економіка
Етика та Естетика
Журналістика
Інвестування
Інформатика
Історія
Культурологія
Література
Логіка
Логістика
Маркетинг
Медицина
Нерухомість
Менеджмент
Педагогіка
Політологія
Політекономія
Право
Природознавство
Психологія
Релігієзнавство
Риторика
Соціологія
Статистика
Техніка
Страхова справа
Товарознавство
Туризм
Філософія
Фінанси
Пошук