Навігація
Головна
 
Головна arrow Маркетинг arrow Маркетингові дослідження
< Попередня   ЗМІСТ   Наступна >

Частотні розподіли

Перейдемо тепер до більш детального розгляду окремих процедур, складових базовий аналіз даних: процедур розрахунку частотних розподілів (frequency distribution) і таблиць крос-табуляції (cross-tabulation). Після цього ми покажемо, як при використанні цих процедур перевіряються статистичні гіпотези (hypothesis testing) про зв'язки та про відмінності.

Почнемо з розрахунку частотних розподілів. Він дозволяє дати відповідь, наприклад, на наступні питання:

  • - Які число і частка лояльних (відданих) споживачів бренду від числа всіх його споживачів?
  • - Які число і частка представників досліджуваної сукупності, добре, середньо, мало і зовсім не інформованих про новий продукт фірми?
  • - Яку частку ринку становлять важкі, середні, легені користувачі і непользователей товару?
  • - Значимо чи ці заміряні в ході опитування частки відрізняються від деяких фіксованих значень, намічених керівниками даної фірми?
  • - Яке розподіл доходів споживачів певного бренду? Чи вірно, що воно зміщене у бік відносно низьких доходів?

У програмному пакеті SPSS розрахунок частотних розподілів здійснюється командою Frequencies (меню Analyze → Descriptive Statistics → Frequencies).

Приклад 12.1

Розподіл відповідей колишніх клієнтів фітнес-центру

Розглянемо розподіл відповідей осіб, які перестали відвідувати фітнес-центр, на питання про те, скільки часу вони зазвичай проводили там, коли відвідували його (табл. 12.5).

Таблиця 12.5. Розподіл відповідей респондентів на запитання: "Скільки приблизно часу ви зазвичай проводили у фітнес-центрі?", Ч

Значення

Варіанти відповідей, ч

Frequency (частота, з якої траплялося значення)

Percent (відсоток від числа всіх значень)

Valid Percent (відсоток від числа допустимих значень)

Cumulative Percent (відсоток допустимих наростаючим підсумком)

Valid (допустимі значення)

, 50

1

, 5

, 5

, 5

1,00

15

7,0

7,1

7,5

1,50

34

15,9

16,0

23,6

1,75

4

1,9

1,9

25,5

2,00

75

35,0

35,4

60,8

2,20

1

, 5

, 5

61,3

2,25

1

, 5

, 5

61,8

2,30

1

, 5

, 5

62,3

2,50

26

12,1

12,3

74,5

2,75

1

, 5

, 5

75,0

3,00

39

18,2

18,4

93,4

3,50

5

2,3

2,4

95,8

4,00

8

3,7

3,8

99,5

5,00

1

, 5

, 5

100,0

Total

212

99,1

100,0

Missing (Відсутні значення)

System

2

, 9

Total (всього)

214

100,0

Ми бачимо, що всього було опитано 214 респондентів. Двоє з них не оцінили типову тривалість свого перебування у фітнес-центрі. Це відображено у відповідному стовпчику таблиці даних написом System - системний пропуск даних. Дві години зазвичай проводили у фітнес-центрі 75 респондентів, що склало 35,0% від числа всіх опитаних, або 35,4% від числа відповіли на питання.

Дані, наведені в таблиці, стають наочними завдяки діаграмі частот (рис. 12.7), можливість побудови якої також передбачена в команді Frequencies (вкладка Charts).

Графік частотного розподілу відповідей респондентів на питання про час їх перебування у фітнес-центрі, ч

Рис. 12.7. Графік частотного розподілу відповідей респондентів на питання про час їх перебування у фітнес-центрі, ч

Знаючи розподіл частот, можна розрахувати статистичні характеристики досліджуваної змінної, тобто відповідей на певне питання анкети. Розрізняють три типи цих характеристик:

  • o характеристики основної тенденції у значеннях показника: мода, медіана, середнє значення;
  • o характеристики різноманітності значень: стандартне відхилення, дисперсія та ін .;
  • o характеристики форми розподілу значень показника: асиметрія, ексцес.

Характеристики основної тенденції у відповідях

Виявити основну тенденцію у відповідях на запитання, значить узагальнено сказати, як в цілому відповіли на нього респонденти, які значення зазвичай приймає дана змінна. Для цього можуть використовуватися три характеристики: мода, медіана і середнє значення. SPSS може розрахувати будь-яку з цих характеристик для будь числовий змінної. Які з цих характеристик можна реально використовувати, залежить від того, з якого типу даними (номінальними, порядковими, інтервальними або пропорційними) ми маємо справу (табл. 12.6).

Таблиця 12.6. Показники, які можуть служити характеристиками основної тенденції в залежності від типу шкали

Тип шкали даних

Характеристики основної тенденції у відповідях

Мода

Медіана

Середнє значення

Номінальна

+

Порядкова

+

+

Інтервальна

+

+

+

Пропорційна

+

+

+

Наведемо результати розрахунку цих значень (табл. 12.7) в програмному комплексі SPSS (у команді Frequencies в підкоманду Statistics опції Mean, Median, Mode).

Таблиця 12.7. Статистичні характеристики основної тенденції у відповідях респондентів на питання про час їх перебування у фітнес-центрі

Мода

(Mode)

Медіана

(Median)

Середнє значення

(Mean)

Скільки приблизно часу ви зазвичай проводили у фітнес-центрі? (ч)

2,0

2,0

2,2

Мода - це варіант відповіді, який зустрічався частіше інших (значення змінної, яке вона приймає частіше, ніж інші свої значення). На графіку частот цьому значенню відповідає найвищий пік. Наприклад, на рис. 12.7 модою є значення 2,00 (години). Таким чином, мода зовсім не відображає частоти вибору інших варіантів відповіді, тобто малоинформативна. Тому її можна вважати гарною характеристикою основної тенденції тільки для номінальних ознак. Дійсно, для них інші, більш інформативні характеристики основної тенденції незастосовні.

Медіана - це значення, яке розбиває вибірку, впорядковану за зростанням досліджуваної змінної, на дві рівні частини: одна половина спостережень лежить нижче медіани, а інша - вище. Припустимо спочатку, що число спостережень непарне, наприклад 101. Тоді медианой буде називатися 51-е по порядку значення у впорядкованому ряду. Якщо ж число спостережень парне, наприклад 100, то медіана розраховується як середнє з двох значень упорядкованого ряду - 50-го і 51-го. У першому випадку медіана збігається зі значенням змінної у "серединного" респондента (51-го), а в другому - з середнім з двох значень "серединної" пари респондентів (50-го і 51-го).

Реально для розрахунку медіани перенумеровувати всіх респондентів, що відповіли, звичайно, не потрібно. Досить з'ясувати на основі розподілу відповідей, куди потрапляє "серединний" респондент або "серединна" пара респондентів. Для цього потрібно знати, на яку відповідь припадають 50% респондентів в стовпці Cumulative Percent - відсоток допустимих наростаючим підсумком (див. Табл. 12.5).

Пояснимо цю процедуру на прикладі зазначеної вище таблиці. Число респондентів, які відповіли на запитання, парне (212). Судячи з даних останнього шпальти таблиці, 25,5% (найближче до 50% менше число) від числа цих респондентів дали відповіді 0,5, 1,00, 1,50 і 1,75. А відповіді 0,5, 1,00, 1,50, 1,75 і 2,00 дали вже 60,8 (найближче до 50% більше число). Нам зовсім неважливо, хто персонально з 212 хто дав відповідь респондентів буде "зарахований" в пару, про яку йшла мова вище, але в даному випадку ясно, що обидва вони обрали відповідь 2,00. А полусумма "двійок", природно, теж дорівнює "двійці", тобто медіана дорівнює 2,00.

Відзначимо один нюанс, пов'язаний з поняттям медіани. У деяких випадках, якщо в середину впорядкованого ряду потрапляє багато співпадаючих значень, тобто дані концентровані, дослідники вважають за краще користуватися не звичайної, а так званої уточненої медианой (у команді Frequencies в підкоманду Statistics опція Values are group midpoints, рис. 12.8).

У нашому прикладі "2:00" відповіли 75 респондентів.

Ідея такого розрахунку полягає в наступному. 212 респондентів відповіли на питання про тривалість перебування в клубі наступним чином:

  • o 54 респондента сказали, що бували в клубі менше двох годин;
  • o 75 респондентів - рівно 2:00;
  • o 83 респондента - більше двох годин.

Вибір опцій для розрахунку уточненої медіани

Рис. 12.8. Вибір опцій для розрахунку уточненої медіани

Якщо пронумерувати всіх респондентів за зростанням тривалості їх перебування в клубі, то "серединна" пара респондентів, що стоять в упорядкованому ряду на 106-му і 107-му місцях, буде розташована ближче до кінця групи відповіли "2:00", ніж до початку. Пояснимо сказане таким малюнком (рис. 12.9).

Схема, що ілюструє ідею розрахунку уточненої медіани

Рис. 12.9. Схема, що ілюструє ідею розрахунку уточненої медіани

Від початку групи "2 ч" з 75 респондентів до "серединної" пари розташовується 105 - 54 = 51 респондент (105 - 54), а після цієї пари до кінця групи 105 - 83 = 22 респондента (105 - 83). Іншими словами, уточнена медіана сильніше "притягається" значеннями, які більше неї, ніж значеннями, які менше. Тому уточнена медіана повинна бути дещо більше, ніж 2:00. В даному випадку її значення дорівнює 2,076 ч. Алгоритм розрахунку ми приводити не будемо, так як він досить складний [2].

Медіану, як уже зазначалося, безглуздо вважати, якщо змінна номінальна. Вона служить гарною характеристикою основної тенденції у відповідях, якщо завмер виробляється на порядкової шкалою, коли, наприклад, різниця між варіантами відповідей № 1 і № 2 може бути зовсім іншою, ніж різниця між варіантами відповідей № 2 і № 3. Нагадаємо, що в порядкових шкалах величина значень не має змістовного сенсу, важливо тільки, що одне з них більше, менше іншого небудь значення збігаються. Наприклад, це пов'язано з тим, що якби йшлося про місце, на яке респондент поставив би у своїх перевагах певний сорт цукерок, то хтось із респондентів цілком міг опинитися однолюбом, тобто любити тільки один сорт цукерок, поставлений ним на перше місце; цукерки ж, поставлені їм на друге, третє і т. д. місця, він може майже в однаковій мірі не любити і не є і лише на прохання інтерв'юера проранжувати. Тому для порядкових шкал перевага медіани перед середнім значенням (до розгляду якого ми незабаром перейдемо) незаперечно: медіана не враховує величину значень досліджуваної змінної у респондентів, що стоять в ряду правіше і лівіше "серединної" пари респондентів або "серединного" респондента. Береться до уваги тільки загальне число тих і інших значень.

Ця властивість робить медіану корисною в якості додаткової характеристики і для інтервальних і пропорційних шкал, особливо якщо в даних зустрічаються відповіді, що різко відрізняються від основної маси, так звані викиди (outliers), тобто значення змінної, далеко віддалені від основної їх маси. (Як саме визначаються викиди, ми обговоримо в наступному підрозділі.) Наприклад, якщо змиритися розподіл доходів, то корисно знати рівень доходу у респондента, що знаходиться в середині ряду добробуту. При цьому неважливо, що у вибірку потрапило невелике число дуже багатих людей, дохід яких у разі підрахунку арифметичного середнього створить ілюзію відносно більш високого достатку в досліджуваній сукупності людей в цілому.

Середнє значення розраховується за формулою

(12.1)

де n - число респондентів, які відповіли на запитання; Xi - відповідь, названий i-му респондентом.

У розглянутому нами прикладі середній час перебування респондентів у фітнес-центрі дорівнювало 2,2 ч.

Використовувати середнє значення в якості характеристики основної тенденції у відповідях має сенс лише при використанні інтервальної чи пропорційною шкал, тобто коли відмінність між величинами 1 і 2 таке ж, як між 2 і 3 і т.д.

У той же час для таких шкал розрахунок середнього значення іноді доповнюється розрахунком медіани. Так, у прикладі про розподіл доходів середнє значення дорівнює того доходу, який вийшов би, якщо всі респонденти склали б свої доходи і порівну поділили. Ситуація досить фантастична. Наприклад, якщо виявиться, що у вибірку потрапив олігарх з доходом на два-три порядки вище, ніж у всіх інших респондентів, середній дохід по всіх опитаних істотно зросте. Але навряд чи можна назвати це збільшення відображенням основної тенденції в доходах представників досліджуваної сукупності.

 
Якщо Ви помітили помилку в тексті позначте слово та натисніть Shift + Enter
< Попередня   ЗМІСТ   Наступна >
 
Дисципліни
Агропромисловість
Аудит та Бухоблік
Банківська справа
БЖД
Географія
Документознавство
Екологія
Економіка
Етика та Естетика
Журналістика
Інвестування
Інформатика
Історія
Культурологія
Література
Логіка
Логістика
Маркетинг
Медицина
Нерухомість
Менеджмент
Педагогіка
Політологія
Політекономія
Право
Природознавство
Психологія
Релігієзнавство
Риторика
Соціологія
Статистика
Техніка
Страхова справа
Товарознавство
Туризм
Філософія
Фінанси
Пошук