Навігація
Головна
 
Головна arrow Маркетинг arrow Маркетингові дослідження
< Попередня   ЗМІСТ   Наступна >

Підготовка та первинна обробка даних

Підготовка даних до обробки

Коли польові роботи завершені і зібрані анкети доставлені в центральний офіс або регіональні офіси, починається підготовка даних до обробки. Вона включає в себе наступні кроки:

 • o редагування анкет з отбраковкой дефектних примірників;
 • o підготовка макету для введення даних в комп'ютер;
 • o введення даних;
 • o комп'ютерна перевірка;
 • o статистичне вирівнювання і перетворення інформації;
 • o шкалювання даних.

Підготовка макета, як і розробка анкети, виконується з урахуванням плану аналізу даних, попередньо розробленого на стадії формулювання схеми дослідження.

Редагування анкет і відбраковування дефектних примірників

Насамперед виявляються і відбраковуються анкети з наступними грубими дефектами.

 • o Деякі сторінки анкети були пропущені в ході анкетування і залишилися зовсім заповненими.
 • o Судячи з відповідей, респондент взагалі не розумів, про що його питали.
 • o Виявлена мала варіація оцінок, поставлених респондентом абсолютно різним об'єктам, про які його попросили висловити свою думку. Наприклад, всім об'єктам виставлені однакові оцінки шкали.
 • o На питання анкети відповідала людина, якого не слід було включати у вибірку даного дослідження.

Потім в анкетах виявляються нерозбірливі записи, невідповідності, двозначності.

До нерозбірливою відносять запис, яку навряд чи вдасться правильно ввести в комп'ютер або закодувати.

Невідповідністю називається, наприклад, ситуація, коли респондент повідомляє про низький рівень доходу своєї родини і одночасно про те, що він часто здійснює покупки в дорогому і престижному універмазі.

Двозначністю вважається, наприклад, наявність двох зазначених у анкеті відповідей на питання, на яке можна було дати тільки одну відповідь.

Анкети з дефектами, якщо можна, повертаються в поле для уточнення. Якщо такої можливості немає, вони або виправляються шляхом видалення очевидним чином невірних відповідей, або видаляються. Останнім, однак, зловживати не можна: це спотворить вибірку. Анкети можна видаляти, тільки якщо одночасно виконані три умови:

 • 1) відсутні прийнятні відповіді на ключові питання анкети;
 • 2) число неякісних анкет не надто велике (звичайно не більше 10%);
 • 3) відповідні респонденти не відрізняються від інших очевидним чином, наприклад за своїми соціально-демографічними характеристиками.

Якщо дослідник вирішив видалити якусь частину анкет, він повинен повідомити про це в звіті.

Зауважимо, що критерії, за якими анкета віддаляється, повинні бути розроблені до початку польового етапу опитування і в жодному разі не повинні коректуватися пізніше. Інакше можливі підтасовки: недобросовісний дослідник може видалити частину анкет, в яких респонденти висловили небажані для нього погляди, на ходу придумуючи нові критерії, яким не задовольняють саме ці анкети. Буває, що завдяки такій "чистці" даних, наприклад, домагаються, щоб рейтинг компанії-замовника став вищим, ніж у конкурентів. Таким чином, як говорилося вище, етичні вимоги слід враховувати на всіх етапах маркетингового дослідження.

Підготовка макета для введення даних в комп'ютер

Ми вже відзначали, що у Фонді Громадська Думка ця стадія роботи виконується до початку польових робіт. Проте в деяких компаніях це завдання вирішується після збору заповнених анкет. Так чи інакше, обговоримо питання про те, яким чином має відображатися в комп'ютерному поданні кожне питання анкети і кожен варіант відповіді на нього.

Незалежно від конкретної програмної реалізації можна вважати, що в результаті введення даних опитування в комп'ютер формується прямокутна таблиця, в кожному рядку якої містяться відомості про відповіді певного респондента.

Згідно із загальними правилами кодування числа заносяться в таблицю даних так, щоб відповіді всіх респондентів на один і той же питання розташовувалися один під одним, утворюючи стовпці таблиці.

Структуровані і неструктуровані питання кодуються по-різному. Почнемо зі структурованих питань. Якщо з точки зору методики опитування та обробки даних вони поділяються на дихотомічні, шкальні і спискові (див. С. 254), то з точки зору комп'ютерного представлення зручніше ділити питання на альтернативні, спільні та кількісні. Альтернативними ми називатимемо питання, в якості відповіді на які можна вказати не більше одного варіанта відповіді, спільними - два або більше варіантів відповіді, а кількісними - будь-яка сума: вік у роках, максимальна прийнятна ціна товару в рублях і т.п.

Отже, з точки зору методики опитування альтернативні питання можуть бути дихотомічними, шкальними або обліковим, вони допускають вибір не більше одного варіанту відповіді. Спільні питання - тільки обліковим, на які допускається вибір двох і більше варіантів відповіді, а кількісні - тільки шкальними, якщо в них не передбачений обмежений список можливих відповідей.

Зупинимося на правилах представлення даних для альтернативних, спільних і кількісних питань.

Таблиця 11.1. Кодування результатів опитування

q1

q2_l

q2_2

q2_3

q2_4

q2_5

q2_6

q2_7

q3

...

2

0

1

0

0

0

1

0

7800

...

1

1

1

0

1

0

0

0

12000

...

0

0

0

0

0

0

0

-2

...

...

...

...

...

...

...

...

...

...

...

Шапка табл. 11.1 містить заголовки стовпців. У ній міститься інформація про те, на яке саме питання анкети закодовані відповіді в кожному стовпці. Наприклад, для обробки даних в пакеті SPSS кожен стовпець таблиці даних повинен мати заголовок, який містить назву питання. Ця назва має починатися з літери, не повинно містити пропусків та інших розділових знаків, крім нижньої риси. У нашому прикладі перша буква всіх заголовків q є скороченням від слова question - питання. Слідом за буквою q ставиться число - номер питання анкети в суцільній нумерації, а потім при необхідності - знак нижнього підкреслення і номер відповіді на запитання.

Почнемо з альтернативного питання. Розглянемо стовпець q1. Відсутність в заголовку після числа "1" знака нижнього підкреслення і номера відповіді означає, що питання № 1 альтернативний, тобто респондент може назвати тільки один варіант з передбаченого в анкеті набору можливих відповідей. Завдяки цьому всю інформацію про відповіді можна розмістити в одному стовпці, записавши номер названого відповіді. Числа 2 і 1 в клітинах цього шпальти означають, що перший респондент дав відповідь, відповідний другому з передбачених варіантів, а другий респондент - відповідний першому. Наприклад, якщо перше питання - дихотомический, що передбачає лише відповіді 1) "так" і 2) "ні", то перший респондент відповів "ні", другий - "так". Клітка, в якій повинен був бути відображений відповідь третього респондента, як ми бачимо, залишилася порожньою. Це означає, що третьому респонденту це питання згідно інструкції не задавався або його відповідь по помилково не був зафіксований інтерв'юєром.

Перейдемо до принципом представлення даних про відповіді на спільний питання. Розглянемо наступні сім стовпців: q2_l, q2_2, ..., q2_7. Вони містять інформацію про відповіді на питання № 2 - спільний, відповідь на який може відповідати відразу декільком передбаченим в анкеті варіантами. Наприклад, це питання може виглядати так.

2. Рекламу яких марок товару "X" ви коли-небудь зустрічали? (Будь-яке число відповідей.)

Картка № 1

 • 5. Інші марки даного товару
 • 6. Не зустрічав (-а) рекламу даного товару
 • 7. Важко відповісти

Для відповіді на це питання респонденту пред'являється картка № 1 зі списком назв чотирьох марок.

Кожен з цих стовпців q2_l, q2_2, q2_7 відповідає одному з варіантів відповіді на запитання. Одиниця в певному стовпці означає, що відповідь респондента даному варіанту відповідає, а нуль - що ні. Так, відповідь першого з наших респондентів відповідав варіантам 2 і 6, другої - варіантам 1, 2 і 4, а третього - жодному з варіантів.

Третє питання анкети - кількісний. Відповідаючи на нього, респондент називає одне число, наприклад суму свого особистого доходу за останній минулий місяць. Як ми бачимо (див. Табл. 11.1), перший з опитаних заробив 7 800 руб., Другий - 12 000 руб. Що стосується третього, то він відмовився назвати свій особистий дохід. Згідно з методикою Фонду Громадська Думка саме числом -2 зазвичай фіксується ситуація, коли респондент відмовляється дати відповідь на кількісний питання, а код -1 зазвичай сигналізує, що респондент не зміг відповісти. Інформація про те, який сенс надається в даному випадку кожному спеціальним кодом, записується в анкеті як додаткові варіанти відповіді під рядком для запису числового відповіді на кількісний питання. У кількісному питанні можуть передбачатися і будь спеціальні коди, аби відповідні значення не могли зустрітися серед змістовних відповідей на це питання. Якщо дані обробляються в SPSS, спеціальним кодами надається сенс пропусків у даних.

Таким чином, за технологією Фонду Громадська Думка кодування всіх питань анкети, за винятком відкритих, здійснюється стандартним для всіх опитувань способом. Це можливо завдяки двом обставинам.

По-перше, всі питання анкети в більшості випадків нумеруються наскрізь, що значно спрощує завдання позначень стовпцях таблиці даних. Виняток, однак, складають так звані табличні питання, кожен з яких представляє собою групу звичайних питань одного типу, як правило, із загальною вступної фразою. Використовувати табличні питання замість того, щоб продовжувати наскрізну нумерацію входять у них питань, буває зручно, якщо анкета дуже велика. У Фонді Громадська Думка стовпцях даних з відповідями на табличний питання прийнято давати назви, наприклад, таким чином: q_7_6. Знак підкреслення після букви q свідчить, що мова йде про табличному, а не окремому питанні. Сімка - це номер даної групи питань у наскрізної нумерації індивідуальних питань і таблиць з питаннями, шістка - номер конкретного питання всередині табличного. В іншому правила подання відповідей на табличні питання не відрізняються від звичайних правил, які обговорювалися вище. Проте використання табличних питань вимагає пояснень про те, що в цій таблиці вважається питанням, а що варіантами відповідей: стовпці або рядки. Ця інформація зазвичай в стандартну анкету заношуваності, і тому при аналізі даних доводиться використовувати спеціальну інструкцію з кодування. (Зауважимо, що в багатьох компаніях використання такої інструкції є не винятком, а правилом.)

По-друге, за технологією Фонду Громадська Думка варіанти відповіді на кожне альтернативний або спільний питання нумеруються, починаючи з одиниці, і наводяться в анкеті. Номер потрібного варіанту, як уже зазначалося, інтерв'юери обводять кружком, після чого обведені ними номера вводяться в комп'ютер. Зауважимо, що такого принципу дотримуються не всі дослідницькі компанії. Іноді номери варіантів відповіді в анкеті не наводяться. Замість цього поруч з кожним варіантом відповіді поміщається рамочка, позначка в якій (зазвичай хрестик або галочка) означає вибір даного варіанту. Оскільки номера відповідей, "прив'язані" до кожної рамочці, при такому підході вказуються не в анкеті, а в іншому документі - інструкції з кодування, то вводити дані з таких анкет вручну стає неможливим; потрібні спеціальні сканери та програмне забезпечення.

В цілому стандартизованная система кодування, використовувана у фонді "Громадська думка", дозволяє легко зрозуміти сенс вмісту будь-якого стовпця таблиці даних, просто глянувши в будь-який екземпляр анкети. У деяких інших технологіях для цього або складають спеціальну таблицю - журнал кодування (codebook), або записують відповідні відомості в одному з примірників анкети.

Тепер про кодування неструктурованих (відкритих) питань. За технологією фонду "Громадська думка" тексти, вимовлені респондентами у відповідь на кожен з них, вводяться в відповідну колонку тієї ж таблиці даних. При використанні інших технологій самі тексти відповідей в таблицю не додають. Замість цього дещо пізніше туди вносяться коди відповідей.

Незалежно від того, додаються тексти в таблицю даних чи ні, здійснюється кодування відкритих питань. При кодуванні кожного відкритого питання умовно формується ще один - спільний, тобто в таблицю даних праворуч дописується набір числових стовпців. Кожен з таких стовпців "відповідає" за певний сенс: у ньому, як у звичайному спільному питанні, ставляться одиниці або нулі в залежності від того, відображений або не відбитий даний сенс у відповіді респондента.

Кодування відкритих питань - досить трудомістка робота. Лише в окремих випадках - за наявності досвіду проведення аналогічних проектів - коди можливих відповідей на ці питання готуються заздалегідь, до початку польових робіт. Набагато частіше ці коди розробляються на основі текстів, записаних у отриманих з поля анкетах. Традиційно дослідники для цього переглядають не всі, а лише частину заповнених анкет - зазвичай від 50 до 100. На відміну від цієї традиції, у Фонді Громадська Думка використовується спеціальне програмне забезпечення, що полегшує перегляд текстів і що дозволяє кодувальника переглядати весь набір змістовних відповідей.

У результаті цього перегляду розробляється так званий кодифікатор - набір формалізованих варіантів, кожен з яких відображає який-небудь один цікавить дослідника смисловий аспект. Кожному з цих варіантів приписується певний числовий код.

При розробці кодификатора зазвичай дотримуються двох важливих правил.

По-перше, в сукупності вони повинні вичерпувати все безліч можливих ситуацій. Якщо варіантів відповідей виявляється занадто багато, ті з них, які зустрічаються відносно рідко, об'єднуються в позицію "інше". Однак до цієї категорії дослідник зазвичай має право віднести не більше 10% респондентів. В іншому випадку якісь смисли необхідно знову виділити з цієї категорії.

По-друге, коди змістовно важливих позицій необхідно вставляти, навіть якщо відповідні їм смисли виражалися респондентами рідко або навіть не виражалися зовсім, оскільки відсутність згадок - теж інформація! Припустимо, наприклад, що потрібно вивчити ставлення покупців до упаковки туалетного мила. Нехай анкета містила наступне питання: що менше всього подобається покупцям в даному сорті туалетного мила? Припустимо, що ніхто з респондентів не сказав, що це упаковка. Тим не менш, така категорія була введена в кодифікатор, хоча вона і "набрала" 0% прихильників.

Після розробки кодификатора кодировщик переглядає весь набір відповідей і приписує кожному з них в залежності від вмісту один або кілька кодів, яким він відповідає за змістом. У результаті заповнюються стовпці нового спільного питання.

Ми описали найбільш типову, на наш погляд, ситуацію, коли в результаті кодування відкритого питання формується набір стовпців спільного питання. Однак традиційно при проведенні маркетингових досліджень намагаються сформувати не сумісних, а альтернативний питання, тобто відповіді кожного респондента намагаються приписувати не кілька кодів, а один. Формально кажучи, якщо створений спільний питання, то завжди можна перейти від нього до альтернативного, просто позначивши новим кодом кожне з зустрілися поєднань вихідних кодів. Насправді ж такий перехід далеко не завжди може принести реальну користь, оскільки всіляких поєднань може виявитися занадто багато.

На завершення теми кодування анкет відзначимо, що деякі дослідницькі компанії (як це було необхідно в період зберігання даних на 80-колонних перфокартах) все ще складають більш детальний журнал кодування, в якому для кожного стовпця даних відбивається ще й його розрядність. Наведемо приклад фрагмента такого журналу, в якому описано вміст перший 80 колонок даних (табл. 11.2).

Таблиця 11.2. Частковий традиційного журналу кодування

Номери

колонок

Порядковий

номер змінної

Найменування

змінної

Номер

питання

Інструкції з кодування

1-3

1

Ідентифікаційний номер респондента

001-890, при необхідності додавати провідні нулі

4

2

Порядковий номер рядка з числа рядків з інформацією, отриманою від даного респондента

1 (для всіх респондентів)

5-6

3

код проекту

31 (для всіх респондентів)

7-8

4

код інтерв'юера

як зазначена в анкеті

9-14

5

код дати

як вказана в анкеті

15-20

6

код часу інтерв'ю

як зазначено в анкеті

21-22

7

код придатності

як зазначена в анкеті

23-24

порожні колонки

залишити колонки порожніми

25

8

ким є

інтерв'юйований

покупець

I

чоловік голова сім'ї = 1 жінка глава сім'ї = 2 інше = 3

26

9

ступінь знайомства з магазином № 1

IIа

друкується обведене в анкеті число, "мало знаком" = 1, "добре знайомий" = = 6,

код пропуску = 9

27

10

те ж з магазином №2

IIb

той же

...

...

...

...

...

35

18

те ж з магазином № 10

IIj

той же

36

19

частота відвідування магазину № 1

IIIа

друкується обведене в анкеті число, «не відвідую" = 1, "дуже часто відвідую" = 6, код пропуску = 9

37

20

те ж з магазином №2

IIIb

той же

...

...

...

...

...

45

28

те ж з магазином № 10

IIIj

той же

46-47

порожні колонки

залишити колонки порожніми

Номери

коло

нок

Порядковий

номер

змін

ної

Найменування

змінної

Номер

питання

Інструкції з кодування

48

29

рейтинг магазину № 1 за якістю

IVa

друкується обведене в анкеті число

...

...

...

...

...

57

38

те ж для магазину № 10

IVj

той же

58

39

рейтинг магазину № 1 за різноманітністю

Va

друкується обведене в анкеті число

...

...

...

...

...

67

48

те ж для магазину № 10

Vj

той же

68

29

рейтинг магазину № 1 за цінами

VIa

друкується обведене в анкеті число

...

...

...

...

...

77

38

те ж для магазину № 10

VIj

той же

78

порожні колонки

залишити колонки порожніми

Ввід данних

У разі проведення комп'ютерного телефонного (САTI), персонального (САРI) або інтернет-опитування дані вводяться в комп'ютер безпосередньо в ході інтерв'ю. В інших випадках вони вводяться в комп'ютер за допомогою зчитувального пристрою або з клавіатури комп'ютера. В останньому випадку для введення використовується різноманітне програмне забезпечення, що дозволяє перевіряти допустимість значень вводяться змінних, їх логічний несуперечність по відношенню до інших відповідей. Деякі з таких програм можуть виконувати і більш складні функції, наприклад первинний аналіз розподілу відповідей.

Контроль попадання даних у допустимий діапазон не страхує від усіх можливих помилок введення. Тому частина анкет, а у Фонді Громадська Думка - всі анкети, вводяться ще й другим оператором і результати введення порівнюються.

Іноді замість ручного введення застосовуються різні засоби автоматизації. Використовуються два варіанти таких технологій. У першому варіанті застосовуються спеціальні сканери, що зчитують інформацію про позначках, внесених в строго фіксовані місця кожного аркуша паперової анкети. Іноді при цьому в ході польових робіт анкети заповнюються спеціальним олівцем, позначки якого "дізнається" сканер. У другому варіанті листи анкети скануються цілком, а потім за допомогою спеціального програмного забезпечення і на основі заданої "прив'язки" питань до наміченої комп'ютером сітці розпізнаються інформативні місця кожного аркуша і з них зчитується інформація.

 
Якщо Ви помітили помилку в тексті позначте слово та натисніть Shift + Enter
< Попередня   ЗМІСТ   Наступна >
 
Дисципліни
Агропромисловість
Аудит та Бухоблік
Банківська справа
БЖД
Географія
Документознавство
Екологія
Економіка
Етика та Естетика
Журналістика
Інвестування
Інформатика
Історія
Культурологія
Література
Логіка
Логістика
Маркетинг
Медицина
Нерухомість
Менеджмент
Педагогіка
Політологія
Політекономія
Право
Природознавство
Психологія
Релігієзнавство
Риторика
Соціологія
Статистика
Техніка
Страхова справа
Товарознавство
Туризм
Філософія
Фінанси
Пошук