Розпізнавання і категоризація об'єктів

Недостатньо просто помітити що-небудь. Образи сприйняття представляють людині світ як систему об'єктів, що мають певні стійкі предметні характеристики (соціальні значення), на основі чого й стає можливою людська діяльність. Предметність сприйняття забезпечується механізмами категоризації відчуттів. В даний час існує дві основні гіпотези, що пояснюють, як нам вдається співвіднести образ з містяться в пам'яті значеннями. Представники першого підходу вважають, що процес сприйняття спрямований знизу вгору: спочатку відбувається аналіз компонентів образу, а потім - їх інтеграція в цілісний об'єкт. Втіленням цієї ідеї є гіпотеза чорт. Протилежний підхід полягає в розумінні процесу сприйняття як спрямованого зверху вниз: від формування гіпотези ("Що б це могло бути?") До аналізу окремих деталей образу для підтвердження або спростування вихідної гіпотези. У даному випадку мова йде про гіпотезі прототипу.

Гіпотеза чорт (Селфрідж, 1955) припускає, що кожен видимий об'єкт кодується за допомогою комбінації найпростіших деталей - еталонів і ключових зв'язків між ними. Наприклад, буква А - це три відрізки, два з яких розташовані під кутом 30 градусів, а третій - горизонтальний - перетинає їх посередині. Згідно з гіпотезою чорт повинні існувати схеми-еталони первинних елементів складних об'єктів, що становлять своєрідний розумовий алфавіт.

Дані на користь гіпотези чорт були отримані Г. Кінні, М. Марсеттой і Д. шоуменом (G. Kinney, М. Marsetta, D. Showman, 1966). Вони пред'являли випробуваним на короткий час букву G і просили впізнати її. Природно, що випробовувані часто помилялися. Проте їх помилки носили регулярний характер: 72% помилок склало помилкове впізнання букви G як С, в 21% випадків випробовувані плутали G і О, і тільки 3% випадків помилок припадало на В або цифру 9. Інших помилок не спостерігалося зовсім. Отже, для відповідей випробовувані вибирали об'єкти зі подібним набором деталей. Помилки ж, на думку авторів, відбувалися тому, що випробовувані не встигали проаналізувати всі риси стимулу. Таким чином, гіпотеза чорт пояснює, як з ізольованих відчуттів за допомогою елементарних схем - чорт формуються образи складних об'єктів.

Оскільки букви - его створення людських рук, виділити риси для них досить легко. Але що можна розглядати в якості рис для складних природних об'єктів? А. Бідерман (I. Biederman, 1987) запропонував теорію розпізнавання по компонентам, що включає в себе три послідовні етапи:

  • 1) об'єкт сегментируется на набір найпростіших субоб'ектов;
  • 2) проводиться категоризація субоб'ектов;
  • 3) субоб'екти інтегруються в цілісний образ.

Бідерман описав 36 категорій субоб'ектов і назвав їх геонім (геометричними іонами). Прикладами геонім є циліндр, куб, піраміда і т.д. Геонім формують деякий "алфавіт", з якого можна схематично побудувати практично будь-які візуальні об'єкти (рис. 7.15). Обгрунтованість гіпотези Бідермсна стає очевидною, якщо подивитися на дитячі малюнки. Маленькі діти малюють навколишній світ за принципом "палиця, палиця, огуречік - от і вийшов чоловічок", тобто діють так, як ніби сприймають об'єкти у формі сукупності геонім.

Сегментація об'єктів на основі геонім - циліндрів (по Андерсон, 2002)

Рис. 7.15. Сегментація об'єктів на основі геонім - циліндрів (по Андерсон, 2002)

Для доказу гіпотези про опосередкуванні розпізнавання візуальних стимулів сегментацією цілісної картини на елементарні геонім був проведений експеримент. Бідерман пред'являв своїм випробуваним зображення, у частини яких були видалені цілі компоненти, а в іншої було створено значну візуальне "збіднення" малюнка при збереженні всіх компонентів (рис. 7.16). Результати його дослідження показали, що при коротких пред'явленнях краще розпізнаються ті зображення, на яких присутні всі компоненти, нехай і в збідненій формі. Іншими словами, випробовувані роблять менше помилок при розпізнаванні, наприклад, прасувальної дошки, коли бачать її переривчастий контур, а не чіткий контур без ніжки, або, наприклад, чітко зображений літак без кабіни розпізнається гірше, ніж "пунктирний" літак, забезпечений усіма необхідними частинами .

Стімул'ний матеріал, використаний в експерименті Бідерман (по Андерсон, 2002)

Рис. 7.16. Стімул'ний матеріал, використаний в експерименті Бідерман (по Андерсон, 2002)

Проте в реальності ми маємо справу не з окремими літерами або символами, а з осмисленими висловлюваннями і складними багатофігурними композиціями. Тут велику роль відіграють схеми більш високого порядку. З ними, наприклад, пов'язано явище "схоплювання" слів, які часто зустрічаються в мові, або помилки коректорів, що пропускають опечатки через те, що вони "бачать" букви, які повинні бути в тому чи іншому місці слова, виходячи з контексту. Я. Стюарт-Гамільтон призводить історичний приклад сумних наслідків такого роду помилок передбачення. У 1632 р в Англії вийшла в світ Біблія, яка тут же отримала прізвисько "нечестивої". У тексті цього видання в сьомої заповіді був допущений пропуск частки "не", так що вона звучала, як "перелюбну!". Людина, зчитує верстку, просто не міг собі уявити подібного блюзнірства і тому не помітив його. Іншими словами, одна і та ж риса може сприйматися по-різному (або взагалі ігноруватися) залежно від контексту. Тому важливі не риси самі по собі, а їх стійка конфігурація, яка називається прототипом (див. Рис. 7.17).

А. Риси обличчя.  Б. Прототип особи (по D. Norman, D. Bobrow, 1976)

Рис. 7.17. А. Риси обличчя. Б. Прототип особи (по D. Norman, D. Bobrow, 1976)

 
< Попер   ЗМІСТ   Наст >