СЕМАНТИЧНА МІРА ІНФОРМАЦІЇ

Розглянемо два підходи до побудови семантичної заходи інформації, яка визначає її кількість з точки зору сенсу або змісту.

Один з підходів побудови такого заходу інформації базується на математичній (символічній) логіці і полягає у використанні простого формалізованої мови, що включає кінцеве число імен одиничних предметів (індивідів) і логічних присудків (предикатів). У цій мові виділяються певні пропозиції, які називаються описами стану. Кожному такому опису стану зіставляється деяке позитивне число, яке називається мірою. Міра розглядається як логічна ймовірність m (i), яка визначає, в якій мірі підтверджується істинність висунутої гіпотези i . Для цього встановлюється зв'язок змісту h гіпотези з початковим достовірним знанняме (емпіричними даними). Значення m (i ) максимально і дорівнює одиниці, якщо гіпотеза повністю випливає з емпіричних даних, і нулю в іншому випадку. За логічної ймовірності, або знань h, що містяться в гіпотезі i щодо достовірного знання е, можна судити про величину семантичної інформації I c ( h / e ). Як семантичної заходи вживають кількість інформації, яке визначається наступним виразом [24]:

(1.7)

З виразу (1.7) випливає, що, кількість інформації / = 0, якщо логічна ймовірність m (i) = 1; зі зменшенням логічної ймовірності m (i), або ступеня підтвердження гіпотези, кількість семантичної інформації збільшується.

Недолік заходи (1.7) полягає в тому, що достовірні знання не несуть інформації.

Розглянемо похід, позбавлений зазначеного недоліку. Згідно з ним інформацією володіють будь-які повідомлення, які змінюють запас знань, відомостей, якими володіє приймач (користувач) інформації. Цей запас знань, відомостей називається тезаурусом. Його можна представити у вигляді словника користувача, в якому відображені всі його знання, а кількість семантичної інформації, що міститься в повідомленні, - ступенем поповнення словника. Після прийому повідомлення доступні два результату, коли користувач не включає прийняту інформацію в свій словник:

  • • користувач не розуміє і не сприймає інформацію, що надходить ( );
  • • користувач все знає ( ).

У тих випадках, коли надходить інформація зрозуміла користувачеві і несе йому раніше невідомі відомості, він включає її (повністю або частково) в свій словник. Максимальна кількість семантичної інформації відповідають погодженням її змісту S зі словником (тезаурусом) користувача, тобто [1].

Отже, кількість семантичної інформації в повідомленні, кількість нових знань, одержуваних користувачем, є величиною відносною. Одне і те ж повідомлення може мати смисловий зміст для компетентного користувача і бути безглуздим (семантичний шум) для некомпетентного. Таким чином, Тезаурусний міра пов'язує семантичні властивості інформації з індивідуальними здібностями користувача приймати надійшло повідомлення. Смисловий зміст S прийнятого повідомлення може бути зрозуміло одному користувачеві і незрозуміло іншому.

Для кількісної оцінки семантичної інформації також використовують коефіцієнт змістовності С, що є відношенням кількості семантичної інформації до її об'єму

Так, школяр, читаючи підручник, змінює (збільшує) свій запас знань. Зміна запасу знань можна певним способом виміряти і визначити кількість семантичної інформації. Однак студент, прочитавши той же підручник, не набуде знань, так як відомості, що містяться в підручнику середньої школи, йому відомі. У цьому випадку він не отримує семантичної інформації, оскільки не змінює запасу своїх знань.

 
< Попер   ЗМІСТ   Наст >