Формування моделі предметної області

Сучасний рівень інструментальних засобів дозволяє працювати на комп'ютері на певному рівні, наприклад, при використанні редакторів, багатьом користувачам. Однак при поглибленої роботі з інформацією, пов'язаною з її збором, створенням бази даних, обробкою інформації, представленням для подальшого використання виникають значні труднощі. Це пов'язано з неможливістю роботи в комп'ютерному середовищі на природній мові. Вся інформація, яка описувала конкретну предметну область повинна бути певним чином абстрагована і формалізована.

Основними напрямками формалізації інформації про предметну область є:

  • • теорія класифікації, що базується на таксономическом і мерономіческом описі інформації. Таксономическое опис засноване на ідеології множин, а мерономіческое здійснюється через строго формалізоване визначення класів;
  • • теорія вимірювань, що пропонує базу для якісних і кількісних вимірювань через класифікаційні та порядкові шкали;
  • • семіотика, яка вивчає знакові системи з точки зору синтактики, семантики і прагматики.

Перш ніж перейти безпосередньо до питань формалізації і абстрагованого опису коротко торкнемося питань термінології.

Поняття інформації в загальному плані повинно бути пов'язане з певною предметною областю, властивості якої вона відображає. У вужчому плані поняття інформації пов'язано з певним об'єктом. При цьому спостерігається відносна незалежність інформації від носія, оскільки можливі її перетворення і передача по різним фізичним середах за допомогою різноманітних фізичних сигналів безвідносно до її змісту, тобто до семантиці, що і стало центральним питанням багатьох досліджень, в тому числі і в філософській науці. Інформація про будь-якому матеріальному об'єкті може бути отримана шляхом спостереження, натурного або обчислювального експерименту, а також на основі логічного висновку. Тому говорять про додосвідні, або апріорної інформації і Післядосвідна, тобто апостеріорної, отриманої в результаті експерименту.

Предметна область - реальний світ, який повинен бути відображений в інформаційній базі.

Факти - результат спостереження за станом предметної області.

Дані - вид інформації, що відрізняється високим ступенем форматування на відміну від більш вільних структур, характерних для мовної, текстової та візуальної інформації

Інформаційна база (база даних) - сукупність даних, призначених для спільного застосування.

Знання - підсумок теоретичної та практичної діяльності людини, що відображає накопичення попереднього досвіду і відрізняється високим ступенем структуризації.

У знаннях можна виділити три основні складові частини:

  • • декларативні (факторальние знання), що представляють загальний опис об'єкта, що не дозволяє їх використовувати без попередньої структуризації в конкретній предметній області;
  • • понятійні (системні) знання, що містять крім першої частини, взаємозв'язку між поняттями і властивості понять;
  • • процедурні (алгоритмічні) знання, що дозволяють отримати алгоритм рішення.

Предмет - будь-яка матеріальна річ, об'єкт пізнання. У логіці предметом називається все те, на що спрямована наша думка; все те, що може бути якось сприйнято, названо і т.д. У цьому сенсі предметом вважаються також судження, поняття, умовивід. У математичній логіці предмети позначаються символами - предметними константами і предметними змінними.

Властивість - те, що притаманне предметів, що відрізняє їх від інших предметів або робить їх схожими на інші предмети. Кожен предмет має безліччю властивостей. Властивості проявляються в процесі взаємодії предметів.

Ознака - все те, в чому предмети, явища подібні між собою або в чому вони відрізняються один від одного; показник, сторона предмета або явища, по якій можна дізнатися, визначити чи описати предмет або явище.

Атрибут (лат. Attributum - призначене, наділене, долучений) - невід'ємне, істотне, необхідне властивість, ознака предмета або явища, без якого вони не можуть існувати, бути самими собою, на відміну від випадкових, скороминущих, несуттєвих властивостей, або акціденцій.

Таким чином, для сучасного стану інформаційних технологій необхідний перехід від інформаційного опису предметної області до подання на рівні даних, здійснюваний на основі декомпозиції, абстракції, агрегування.

Декомпозиція - це розбиття системи (програми, завдання) на компоненти, об'єднання яких дозволяє вирішити це завдання.

Абстракція дозволяє правильно вибрати потрібні компоненти для декомпозиції.

Абстракція являє собою ефективний спосіб декомпозиції, що здійснюється за допомогою зміни списку декомпозиції.

Абстракція передбачає продуманий вибір компонент. Процес абстракції може бути розглянутий як деяке узагальнення. Він дозволяє забути про відмінності і розглядати предмети і явища так, як якщо б вони були еквівалентні.

Виділення загального у процесів і явищ є основа класифікації. Ієрархія абстракцій є фактично схему класифікації.

Агрегування - процес об'єднання предметів в деяку групу не обов'язково з метою класифікації. Агрегування виконується з деякою метою.

Способи абстрагування:

  • • абстракція через параметризацію;
  • • абстракція через специфікацію.

Абстракція через параметризацію - виділення формальних параметрів з можливістю їх заміни на фактичні в різних контекстах.

Виділення формальних параметрів дозволяє абстрагуватися від конкретного додатка і базується на спільності певних властивостей конкретних додатків.

Абстракція через специфікацію дозволяє абстрагуватися від внутрішньої структури до знання властивостей зовнішніх проявів (результату).

Модель даних - модель, яка використовується при абстрагуванні. Концептуальна модель - абстраговані опис предметної області.

Після знайомства з питаннями термінології Ви отримали можливість розмовляти професійною мовою і можна перейти до проблем конструювання інформаційного забезпечення. Першою в цьому ряду стоїть проблема аналізу предметної області.

При аналізі предметної області прийнято виділяти три етапи:

  • • аналіз вимог та інформаційних потреб;
  • • визначення інформаційних об'єктів і зв'язків між ними;
  • • конструювання-концептуальної моделі предметної області.

Етап аналізу вимог та інформаційних потреб включає наступні завдання:

  • • визначення переліку завдань з вилучення, обробки, зберігання, транспортування та поданням (в тому числі документування) інформації;
  • • визначення вимог до складу, структури, форм представлення інформації;
  • • прогнозування можливих змін інформаційних ресурсів як в кількісному, так і в змістовному плані.

Розглянемо приклад аналізу предметної області. Виберемо область діяльності, знайому всім студентам - навчальний процес. Припустимо, нам доручили розробити інформаційну систему "Розклад занять".

Кожен з учасників дії має своє уявлення про інформацію даної предметної області. Нашим завданням є узагальнення цих уявлень, одержуваних шляхом опитування учасників інформаційних процесів і аналізу документів. Всі дії бажано фіксувати у вигляді певних документів на папері або в пам'яті комп'ютера. Форма фіксації може бути будь-яка: структурна схема, блок-схема, таблиця і т.д. Наприклад, в якості таких можна використовувати такі види документів: схему зовнішніх інформаційних зв'язків (рис. 7.5), схему деталізації дії (рис. 7.6), схему потоків даних (рис. 7.7) і ін.

Схема зовнішніх інформаційних зв'язків

Мал. 7.5. Схема зовнішніх інформаційних зв'язків

Схема деталізації дії

Мал. 7.6. Схема деталізації дії

Використовуємо запропоновані типи документів.

  • 1. Схема зовнішніх інформаційних зв'язків. Дія - Работа_с_распісаніем.
  • 2. Схема деталізації дії. Дія - Работа_с_распіса- ням.
  • 3. Схема потоків даних. Дія - Работа_с_распісаніем.
  • 4. Схеми класифікації: об'єкт - користувачі розкладу (рис. 7.8, а); об'єкт - приміщення (рис. 7.8, б); дані - запити до розкладу (рис. 7.8, в).

Схема потоків даних

Мал. 7.7. Схема потоків даних

схеми класифікації

Мал. 7.8. Схеми класифікації

  • 5. Схема деталізації. Дані - довідки за розкладом (рис. 7.9).
  • 6. Схема класифікації. Дані - довідки за розкладом (рис. 7.10).

Ретельність проведення етапу аналізу визначає в подальшому ефективність роботи інформаційної системи, можливість

схема деталізації

Мал. 7.9. Схема деталізації

ність подальшого нарощування інформаційних ресурсів, адаптованість до зміни вимог до системи.

Після аналізу вимог та інформаційних потреб можна перейти до наступної фази - визначення інформаційних об'єктів і зв'язків між ними.

Основним завданням даного етапу є розбиття предметної області на складові частини шляхом декомпозиції, що здійснюється за певними правилами.

На даний момент існують два основні підходи до цього процесу, що відрізняються критеріями декомпозиції: функціонально - модульний (структурний) і об'єктно-орієнтований.

Функціонально-модульний підхід заснований на принципі алгоритмічної декомпозиції з виділенням функціональних елементів і встановленням суворого порядку виконуваних дій, тобто в основі лежить ієрархічний підхід з виділенням спочатку функціональних дій, потім незалежних компонентів з подальшою їх деталізацією.

схема класифікації

Мал. 7.10. Схема класифікації

Об'єктно-орієнтований підхід заснований на об'єктної декомпозиції з описом поведінки системи в термінах взаємодії об'єктів.

Головним недоліком функціонально-модульного підходу є односпрямованість інформаційних потоків і недостатня зворотний зв'язок. У разі зміни вимог до системи це призводить до повного перепроектування, тому помилки, закладені на ранніх етапах, сильно позначаються на тривалості і вартості розробки. Іншою важливою проблемою є неоднорідність інформаційних ресурсів, що використовуються в більшості інформаційних систем. В силу цих причин в даний час найбільшого поширення набув об'єктно-орієнтований підхід.

Основні поняття, що використовуються при декомпозиції предметної області на основі об'єктно-орієнтованого підходу - об'єкт, клас, екземпляр, атрибут, зв'язок між об'єктами, зв'язок між атрибутами.

Об'єкт - це абстракція безлічі предметів реального світу, що володіють однаковими характеристиками і законами поведінки. Об'єкт характеризує собою типовий невизначений елемент такого безлічі. Основною характеристикою об'єкта є склад його атрибутів (властивостей). Іншим чином, об'єкт можна характеризувати як факт, особа, подія, предмет, який визначається сукупністю даних. У примітивному плані - об'єкт це те, що відповідає на питання "хто?", "Що?". Об'єкт може бути реальним (наприклад, людина, предмет, географічний пункт) і абстрактним (наприклад, подія, рахунок покупця, що вивчається навчальний курс).

Атрибут - інформаційне відображення властивостей об'єкта.

Примірник об'єкта - це конкретний, певний елемент множини. Наприклад об'єктом може бути державний номер автомобіля, а екземпляром цього об'єкта - номер До 173 ПА.

Клас - це безліч предметів реального світу, пов'язаних спільністю структури і поведінкою.

Елемент класу - це конкретний елемент даної множини. Наприклад, клас реєстраційних номерів автомобіля.

Узагальнюючи ці визначення, можна сказати, що об'єкт - це типовий представник класу, а терміни "екземпляр об'єкта" і "елемент класу" рівнозначні. На рис. 7.11 показані відносини між класами, об'єктами і предметами реального світу. Зв'язок між об'єктами (атрибутами) - інформаційне відображення

Відносини між класами, об'єктами і предметами реального світу

Мал. 7.11. Відносини між класами, об'єктами і предметами реального світу

функціональної, "спорідненої", видовий або іншій залежності (підпорядкованості).

При виділенні інформаційних об'єктів можна простежити таку послідовність дій:

  • • формування класів, на які можна розбити дані, що підлягають зберіганню;
  • • присвоєння унікального імені кожного класу об'єктів;
  • • виділення інформаційних об'єктів шляхом аналізу інформаційних потоків, документальних джерел та інтерв'ювання учасників інформаційної взаємодії;
  • • присвоєння унікального імені кожному об'єкту даних і перевірка їх синтактіки і семантики;
  • • визначення набору характеристик кожного об'єкта і формування на цій основі складу атрибутів;
  • • присвоєння унікальних імен обраним атрибутам;
  • • завдання обмежень на об'єкти і їх атрибути (кількісні обмеження - діапазон зміни: максимальне (мінімальне) значення та ін., Обмеження цілісності (незмінності стану об'єкта в даному інтервалі часу).

У процесі відображення між станами взаємодіючих об'єктів виникає певний зв'язок. Інформація як результат відображення одного об'єкта іншим виявляє ступінь відповідності їх станів.

Виділяють три типи зв'язку: зв'язок "один до одного" (1: 1), зв'язок "один до багатьох" (1: М), зв'язок "багато до багатьох" (M: N).

Приклади цих зв'язків:

Зв'язок "один до одного" (1: 1) відображає однозначну залежність між об'єктами (хворий Іванов лежить на ліжку 73 - на ліжку 73 лежить хворий Іванов; студент Петров має залікову книжку №131056 - залікова книжка №131056 належить студенту Петрову).

Зв'язок "один до багатьох" (1: М) або "багато до одного" (М: 1) відображає неоднозначну залежність одного об'єкта по відношенню до іншого (хворий Іванов лежить в палаті №6 - в палаті №6 лежать хворі Іванов, Петров, Сидоров, Михайлов; студент Петров вчиться в групі №131 - в групі №131 навчаються студенти Петров, Максимов, Коробкін, Ільїн, Круглова і ін.).

Зв'язок "багато до багатьох" (M: N) відображає неоднозначну залежність об'єктів по відношенню один до одного (хворий Іванов лікується у лікарів Соколова, Воробйова, Воронова - лікар Соколов лікує хворих Іванова, Петрова, Сидорова; студент Петров відвідує лекції професорів Яшина, Васильєва , Волкова - професор Яшин читає лекції студентам Петрову, Максимову, Короб- кину, Ільїну, Кругловой і ін.).

Виділення цих зв'язків є вкрай важливим, так як зв'язку 1: М і MN мають внутрішню невизначеність, що позначається при операціях пошуку і модифікації (зміни) даних. Для подолання невизначеності на етапі реалізації логічної моделі потрібно вводити надлишкову інформацію.

Завершальною фазою аналізу предметної області є проектування певної інформаційної структури у вигляді концептуальної моделі. Для побудови концептуальної моделі використовуються операції агрегації і узагальнення.

Агрегація заснована на об'єднанні інформаційних об'єктів в один на основі семантичних зв'язків між об'єктами. Наприклад, літак типу X перевозить вантаж з пункту відправлення А в пункт призначення В. Використовуючи агрегацію створюємо інформаційний об'єкт РЕЙС з атрибутами "тип літака", "пункт відправлення", "пункт призначення", "рейс літака".

Узагальнення засноване на об'єднанні родинних інформаційних об'єктів в родовий об'єкт. Наприклад, об'єкти АВТОМОБІЛЬ, ЛІТАК, КОРАБЕЛЬ, ВЕЛОСИПЕД, МОТОЦИКЛ об'єднуємо в об'єкт ТРАНСПОРТНИЙ ЗАСІБ. Одним з атрибутів цього об'єкта буде атрибут "тип транспортного засобу".

Етап концептуального проектування є специфічним, оскільки тут потрібно одночасно знання особливостей предметної області і методології проектування. Характерним є використання різних моделей (моделі "сутність - зв'язок", бінарних моделей даних, семантичних мереж, інфологічних моделей даних і ін.). Негативним моментом є неадекватність отриманих результатів як при використанні різних моделей, так і в рамках колективу виконавців. Особливістю концептуальної моделі є її орієнтація з одного боку на інформаційні інтереси користувача, з іншого - на інформаційні потреби самої предметної області. Користувачам на вибір пропонується дві моделі: модель "сутність - зв'язок" і проста реляційна модель із зазначенням функціональних взаємозв'язків між атрибутами.

Однією з поширених моделей є модель "сутність - зв'язок" ( "entity" - "relationship"), в літературі поряд з цим використовується термін "ER-модель", або "модель Чена".

Базовими структурами в ER-моделі є типи сутностей і типи зв'язків (рис. 7.12). Відмінність типу зв'язку від типу сутності - у встановленні залежності реалізації одного типу від реалізації іншого.

Приклад: ОСОБИСТІСТЬ - тип сутності, тип СКЛАДАЄТЬСЯ В ШЛЮБ - немає, так як реалізація останнього типу не існує, якщо не існує двох особистостей. Тому, тип зв'язку можна розглядати як агрегат двох або більше типів сутностей.

Реляційна модель є найбільш поширеною на практиці в сучасних ІС, тому доцільно розглянути

Семантична діаграма реляційної моделі

Мал. 7.13. Семантична діаграма реляційної моделі

Елементи ER-діаграми

Мал. 7.12. Елементи ER-діаграми

Приклад реляційної моделі

Мал. 7.14. Приклад реляційної моделі

її можливості. Більшість СУБД, представлених на ринку, є реляційними або об'єктно-реляційними. Семантична діаграма реляційної моделі представлена на рис. 7.13, а приклад реляційної моделі - на рис. 7.14.

 
< Попер   ЗМІСТ   Наст >