Основні поняття та визначення

Під класифікацією розуміється поділ безлічі на підмножини за неформально запропонованим ознакою. В силу багатогранності баз даних і СУБД (комплексу технічних і програмних засобів для зберігання, пошуку, захисту та використання даних) є безліч класифікаційних ознак. Класифікація БД за основними з них [28] наведена на рис. 1.12.

Класифікація баз даних

Рис. 1.12. Класифікація баз даних

Особливо поговоримо про статичних та динамічних БД.

У статичних БД частота оновлення даних багато нижче частоти їх зчитування. Дані безпосередньо не пов'язані з часом. Наприклад, анкетні дані, які використовуються набагато частіше, ніж змінюються. Саме для статичних БД будувалася спочатку теорія баз даних.

У статичних БД дані частіше змінюються, ніж додаються. У зв'язку з цим основною вимогою до них стало простота оновлення, що досягається поділом таблиці на декілька в процесі нормалізації. Формуються чаші всього перша, друга і третя нормальна форми, рідше - четверта і п'ята. Використання другої і вище форм говорить про глибоку нормалізації.

Останнім часом все частіше звертаються до динамічним БД, в яких частоти зчитування та поновлення даних співмірні. У динамічних БД час виступає явно у вигляді понять моментів часу (дата) або інтервалу часу (семестр, місяць, рік). Наприклад, дані про успішність студентів груп за час навчання (по семестрах).

Для таких БД більш характерно не зміна, а додавання даних і процедура глибокої нормалізації втрачає актуальність. Нормалізація може обмежуватися першій нормальній формою.

Окремо слід класифікувати системи управління базами даних (рис. 1.13). Бази даних можуть класифікуватися і з точки зору економічної 181: - безкоштовні й платні (безприбуткові, комерційні); за формою власності (державні, недержавні); за ступенем доступності (загальнодоступні, з обмеженим колом користувачів).

Класифікація СУБД

Рис. 1.13. Класифікація СУБД

В даний час є додаткові, не загальноприйняті пропозиції [3] по виділенню таких класів, як активні БД (фактично - експертні системи, які раніше називалися дедуктивними базами даних); просторові БД (пов'язані зі зберіганням графічних файлів, наприклад, географічних карт); тимчасові БД, в яких час присутній в явному вигляді в якості полів таблиць. Оскільки два останні класу входять до складу інших класів і самостійного значення поки не мають, від цієї лінії класифікації тут утримаємося.

Надалі зосередимо увагу на відеобазах даних- текстів (таблиць) зі структурованими даними документального характеру. Йтиметься про відкриті СУБД, як правило, операційного типу.

До середини 90-х років XX ст. під базою даних розуміли статичні БД, які згодом отримали назву операційних (транзакційних) БД, а за кордоном - OnLine Transaction Processing (OLTP).

До середини 90-х років в базах даних класу OLTP накопичилося стільки хронологічній інформації, що обсяг БД різко зріс, а швидкодія почало падати. Наприклад, у роботі деканату найчастіше потрібні детальні дані про поточний навчальний рік. У той же час в БД зберігаються ретроспективні дані і за попередні роки. Такі дані необхідні значно рідше і найчастіше в агрегованому вигляді. Наприклад, видати прізвища студентів, які три останні семестру отримували тільки відмінні оцінки.

Стало ясно, що ретроспективну інформацію слід періодично передавати в окрему БД. До того ж з'ясувалося, що ретроспективні дані володіють новою якістю: вони дозволяють виробляти стратегічні рішення. Виникла можливість формування систем підтримки прийняття стратегічних рішень (СППР). Такі системи отримали за кордоном назву OnLine Analytic Processing (OLAP).

Зв'язок OLTP і OLAP показана на рис. 1.14. OLAP служить як би доповненням OLTP.

Співвідношення OLTP і OLAP

Рис. 1.14. Співвідношення OLTP і OLAP

OLAP відразу була оцінена по достоїнству менеджерами, оскільки дозволяла: істотно підвищити ефективність праці керівників різного рангу; підвищити конкурентоспроможність фірм; одержувати додатково високий прибуток.

Наведені характеристики системи OLAP дозволяють помітити, що при проектуванні цієї системи, як і при проектуванні OLTP, виникають складнощі, обумовлені наступними обставинами:

  • • потребою в значних обчислювальних ресурсах для обробки великого обсягу даних;
  • • проблемами, пов'язаними з незаповненістю (відсутністю даних) або відсутністю необхідних полів в операційній БД;
  • • збільшенням складності супроводу та реструктуризації;
  • • значною тривалістю створення і заповнення OLAP.

OLAP, у порівнянні з OLTP характеризується дещо іншими властивостями, як це видно з табл. 1.13.

У подальших міркуваннях, при відсутності спеціального застереження, під СУБД будемо розуміти операційну базу даних.

Таблиця 1.13

Властивості даних в OLTP і OLAP

Властивість

OLTP

OLAP

Призначення даних

Оперативний пошук, нескладна обробка

Аналітична обробка: прогнозування, моделювання, аналіз і виявлення зв'язків, виявлення статистичних закономірностей

Рівень агрегації

Детальні дані

Агреговані дані

Період зберігання даних

До року

До декількох десятків років

Мінливість даних

Змінюються

Додаються

Впорядкування

даних

По любому полю

За хронологією

Обсяг оброблюваної інформації

Невеликий

Дуже великий

Швидкість обробки

Середня

Дуже висока

Критерій ефективності роботи

Кількість транзакцій в одиницю часу

Швидкість виконання складних запитів

Завантаження

Часто і невеликими порціями

Рідко і дуже великими порціями

 
< Попер   ЗМІСТ   Наст >