Методологія функціонування баз даних

Йтиметься насамперед про функціонування операційних БД в рамках СУБД.

Незалежно від класу БД тут доводиться вирішувати проблеми, до яких відносяться забезпечення одно- і багатокористувацького функціонування, захист даних, забезпечення цілісності, відновлення даних після збою в БД.

У централізованих однопользовательских БД функціонування забезпечується так званими транзакціями, в результаті виконання яких дані в БД або оновлюються (фіксація), або залишаються колишніми (відкат). Для операційних БД (СУБД) характерні так звані короткі транзакції з тривалістю в мікро- і мілісекунди. Сховища даних повинні працювати при тривалих (години) транзакціях. У разі багато режиму додатково виникає необхідність одночасного доступу декількох користувачів до одних і тих же даних, що найчастіше досягається блокуванням даних.

Захист даних від несанкціонованого доступу здійснюється або забороною доступу (пароль), або дозволом на доступ, що особливо легко забезпечити за допомогою мови програмування SQL. Забезпечення цілісності визначається спеціальними програмами, що одержали назву тригери. Вони реалізують різного роду обмеження. Наприклад, для поля Пол програма обмежує завдання тільки значень "чоловік" і "дружин". Інші значення базою даних не сприймаються.

Відновлення даних після збою БД визначається характером збою. При короткочасних збоях БД відновлюється сама: використовуються дані БД в контрольних точках і невиконані транзакції. При тривалих збоях відновлення БД можливе лише на основі створюваної і періодично оновлюваної резервної копії бази.

У розподілених однорангових БД у вирішенні перерахованих проблем виникають додаткові складності. Можуть бути використані розподілені транзакції. Ускладнюється і процедура одночасного доступу, для забезпечення якої сформовані додаткові методи. Їх суть - та чи інша схема централізації управління базою даних. Особливу значимість набувають питання дублювання даних.

Нові труднощі виникають при інтегруванні в неоднорідну розподілену БД раніше побудованих, діючих локальних баз даних з різними моделями даних.

Вирішення названих проблем дещо спрощується при використанні в розподілених БД режиму клієнт-сервер.

Більш докладно відомості про функціонування БД наведені в гл. 4 і 5.

Методологія проектування сховищ даних

Перейдемо до методологічної стороні сховищ даних. Тут як і раніше можна виділити процедуру створення (проектування) і використання ХД.

Процедура використання ХД мало відрізняється від аналогічної процедури в БД, тому її докладно розглядати не будемо, а відзначимо одну особливість. У силу високих вимог до швидкодії ХД слід особливу увагу звернути на оптимізацію запитів.

При створенні ХД виконуються наступні роботи.

  • 1. Формується склад підсумкової інформації з гранично допустимим часом відгуку і граничним терміном зберігання детальної інформації.
  • 2. Визначається передбачуваний набір запитів на основі детальних даних. При цьому слід знайти компроміс між створенням підсумкової статистичної інформації та її обчисленнями на основі детальних даних.
  • 3. Вибирається спосіб зберігання даних "час" в таблицях.
  • 4. Здійснюється вибір СУБД, який повинен врахувати і потреби системи OLTP. Найбільш придатною є ООСУБД з використанням багатовимірної моделі даних MOLAP. Визначаються розмірності моделі даних.

У той же час можна використовувати і реляційну СУБД із застосуванням різновиди ROLAP. Слід вибрати схему ("зірка" або "сніжинка"). Тоді корисно побудувати таблицю фактів і супроводжуючі її довідкові таблиці з мінімальним зміною ключів в них. При використанні схеми "зірка" слід провести денормализация.

5. Визначаються потреби в додаткових даних, відсутніх в OLTP, і видаляються непотрібні, зайві стовпці в детальних даних.

 
< Попер   ЗМІСТ   Наст >