Навігація
Головна
 
Головна arrow Інформатика arrow Бази даних
< Попередня   ЗМІСТ   Наступна >

Питання програмної реалізації БД, організація зберігання та доступ

Метод фізичного доступу - сукупність програмних засобів, що забезпечують можливість зберігання і вибірки даних, розташованих на фізичних пристроях.

Користувачі стандартних СУБД зазвичай не проводять проектування фізичної БД. Однак у великорозмірних і розподілених СУБД (наприклад, Oracle) ведеться розподіл областей пам'яті. У силу цього знання характеристик фізичного розташування даних корисно.

Виділяють три основні режими роботи додатків, пов'язаних з використанням баз даних.

Режим 1. Отримати всі дані (послідовна обробка).

Режим 2. Отримати унікальні дані (наприклад, одну запис), для чого використовують довільний доступ (кешування, ідентифікатори), індексний метод (первинний ключ), довільний доступ, послідовний доступ (бінарне У-дерево, В + -дерево).

Режим 3. Отримати деякі дані (групу записів), для чого застосовують вторинні ключі, мультіспісок, інвертований метод, двусвязний дерево.

До фізичної моделі пред'являються дві основні суперечливих вимоги: 1) висока швидкість доступу до даних; 2) простота оновлення даних.

Ще одним відносно новим вимогою є обсяг додатково використовуваної (вторинної) пам'яті.

Введемо необхідні додаткові терміни.

Для прискорення процесу пошуку і впорядкування даних створюються індексні файли. В якості індексів можуть виступати окремі поля, насамперед - ключі. Індексний файл менше за розміром, і тому швидкість пошуку збільшується. "Платою" за це є додаткова, вторинна пам'ять. Індекс може бути багаторівневим (В + -дерева). Часто як індексів використовують числа.

Якщо одне й те ж поле використовується в індексі і для впорядкування записів файлу, то індекс називають основним, а файл - індексного-послідовним. В іншому випадку індекс називають вторинним.

Якщо використовується хоча б один вторинний індекс, файл називають інвертованим.

Якщо вторинні індекси існують для всіх можливих полів, файл - повністю інвертований.

У фізичній БД слід розглядати методи розміщення (запис і зберігання) даних і методи доступу (пошук) до них.

Основними методами зберігання і пошуку є фізично послідовний, прямий, індексного-послідовний і індексного-довільний. Для їх порівняльної оцінки використовуємо дна критерію [12].

Ефективність зберігання - величина, зворотна середньому числу байт вторинної пам'яті, необхідного для зберігання одного байта вихідної пам'яті.

Ефективність доступу - величина, зворотна середньому числу фізичних звернень, необхідних для здійснення логічного доступу.

Виділяють [9] первинні (фізично послідовний і довільний) і вторинні (мультіспісковий, інвертований файли, двусвязний дерево) методи доступу.

Стосовно до ієрархічної МД основні методи отримали свої назви і абревіатури (рис. 9.2):

  • 1) ієрархічно послідовний метод доступу (Hierarchical Sequential Access Method - HSAM);
  • 2) ієрархічний прямий метод (Hierarchical Direct Access Method - HDAM);
  • 3) ієрархічний індексного-послідовний метод (Hierarchical Indexed Sequential Access Method - HISAM);
  • 4) ієрархічний індексного-довільний метод (Hierarchical Indexed Direct Access Method - HIDAM).

Методи зберігання і доступу

Рис. 9.2. Методи зберігання і доступу

Дамо цим методам коротку характеристику [9].

Ієрархічно послідовний метод

Записи зберігаються в логічній послідовності, файл має постійний розмір, покажчики можуть бути відсутні. Дані зберігаються в головному файлі, а оновлення вимагає створення нового головного [4, 10, 11] файлу з упорядкуванням, для чого використовується допоміжний файл. Ефективність використання пам'яті близька до 100%, ефективність доступу низька.

Метод зручний для режиму 1, проте швидкодія в режимі 2 мало: для його підвищення необхідно використовувати бінарний пошук (В- і В + -дерева). Час включення і видалення записів значно.

Різновидом методу є фізично пов'язаний (зв'язано-послідовний) метод, який називають також щільним. Є несуміжні фізичні ділянки даних, використовуються покажчики. Здійснюється динамічний перерозподіл пам'яті: в одній і тій же області пам'яті можна виконувати декілька процесів або працювати з даними, що володіють великою мінливістю. При включенні і видаленні даних міняється тільки логіка пошуку. У режимі 1 час пошуку мало, в режимі 2 - велике. Витрати на вторинну пам'ять невеликі. Застосовувати бінарний пошук тут не можна через нещільної упаковки файлів і неможливості обчислювати адреси.

В організації даних використовується ціла група індексних методів, основними з яких є індексного-послідовний і індексного-довільний методи.

 
Якщо Ви помітили помилку в тексті позначте слово та натисніть Shift + Enter
< Попередня   ЗМІСТ   Наступна >
 
Дисципліни
Агропромисловість
Аудит та Бухоблік
Банківська справа
БЖД
Географія
Документознавство
Екологія
Економіка
Етика та Естетика
Журналістика
Інвестування
Інформатика
Історія
Культурологія
Література
Логіка
Логістика
Маркетинг
Медицина
Нерухомість
Менеджмент
Педагогіка
Політологія
Політекономія
Право
Природознавство
Психологія
Релігієзнавство
Риторика
Соціологія
Статистика
Техніка
Страхова справа
Товарознавство
Туризм
Філософія
Фінанси
Пошук