Система управління базами даних

Вивчивши матеріал даної глави, студент повинен:

знати

  • • призначення та сфери використання баз даних у філології;
  • • види організації даних і їх відмінність;
  • • способи взаємодії користувача з базами даних;
  • • найбільш часто використовувані типи баз даних;

вміти

  • • управляти різними наборами даних;
  • • використовувати існуючу модель бази даних для зберігання власних даних;
  • • виконувати введення, пошук, висновок необхідних даних в системі управління базами даних;

володіти

  • • розумінням проблем, що стоять перед філологами в області організації даних, та шляхів їх вирішення;
  • • уявленням про організацію взаємодії з базами даних.

Вступ: навіщо потрібні бази даних в лінгвістиці і які завдання вони повинні вирішувати

Філологія розпорядженні величезною кількістю даних. Оскільки предметом вивчення філології є опис та аналіз мови, можна вважати її областю досліджень сотні висловлювань (усних і письмових), вироблених мільярдами людей за кілька тисячоліть. Ці висловлювання вироблені на тисячах мов, кожен з яких містить сотні тисяч слів, кожне з яких може вживатися в десятках словоформ і значень. Результати лінгвістичного аналізу виявляють велику різноманітність правил кодування на всіх рівнях - звуки, слова, фрази, тексти. Ці правила обчислюються тисячами для кожної мови. Вивчаються багато факторів мовних варіацій, в тому числі географічні, гендерні, соціальні, патологічні та ситуаційні, що додає до цього багатства об'єкти дослідження.

Завдання баз даних

Враховуючи цей величезний обсяг даних, не дивно, що багато філологи намагаються використовувати технічні засоби для управління даними. Бази даних містять набори даних в області фонетики, фонології, морфології, синтаксису, історичної лінгвістики і діалектології, також в областях прикладної лінгвістики, таких як лексикографія і навчання мовам за допомогою комп'ютера. Вони служать не тільки в якості сховищ для великих обсягів даних, але і полегшують доступ до них.

Технічно база даних визначається як будь структурований набір даних. Старомодна картотека, наприклад картотека бібліотечного каталогу, являє собою базу даних. Картки організовані на регулярній основі, кожна містить ім'я автора, назву книги, рік і місце видання, і покажчик на місце зберігання книги. У наші дні термін "база даних" (БД), як правило, відноситься до цифровій базі даних; але хоча цифрові бази даних мають величезні переваги в порівнянні з картотеками, сутність бази даних нс змінилася, вона як і раніше є структурованим представленням збереженого вмісту. Крім того, БД повинна забезпечувати єдність даних і виключати надмірність. Виняток надлишкових або дубльованих даних зменшує можливість їх неузгодженості. Наприклад, якщо потрібно записати ФІНІТНОГО дієслово (в головному реченні) в базі даних пропозицій, не кращим рішенням буде його пряма запис, наприклад "працює", кращим рішенням є запис індексу при інфінітиві ("працювати", 3 л. 1 ч, н. вр.).

Модель бази даних

Майже всі комп'ютерні додатки виконують управління даними деякого виду. Програма текстового редактора читає файл документа, представляє його користувачеві для редагування і записує відредаговану версію; комп'ютерна гра показує послідовність закодованих образів і записує досягнутий гравцем результат у файл і т.д. Цей підхід, називається моделлю на основі файлів. Він має серйозні недоліки для складних, інформаційно ємних додатків, які повинні обробляти великі обсяги інформації набагато складнішими методами. У цьому випадку модель на основі файлів призводить до дублювання програмування, помилок і несумісності на всіх рівнях. Програмні додатки повинні розуміти формат файлів, забезпечувати одночасний доступ до одних і тих же даних, і так чи інакше запобігати несанкціоноване отримання доступу до даних.

Модель бази даних делегує роботу по зберіганню і управлінню даними спеціалізованої структури, званої "Система управління базами даних" (СУБД). Замість того щоб безпосередньо звертатися до диска, додатки запитують дані з СУБД або відправляють у неї дані для зберігання. Всі складні питання зберігання, пошуку, поновлення і навіть доступу до даних можуть бути вирішені тільки один раз на рівні СУБД.

СУБД може функціонувати локально, на вашому комп'ютері, або як віддалений сервіс, що викликається через підключення до Інтернету. Зовнішні програми запитують дані з СУБД (подавши відповідний запит, що описує, які дані потрібні) або передають дані в СУБД для зберігання в базі даних. СУБД повинна з високою продуктивністю вирішувати всі завдання обробки даних (обробка одночасних запитів, управління доступом і т.д.). Але рішення цих завдань виконується в одному модулі, який запрограмований досвідченими фахівцями, пройшов багаторазові перевірки, постійно підтримується і оновлюється. СУБД використовує дуже загальну модель організації даних, яка потім може бути налаштована відповідно до потреб кожного проекту. Лінгвіст може придбати таку СУБД (можливо, Access або MySQL) і використовувати її для створення і використання бази даних з урахуванням специфіки своїх потреб.

 
< Попер   ЗМІСТ   Наст >