Вибір платформи бази даних

Проблеми вибору БД

Створення лінгвістичної БД не завжди легко дається лінгвістам.

Перше питання, яке потребує відповіді: "Чи повинні ви створити власну базу даних?" В даний час є численні готові до використання додатки, які можуть підтримувати колекцію лінгвістичних даних, починаючи від специфічних лінгвістичних (наприклад, Toolbox лінгвіста, Starling) до програм загального призначення (наприклад, Microsoft Excel - електронні таблиці). Якщо існуючий додаток відповідає вашим потребам, не треба займатися проектуванням і створенням нової БД з нуля. Якщо ви вирішили створити нову лінгвістичну БД, слід ознайомитися з існуючими типами баз даних.

  • 1. Локальна база даних (ЛБД), створена засобами Microsoft Access. Це найпростіше рішення, воно підходить для збору та організації даних, використовується на одному персональному комп'ютері.
  • 2. Маленька БД в Інтернеті. Хоча створення такої БД значно складніше, ніж у випадку ЛБД, воно буде кращим рішенням, якщо кілька людей повинні мати можливість вводити дані паралельно або є плани в кінцевому підсумку зробити БД у відкритому доступі.
  • 3. Складні БД для великого проекту з професійним персоналом програмістів. Оскільки немає чіткої межі між малої і великої БД, мала БД може з часом перерости у велику, при збереженні загальної ідеології. Наша мета тут полягає у вирішенні проблем лінгвістів, які зможуть самостійно розробити пілотний проект лінгвістичної БД.

Локальна база даних

Для виконання дослідницького проекту однією людиною або невеликою групою, без кваліфікованої технічної підтримки, локальна (настільна) БД, розроблена засобами Microsoft Access, часто виявиться дуже хорошим рішенням. Ця програма зберігає всю базу даних в одному файлі на диску або в папці, дозволяють копіювати її, виконати резервне копіювання і переміщати її як звичайний файл. Це значно спрощує первинну настройку системи, тому що не потрібно використовувати віддалений сервер. Іноді політика організації може забороняти роботу з віддаленим сервером баз даних. Користувальницький інтерфейс програмного забезпечення (ПЗ) настільних БД дозволяє визначати таблиці і відносини БД і форми користувальницького інтерфейсу. Для настільної БД не потрібен доступ в Інтернет, що є важливим чинником для лінгвістів, що припускають збір даних в польових умовах.

З іншого боку, цей підхід також має певні недоліки. На комп'ютері-реципієнті повинно бути встановлено той же ПО, що і на комп'ютері-донорі. Засоби створення інтерфейсу обмежені. Неможлива паралельна робота декількох користувачів. В даний час загальної (і настійно рекомендованої) практикою є надання доступу до даних іншим дослідникам через Інтернет, що особливо важливо для спільних проектів. Одна з цілей моделі бази даних - підтримка паралелізму, тобто одночасних сесій редагування різними користувачами. Але оскільки ЛБД зберігається у файлі на диску, тільки одна людина в даний момент часу може вносити зміни в ЛБД.

Мала база даних в Інтернеті

Щоб подолати недоліки настільної БД розробляються бази даних в Інтернеті, що працюють, як показано на рис. 13.1. Дуже популярним способом налаштувати таку систему є так званий LAMP-стек - операційна система Linux, вебсервер Apache, СУБД MySQL і мова програмування РНР. Поєднання LAMP надійно, а програмне забезпечення - безкоштовне з відкритим вихідним кодом. Порівняно легко знайти програмістів, у тому числі програмістів-аматорів (наприклад, студентів), які знають, як створити веб-базу даних за допомогою мови РНР. Перевага цього підходу полягає також у тому, що користувальницький інтерфейс реалізується веб-браузером користувача, який вже встановлений на кожному комп'ютері.

Але веб-база даних має одне істотне обмеження - вебсторінка не може забезпечити всі шрифти, які часто необхідні для лінгвістичних завдань, наприклад фонетичні символи або тексти на мовах з рідкісними системами письма, для яких потрібні власні шрифти. У таких випадках користувачам веб-бази даних, можливо, буде потрібно вручну завантажити та встановити шрифт, перш ніж вони зможуть використовувати його правильно. Деякі речі надто складно реалізувати за допомогою мови розмітки HTML і веб-браузера. Наприклад, нам потрібно виводити на дисплей аудіо- або відеофайли у форматі, який браузер не підтримує, зображати синтаксичні дерева, точно вимірювати час реакції або використовувати географічні карти в інтерактивному режимі. Сучасні браузери підтримують деякі розширення їх базової функціональності. Зокрема, вони можуть виконати програми на javascript, вбудовані у веб-сторінки. Для більш складних додатків єдиним рішенням може виявитися окреме клієнтську програму.

Деякі загальні рекомендації щодо створення бази даних:

  • 1) плануйте заздалегідь - ретельно проектуйте базу даних, перш ніж ви почнете її реалізацію;
  • 2) плануйте зміни - коли ви будете накопичувати дані, ваше розуміння явищ і кращий спосіб їх вивчення буде вдосконалюватися;
  • 3) прагнете до простоти, але намагайтеся врахувати свої майбутні потреби;
  • 4) документуйте вашу базу даних у письмовій формі для себе і для інших.
 
< Попер   ЗМІСТ   Наст >