Етапи еволюції інформаційних технологій

Тимчасові фази розвитку управління даними

Мал. 3.1. Тимчасові фази розвитку управління даними

У нульовому поколінні (4000 до н.е. - 1900 г.) протягом шести тисяч років спостерігалася еволюція від глиняних таблиць до папірусу, потім до пергаменту і, нарешті, до паперу. Малося багато нововведень в поданні даних: фонетичні алфавіти, твори, книги, бібліотеки, паперові та друковані видання. Це були великі досягнення, але обробка інформації в цю епоху здійснювалася вручну.

Перше покоління (1900-1955) пов'язане з технологією перфокарт, коли запис даних представлялася на них у вигляді довічних структур. Процвітання компанії IBM в період 1915-1960 рр. пов'язане з виробництвом електромеханічного обладнання для запису даних на карти, сортування і складання таблиць. Громіздкість устаткування, необхідність зберігання величезної кількості перфокарт визначили поява нової технології, яка повинна була витіснити електромеханічні комп'ютери.

Друге покоління (програмований обладнання обробки записів, 1955-1980 рр.) Пов'язано з появою технології магнітних стрічок, кожна з яких могла зберігати інформацію десяти тисяч перфокарт. Для обробки інформації були розроблені електронні комп'ютери з збереженими програмами, які могли обробляти сотні записів в секунду. Ключовим моментом цієї нової технології було програмне забезпечення, за допомогою якого порівняно легко можна було програмувати і використовувати комп'ютери.

Програмне забезпечення цього часу підтримувало модель обробки записів на основі файлів. Типові програми послідовно читали кілька вхідних файлів і виробляли на виході нові файли. Для полегшення визначення цих орієнтованих на записи послідовних завдань були створені COBOL і декілька інших мов програмування. Операційні системи забезпечували абстракцію файлу для зберігання цих записів, мова управління виконанням завдань і планувальник завдань для управління потоком робіт.

Системи пакетної обробки транзакцій зберігали їх на картах або стрічках і збирали в пакети для подальшої обробки. Раз в день ці пакети транзакцій сортувалися. Відсортовані транзакції зливалися з збереженої на стрічці набагато більшою за розмірами базою даних (основним файлом) для виробництва нового основного файлу. На основі цього основного файлу також проводився звіт, який використовувався як гроссбух наступного бізнес-день. Пакетна обробка дозволяла дуже ефективно використовувати комп'ютери, але володіла двома серйозними обмеженнями: неможливістю розпізнавання помилки до обробки основного файлу і відсутністю оперативного знання про поточну інформації.

Третє покоління (оперативні бази даних, 1965-1980 рр.) Пов'язано з впровадженням оперативного доступу до даних в інтерактивному режимі, заснованому на використанні систем баз даних з оперативними транзакціями.

Технічні засоби для підключення до комп'ютера інтерактивних комп'ютерних терміналів пройшли шлях розвитку від телетайпів до простих алфавітно-цифровим дисплеям і, нарешті, до сьогоднішніх інтелектуальним терміналам, заснованим на технології персональних комп'ютерів.

Оперативні бази даних зберігалися на магнітних дисках або барабанах, які забезпечували доступ до будь-якого елементу даних за частки секунди. Ці пристрої і програмне забезпечення управління даними давали можливість програмам зчитувати кілька записів, змінювати їх і потім повертати нові значення оперативному користувачеві. На початку системи забезпечували простий пошук даних: або прямий пошук по номеру запису, або асоціативний пошук по ключу.

Прості індексного-послідовні організації записів швидко розвинулися в більш потужну модель, орієнтовану на набори. Моделі даних пройшли еволюційний шлях розвитку від ієрархічних і мережевих до реляційних.

У цих ранніх базах даних підтримувалися три види схем даних:

  • • логічна, яка визначає глобальний логічний проект записів бази даних і зв'язків між записами;
  • • фізична, що описує фізичне розміщення записів бази даних на пристроях пам'яті і в файлах, а також індекси, потрібні для підтримки логічних зв'язків;
  • • надається кожному з додатком подсхема, яка розкриває тільки частина логічної схеми, яку використовує програма.

Механізм логічних і фізичних схем і подсхем забезпечував незалежність даних. І насправді багато програм, написані в ту епоху, все ще працюють сьогодні з використанням тієї ж самої підсхеми, з якої все починалося, хоча логічна і фізична схеми абсолютно змінилися.

До 1980 р мережеві (і ієрархічні) моделі даних, орієнтовані на набори записів, стали дуже популярні. Однак навігаційний програмний інтерфейс був низького рівня, що послужило поштовхом до подальшого вдосконалення інформаційних технологій.

Четверте покоління (реляційні бази даних: архітектура "клієнт - сервер", 1980-1995 рр.) Стало альтернативою низкорівневому інтерфейсу. Ідея реляційної моделі полягає в однаковому поданні суті і зв'язку. Реляційна модель даних має уніфікованим мовою для визначення даних, навігації за даними і маніпулювання даними. Роботи в цьому напрямку породили мову, названий SQL, прийнятий в якості стандарту.

Сьогодні майже всі системи баз даних забезпечують інтерфейс SQL. Крім того, у всіх системах підтримуються власні розширення, що виходять за рамки цього стандарту.

Крім підвищення продуктивності і простоти використання реляційна модель має деякі несподіваними перевагами. Вона виявилася добре придатною до використання в архітектурі "клієнт-сервер", паралельній обробці і графічних користувальницьких інтерфейсів. Додаток "клієнт-сервер" розбивається на дві частини. Клієнтська частина відповідає за підтримку введення і представлення вихідних даних для користувача або клієнтського пристрою. Сервер відповідає за зберігання бази даних, обробку клієнтських запитів до бази даних, повернення клієнту загальної відповіді. Реляційний інтерфейс особливо зручний для використання в архітектурі "клієнт-сервер", оскільки призводить до обміну високорівневими запитами і відповідями. Високорівнева інтерфейс SQL мінімізує комунікації між клієнтом і сервером. Сьогодні багато клієнт-серверні кошти будуються на основі протоколу Open Database Connectivity (ODBC), який забезпечує для клієнта стандартний механізм запитів високого рівня до сервера. Архітектура "клієнт-сервер" продовжує розвиватися. Як пояснюється в наступному розділі, є зростаюча тенденція інтеграції процедур в серверах баз даних. Зокрема, такі процедурні мови, як BASIC і Java, були додані до серверів, щоб клієнти могли викликати прикладні процедури, що виконуються на них.

Паралельна обробка баз даних була другим несподіваним перевагою реляційної моделі. Відносини є однорідними множинами записів. Реляційна модель включає набір операцій, замкнутих по композиції: кожна операція отримує відносини на вході і виробляє ставлення як результат. Тому реляційні операції природним чином надають можливості конвеєрного паралелізму шляхом направлення виведення однієї операції на вхід наступної.

Реляційні дані також добре пристосовані до графічним призначеним для користувача інтерфейсів (GUI). Користувачі легко можуть створювати відносини у вигляді електронних таблиць і візуально маніпулювати ними.

Тим часом файлові системи і системи, орієнтовані на набори, залишалися "робочими конячками" багатьох корпорацій. З роками ці корпорації побудували величезні програми, але не могли легко перейти до використання реляційних систем. Реляційні системи швидше стали ключовим засобом для нових клієнт-серверних додатків.

П'яте покоління (мультимедійні бази даних, з 1995 р) пов'язано з переходом від традиційних зберігають числа і символи, до об'єктно-реляційних, що містить дані зі складною поведінкою. Наприклад, географам слід мати можливість реалізації карт, фахівцям в області текстів має сенс реалізовувати індексацію і вибірку текстів, фахівцям з графічним образам варто було б реалізувати бібліотеки типів для роботи з образами. Конкретним прикладом може служити поширений об'єктивний тип часових рядів. Замість вбудовування цього об'єкта в систему баз рекомендується реалізація відповідного типу у вигляді бібліотеки класів з методами для створення, оновлення та видалення тимчасових рядів.

Швидкий розвиток Інтернету посилює ці дебати. Клієнти і сервери Інтернету будуються з використанням аплетів і "хелперів", які зберігають, обробляють і відображають дані того чи іншого типу. Користувачі вставляють ці аплети в браузер або сервер. Загальнопоширені аплети керують звуком, графікою, відео, електронними таблицями, графами. Для кожного з асоційованих з цими апплетами типів даних є бібліотека класів. Настільні комп'ютери і Web-браузери є поширеними джерелами і приймачами здебільшого даних. Тому типи і об'єктні моделі, використовувані в настільних комп'ютерах, будуть диктувати, які бібліотеки класів повинні підтримуватися на серверах баз даних.

Підводячи підсумок, слід зазначити, що бази даних покликані зберігати не тільки числа і текст. Вони використовуються для зберігання багатьох видів об'єктів і зв'язків між цими об'єктами, що ми бачимо в World Wide Web. Різниця між базою даних і іншою частиною Web стає незрозумілим.

Щоб наблизитися до сучасного стану технології управління даними, має сенс описати два великих проекти, в яких використовуються граничні можливості сьогоднішньої технології [10]. Система Earth Observation System / Data Information System (EOS / DIS) розробляється агентством NASA і його підрядниками для зберігання всіх даних, які почали надходити зі супутників серії "Місія до планети Земля" з 1977 р Обсяг бази даних, що включає дані від віддалених сенсорних датчиків , буде рости на 5 Тбайт в день (1 Тбайт - 106 Гбайт). До 2007 р розмір бази даних виросте до 15 Пбайт. Це в 1000 разів більше обсягу найбільших сучасних оперативних баз даних. NASA хоче, щоб ця база даних була доступна кожному в будь-якому місці і в будь-який час. Будь-яка людина зможе здійснювати пошук, аналіз і візуалізацію даних з цієї бази. Для побудови EOS / DIS потрібні найбільш розвинені методи зберігання, пошуку і візуалізації даних. Велика частина даних буде мати просторовими і тимчасовими характеристиками, так що для системи будуть потрібні суттєвий розвиток технології зберігання даних цих типів, а також бібліотеки класів для різних наукових наборів даних. Наприклад, для цього додатка потрібно бібліотека для визначення снігового покриву, каталогу рослинних форм, аналізу хмарності та інших фізичних властивостей образів.

Іншим вражаючим прикладом бази даних є створювана всесвітня бібліотека. Багато відомчі бібліотеки відкривають доступ до своїх сховищ в режимі on-line. Нова наукова література публікується в режимі on-line. Такий вид публікацій піднімає важкі соціальні питання з приводу авторських прав та інтелектуальної власності і змушує вирішувати глибокі технічні проблеми. Лякають розміри і різноманіття інформації. Інформація з'являється на багатьох мовах, у багатьох форматах даних і в величезних обсягах. При застосуванні традиційних підходів до організації такої інформації (автор, тема, назва) не використовуються потужності комп'ютерів для пошуку інформації по вмісту, для зв'язування документів і для групування подібних документів. Пошук необхідної інформації в море документів, карт, фотографій, аудіо- та відеоінформації є захоплюючу і важку проблему.

Швидкий розвиток технологій зберігання інформації, комунікацій та обробки дозволяє перемістити всю інформацію в кіберпростір. Програмне забезпечення для визначення, пошуку і візуалізації оперативно доступної інформації - ключ до створення і доступу до такої інформації. Основні завдання, які необхідно вирішити:

  • • визначення моделей даних для їх нових типів (наприклад, просторових, темпоральних, графічних) та їх інтеграція з традиційними системами баз даних;
  • • масштабування баз даних за розміром (до петабайт), просторового розміщення (розподілені) і різноманіттю (неоднорідні);
  • • автоматичне виявлення тенденцій даних, структур і аномалій (пошук, аналіз даних);
  • • інтеграція (комбінування) даних з декількох джерел;
  • • створення сценаріїв і управління потоком робіт (процесом) і даними в організаціях;
  • • автоматизація проектування і адміністрування базами даних.
 
< Попер   ЗМІСТ   Наст >