Засоби Data Mining (DM)

Засоби DM подразумевают витяг ("раскопку", "здобич") даних і спрямовані на виявлення відносин між інформацією, що зберігається в цифрових базах даних підприємства, які аналітик може використовувати для побудови моделей, що дозволяють кількісно оцінити ступінь впливу цікавлять його факторів. Крім того, такі кошти можуть бути корисні для побудови гіпотез про можливий характер відносин інформації в цифрових базах даних підприємства.

Технологія видобутку текстових даних (Text Mining - ТМ) являє собою набір інструментів, що дозволяє аналізувати великі набори інформації в пошуках тенденцій, шаблонів і взаємозв'язків, здатні допомогти у прийнятті стратегічних рішень.

Технологія Image Mining (IM) містить засоби для розпізнавання і класифікації різних візуальних образів, що зберігаються в базах даних підприємства або отриманих в результаті оперативного пошуку із зовнішніх інформаційних джерел.

Для вирішення проблем з обробки та зберігання всіх даних використовують такі підходи:

 • 1) створення декількох систем резервного копіювання або однієї системи розподіленого документообігу, які дозволяють зберігати дані, але володіють повільним доступом до збереженої інформації за запитом користувача;
 • 2) побудова інтернет-систем, що володіють високою гнучкістю, але не пристосованих для реалізації пошуку та зберігання текстових документів;
 • 3) впровадження інтернет-порталів, які добре орієнтовані на запити користувачів, але не володіють описової інформацією щодо завантажуються в них текстових даних.

Системи обробки текстової інформації, вільні від перерахованих вище проблем, можна розділити на дві категорії: системи лінгвістичного аналізу і системи аналізу текстових даних.

Основними елементами технології Text Mining є:

 • o суммарізація (summarization);
 • o тематичний пошук (feature extraction);
 • o кластеризація (clustering);
 • o класифікація (classification);
 • o відповідь на запити (question answering);
 • o тематичне індексування (thematic indexing);
 • o пошук за ключовими словами (keyword searching);
 • o створення та підтримка офтаксономіі (oftaxonomies) і тезаурусів (thesauri).

До програмних продуктів, що реалізують технологію Text Mining, відносяться:

IBM Intelligent Miner for Text - набір окремих утиліт, що запускаються з командного рядка, або Скіпт, незалежних один від одного (основний упор робиться на механізми видобутку даних - information retrieval);

Oracle InterMedia Text - набір, інтегрований в СУБД, що дозволяє найбільш ефективно працювати з запитами користувачів (дозволяє працювати з сучасними реляційними СУБД в контексті складного багатоцільового пошуку та аналізу текстових даних);

Megaputer Text Analyst - набір вбудованих в програму СОМ - об'єктів, призначених для вирішення завдань Text Mining.

Інтелектуальні інформаційні технології

Сьогодні в області автоматизації управління аналіз інформації домінує на попередній стадії підготовки рішень - обробки первинної інформації, декомпозиції проблемної ситуації, що дозволяє пізнати лише фрагменти і деталі процесів, а не ситуацію в цілому. Для подолання цього недоліку треба навчитися будувати бази знань, використовуючи досвід кращих фахівців, а також генерувати відсутні знання.

Використання інформаційних технологій у різних сферах людської діяльності, експоненціальне зростання обсягів інформації і необхідність оперативно реагувати в будь-яких ситуаціях зажадали пошуку адекватних шляхів вирішення виникаючих проблем. Ефективним з них є шлях інтелектуалізації інформаційних технологій.

Під інтелектуальними інформаційними технологіями (ІТТ) зазвичай розуміють такі інформаційні технології, в яких передбачені наступні можливості:

 • o наявність баз знань, що відображають досвід конкретних людей, груп, товариств, людства в цілому, при вирішенні творчих завдань у визначених сферах діяльності, які традиційно вважалися прерогативою інтелекту людини (наприклад, такі погано формалізуються завдання, як прийняття рішень, проектування, витяг сенсу, пояснення , навчання тощо);
 • o наявність моделей мислення на основі баз знань: правил і логічних висновків, аргументації і міркування, розпізнавання та класифікації ситуацій, узагальнення та розуміння і т.п .;
 • o здатність формувати цілком чіткі рішення на основі нечітких, нестрогих, неповних, недовизначених даних;
 • o здатність пояснювати висновки і рішення, тобто наявність механізму пояснень;
 • o здатність до навчання, перенавчання і, отже, до розвитку.

Технології неформализованного пошуку прихованих закономірностей у даних та інформації Knowledge Discovery (KD) базуються на новітніх технологіях формування та структурування інформаційних образів об'єктів, що ближче всього лежить до принципів обробки інформації інтелектуальними системами.

Інформаційні технології підтримки процесу прийняття рішень Decision Support (DS) являють собою оболонки експертних систем або спеціалізовані експертні системи, які надають можливість аналітикам визначати відносини і взаємозв'язки між інформаційними структурами в базах структурованої інформації підприємства, а також прогнозувати можливі результати прийняття рішень.

Тенденції розвитку ІІТ. Системи зв'язку та комунікацій. Глобальні інформаційні мережі та ІІТ можуть докорінно змінити наші уявлення про компанії та самому розумовому працю. Присутність співробітників на робочому місці стане практично не потрібним. Люди можуть працювати вдома і взаємодіяти один з одним при необхідності через мережі. Відомий, наприклад, успішний досвід створення нової модифікації літака "Боїнг-747" розподіленим колективом фахівців, взаємодіючих по Інтернету. Місцезнаходження учасників яких-небудь розробок буде грати все меншу роль, зате зростає значення рівня кваліфікації учасників. Інша причина, що визначила бурхливий розвиток І ІТ, пов'язана з ускладненням систем комунікації і розв'язуваних на їх основі завдань. Знадобився якісно новий рівень "інтелектуалізації" таких програмних продуктів, як системи аналізу різнорідних і нестрогих даних, забезпечення інформаційної безпеки, вироблення рішень в розподілених системах і т.п.

Освіта. Вже сьогодні дистанційне навчання починає грати важливу роль в освіті, а впровадження ІІТ дозволить істотно індивідуалізувати цей процес згідно з потребами та здібностями кожного учня.

Побут. Інформатизація побуту вже почалася, але з розвитком ІІТ з'являться принципово нові можливості. Поступово комп'ютера передаватимуться всі нові функції: контроль над станом здоров'я користувача, управління побутовими приладами, такими як зволожувачі, освіжувачі повітря, обігрівачі, іонізатори, музичні центри, засоби медичної діагностики тощо Іншими словами, системи стануть ще й діагностами стану людини та її житла. Буде забезпечено комфортне інформаційний простір в приміщеннях, де інформаційна середу стане частиною навколишнього середовища людини.

Перспективи розвитку ІІТ. Представляється, що в даний час ІІТ підійшли до принципово нового етапу свого розвитку. Так, за останні 10 років суттєво розширилися можливості ІІТ за рахунок розробки нових типів логічних моделей, появи нових теорій і уявлень. Вузловими точками в розвитку ІІТ вважаються:

 • o перехід від логічного висновку до моделей аргументації та міркування;
 • o пошук релевантних знань і породження пояснень;
 • o розуміння і синтез текстів;
 • o когнітивна графіка, тобто графічне і образне уявлення знань;
 • o мультиагентні системи;
 • o інтелектуальні мережеві моделі;
 • o обчислення, засновані на нечіткій логіці, нейронних мережах, генетичних алгоритмах, імовірнісних обчисленнях (що реалізовуються в різних комбінаціях один з одним і з експертними системами);
 • o проблема метазнаній.

Нової парадигмою створення перспективних ІІТ стали мультиагентні системи. Тут передбачається, що агент - це самостійна інтелектуальна система, що має свою систему цілепокладання і мотивації, свою область дій і відповідальності. Взаємодія між агентами забезпечується системою більш високого рівня - метаінтеллектом. У мультиагентних системах моделюється віртуальне співтовариство інтелектуальних агентів - об'єктів, які автономні, активні, вступають у різні соціальні відносини - кооперації і співробітництва (дружби), конкуренції, змагання, ворожнечі і т.п. Соціальний аспект вирішення сучасних завдань і є фундаментальна особливість концептуальної новизни передових інтелектуальних технологій - віртуальних організацій, віртуального суспільства.

 
< Попер   ЗМІСТ   Наст >