Інформаційний пошук в Інтернеті

Інформаційний пошук - послідовність операцій, спрямованих па надання інформації зацікавленим особам. Пошук виконується в чотири етапи:

  • 1) визначення інформаційної потреби і власника інформаційного масиву;
  • 2) формулювання запиту;
  • 3) вилучення інформації з інформаційного масиву;
  • 4) ознайомлення з отриманою інформацією і оцінка результатів пошуку.

Інформаційний пошук в сукупності інформаційних ресурсів, масивів документів, базах даних, знань реалізується за допомогою автоматизованих інформаційно-пошукових систем.

Пошукові сайти

Інтернет - перший і єдиний інформаційний об'єкт, в якому потенційно можливий пошук по всьому об'єму інформації, накопиченому людством на даний момент. Інформація в гіпертекстовому представленні зростає на кілька мільйонів веб-сторінок в день. В принципі можливий глобальний пошук, але від 30 до 70% інформації, розміщеної в Інтернеті, і цілі ресурси закриті для пошукових систем парольним входом (конфіденційні) або динамічно породжуються сервером тільки на підставі запиту. Однак навіть при цих обмеженнях пошук дуже ефективний.

У звичайній бібліотеці інформаційний масив має на увазі наявність класифікації та спеціалізації знань по областям. В Інтернеті немає глобального каталогу всіх ресурсів і головного редактора, частина інформації має низьку якість.

Тому там легко витратити час даремно. Однак є засоби і методи вести ефективний пошук.

Існують два основні методи відкриття ресурсу інформації в Інтернеті:

  • а) послідовний перехід від сайту до сайту за гіперпосиланнями, які, на вашу думку, можуть призвести до необхідної інформації, і їх перегляд;
  • б) пошук.

До основних засобів пошуку інформації в Інтернеті відносяться (табл. 9.1);

  • • пошукові та метапоісковая системи (пошук конкретних документів);
  • • індексовані каталоги (пошук тематичних сайтів але структурі рубрик);
  • • адреси популярних пошукових систем і каталогів мережі Інтернет;
  • • рейтинги (топи) найбільш відвідуваних ресурсів;
  • • тематичні списки посилань (тематичні портали- покажчики);
  • • мережеві енциклопедії та довідники з визначеннями понять і довідковими даними.

Таблиця 9.1

пошукові сайти

Яндекс (yandex.ru)

Пошукова система і каталог

Рамблер (rambler.ru)

Пошукова система і каталог Тор 100

Google (Гугл) (google.ru)

Міжнародна пошукова система і каталог

Mail.ru

Пошукова система і каталог

Bing! (Bing.com)

Пошукова система

Nigma (nigmaru)

метапоісковая система

Пошукова система в Інтернеті - спеціальний вебсайт, на якому можна зробити запит і отримати посилання на документи та сайти, відповідні запиту. До складу пошукової системи може входити кілька потужних серверів (в системі Google - більше 10 000 комп'ютерів).

Інтерфейс пошукової сторінки забезпечує можливість формулювати в рядку текстовий запит, посилати ех о, переглядати отриманий у відповідь список посилань і переходити за їхніми адресами.

Програмне забезпечення пошукової системи складається з трьох компонентів: пошуковий робот, індекс системи, класифікатор.

Пошуковий робот - програма-аналізатор, безперервно відвідує веб-адреси в Інтернеті ( "повзає, як павук по павутині"); переглядає і досліджує зміст документів, індексує слова з тексту і заносить в базу даних (оновлює її).

База даних індексів - створювана за результатами пошуку таблиця: "слово - адреса документа, де слово зустрічається". Пошуковий робот періодично оновлює базу даних, знаходячи нові матеріали, прибираючи непрацюючі посилання.

Коли відвідувач робить запит, пошук адрес ведеться не в Інтернеті, а в заготовленої базі даних сервера.

Класифікатор - програма, яка: а) обробляє запит користувача; б) знаходить і витягає за допомогою індексу слів з бази даних посилання, що відповідають критеріям запиту; в) виводить список посилань на знайдені документи в порядку убування релевантності (визначає їх відповідність, "вага", значимість і виконує сортування), зверху списку найбільш підходящі адреси.

Особливо потужні пошукові системи враховують популярність сайту за кількістю відвідувань і посилань на нього з інших сайтів, оцінюють сторінки за кількістю інших пов'язаних важливих сторінок. Алгоритми ранжування (оцінювання) важливості можуть відрізнятися, сайт може займати 5-е місце по одним рейтингам і 30-е - за іншими.

Пошукові системи в списку посилань можуть запропонувати не тільки прямий перехід до документа і його сайту, але і текст з виділенням слів, заявлених в запиті, а також збережену копію основного тексту документа зі свого архіву (без малюнків і гіперпосилань, іноді без форматування). Збережена в архіві пошукової системи копія зручна тим, що завантажується швидше, можна отримати документ, недоступний на вихідному сервері, або перетворення формату doc, pdf в формат HTML.

Метапоісковая система - система пошуку, яка не має власної бази даних, але вона володіє програмними можливостями запитувати дані у кількох інших пошукових сайтів, аналізувати отримане, слідуючи власним алгоритмом обробки, надавати зведений результат [1] .

Деякі каталоги містяться в пошукових системах і дозволяють пошук і за ключовими словами, і за ієрархічним дереву розділів. Якщо ж необхідно знайти конкретний документ, то каталог малоефективний. Іноді частина наведених в тематичних колекціях посилань не працює.

Корисно звертатися до топів (tops) - списками найбільш відвідуваних сайтів по конкретній тематиці. Висока відвідуваність сайту свідчить про якісний зміст, сервісі.

Великі пошукові системи і каталоги ресурсів Інтернету стали порталами - пропонують різноманітну інформацію, новини, додаткові послуги: безкоштовну електронну пошту, місце для розміщення веб-сторінок, підтримують форуми.

Пошукові системи Інтернету на перших позиціях списку ресурсів, пропонованих за запитом користувача, розміщують так звані оплачені і "керовані результати" і комерційну рекламу товарів і послуг різних компаній, штучно підвищуючи їх рейтинг. Рекламодавці купують право контекстної реклами на конкретні теми запитів. Рекламні посилання не обов'язково відрізняються оформленням від звичайних результатів пошуку.

  • [1] Метадані - дані про дані: каталогу, довідники, реєстри, бази метаданих, що містять відомості про склад даних, зміст, статус, походження, місцезнаходження, як, форматах і формах уявлення, умови доступу. Метаінформація - опис інформації, інформація про інформацію.
 
< Попер   ЗМІСТ   Наст >