ПЗ № 26. Робота в мережі Інтернет. Пошук потрібної інформації. Види пошуку

Мета Ознайомити студентів з пошуковими системами Інтернету. Навчити знаходити потрібну інформацію за допомогою пошукових систем. Після виконання практичної роботи студенти повинніЗнати:

Вміти:

Теоретичні відомості

У Всесвітній Мережі розміщена інформація на різноманітну тематику і напрями які тільки можна собі уявити. Але проблема полягає в самому пошуку потрібних даних. Пошук інформації здійснюється двома способами:

Перший спосіб.  Він найшвидший і простий, якщо знаєте ім'я www - документа (URL адреса). Для виклику www-документа, що містить потрібну вам інформацію, необхідно в адресному рядку браузера набрати адрес цієї сторінки або сайту: (ввести URL адресу в полі Адреса ) > Enter.

Другий спосіб. Використання  пошукових серверів. Він універсальний, дозволяє "знайти" будь-яку потрібну вам інформацію. Саме тут користувач повинен продемонструвати свій рівень розуміння задачі і формулювання мети.

Кожна пошукова служба – це велика база ключових слів, які зв’язані з web-сторінками, на яких вони знаходяться. Ключовими є ті слова, які є основними. Для пошуку адреси сервера з інформацією, яка вас цікавить, треба ввести в поле ключове слово або фразу. Так ви посилаєте пошуковій системі запит. В відповідь система виводить список адрес web-сторінок, на яких зустрілись ці ключові слова 

 За принципом дії розрізняють кілька видів пошукових служб. Найбільш поширеними є 

Веб-каталоги. Веб-каталоги (інша назва тематичні каталоги) містять базу даних посилань на веб-сайти, які розподілені на окремі тематичні рубрики. Наприклад, до однієї рубрики віднесені усі посилання, що стосуються подорожей, до іншої – комп’ютерів, до третьої – бізнесу тощо.У свою чергу, кожна рубрика поділяється на підрубрики. Так, у рубриці Бізнес можна виділити підрубрики Промисловість, Будівництво, Транспорт тощо.

Окремі пошукові каталоги поруч із посиланнями на ресурс надають оцінку його популярності у користувачів. Такі каталоги називають рейтинговими системами.

Заповнюють базу даних каталогу, як правило, вручну працівники служби. Вони переглядають веб-сторінки, обирають ті, що на їх погляд можуть представляти інтерес для користувачів Інтернету, заносять URL-адреси таких веб-сторінок з коротким описом до відповідної рубрики бази даних.

Один і той самий сайт може бути віднесений до кількох рубрик. Число сайтів в Інтернеті величезне, тому при ручному опрацюванні веб-сторінок база даних інформаційнопошукової системи веб-каталогів наповнюється й оновлюється досить повільно. Власники сайтів для популяризації своїх ресурсів можуть самостійно зареєструвати свій сайт у веб-каталогах.

Існує багато веб-каталогів, у тому числі українські

Мета (http://meta.ua)

UAport(http://uaport.net)

Пошук (http://www.poshuk. com)

Холмс(http://holms.ukrnet.net)

UkraiNet (http://www.ukrainet.com.ua/ukr) та інші.

У різних каталогах рубрики можуть називатися по різному, бази даних можуть суттєво відрізняться за обсягом, працівниками пошукових служб можуть опрацьовуватися різні ресурси Всесвітньої павутини. Тому результати пошуку на різних веб-каталогах будуть відрізнятися один від одного. Якщо потрібна інформація не знайдена в одному тематичному каталозі, то можна спробувати її знайти в іншому.

Для пошуку інформації з використанням вебкаталогу користувачу потрібно виконати таку послідовність дій:

1. Визначити тему, за якою здійснюватиметься пошук.

2. Вибрати на сторінці тематичного каталогу рубрику, яка найбільше відповідає темі.

3. Прочитати описи посилань на сторінці, що відкрилася.

4. Якщо знайдено посилання, яке відповідає темі, то використати його для відкриття відповідної вебсторінки, інакше уточнити тему і повторити пошук у цій або іншій пошуковій службі.

Пошукові системи

Інший вид пошукових служб – пошукові системи, які також називають індексними базами даних або пошуковими серверами.

Бази даних пошукових систем містять значно більше посилань на веб-сторінки, ніж бази даних тематичних каталогів. Це досягається завдяки тому, що опрацювання веб-сторінок виконують не люди, а спеціальні програми, які називають пошуковими роботами. Ці програми переглядають вміст веб-сторінок, визначають слова, які найчастіше зустрічаються у тексті та зберігають результати опрацювання вмісту сторінок у базі даних пошукової системи.

Пошукова система (ПС) – спеціалізований ресурс, який використовується для пошуку необхідної користувачам інформації в мережі Інтернет. Основою будь-якої пошукової системи є складний програмний комплекс, що працює на базі пошукових алгоритмів, що постійно оновлюються і модифікуються.

Історія

Незважаючи на майже п’ятидесятирічну історію розвитку Всесвітньої павутини перші пошукові системи з’явилися лише на початку 1990-х років, причому до наших днів дожила лише одна – система Aliweb. Вона користується популярністю і сьогодні. Трохи пізніше з’явився пошуковик WebCrawler, дуже схожий на сучасні пошукові системи.

Він використовував автоматичну систему індексації сайтів, а видача формувалася на основі вибору пошукових роботів. Згодом кількість пошукачів збільшувалася, багато хто з них популярні до цих пір.

 

У змаганні за популярність пошукові системи намагаються надати якомога більше послуг своїм користувачам. Серед них:

Розглянемо, як здійснюється пошук інформації з теми Штучний інтелект у пошуковій системі Google (http://www.google.com.ua). Це одна з найбільших у світі пошукових систем, до того ж її послуги можуть надаватися українською мовою.

Як ключове словосполучення для пошуку можна вибрати штучний інтелект, якщо нас цікавить загальна інформація про цю наукову галузь. У пошуковій системі Google результат не залежить від того, великими чи маленькими літерами введені ключові слова.

На головній сторінці веб-сайта в поле для введення пошукового запиту введемо ключове словосполучення та виберемо кнопку Пошук. Менш ніж за секунду в базі даних служби Google буде виконаний пошук і відкриється сторінка з результатами. На цій сторінці наводиться список гіперпосилань, кожне з яких супроводжується фрагментом вмісту веб-сторінки. У ньому виділені слова, що входять до пошукового запиту. Для кожного посилання вказана URL-адреса веб-сторінки. В окремому рядку відображається кількість знайдених посилань, що відповідають пошуковому запиту.

Результати пошуку виводяться групами по 10 посилань на сторінку. На початку списку розміщені посилання на ті веб-сторінки, у яких найчастіше зустрічаються слова з пошукового запиту або до яких найбільше зверталися користувачі. Таким чином, можна очікувати, що серед перших десяти посилань будуть такі, що найбільше відповідають побажанням користувача. Перед гіперпосиланням може бути вказаний тип документа: [PDF], [DOC], [RTF] тощо. При виборі такого посилання залежно від налаштувань браузера або відкривається вікно відповідної прикладної програми та в нього завантажується документ, або з’являється діалогове вікно Завантаження файлу з пропозицією відкрити або зберегти документ.

Кількість знайдених посилань може бути великою, але це не означає, що всі вони відповідають темі. Так, на окремих веб-сторінках, на які є посилання за пошуковим запитом штучний інтелект, зустрічаються обидва ключові слова, але не обов’язково, що у тексті вони стоять поруч. Можливо, на одній сторінці згадується не штучний інтелект, а штучний газон та інтелект нації тощо. Для переходу на іншу сторінку з результатами пошуку слід вибрати її номер у списку номерів або посилання Уперед у нижній частині сторінки.

Якщо результати пошуку не містять потрібної інформації, то це означає, що користувач невдало сформулював пошуковий запит або в пошукової служби недостатня база даних.

 

Завдання і критерії оцінювання

На оцінку 3

На оцінку 4

На оцінку 5