Пошук через Інтернет

В Інтернеті дуже багато різноманітної інформації і з кожним днем їх кількість зростає. Дані по одному конкретному питанню можуть перебувати на тисячах різних сайтів. Знайти найбільш підходящі з них нам допомагають пошукові системи Інтернету.

Розберіться, як працюють ці системи, і ви зможете знайти в мережі все, що завгодно.

Пошук в Інтернеті.

Як працюють пошукові системи

Пошук інформації в інтернеті

Способи пошуку інформації в web

Пошук інформації – одна з найбільш затребуваних на практиці завдань, яку доводиться вирішувати будь-якому користувачеві Інтернету.

Існують три основні способи пошуку інформації в Інтернет:

1. Вказівка ​​адреси сторінки.

2. Пересування по гіперпосиланням.

3. Звернення до пошукової системи (пошукового сервера).

Спосіб 1: Вказівка ​​адреси сторінки

Це найшвидший спосіб пошуку, але його можна використовувати тільки в тому випадку, якщо точно відома адреса документа або сайту, де розташований документ.

Не варто забувати можливість пошуку по відкритій у вікні браузера web-сторінці (Правка-Знайти на цій сторінці …).

Спосіб 2: Пересування по гіперпосиланням

Це найменш зручний спосіб, так як з його допомогою можна шукати документи, тільки близькі за змістом поточного документа.

Спосіб 3: Звернення до пошукової системи

Користуючись гіпертекстовими посиланнями, можна нескінченно довго подорожувати в інформаційному просторі Мережі, переходячи від однієї web-сторінки до іншої, але якщо врахувати, що в світі створені не один мільйон web-сторінок, то знайти на них потрібну інформацію таким способом навряд чи вдасться.

На допомогу приходять спеціальні пошукові системи (їх ще називають пошуковими машинами). Адреси пошукових серверів добре відомі всім, хто працює в Інтернеті. В даний час в україномовній частині Інтернет популярні такі пошукові сервери: Google (google.uа) Яндекс (yandex.ua), і Yahoo (yahoo.ua)

Пошук в Інтернеті

Пошукова система

Пошукова інтернет система – веб-сайт, що надає можливість пошуку інформації в Інтернеті.

Більшість пошукових систем шукають інформацію на сайтах Всесвітньої павутини, але існують також системи, здатні шукати файли на ftp-серверах, товари в інтернет-магазинах, а також інформацію в групах новин Usenet.

За принципом дії пошукові інтернет системи діляться на два типи: пошукові каталоги і пошукові індекси.

Пошукові каталоги

Пошукові інтернет каталоги служать для тематичного пошуку.

Інформація на цих серверах структурована за темами і підтемами. Маючи намір висвітлити якусь вузьку тему, неважко знайти список web-сторінок, їй присвячених.

Каталог ресурсів в Інтернеті або каталог інтернет-ресурсів або просто інтернет-каталог – структурований набір посилань на сайти з коротким їх описом.

Каталог в якому посилання на сайти всередині категорій упорядковано відповідно до популярності інтернет сайтів називається рейтинг (або топ).

Пошукові індекси

Пошукові індекси працюють як алфавітні покажчики. Клієнт задає слово або групу слів, які характеризують його область пошуку, – і отримує список посилань на web-сторінки, що містять зазначені терміни.

Першою пошуковою системою для Всесвітньої павутини був «Wandex», вже не існуючий індекс, розроблений Метью Грей з Массачусетського технологічного інституту в 1993.

Як працює пошукової індекс?

Пошукові індекси автоматично, за допомогою спеціальних програм (веб-павуків), сканують сторінки Інтернету та індексують їх, тобто заносять в свою величезну базу даних.

Пошуковий робот ( «веб-павук») – програма, що є складовою частиною пошукової системи і призначена для обходу сторінок Інтернету з метою занесення інформації про них (ключові слова) в базу пошукової системи. За своєю суттю павук найбільше нагадує звичайний браузер. Він сканує вміст сторінки, закидає його на сервер пошукової машини, якій належить і відправляється по посиланнях на наступні сторінки.

У відповідь на запит, де знайти потрібну інформацію, пошуковий сервер повертає список гіперпосилань, ведучих web-сторінок, на яких потрібна інформація є або згадується. Широту списку може бути будь-який, в залежності від змісту запиту.

http://www.google.ru/

Лідер пошукових машин Інтернету, Google займає більше 70% світового ринку. Cейчас реєструє щодня близько 50 млн пошукових запитів та індексує більше 8 млрд веб-сторінок. Google може знаходити інформацію на 115 мовах.

За однією з версій, Google – перекручене написання англійського слова googol. «Googol (гугол)» – це математичний термін, що позначає одиницю зі 100 нулями. Цей термін був придуманий Мілтоном Сіроттой, племінником американського математика Едварда Кайзера, і вперше описаний в книзі Каснера і Джеймса Ньюмена «Математика і уява» (Mathematics and the Imagination). Використання цього терміна компанією Google відображає завдання організувати величезні обсяги інформації в Інтернеті.

Інтерфейс Google містить досить складну мову запитів, що дозволяє обмежити область пошуку окремими доменами, мовами, типами файлів і т.

http://www.yandex.ru/

Яндекс – російська система пошуку в Мережі. Сайт компанії, Yandex.ru, був відкритий 23 вересня 1997 року. Головний офіс компанії знаходиться в Москві. У компанії є офіси в Санкт-Петербурзі, Єкатеринбурзі, Одесі та Києві. Кількість працівників перевищує 700 осіб.

Слово «Яндекс» (що складається з букви «Я» і частини слова index; обіграний той факт, що російське займенник «Я» відповідає англійському «I») придумав Ілля Сегалович, один із засновників Яндекса, зараз займає посаду технічного директора компанії.

Пошук Яндекса дозволяє шукати по Рунету документи російською, українською, білоруською, румунською, англійською, німецькою та французькою мовами з урахуванням морфології російської та англійської мов і близькості слів у реченні. Відмітна особливість Яндекса – можливість точної настройки пошукового запиту. Це реалізовано за рахунок гнучкого мови запитів.

За замовчуванням Яндекс виводить по 10 посилань на кожній сторінці видачі результатів, в настройках результатів пошуку можна збільшити розмір сторінки до 20, 30 або 50 знайдених документів.

Час від часу алгоритми Яндекса, що відповідають за релевантність видачі, змінюються, що призводить до змін в результатах пошукових запитів. Зокрема, ці зміни спрямовані проти пошукового спаму, що приводить до нерелевантних результатів по деяким запитам.

http://uk.search.yahoo.com/

Yahoo і Microsoft – запізнились зі вступом в гру

Yahoo і Microsoft не мали власних пошукових технологій до 2004 року. Yahoo Search використовував дані AltaVista і Inktomi, і навіть деякий час – Google. MSN Search (тепер Live Search) пройшов схожий шлях, хоча і не вдавався до послуг Google. Власну технологію пошуку Microsoft запустив лише в 2005 році (бета-версія з’явилася в 2004).

Механізм роботи сучасної пошукової системи

Технології, що використовуються пошуковими системами, пройшли складну еволюцію і сьогодні продовжують удосконалюватися. Яндекс і Google є популярними в першу чергу завдяки гнучкості і високій якості своїх пошукових алгоритмів, які максимально враховують інтереси користувача і забезпечують надання йому дійсно адекватних відповідей на кожен його запит.

Механізм роботи сучасної пошукової системи полягає приблизно в наступному. Основною її частиною є пошуковий робот - апаратно-програмний комплекс, який безперервно обходить і сканує сайти. Результатом відвідування сайту роботом є поміщення інформації про зміст його сторінок у базу (індекс) пошукової системи. Цей процес називається індексацією. Далеко не усі сторінки сайту потрапляють в індекс пошукової системи, навіть якщо робот на них заходив. Неякісні і некорисні матеріали зазвичай відсіюються. Усупереч думці деяких недосвідчених користувачів, пошукова система при виконанні запиту не сканує Інтернет (це, враховуючи величезні його масштаби, нереально), а видає результати зі згаданої вище пошукової бази. База ця - текстова, і саме текст має вирішальне значення для пошукових систем. Від частоти відвідування сайту роботом залежить актуальність інформації про нього у базі пошукової системи. Тому іноді можна зіткнутися з ситуацією, коли пройшовши по посиланню в результатах пошуку, ми не виявляємо відповідної інформації, оскільки зміст сторінки сайту з часу останнього її відвідування роботом змінився. За спостереженнями, пошукові роботи "самонавчаються", встановлюючи індивідуальну періодичність індексації для кожного сайту залежно від середньої частоти зміни його контенту (зміст). Це дозволяє мінімізувати кількість подібних непорозумінь.

Знайти якусь сторінку в Інтернеті можна тільки за словами, що містяться на ній. Якщо вам потрібно щось знайти в Інтернеті, постарайтеся точно сформулювати запит. Подумайте, які слова повинні міститися в заголовках потрібної сторінки, і шукайте за цими словами. У разі пошуку в Інтернеті висловлювання про те, що правильне питання - це вже половина відповіді, повністю відповідає дійсності.

Усім, хто хоч раз здійснював пошук в Інтернеті за допомогою Яндекса, Google або іншої пошукової системи, напевно відомо, що в результатах запиту відповідні сайти за замовчуванням видаються по 10 на сторінку. Саме на ці перші десять сайтів і припадає левова частка відвідувачів, що шукають щось з використанням пошукової системи, оскільки мало хто переходить на другу і подальші сторінки результатів пошуку. Слова, що вводяться для пошуку, називаються пошуковими запитами. Пошукові системи відбирають зі своєї бази сторінки, які містять необхідні дані, і розміщують їх в пошуковій видачі по мірі їх релевантности(відповідності) пошуковому запиту. Релевантність сторінок визначається згідно зі спеціальними алгоритмами, детальна побудова яких зберігається в таємниці. Проте відомо, що на позиції сайту у видачі значною мірою впливає його якість, PR, ТІЦ і деякі інші показники. PR і ТІЦ - схожі за своєю суттю поняття. Це числові відображення авторитетності сайту в Інтернеті, що визначаються якістю і кількістю інших сайтів, які на нього посилаються. Поняття ТІЦ для сайту введене і враховується Яндексом, PR - Google. Ці значення в розмовній мові часто називають "пузомірками" сайту.

Сьогодні практично кожне поважаюче себе підприємство, установа чи організація має свій сайт в Інтернеті. Фактично сайти знаходяться на спеціальних серверах. Розміщення сайту не сервері називається хостинг. Відвідувачі сайтів - це потенційні клієнти, і чим їх більше, тим краще. Саме тому всі прагнуть просунути сайт в першу десятку видачі пошукових систем. Для цього інтернет-ресурс повинен відповідати певним вимогам більше, ніж сайти-конкуренти. Процес приведення ресурсу до цих вимог називається пошуковою оптимізацією сайту або SEO (search engine optimization), а діяльність по його просуванню на перші місця у видачі - просуванням("розкручуванням") сайту.

Складність досягнення першості в пошуковій видачі залежить від популярності (конкурентності) пошукового запиту. Наприклад, просунути сайт в першу десятку Яндекса за запитом "кондиціонери" або "магазин побутової техніки" дуже складно. Потрібна наявність певних знань, значні витрати часу, сил і засобів. Сьогодні існує певний клас інтернет-підприємців, котрі за гроші займаються розкручуванням сайтів. Це так звані оптимізатори.

Пошукові системи, прагнучи забезпечити якісну пошукову видачу, вітають просування сайтів так званими "білими" методами (висока якість тексту, ніякого плагіату, красиве оформлення, зручна навігація для користувачів, корисна і максимально повна інформація і так далі) і украй негативно реагують на спроби маніпулювати результатами видачі з використанням заборонених способів (обмін посиланнями, купівля посилань з інших сайтів, перенасичення тексту ключовими словами на шкоду його читабельності та ін.). На сайти, помічені в таких діях, нерідко накладаються санкції у вигляді видалення частини або навіть усіх його сторінок з пошукової видачі. Коли говорять, що сайт потрапив в бан Яндекса або іншої пошукової системи, мається наувазі саме накладення таких санкцій.

Дати визначення усіх пов'язаних з пошуком в Інтернеті термінів, незрозумілих недосвідченим користувачам, в одній статті нереально. У викладеному вище матеріалі описано тільки ті з них, якими сьогодні глобальна мережа просто кишить. Сподіваюся, що отримані знання допоможуть Вам не лише ефективніше знаходити необхідну інформацію у Всесвітній мережі, але і розуміти суть різноманітних рекламних оголошень, банерів, коментарів та ін.

Взято з сайту https://www.chaynikam.info/ukr/poiskovie_systemi.html