Поиск информации – одна из самых востребованных на практике задач, которую приходится решать любому пользователю Интернета.
Это самый быстрый способ поиска, но его можно использовать только в том случае, если точно известен адрес документа или сайта, где расположен документ. Не стоит забывать возможность поиска по открытой в окне браузера web-странице (Правка-Найти на этой странице…).
Это наименее удобный способ, так как с его помощью можно искать документы, только близкие по смыслу текущему документу.
Пользуясь гипертекстовыми ссылками, можно бесконечно долго путешествовать в информационном пространстве Сети, переходя от одной web-страницы к другой, но если учесть, что в мире созданы многие миллионы web-страниц, то найти на них нужную информацию таким способом вряд ли удастся. На помощь приходят специальные поисковые системы (их еще называют поисковыми машинами). Адреса поисковых серверов хорошо известны всем, кто работает в Интернете. В настоящее время в русскоязычной части Интернет популярны следующие поисковые серверы: Яндекс ,Google и Rambler.
Поисковая система — веб-сайт, предоставляющий возможность поиска информации в Интернете.
Большинство поисковых систем ищут информацию на сайтах Всемирной паутины, но существуют также системы, способные искать файлы на ftp-серверах, товары в интернет-магазинах, а также информацию в группах новостей Usenet.
По принципу действия поисковые системы делятся на два типа: поисковые каталоги и поисковые индексы.
Поисковые каталоги служат для тематического поиска. Информация на этих серверах структурирована по темам и подтемам. Имея намерение осветить какую-то узкую тему, нетрудно найти список web-страниц, ей посвященных. Каталог ресурсов в Интернете или каталог интернет-ресурсов или просто интернет-каталог — структурированный набор ссылок на сайты с кратким их описанием. Каталог в котором ссылки на сайты внутри категорий сортируются по популярности сайтов называется рейтинг (или топ).
Поисковые индексы работают как алфавитные указатели. Клиент задает слово или группу слов, характеризующих его область поиска, — и получает список ссылок на web-страницы, содержащие указанные термины.
Крупнейшая в мире поисковая система интернета, принадлежащая корпорации Google Inc.
Основана в 1998 году Ларри Пейджем и Сергеем Брином.
Первая по популярности система (77,05 %), обрабатывает 41 млрд 345 млн запросов в месяц (доля рынка 62,4 %), индексирует более 25 миллиардов веб-страниц (на закрытой конференции в начале мая 2014 представитель Google упомянул, что на данный момент проиндексировано 60 триллионов документов, и как можно заметить в результате тестов, счётчик в поиске Google ограничен числом 25 270 000 000, также на это число при выдаче влияют фильтры, встроенные в алгоритм ранжирования выдачи).
Поддерживает поиск в документах форматов PDF, RTF, PostScript, Microsoft Word, Microsoft Excel, Microsoft PowerPoint и других.
Поисковый движок, принадлежащий российской корпорации «Яндекс», основной продукт компании.
Доля «Яндекс.Поиска» составляет 50,9 % на рынке Рунета (октябрь 2018 года) и 7 % на рынке Турции (по данным на октябрь 2015 года).
В целом «Яндекс» индексирует следующие типы файлов: html, pdf, rtf, doc, xls, ppt, docx, odt, odp, ods, odg, xlsx, pptx.
Поисковая система способна также индексировать текст внутри объектов Shockwave Flash (если текст не помещен на само изображение), если эти элементы передаются отдельной страницей, имеющей MIME-тип application/x-shockwave-flash, и файлы с расширением .swf.
В «Яндексе» работают 2 сканирующих робота — «основной» и «быстрый». Первый отвечает за интернет в целом, второй индексирует сайты с часто меняющейся и обновляемой информацией (новостные сайты и информационные агентства). В 2010 году «быстрый» робот получил новую технологию под названием «Orange», разработанную совместно калифорнийским и московским подразделениями «Яндекса».
Появившись в 1996 году, он быстро завоевал популярность и оставался ведущим игроком на рынке поиска России вплоть до 2011 года. «Рамблер» запустил первый в Рунете рейтинг-классификатор (Rambler Top100), первый интернет-портал, первым среди отечественных интернет-компаний вышел на биржу.
В 2012 году философия портала была полностью переосмыслена — «Рамблер» стал медиапорталом персонализированных новостей. Вошёл в группу компаний Rambler&Co, образованную в мае 2013 года в результате объединения активов «Афиши-Рамблер» (ранее входила в холдинг «ПрофМедиа» Владимира Потанина) и SUP Media Александра Мамута.
«Рамблер» четырежды завоёвывал «Премию Рунета».
По данным на июль 2013 года, «Рамблер» занимал 11-е место по популярности среди сайтов России (по другим данным — 9-е). Месячная аудитория «Рамблера» в 2015 году составляла 26 миллионов человек.
5 апреля 2016 года у «Рамблера» появился новый логотип — «/» (косая черта). По утверждению сотрудников компании, это символизирует, что «Рамблер» стоял у истоков Рунета и всегда был связан с интернетом и технологиями.
По данным на сентябрь 2019 года на рынке Рунета он занимает долю около 1,0 — 2,3 % (третье место в рейтинге поисковых систем на российском рынке). С 1 марта 2010 года руководителем Поиска Mail.ru является Андрей Калинин.
В течение многих лет в поисковой строке на главной странице Мейл.ру использовался сторонний движок: в 2004—2006 и 2010—2013 годы использовался поиск Google, 2007—2009 годах — решение от Яндекса. С 1 июля 2013 года сервис использует собственные поисковые технологии, которые разрабатывались командой инженеров Mail.ru.
Первые поисковые технологии в компании Mail.ru начали разрабатываться в 2004 году под руководством Михаила Костина, прежнего руководителя системы Апорт. Инвестиции в проект составили около 700 тыс. долл. Сам домен gogo.ru был приобретён компанией Mail.Ru ещё в 2000 году.
Результатом работы стал открытый в 2007 году сайт GoGo.ru. Поисковик имел первый на тот момент в рунете поиск по видео, а также поиск по картинкам.
К отличительным особенностям поисковика можно отнести русскоязычный поиск по видеороликам, а также по базе данных проекта Ответы mail.ru. Также разработчики предусмотрели возможность тематической фильтрации результатов текстового поиска. Выдачу можно ограничить информационными, коммерческими и пользовательскими (форумы и блоги) источниками.