Представьте себе комнату, в которой живет множество пауков, и каждый из них плетет свою паутину. Паутин уже так много, что все они переплетаются, и пауки могут без труда добраться по ним в любую точку комнаты. Так можно описать Интернет - совокупность множества самых разных компьютеров и компьютерных сетей, охватывающих весь земной шар и миллионы пользователей по всему миру. Эта сеть начала свою работу в 1969 году в качестве военного проекта. Информация передаваемая через Интернет, перемещается от одного компьютера к другому наиболее коротким путем. По этой причине, любые два компьютера останутся соединенными до тех пор, пока есть хотя бы один маршрут между ними.
Всемирная компьютерная глобальная сеть Интернет привлекает пользователей своими информационными ресурсами и услугами, такими как телеконференции, Интернет-телефония, файловые архивы, электронная почта, WWW, форумы прямого общения (chat) и многие другие, которыми регулярно пользуется около двух миллиардов человек во всех странах мира.
Бурное развитие сети Интернет, которое происходит последние годы, в первую очередь обусловлено появлением Всемирной паутины.
«Всемирная паутина» — это вольный перевод английского словосочетания «World Wide Web», которое часто обозначается как WWW или Web. Эту систему можно сравнить с огромной энциклопедией, страницы которой разбросаны по компьютерам-серверам, объединенным сетью ИНТЕРНЕТ. Создатели WWW ввели понятие Web-страницы.
Технология Всемирной паутины. Всемирной Паутине исполнилось всего 23 года. Датой рождения World Wide Web (WWW) считается 6 августа 1991 года. Всемирная паутина использует технологию гипертекста, в котором документы связаны между собой с помощью гиперссылок.
Поиск информации – одна из самых востребованных на практике задач, которую приходится решать любому пользователю Интернета.
Существуют три основных способа поиска информации в Интернет:
Указание адреса страницы.
Передвижение по гиперссылкам.
Обращение к поисковой системе (поисковому серверу).
Поисковая система – это аппаратно-программный комплекс, который предназначен для осуществления функции поиска в интернете, и реагирующий на пользовательский запрос, который обычно задают в виде какой-либо текстовой фразы (или точнее поискового запроса), выдачей ссылочного списка на информационные источники, осуществляющейся по релевантности.
Основные характеристики поисковых систем
Полнота. Полнота является одной из главнейших характеристик поиска, она представляет собой отношение цифры найденных по запросу информационных документов к их общему числу в интернете, относящихся к данному запросу. Чем полнее сам поиск, тем больше вероятность, что пользователь найдет именно тот документ, который ему необходим, конечно, если он вообще существует.
Точность. Точность определяет степень соответствия запросу пользователя найденных страниц в Сети. Чем поиск точнее, тем скорее пользователь найдет необходимую ему информацию, тем меньше разнообразного «мусора» будет встречаться среди результатов, тем меньше найденных документов будут не соответствовать смыслу запроса.
Актуальность. Актуальность характеризует время, проходящее с момента опубликования информации в интернете до занесения ее в индексную базу поисковика. К примеру, на следующий день после возникновения информации о выходе нового iPad, множество пользователей обратилась к поиску с соответствующими видами запросов. В большинстве случаев информация об этой новости уже доступна в поиске, хотя времени с момента ее появления прошло очень мало. Это происходит благодаря наличию у крупных поисковых систем «быстрой базы», которая обновляется несколько раз за день.
Скорость поиска. Такая функция как скорость поиска теснейшим образом связана с так называемой «устойчивостью к нагрузкам». Ежесекундно к поиску обращается огромное количество людей, подобная загруженность требует значительного сокращения времени для обработки одного запроса. Тут интересы, как поисковой системы, так и пользователя целиком совпадают: посетитель хочет получить результаты как можно быстрее, а поисковая система должна отработать его запрос тоже максимально быстро, чтобы не притормозить обработку последующих запросов.
Наглядность. Наглядное представление результатов является важнейшим элементом удобства поиска. По множеству запросов поисковая система находит тысячи, а в некоторых случаях и миллионы разных документов. Вследствие нечеткости составления ключевых фраз для поиска или его не точности, даже самые первые результаты запроса не всегда имеют только нужные сведения. Это значит, что человеку часто приходится осуществлять собственный поиск среди предоставленных результатов. Разнообразные компоненты страниц выдачи ПС помогают ориентироваться в поисковых результатах.
Поисковая машина – это автоматическая система, которая хранит информацию об известных ей веб-страницах и выдает по запросу адреса тех из них, где встречаются введённые ключевые слова.
Ключевые слова – это набор слов и выражений, которые отражают требуемую информацию.
Самая основная задача каждой поисковой системы – доставить людям именно тот вид информации, который им нужен.
Именно поэтому специалисты-разработчики поисковиков делают принципы и алгоритмы их работы, которые бы давали пользователям находить интересующие их сведения. Это означает, что система, должна «думать» так же, как мыслит человек при поиске необходимой информации в интернете.
Для того чтобы получить правильные ответы на подобные вопросы, разработчики поиска постоянно улучшают принципы ранжирования и его алгоритмы, добавляют им новые возможности и функции и любыми средствами пытаются сделать быстрее работу системы.
Первой компьютерной программой для поиска в Интернете была программа Арчи (англ. archie — архив без буквы «в»). Она была создана в 1990 году Аланом Эмтэджем (Alan Emtage), Биллом Хиланом (Bill Heelan) и Дж. Питером Дойчем (J. Peter Deutsch), студентами, изучающими информатику в университете Макгилла в Монреале. Программа скачивала списки всех файлов со всех доступных анонимных FTP-серверов и строила базу данных, в которой можно было выполнять поиск по именам файлов. Однако, программа Арчи не индексировала содержимое этих файлов, так как объём данных был настолько мал, что всё можно было легко найти вручную.
Первым поисковым роботом, написанным на языке Perl, был «World Wide Web Wanderer» — бот Мэтью Грэя (Matthew Gray) из Массачусетского технологического института в июне 1993 года. Этот робот создавал поисковый индекс «Wandex». Цель робота Wanderer состояла в том, чтобы измерить размер всемирной паутины и найти все веб-страницы, содержащие слова из запроса.
Поисковая система «WebCrawler», запущенная в 1994 году - первая полнотекстовая система индексирующая ресурсы при помощи робота («craweler-based»).
Система позволяла пользователям искать по любым словам, расположенным на любой веб-странице — с тех пор это стало стандартом для большинства поисковых систем.
Поисковая система «WebCrawler» - первый поисковик, получивший широкое распространение.
В 1996 году реализован поиск с учётом русской морфологии на поисковой машине Altavista и запущены оригинальные российские поисковые машины Рамблер и Апорт. 23 сентября 1997 года была открыта поисковая машина Яндекс. 22 мая 2014 года компанией Ростелеком была открыта национальная поисковая машина Спутник. 22 апреля 2015 года был открыт новый сервис Спутник. Дети специально для детей с повышенной безопасностью.
Типы поисковых систем:
Системы, использующие поисковые роботы. Состоят из трёх частей: краулер («бот», «робот» или «паук»), индекс и программное обеспечение поисковой системы. Краулер нужен для обхода сети и создания списков веб-страниц. Индекс — большой архив копий веб-страниц. Цель программного обеспечения — оценивать результаты поиска. Благодаря тому, что поисковый робот в этом механизме постоянно исследует сеть, информация в большей степени актуальна. Большинство современных поисковых систем являются системами данного типа.
Системы, управляемые человеком (каталоги ресурсов). Эти поисковые системы получают списки веб-страниц. Каталог содержит адрес, заголовок и краткое описание сайта. Каталог ресурсов ищет результаты только из описаний страницы, представленных ему веб-мастерами. Достоинство каталогов в том, что все ресурсы проверяются вручную, следовательно, и качество контента будет лучше по сравнению с результатами, полученными системой первого типа автоматически. Но есть и недостаток — обновление данных каталогов выполняется вручную и может существенно отставать от реального положения дел.
Гибридные системы. Такие поисковые системы, как Yahoo, Google, MSN, сочетают в себе функции систем, использующие поисковых роботов, и систем, управляемых человеком.
Мета-системы. Метапоисковые системы объединяют и ранжируют результаты сразу нескольких поисковиков. Эти поисковые системы были полезны, когда у каждой поисковой системы был уникальный индекс, и поисковые системы были менее «умными». Поскольку сейчас поиск намного улучшился, потребность в них уменьшилась.
Многие поисковые системы, такие как Google и Bing, используют алгоритмы выборочного угадывания того, какую информацию пользователь хотел бы увидеть, основываясь на его прошлых действиях в системе. В результате, веб-сайты показывают только ту информацию, которая согласуется с прошлыми интересами пользователя. Этот эффект получил название «пузырь фильтров». Всё это ведёт к тому, что пользователи получают намного меньше противоречащей своей точке зрения информации и становятся интеллектуально изолированными в своём собственном «информационном пузыре».
Язык запросов
! – запрет перебора всех словоформ.
+ - обязательное присутствие слов в найденных документах.
- - исключение слова из результатов поиска.
& - обязательное вхождение слов в одно предложение.
~ - требование присутствия первого слова в предложении без присутствия второго.
| - поиск любого из данных слов.
«» - поиск устойчивых словосочетаний.
$title – поиск информации по названиям заголовков.
$anchor – поиск информации по названию ссылок.
Для того, чтобы посмотреть разбор задач перейдите по ссылке
Для поиска картинки в Google перейдите по ссылке images.google.ru или перейдите на главную страницу Google и нажмите на «Картинки». Затем кликните на иконку фотоаппарата.
У вас будет три варианта загрузить свое изображение для поиска:
Указать ссылку.
Загрузить файл с компьютера.
Перетащить изображение непосредственно в область поиска.
Откройте браузер (например, Chrome или Safari) на компьютере.
Перейдите на страницу Google Картинки.
Нажмите на значок поиска по картинке .
Нажмите Загрузить файл Выберите файл или Обзор.
Выберите изображение на своем компьютере.
Нажмите Открыть или Выбрать.
Внимание! Эта функция поддерживается только в браузерах Chrome и Firefox.
Откройте браузер Chrome или Firefox на компьютере.
Перейдите на страницу Google Картинки.
Найдите на компьютере изображение, по которому вы хотите выполнить поиск.
Нажмите на это изображение.
Удерживая кнопку мыши нажатой, перетащите изображение в окно поиска, а затем отпустите кнопку.
Откройте браузер (например, Chrome или Safari) на компьютере.
Перейдите на сайт, где размещено изображение, по которому вы хотите выполнить поиск.
Нажмите на нужное изображение правой кнопкой мыши.
Выберите Копировать URL картинки.
Перейдите на страницу Google Картинки.
Нажмите на значок поиска по картинке .
Откройте вкладку Указать ссылку.
Вставьте URL в текстовом поле.
Нажмите кнопку Поиск по картинке.
URL, по которым вы выполняете поиск, не добавляются в историю браузера, но могут храниться в Google и использоваться для совершенствования наших продуктов и сервисов.
Откройте браузер Chrome на компьютере.
Перейдите на сайт, где размещено изображение, по которому вы хотите выполнить поиск.
Нажмите на нужное изображение правой кнопкой мыши.
Выберите Найти картинку (Google). Откроется новая вкладка с результатами.
Изображения, которые вы загружаете при поиске, могут храниться в Google в течение 7 дней. Они не добавляются в вашу историю поиска, а использовать мы их будем только для того, чтобы усовершенствовать наши продукты и сервисы.