Поиск информации в Интернет

Поисковая система определяется как компьютерная система, которая индексирует файлы, хранящиеся на веб-серверах, когда запрашивается информация по какой-либо теме. С помощью ключевых слов выполняется сканирование, и поисковая система отображает список адресов с соответствующими темами. Существуют различные способы ранжирования поисковых систем в зависимости от процесса опроса, который они выполняют. Наиболее частая классификация делит их на:

Индексы или веб-каталоги-это системы, созданные с целью разработки каталога по темам, определяя рейтинг, поэтому можно считать, что контент, предлагаемый на этих страницах, уже имеет определенный порядок и качество. Функция таких систем заключается в представлении некоторых данных с наиболее важных страниц, с точки зрения темы, а не того, что содержится. Результаты поиска по этому из этих индексов могут быть очень ограниченными, так как тематические каталоги, адресные базы данных очень малы, плюс может быть возможно, что содержимое страниц не полностью актуально.

Наиболее часто используются поисковые системы, основанные на приложениях, называемых spiders ("пауки") или роботами, которые ищут информацию на основе написанных слов, собирая содержимое страниц и в результате отображая страницы, содержащие слово или фразу Где-то в тексте.

Метапускаторы - это системы, которые находят информацию в наиболее часто используемых поисковых системах, выполняют анализ и выбирают свои собственные результаты. У них нет базы данных, поэтому они не хранят веб-страницы и выполняют автоматический поиск в базах данных других поисковых систем, из которых он берет определенный диапазон записей с наиболее релевантными результатами и, таким образом, может иметь необходимую информацию. Функция таких систем заключается в представлении некоторых данных с наиболее важных страниц, с точки зрения темы, а не того, что содержится. Результаты поиска по этому из этих индексов могут быть очень ограниченными, так как тематические каталоги, адресные базы данных очень малы, плюс может быть возможно, что содержимое страниц не полностью актуально.