Что такое поисковая система

Классификация поисковых систем

По охвату принято выделять поисковики двух видов:

  • Глобальные — осуществляют поиск по ресурсам, размещенным в международной компьютерной сети Интернет;
  • Локальные — создаются для нужд конкретных организаций, функционируют в рамках корпоративных сетей или определенных сайтов.

Главные задачи и принципы функционирования систем остаются общими.

Глобальные поисковики подразделяются на:

  • Универсальные — обеспечивают возможность поиска любой информации, независимо от типа контента (текстовый, графический, мультимедийный). К таковым относятся поисковики “большой двойки” — Яндекс и Гугл, в числе других систем, базирующихся на технологиях и алгоритмах собственной разработки можно выделить Yahoo и созданный корпорацией Microsoft Bing;
  • Специализированные — работают с контентом ограниченной тематики, либо отличаются узкой направленностью. К таковым относятся, например, сервис поиска товарных позиций в интернет-магазинах (Яндекс.Маркет) и проект «Академия Google», осуществляющий поиск по научным публикациям, монографиям и специальной литературе.

Принципиальное устройство поисковой системы

В любом глобальном поисковике присутствуют следующие функциональные модули:

  1. Поисковый робот — программа-краулер, осуществляющая непосредственный поиск веб-документов и других файлов;
  2. Индексатор — анализирует найденный контент с применением лексических, морфологических и семантических алгоритмов, определяя его тематику и релевантность содержания тому или иному запросу;
  3. Индекс — база данных поисковой системы, где хранятся ключевые фразы, выявленные индексатором, фрагменты окружающего их текста и гиперссылки на первоисточники;
  4. Кэш — хранит копии загруженных веб-документов, наличие которых помогает ускорить повторное извлечение информации из уже найденных поисковым ботом страниц.