Найти
RSS-лента записей

10 Ноя 2010

Roman

0

Уроки сеопродвижения. Урок 2

Следующий шаг мы посвятим принципу работы, уже известных нам, поисковых систем. Каждая поисковая система содержит в себе некоторые основные компоненты. Сейчас, мы рассмотрим самые основные.

В природе они носят следующие названия: Spider, Crawler, Indexer, Database, Search engine results engine и Web server. Теперь о каждом компоненте отдельно.
Spider (паук) – программа скачивающая веб-страницы. Принцип ее работы идентичен работе Вашего браузера, и вся разница лишь в том, что он не смотрит на картинки и красоту страницы, а работает с html-текстом. При желании, вы тоже можете посмотреть на страницу глазами паука, для этого необходимо в своем браузере выбрать функцию просмотра «исходного текста» интернет-страницы.

Crawler (краулер, «путешествующий» паук) – программа, выделяющая и переходящая по ссылкам, найденным на странице. Таким образом разобравшись со всеми ссылками, которые она находит на странице, определяется дальнейший маршрут следования паука. Также проследовав по найденным ссылкам, Краулер выполняет поиск новых страниц.

Indexer (индексатор) – работает над вопросом анализа скачанных веб-страниц. Анализ этот настолько подробный, что скажу просто: Ваша страница «промывается» до последнего символа (структура, тексты, заголовки, теги и т. д.).

Database (база данных) – база страниц, которые были скачаны и обработаны. В практике существует еще и альтернативное название – Индекс поисковой системы.

Search engine results engine (система выдачи результатов) – выдает результат поиска по запросу из существующей базы данных. еще этот процесс называют ранжированием. Это значит, что именно этот компонент принимает решение, какие страницы удовлетворяют запрос и в каком порядке их представить пользователю. Ранжирование происходит согласно соответствующих алгоритмов поисковой системы. Думаю, вы и сами поняли, что именно эта информация является самой ценной для любого оптимизатора, который пытается вывести нужную странице в первые ряди. Этот вопрос, более подробно, мы рассмотрим дальше.

Web server (веб-сервер) –осуществляет взаимодействие между компонентами системы и нашим пользователем.

Если взять конкретную поисковую систему и разложить ее на элементы, то вероятно некоторые компоненты могут быть объедены в одно целое, но функциональные их задачи не меняются.

Обсуждение закрыто.