Перейти к содержимому

Принципы работы поисковых систем: 3 принципа

обучение робота

Как работают поисковые системы? Основные принципы работы поисковых систем, и обучение поискового робота с целью совершенствования алгоритма поиска.

Индексация контента

Индексация - один из двух основных процессов, которые происходят в поисковых системах.

Роботы поисковых систем - это программы, которые проходят все сайты в интернете, скачивают себе все страницы со всего интернета и передают поисковику.

Создается так называемый индекс - база знаний. В этой базе знаний напротив каждой статьи стоит фраза или слово, которой она соответствует - ключевое слово.

Пример индекса: По слову "дом" в Яндексе можно найти миллион страниц. Это один индекс. А слову "купить" в поисковике соответствует другой миллион страниц. Это другой индекс.

Когда пользователь вводит в поисковую систему "купить дом", Яндекс формирует поисковую выдачу. Она будет состоять из тех десятков тысяч страниц, на которых встречается и то, и другое слово.

То есть те сайты, что находятся в индексе по обоим словам, окажутся видимы через поисковик.

Ранжирование

Ранжирование - второй важнейший процесс, второе важнейшее определение. Ранжирование - это упорядочивание поисковых результатов. Именно оно определяет, кто будет на первом месте.

Формула ранжирования настолько сложна, что в ней участвует порядка 800 факторов. Каждый фактор - это переменная. В ранжировании каждый фактор взвешен - он имеет определенный коэффициент, определенное влияние на формулу.

Если углубиться в SEO, то видно что и коэффициенты тоже непостоянны. В зависимости от истории поисковых запросов конкретного пользователя и характера запроса (коммерческий\некоммерческий) они меняются.

Поэтому для разных пользователей интернета, из разных регионов и с разными историями пользования поисковой системой, результаты в поисковой выдаче будут разными. Какой-то сайт будет, например, на первом месте у одного пользователя, и показываться на третьем для другого.

Формула ранжирования в итоге выводит рейтинг документа. Он-то и определяет место в выдаче.

Обучение поисковых машин

Над улучшением формулы алгоритма поисковики постоянно работают. Существует два вида обучения робота:

  • самостоятельное;
  • при помощи асессора.

При самостоятельном обучении поисковый робот отталкивается от поведенческих факторов. Имеет значение, как долго в среднем читают статью, возвращаются ли в поиск за другими, более подробными, ответами и так далее.

Второй способ обучения поисковой системы - асессоры. Это люди, порядка 1000 человек. Все они работают в Яндексе и вручную оценивают результаты. Целью является выявить сайты, которые наиболее, соответствуют запросу.

Сайты, асессоры проверяют по чек листу. В результате выносится вердикт - оценка статье и в целом сайту.

Алгоритм ранжирования учится у асессоров. Он сопоставляет свою оценку статьи с их, затем меняет свои алгоритмы.

Поисковые системы сначала индексируют контент, затем начинают его ранжировать. Каждый день поисковые машины обучаются, чтобы усовершенствовать алгоритмы.

 

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *