Перейти к содержимому

Принципы работы поисковых систем: 3 принципа

обучение робота

Как работают поисковые системы? Основные принципы работы поисковых систем, и обучение поискового робота с целью совершенствования алгоритма поиска.

Индексация контента

Индексация - один из двух основных процессов, которые происходят в поисковых системах.

Роботы поисковых систем - это программы, которые проходят все сайты в интернете, скачивают себе все страницы со всего интернета и передают поисковику.

Создается так называемый индекс - база знаний. В этой базе знаний напротив каждой статьи стоит фраза или слово, которой она соответствует - ключевое слово.

Пример индекса: По слову "дом" в Яндексе можно найти миллион страниц. Это один индекс. А слову "купить" в поисковике соответствует другой миллион страниц. Это другой индекс.

Когда пользователь вводит в поисковую систему "купить дом", Яндекс формирует поисковую выдачу. Она будет состоять из тех десятков тысяч страниц, на которых встречается и то, и другое слово.

То есть те сайты, что находятся в индексе по обоим словам, окажутся видимы через поисковик.

Ранжирование

Ранжирование - второй важнейший процесс, второе важнейшее определение. Ранжирование - это упорядочивание поисковых результатов. Именно оно определяет, кто будет на первом месте.

Формула ранжирования настолько сложна, что в ней участвует порядка 800 факторов. Каждый фактор - это переменная. В ранжировании каждый фактор взвешен - он имеет определенный коэффициент, определенное влияние на формулу.

Если углубиться в SEO, то видно что и коэффициенты тоже непостоянны. В зависимости от истории поисковых запросов конкретного пользователя и характера запроса (коммерческий\некоммерческий) они меняются.

Поэтому для разных пользователей интернета, из разных регионов и с разными историями пользования поисковой системой, результаты в поисковой выдаче будут разными. Какой-то сайт будет, например, на первом месте у одного пользователя, и показываться на третьем для другого.

Формула ранжирования в итоге выводит рейтинг документа. Он-то и определяет место в выдаче.

Обучение поисковых машин

Над улучшением формулы алгоритма поисковики постоянно работают. Существует два вида обучения робота:

  • самостоятельное;
  • при помощи асессора.

При самостоятельном обучении поисковый робот отталкивается от поведенческих факторов. Имеет значение, как долго в среднем читают статью, возвращаются ли в поиск за другими, более подробными, ответами и так далее.

Второй способ обучения поисковой системы - асессоры. Это люди, порядка 1000 человек. Все они работают в Яндексе и вручную оценивают результаты. Целью является выявить сайты, которые наиболее, соответствуют запросу.

Сайты, асессоры проверяют по чек листу. В результате выносится вердикт - оценка статье и в целом сайту.

Алгоритм ранжирования учится у асессоров. Он сопоставляет свою оценку статьи с их, затем меняет свои алгоритмы.

Поисковые системы сначала индексируют контент, затем начинают его ранжировать. Каждый день поисковые машины обучаются, чтобы усовершенствовать алгоритмы.

 

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *