Яндекс тестирует новый принцип оценки релевантности документов

В течение последних месяцев специалисты Яндекса работали над созданием нового принципа оценки релевантности документов.

Аналитик Яндекса по безопасности поиска Екатерина Гладких рассказала, что в течение последних месяцев команда специалистов компании работала над созданием нового подхода к оценке релевантности содержимого документа. На данном этапе разработанный метод проходит стадию тестирования.

Яндекс тестирует новый принцип оценки релевантности документов

Было отмечено, что при традиционном подходе к оценке релевантности используется уже имеющаяся информация о факторах, которые определяются после индексации документа. А также обо всех последующих его изменениях, при которых учитывается поведение пользователей на сайте.

Но иногда первоначальной информации недостаточно для определения «ценности» содержимого документа относительно его соответствия поисковому запросу. Из-за этого некоторые «полезные» или новые (с другой структурой) документы могут неправильно (низко) ранжироваться. Поэтому требуется более долгий промежуток времени для накопления нужного объема данных, по которым можно определить качество содержимого по поведенческим показателям.

Специалисты компании установили, что периодически «полезно» располагать «недооцененные» документы (для оценки которых не хватает данных о пользовательских показателях) в зоне видимости поисковой выдачи. Может оказаться так, что релевантная ценность этого контента может быть довольно высокой.

Благодаря такому подходу (за счет краткосрочного снижения качества поисковой выдачи) удается получить более точную информацию о «спорных» документах. В результате общее качество поиска повышается.

Также было отмечено, что на практике невозможно (для получения пользовательской оценки) разместить на самых высоких позициях сразу весь объем тех документов, из которых состоит вся поисковая выдача. Поэтому применяется принцип «эксплуатирующего подхода», который основан на предварительной оценке документа как релевантного. Его целью является сбор максимального объема информации о качестве документов на основе данных о поведении пользователей.

Напомним, что на протяжении лета текущего года многие вебмастера сообщали о резких скачках и «уходах» своих ресурсов из зоны видимости в поисковой выдаче. Скорее всего, основной причиной этой «аномалии» были разработка и тестирование нового подхода к оценке релевантности документа, которые проводились специалистами Яндекса.