Обновление алгоритма рекомендаций от Яндекс.Дзен

Команда разработчиков платформы Яндекс.Дзен сообщила об обновлении используемого алгоритма рекомендаций.

Новейшая версия данного алгоритма получила название Альфа Центавра (так же как ближайшая к нашей планете тройная звездная система). Такое название было выбрано, потому что нынешние обновление включает в себя три основных нововведения.

Основную работу рекомендательного алгоритма можно условно разделить на два основных этапа:

  1. Первичный отбор кандидатов. На этом этапе из всех публикаций, размещаемых в рамках платформы Яндекс.Дзен, для дальнейшего глубокого анализа и предоставления пользователям отбирается около 10000 вариантов.
  2. Ранжирование. В рамках данного этапа из предварительно отобранных и детально проанализированных вариантов формируется окончательный перечень рекомендаций, которые и попадают в ленты пользователей платформы Яндекс.Дзен.

В рамках новейшего рекомендательного алгоритма Альфа Центавра было реализовано сразу три новых технологических решения, каждое из которых работает на различных этапах его работы.

На этапе предварительного отбора теперь будет применяться новая технология, основанная на методе поиска «ближайших соседей» (k-NN). Данная технология позволяет уже на этапе предварительного отбора эффективно работать с содержанием каждой конкретной публикации.

Уже сейчас она умеет очень быстро сравнивать интересы пользователя и содержание материала, находя ближайшие по содержанию публикации среди всего множества публикаций, размещаемых в рамках платформы Яндекс.Дзен.

Кроме того ее использование позволяет анализировать намного больше публикаций за раз, что значительно расширяет так называемую «воронку отбора».

Благодаря этим особенностям авторам небольших с точки зрения объема аудитории, но при этом действительно качественных с точки зрения наполнения каналов станет проще получить аудиторию, даже не будучи массово востребованными.

В свою очередь на этапе ранжирования материалов, прошедших предварительный отбор алгоритм Альфа Центавра в качестве одного из параметров будет учитывать реакцию пользователей. Обновленный алгоритм рекомендаций сделает этот этап анализа более глубоким, детальным и эффективным.

Фактически в рамках платформы Яндекс.Дзен теперь будет использоваться алгоритм матричных разложений (matrix factorization), который часто используется для рекомендации «долго живущего» контента, примером которого в частности можно считать музыку или фильмы.

Данная технология среди прочего учитывает оценки контента, выставленные разными людьми, что позволяет гораздо более точно рекомендовать его другим пользователям с похожим профилем интересов.

Что же касается третьего важного улучшения, то оно направлено на то, чтобы новостная повестка дня оттягивала меньше внимания от интересных, но не таких актуальных материалов.

Руководствуясь этой целью, технология continuous exploration увеличивает время, на протяжении алгоритм собирает информацию о пользовательской реакции на опубликованный контент.

Именно поэтому теперь любой опубликованный материал будет иметь шанс повторно попасть в пользовательские ленты. А авторы «вечнозеленого контента», размещенного в рамках платформы Яндекс.Дзен, будут иметь больше возможностей для привлечения аудитории независимо от формирующейся новостной повестки.

Кроме того представители платформы Яндекс.Дзен сообщили о том, что теперь у каждой версии алгоритма будет свое имя – в честь одной из звезд. При этом было отмечено, что подобные обновления будут внедряться в работу сервиса «регулярно и планомерно».

В этой связи стоит напомнить, что предыдущие подобные обновления были внедрены в работу платформы Яндекс.Дзен в ноябре прошлого года.

А в конце сентября прошлого года платформа Яндекс.Дзен запустила партнерскую программу приоритетного ранжирования качественных медиа и авторов под названием «Нирвана».