Яндекс ранжирует веб-страницы с помощью новой нейросетевой архитектуры!

Представители компании Яндекс рассказали о внедрении в работу так называемого трансформера — новой нейросетевой архитектуры, предназначенной для ранжирования веб-страниц.

Благодаря ее использованию поисковая система Яндекс стала гораздо достовернее оценивать смысловую связь между пользовательскими запросами и содержанием проиндексированных веб-документов. Причем настолько достовернее, что, по мнению специалистов Яндекса, это наиболее значимое событие для ведущей российской поисковой системы за последние 10 лет (с момента запуска Матрикснета).

По словам представителей поисковой системы Яндекс алгоритмы Палех и Королев совместно повлияли на выдачу гораздо меньше, чем новая модель ранжирования, основанная на применении так называемых трансформеров.

Более того, несмотря на то, что при поисковом ранжировании учитываются без преувеличения тысячи самых разнообразных — если все их выключить и использовать только новую нейросетевую архитектуру — качество ранжирования по основной офлайн-метрике упадет всего лишь на 4-5%.

Новейшая технология анализа текстов получила название YATI. В ее работе задействованы нейронные сети нового поколения — они же «трансформеры».

Необходимо четко понимать, что YATI — это общее название популярной нейросетевой архитектуры, которая является фундаментом всех наиболее современных подходов к анализу текста. Так как компания Яндекс разработала собственную реализацию «трансформеров» YATI, в данном случае расшифровывается как Yet Another Transformer with Improvements («Ещё один трансформер с улучшениями»).

Фактически можно говорить о том, что именно YATI сопоставляет смысл пользовательских запросов и проиндексированных веб-документов.

Данная технология действительно эффективно работает не только с короткими текстами, такими как пользовательские запросы или заголовки статей, но и с длинными статьями.

Технология YATI помимо всего прочего включает в себя «механизм внимания», позволяющий выделять наиболее значимые фрагменты в каждом конкретном тексте.

Кроме того YATI обращает особое внимание порядок слов, а также учитывает контекст — то, как те или иные слова влияют друг на друга. Это связано с тем, что во многих случаях именно порядок слов определяет смысл всей фразы (например, при поиске билетов из одной точки в другую).

Более подробная информация о так называемых «трансформерах» в поиске, а также о том, как Яндекс применил тяжёлые нейросети для поиска по смыслу, доступна здесь.

Меню