Ускорение обучения в задаче последовательных рекомендаций с использованием тензорной модели внимания
В этом докладе мы обсудим проблему генерации персонализированных рекомендаций при обучении на основе последовательностей действий пользователя. Современные модели решают эту задачу на основе механизма внимания, используемого в трансформерных нейронных сетях. Мы рассмотрим альтернативный подход, основанный на особом тензорном представлении входных данных. Будет показано, как этот подход позволяет создать линейный аналог механизма внимания в рамках обобщения стандартной матричной факторизации для многомерного случая. Полученное решение обеспечивает сравнимое качество рекомендаций, но при этом дает ряд вычислительных преимуществ по сравнению с нейросетевым подходом