Задача системы рекомендаций (15/50)

бумажная ссылка

Какую проблему они решают?

Анализ того, как делать анкеты рекомендательной системы

Что они нашли?

Нелегко адекватно измерить пользовательский опыт, не позволяя пользователям потреблять товары.

Например, когда пользователь увидел рекомендованную песню, пользователь может увидеть исполнителя и название, и ему трудно оценить, хорош ли рекомендуемый элемент, прежде чем пользователь прослушает.

Как они проводят эксперименты?

Две группы по двум темам. Музыка и кино

По каждой теме они создали две группы (S1, S2).

Музыка

Группа1 S1

Заполните предварительную анкету

Сначала участники должны выбрать 3 из 110 жанров Spotify.

Затем они порекомендуют пользователям 5 элементов и будут отображать названия песен, исполнителей, названия альбомов и обложки.

Позже участников попросили оценить степень их удовлетворенности каждой рекомендацией и заполнить анкету.

Проведите анкетирование после потребления

После заполнения анкет участников просили прослушать каждую рекомендованную песню не менее 30 секунд с возможностью остановки, паузы и перемотки вперед.

В конце они должны были оценить рекомендации и заполнить анкету

Итак, в группе S1 у нас будет 2 анкеты для каждого пользователя.

Группа2 С2

Заполняйте анкету только после потребления

Сначала участники должны выбрать 3 из 110 жанров Spotify.

Затем они порекомендуют пользователям 5 товаров.

участников просили прослушать каждую рекомендованную песню не менее 30 секунд с возможностью остановки, паузы и перемотки вперед.

В конце они должны были оценить рекомендации и заполнить анкету

Итак, в группе S2 у нас будет 1 вопросник для каждого пользователя.

Результат

Внутрисубъектные эффекты

Если бы участники дали более высокие оценки рекомендациям после прослушивания рекомендованной песни? Да!

Участникам перед употреблением было трудно сформировать твердое мнение

S1-pre и S1-Post соответствуют нормальному распределению, но S1-Pre имеет более высокую дисперсию.

Межпредметные эффекты

Если S1-Pre и S2-Post показывают различия? НЕТ!

Вывод по музыке

Это показывает, что типичный дизайн исследований системы рекомендаций может способствовать получению неточной картины по сравнению с тем, когда пользователи могут испытывать элементы.

Однако рекомендации известных элементов не только снижают удовлетворенность пользователей, но и вредят цели рекомендаций.

Как насчет Кино?

Группа1 S1

Заполните предварительную анкету

Во-первых, участники должны предоставить демографические данные и выбрать 1 категорию из «Ужасы, мистика и триллер», «Комедия и романтика» или «Драма».

Затем они будут рекомендовать пользователям 3 фильма и включать названия фильмов, жанры, постеры, метаданные о режиссере и актерах, а также (субъективные) тексты описания автора статьи.

Позже участников попросили оценить степень их удовлетворенности каждой рекомендацией и заполнить анкету.

Проведите анкетирование после потребления

После заполнения анкет участников просили выбрать 1 фильм для просмотра, а затем выбрать еще 1 и последний 1 и записать время просмотра.

В конце они должны были оценить рекомендации и заполнить анкету

Итак, в группе S1 у нас будет 2 анкеты для каждого пользователя.

Группа2 С2

Заполняйте анкету только после потребления

Во-первых, участники должны предоставить демографические данные и выбрать 1 категорию из «Ужасы, мистика и триллер», «Комедия и романтика» или «Драма».

Затем они порекомендуют пользователям 3 фильма.

участников попросили выбрать 1 фильм для просмотра, а затем выбрать еще 1 и последний 1 и записать время просмотра.

В конце они должны были оценить рекомендации и заполнить анкету

Итак, в группе S2 у нас будет 1 вопросник для каждого пользователя.

Вывод по фильму

Фильмы выглядят не слишком большой разницей между Pre-S1, Post-S1, потому что перед просмотром фильма пользователи уже получают достаточно информации о текстах описания от автора статьи.

Вывод

В целом это указывает на то, что в значительной степени зависит от предметной области, а также от типа и объема информации, предоставляемой наряду с рекомендациями, может ли фактический опыт быть в достаточной степени заменен.

Только при представлении адекватной информации ответы участников могут быть достоверными.

Другие связанные блоги:

Помимо кликов: время ожидания для персонализации

RecSys’15: Рекомендации по контекстно-зависимым событиям в социальных сетях, основанных на событиях

RecSys16: Адаптивное, персонализированное разнообразие для визуального обнаружения

RecSys ’16: локальные модели товаров для рекомендаций Top-N

NAACL'19: использование BERT для анализа тональности на основе аспектов посредством построения вспомогательного предложения

RecSys ’17: Рекомендации на основе перевода

RecSys ’17: Моделирование эффектов ассимиляции-контраста в онлайн-системах оценки продуктов: устранение предвзятости и рекомендации

RecSys ’18: HOP-Rec: близость высокого порядка для неявной рекомендации

Лучшая статья в RecSys:

https://recsys.acm.org/best-papers/

Мой сайт:

https://light0617.github.io/#/