Открытка компании: когда Яндекс.Музыка забудет про рост в 70% и починит систему рекомендаций?

Развитие событий: Яндекс.Музыка ещё чуть-чуть интегрировалась с Last.fm. Плюсы-минусы (8 июня 2016)

На YaC/m 2015 Виктор Ламбурт рассказал, как новые рекомендательные системы разогнали Яндекс.Музыку. Через 9 месяцев после перезапуска длительность прослушивания музыки на сайте сайте выросла на 70% (а значит и потенциальные доходы могут подтянуться поближе к точке безубыточности; сайт, в том числе, считает размещения медийной рекламы, что называется, "повремённо": в терминах времени: "сутки" и т. д.)

Нет повода не порадоваться за Яндекс. Но в частной жизни от использования сайта приходится отказываться. Начиная с весны 2015 года (возможно это случилось в конце февраля, в марте, точно уже не помню) рекомендательные системы Яндекс.Музыки больше ничего не рекомендуют (в частном описываемом случае) — лишь держат человека внутри "пузыря".

Рекомендации сегодня, 20 июня:

  • Похоже, вам нравится исполнитель Zorge, попробуйте послушать и эти треки группы Zorge (причём блок про "любителям Zorge рекомендуем Zorge" размещён дважды в вёрстке главной страницы, под чуть-чуть разными заголовками).
  • Судя по вашим предпочтениям, David Lynch вам понравится — David Lynch (слушали вообще-то)

бесконечные рекомендации без смысла

Рекомендации вчера, 19 июня:

  • Похоже, вам нравится исполнитель Alain Goraguer (да, слушали, в том числе на Яндекс.Музыке), попробуйте послушать и эти треки — подборка треков Alain Goraguer

18 июня, и сколько угодно дней назад рекомендация будет повторяться:

  • Похоже, вам нравится исполнитель Zorge, попробуйте послушать и эти треки — треки Zorge (рекомендация Zorge есть каждый день)

Как будет повторяться и сам алгоритм "рекомендаций". Похоже вам нравится что-то — вот его вы и слушайте.

Яндекс.Музыка не обращает никакого внимания на лог прослушиваний в сервисе Last.fm (интегрирован в интерфейсы Яндекс.Музыки) и готова бесконечно предлагать то, что уже много раз (это видно по логу) было прослушано.

Обязательное дополнение. На главной странице Яндекс.Музыке собрано несколько различных механизмов рекомендаций. Но только 1 из них обращается к слушателю лично, а не делает умозаключений в третьем лице. Поэтому неработающий блок бросается в глаза, чем особенно раздражает.

Менее раздражает, но тоже не несёт в себе ничего хорошего, рекомендация переизданий и сборников. Проблема затрагивает только престарелых слушателей и особенно выражена в почтовой рассылке. В некоторые дни она полностью состоит из "допечаток" альбомов давно покойных звёзд и "ремастеринговых" дисков (Яндекс.Музыка передаётся на 192 kbps, поэтому обновлённое звучание может и не уместиться в такую ширину звукового потока).

На иллюстрации ниже нет свежих записей — это сборники и переиздания. Яндекс.Музыка утверждает, что свежие записи есть:

здесь нет ни одного нового альбома

Лучшие комментарии

Добавить 9 комментариев

  • Ответить

    Иван,
    пожалуйста, пришлите ваш логин на lamburt[эт]yandex-team.ru Посмотрим, почему этот «пузырь» случился и как его разорвать.

  • Ответить

    Классика «рекомендательных сервисов». Если в том же гуглоплее поставить оценку какому-нибудь rss-ридеру, к примеру, то он тут же начнет рекомендовать вам другие ридеры. И так далее. :)

  • Ответить

    А посмотрите пожалуйста мой профиль тоже — minaton.
    В рекомендациях почему-то только «В плейлистах у поклонников Caspa» и там одни и те же исполнители.

    И вот например также:
    Похоже, вам нравится исполнитель Red Titanic, попробуйте послушать и эти треки
    White Rabbit
    Dubstep, Red Titanic

    Barbra Streisand
    Dubstep, Red Titanic

    Tonight (Club Anthem)
    Red Titanic

    Wicked Game
    Red Titanic

    Sexy
    Red Titanic

  • Ответить

    Иван,
    посмотрели ваши рекомендации. Сразу хочу сказать, что из тех артистов, которых мы порекомендовали вам 20 февраля 42% новые по отношению к вашей истории прослушиваний. Т.е. мы все-таки стараемся разрывать «пузырь».

    Теперь отвечу по пунктам:
    1. исполнитель Zorge размещен размещён дважды в вёрстке главной страницы — наша недоработка. У нас есть защита от повторов артистов, но в данном случае она дала сбой — исправим.

    2. Рекомендация David Lynch — мы рекомендуем треки David Lynch, которые отсутствуют в вашей истории прослушиваний. По идее, этот способ позволяет открывать неизвестные ранее треки любимого артиста.

    3. Alain Goraguer — признаться не понял, в чем тут вопрос. Аналогично с предыдущим пунктом в данной рекомендации должны быть треки Alain Goraguer, отсутствующие в вашей истории прослушиваний.

    4. Рассылка о новых поступлениях на Яндекс.Музыке. Действительно, это не новинки, а именно новые поступления на сервисе. Возможно, мы недостаточно явно рассказываем про эту разницу.

    В нашей системе рекомендаций много магии, но на чудеса она пока не способна. Поэтому, если помимо Яндекс.Музыки вы пользуетесь и другими музыкальными сервисами, то мы про это пока не знаем и не можем давать рекомендации, с учетом внешних прослушиваний.

    И спасибо за подробный фидбек!

  • Ответить

    Спасибо! Посмотрим, что получится.

    2-3) Если бы у Яндекс.Музыки было двухстороннее подключение к Last.fm — можно было бы забрать мой лог и даже отмеченные сердечком треки (там тоже есть) и значительно полнее знать, что прослушано, что нет. Что чаще, что реже слушается и т. д.

    4) «а именно новые поступления на сервисе. Возможно, мы недостаточно явно рассказываем про эту разницу»

    — тут 3 момента.

    А) Я понимаю, что приходят или появившиеся на сервере записи, или те, что временно пропадали и появились снова. Дополнительные «хорошие» объяснения не нужны. Это всегда выглядело (для меня), как самоочевидная вещь. Дело в другом.

    Б) Записи престарелых музыкантов делятся на 3 типа.
    1-Номерные альбомы. Первый класс качества.
    2-Компиляции, «бест оф», «лучшие треки музыканта с 80 по 89 год» и т.д. и т.п.
    3-сборники схожей музыки, случайной музыки и непонятно чего — где треки одного престарелого соседствуют с другими престарелыми музыкантами и кем угодно ещё.

    Если взять список записей старого музыканта выяснится, что номерных альбомов — несколько десятков
    http://www.allmusic.com/artist/john-coltrane-mn0000175553/discography

    Разнообразных сборников (см. переключатель Albums / Compilations) «бест оф», «все ранние года», и т.д. и т.п. — их уже несколько сотен (при том, что качество и интерес к ним на порядок ниже, см. например https://www.billboard.com/charts/billboard-200 — сборники бест-офф — редкая вещь и появляются лишь во второй сотне пластинок.

    Наконец третий тип, самый бессмысленный, даёт о себе знать вот тут https://music.yandex.ru/artist/33/albums — сколько их всего? Тысячи, больше? Бессмысленных безликих пластинок а ля The Greatest Male Artists in the World, Vol. 13 где музыкант, так или иначе, хоть одним треком попал.

    Ни второй, ни третий тип записей, за редчайшими исключениями, никакого смысла не несут. Однако они постоянно выходят и появляются на сервере и типа «нужно порекомендовать».

    Тут есть такая ловушка, что вместо работы рекомендательного алгоритма Яндекс.Музыки — работает безумный маркетолог в Винипеге, который 77 раз в год рисует новую обложку на чуть-чуть перетасованный сборник из старых записей и сдаёт «новый диск» в продажу. А он — не новый. Его ценность низкая. Музыканта учитывать при подборе — нужно. Рекомендовать сборники — нет. Мне так кажется.

  • Ответить

    Нет — всё-таки ничего не вышло :)
    Сегодня, 11 июля. Сверху вниз (термином «бла-бла-бла» обозначена любая рекомендация не Zorge):

    бла-бла-бла
    Похоже, вам нравится исполнитель Zorge, попробуйте послушать и эти треки
    бла-бла-бла
    бла-бла-бла
    В плейлистах у поклонников Zorge
    бла-бла-бла
    бла-бла-бла
    редакционная бла-бла-бла на цветной подложке с текстом
    редакционная бла-бла-бла на цветной подложке с текстом
    бла-бла-бла
    бла-бла-бла
    бла-бла-бла
    бла-бла-бла
    бла-бла-бла
    Похоже, вам нравится исполнитель Zorge, попробуйте послушать и эти треки
    бла-бла-бла
    бла-бла-бла
    бла-бла-бла
    бла-бла-бла
    В плейлистах у поклонников Zorge
    бла-бла-бла
    бла-бла-бла
    Если вам по душе Zorge, обратите внимание на эту музыку
    бла-бла-бла
    бла-бла-бла
    бла-бла-бла
    бла-бла-бла
    бла-бла-бла радио в любимых жанрах.

    Итого — 5 включений Zorge или связанных с Zorge, которые я не слушал и в предыдущие полгода, пока их показывали по 5 раз каждый день. Короче замкнутый круг. Робот определил, что Zorge — это наиболее подходящая рекомендация. Лог Last.fm Яндекс.Музыку не интересует, поэтому изменить «самую лучшую рекомендацию» нельзя. Хотя можно было бы, хотя бы, на основании того, что я никогда не кликаю на Zorge.

    P. S. Мотивация, почему Яндекс.Музыка предпочитает игнорировать логи Last.fm вполне извинительная (его мало кто берёт, на самом деле, не в Яндексе дело, это общее правило — а из тех, кто берёт и в итоге классно играет, могу вспомнить только Mentor.fm). Данных в логах у всех музыкальных идиотиков слишком много, этих данных в десятки тысяч раз больше, чем в собственных логах Яндекс.Музыки, созданных на наблюдении за прослушиваниями «обычных людей». Раз данных слишком много — работать с ними вычислительно накладно.

    Однако в логах last.fm (они у всех аж с 2004! Или какого-то там древнего года, когда существовала ещё прошлая Яндекс.Музыка закрытая потом) есть и микроскопические данные, весьма напоминающие данные «обычных людей». Это последовательности, развитие вкусов. После чего именно люди начинают слушать, и что именно? Чисто пары значений. После ансамбля X люди слушают Y. Не просто пересечение двух множеств, но вектор, а то и тензор.