1 ноября Яндекс дал официальный старт конкурсу из серии "Интернет-математика". В этот раз конкурс посвящен прогнозированию перехода пользователей в другие поисковые системы в рамках одной поисковой сессии.
В 2012 году конкурс проводится в седьмой раз. Если раньше конкурсные задания были сосредоточены больше на работе продуктов - участники решали задачу ранжирования, предсказывали пробки, искали похожие изображения и предсказывали релевантность документов анализируя поисковое поведение пользователей, то в этом году исследования проходят скорее в области маркетинга: Яндекс хочет разобраться, в каких случаях одного поисковика для пользователя недостаточно.
В качестве возможных причин переходов в другие поисковики Яндекс называет неудовлетворенность результатами поиска или ситуацию, когда "сама информационная потребность может предполагать необходимость получения и сравнения результатов нескольких поисковых систем". Специально для конкурса Яндекс подготовил обезличенные пользовательские поисковые логи двухлетней давности.
Добавить 13 комментариев
У нас есть метапоисковый тулбар, где юзерам на одной странице предлагаются непересекающиеся топы результатов Яндекса и Гугла. Пользователи есть как Яндекса, так и Гугла. SERP для всех выглядит привычно — http://neiron.ru/toolbar/index.html#dop Статистику переходов по ссылкам подсчитываем. Вот график за последние 620 дней — http://media.neiron.ru/pics/f8/9d/f89d32ed902e2bb1835e6f0c4f837e1e.jpeg «Из G в Я» — это процент кликов по допрезультатам по отношению к количеству кликов по родным результатам Гугла. И наоборот — для Яндекса. Похоже, какого-то явно выраженного тренда, что юзеры Яндекса стали чаще кликать по ссылкам Гугла или наоборот, нет. Если бы он был, можно было бы предположить, что качество поиска у кого-то стало сильно лучше или хуже. Можно посмотреть на запросы, в ответ на которые пользователи статистически чаще кликают по допссылкам, но не кликают по Тор3 основной выдачи. Это как раз и будут ситуации, когда Яндекс дает худшие результаты, чем предлагает Гугл. Но выдача поисковиков со временем меняется, поэтому вряд ли какие-то стабильные ошибки существуют годами и приводят к оттоку пользователей. Скорее всего, пока доли в поиске больше зависят от тех, кто создает имидж кампании, а не поиск.
Похоже, какого-то явно выраженного тренда, что юзеры Яндекса стали чаще кликать по ссылкам Гугла или наоборот, нет. Речь идет о каждой конкретной сессии. В данных присутствуют идентификаторы сессии и пользователя, если что, а так же продолжительность сессии.
Любопытно, вообще! Я бы оговорился, что им, вероятно, непринципиальны «сомневающиеся». И следующая из сомнений первая производная — «лояльность к сервису». Она хороша для газетёнок и по телевизору можно показать в патриотической передачке про Сколково. Но лояльность — не равна прямым продажам рекламы. Привлечённый в рекламу бакс никак не перемножается на лояльность и остаётся одним единственным баксом. Так как платят-то не серферы, а покупатели объявлений. Им до лояльности дела нет вообще никакого. Если аудитория Яндекса упадёт в 10 раз, но средний CRT и продажи у рекламодателей вырастут с 2 до 20 процентов — покупатели объявлений будут только «за». Что бесполезные сомневающиеся и все остальные «не покупающие» пропали с Яндекса. Кроме того — лояльность не равна качеству поиска. Удовольствию от поиска. Внезапным приступам ненависти, раздражению от поиска. Я ниже чиркану несколько гипотез мыслшек, где в «математическом конкурсе» спрятаны деньги. О чём он? /// Весьма вероятно ищущие на Многих поисковиках по поведению напоминают «непонятных» для Одного поисковика пользователей. Человек смотрит кучу страниц, крутится с синонимичными запросами — но что конкретно он ищет — формализовать не получается. Если спросить голосом — что искал, нашёл ли? Вопреки двум десяткам кликов, скажет — «нет, не нашёл!» По рекламе сегодняшнего формата эти люди тоже не кликают. Лишь повышают для рекламодателей цену контекста. Или кликают и не покупают. На пустом месте, абсолютно, проблемы для Директа. Дело в том, что сегодняшние поисковики показывают снипеты с ключевыми словами, фокусируются на введённый запрос. Но, подобного пользователя — ни одно включение не радует. Ни на одном поисковике. Этому человеку, наверняка, сработает не демонстрация ключевых слов в SERP, везде одинаковых, а Демонстрация Различий между найденными материалами. Возможно инфографическая. Графикой, цветом. В духе — квадратик на 90% серый, на 75% серый. А за серостью — уникальный материал. SERP может стать Перевёрнутым. Показать ТОЛЬКО различия между страницами, только уникальные особенности их контента. Пусть найденные по ключевому слову. Но в выдаче его не использующие. Яндекс компания алгоритмическая. Подобный перевернутый SERP должен формироваться автоматически для соответствующего пользователя и в соответствующей сессии. Для того и конкурс. Но технически его можно уже сегодня, без искомого конкурсом алгоритма, сделать частью расширенного поиска, или просто одной единственной переключалкой. «Показывать в выдаче не ключевики, а уникальность». К подобной уникальности — можно и объявления показывать совсем на другие ключевики. На «уникальные». А не на выкупленные покупателем рекламы исходные. Далее. Ещё один тип поведения ищущего везде подряд. Человек ищет не просто уникальное. А Уникальный Товар. Такому человеку вместо вышеописанного SERP про уникальность контента — хорошо показать табличку a la Яндкс.Маркет. Прям сравнительную таблицу всех различающихся характеристик «пылесосов с аквафильтром дешевле 15 тысяч рублей» с репликами «Выводы» из обзоров. Реклама, в этом случае поискового поведения, может быть уже не просто контекстом, а почти готовым лидом, почти готовой сделкой, покупкой искомого товара. Далее. Ещё вариант. Тот, кто ищет сразу везде — предположительно не ищет «чего-то одного самого лучшего». А именно смотрит на всю совокупность сообщений. Как журналист, как аналитик, рекламщик, короче — как маргинал. Вспомним, что реклама — это сообщение жанра «вот оно единственное самое лучшее». Не совокупность, а единственное. Обратные вещи. Реклама маргинальному пользователю не нужна. Её показ лишь снизит CRT рекламодателям, а то и объявления остановит. Значит Этому типу пользователя вообще лучше показать вакансии аналитиков, предложения об удалённой работе журналистом. А не какую-то там контекстную рекламу. /// Спасибо за внимание :)
=каждой конкретной сессии= И целью анализа «обезличенных поисковых логов» является автоматическое определение пользователей, у которых в сессиях есть клик по «Искать в Google»?
У кого-нибудь есть сомнения, что через 10 лет поиск Google или Yandex будет востребованы в том виде в котором они сейчас существуют?
Поиск без извлечения прибыли — мёртв. Доказано Рамблерами
>Поиск без извлечения прибыли — мёртв. Доказано Рамблерами Поиск с извлечением прибыли — мёртв. Доказано Яхами
Это что-ли типо задаки которую Авдеев решил на предыдущем СИГИР По поведению пользователя в сессии предсказать «успех» — в данном случае «успех» = переход пользователя на другой поисковик. Какие параметры кроме самой сессии есть для обучения? Решали мы такие задачки CRF и пр, может марковское поле
Может имеется в виду Миша Агеев? Если да, то похоже, но у них представлен конкретный способ проверенный на небольшом объеме самостоятельно собранных данных, если я все верно помню. В данном случае впервые представлена платформа для подобных экспериментов с уникальными для широкого круга исследователей данными на которых можно померяццо. Что касается «денег» — мне показалось надуманным. С появлением саджестов, подсказок, персонализации и массы других технологий, позапросный поиск становится все менее интересным. Но измерять мы (IR сообщество) умеем только его. Конкурс во многом про измерения: хочется распространить знания о известных пользователях на всех, предсказывая необходимость «помощи зала». Выше изложенное строго IMHO.
> Это что-ли типо задаки которую Авдеев решил на предыдущем СИГИР Агеев, не Авдеев. По уровню дремучести чувствуется, что подтянулись сеошники) Кстати, характерный момент: ничто так не возвращает к реальности, как конкурсы вроде kaggle. Судя по нику euhenio, как минимум один человек из seo индустрии присутствует на интернет-математике с закономерным результатом — заметно ниже baseline и только немного лучше рандома :)
Я и без исследования расскажу, что заставляет переходить :) Когда ищешь в яндексе какой-либо товар (техника для дома, электроника, сантехника и т.д. — почти всё что угодно), то яндекс выдаёт сайты магазинов (интернет-магазинов, как правило), где это купить. А гугл выдаёт вперемешку к интернет-магазинам ещё и сайты с отзывами об этом товаре, обсуждения товара на форумах. Вот это куда более ценно! На яндексе и на N-й странице поиска этого не найти!
Прошу прощения за Авдеева. Агеев, конечно же
Авдеев это «Роман с кокаином»