Иван, вы все рассказываете про новостные порталы, а я апеллирую к посту artemkv, в котором он жалуется на вертикаль поиска. Оценить — давайте, будет повод поговорить предметно, да может быть новый какой взгляд на оценку получите, что интересно. Андрей, попробуйте представить, что вы знаете не все про «системы такого плана», иначе это выглядит как зашоренность. «Ручка» не там, и не такая как вам кажется.
Охохох. Почему же даже тут больше всего о предмете рассуждают люди в нем не понимающие? Господа, не путайте топ на выдаче и топ5 на морде. Появление на выдаче почти никак не связано с важностью в новостях. А главный цензор на выдаче — непопулярность wizard’а новостей, которая меняется со временем и может убрать новости по запросу в течении дня. Жмите на новости, и это будет держать их выше!
Складывается ощущение, что процентов 90 перечисленных в этой дискуссии проблем может решить введение относительного рейтинга (когда водителя оценивают по сравнению с другими, а не абсолютно) и более аккуратное моделирование входного сигнала (часто 2 хуже чем 1).
Автор забывает что пишет. Действительно топик существенно разросся, напомню: ИА: «Если в Ромипе есть дорожка, то можно быть уверенным, что тема уже старая, а участвуют в ней в основном аутсайдеры.» ИА: «Типа, да я там не сбоку в углу семнадцатый фактор подкручиваю ключом на 19, а я там главный ваще. Архитектор, лингвист и релевантщик в одном лице. Начальник поиска, начальник релевантности или как там. Давайте, расчехляйтесь, самолюбие же вы не на помойке нашли!» ИА: «Я не вижу смысла доказывать, что у нас самая крутая морфология (для целей проверки правописания, то есть по точности и покрытию языка, соответствию правилам). Я это и так знаю, а ваше мнение мне лично неинтересно и нерелевантно — вы не разбираетесь в предмете. Морфология ОРФО разрабатывается с 1987 года (26 лет), входит в любой Микрософт Офис в нашей стране, куплена Яндексом и т.п. Никто в нашей стране или за рубежом не вложил столько сотен человеколет в словари и морфмодель, сколько вложено в ОРФО.»
Ну вот, теперь РОМИП не по нраву. Для справки Рамблер тоже его спонсировал, и кажись участвовал, если мне память не изменяет. В итоге: Яндекс, Rambler и Mail не считают зазорным спонсировать и участвовать в РОМИП, а вот для АиП — это слишком мелко. Ок. Более того, для справки опять же, ни одного спонсорского взноса от АиП я тоже как-то не наблюдаю, да и Ашманова не видел ни на одной сессии, хотя большинство что-то сделавших за последнее время ребят там были. Тот же Сегалович, Костин, Гулин, Расковалов, Добров, etc. Соответственно и предложений как-то нету от Ашманова, как по формату проведения, так и по дорожкам. Так что критика странная, опять все намеки на героя Дюма. Прийдите и выскажите открыто что хотите, и, возможно, все так и будет. Критиковать довольно просто, а вот что-то сделать — значительно тяжелее. На счет должностей, уважаемый Игорь Станиславович действительно считает, что Волож разбирается круче всех в технических вопросах поиска в России? Или может Путин? Или все же это посчитаем шуткой. У меня вот кот мышей ловит, мне по вашей логике в специалисты по мышам записаться?
Игорь, извините, но это вы «не вкуриваете» в поисковых технологиях последнего времени, судя по вашим высказываниям и попыткам свести дискуссию в русло «все в трико, а я Д’Артаньян». Вам несколько человек, которые занимаются проблемой 24/7 пишут: морфология важна, клики и потыреный ранкинг — решают, базу можно сократить не слишком слив в качестве. Поймите наконец, на той стороне провода тоже не школоло сидит и, в отличии от вас, владеет результатами экспериментов на реальных данных, которые вы в прямом эфире опровергаете сомнительными умозаключениями. Ситуация далека от «хомячки и пациенты vs. Ашманов», правда. Ваши достижения в области биздева по продаже технологии говорят скорее о том, что вы талантливый продажник, что несомненно круто, но к обсуждаемой проблематике не имеет отношения.
Исследование приводилось не как источник информации (там обсуждаемых морфологий просто нету), а как пример того, что хочется получить в аргументации. Я лучше не знаю, может быть Игорь знает, и обоснованно говорит про то, что у них самая крутая морфология. Если это утверждение снято (я про цифры в 98%, etc.), то предмет спора пропадает, и нам действительно не о чем спорить. Пикировку про историческую значимость продолжать не хочется: все мы пылинки на колесе истории :).
Нет, что вы, просто поднять обзоры, в которых не только kia, что к салонам относится в последнюю очередь. Но это _точно_ офф топ :). Что касается аномальной кликабельности, то очевидно имеется ввиду аномальная в условиях positional bias данного запроса. Кликабельность даже ниже чем положено на той позиции, на которой салоны находятся. Про размещение статистику не буду приводить не потому, что не хочу открывать чисел по данному запросу, а потому, что не хочу их сравнивать с «средним по больнице».
Seo, вы давно машину меняли? Народ обычно выбирает между несколькими марками, а объективность оценки салоном KIA деятельности соседей из Hyundai у меня вызывает сомнения. + вы прелагаете пользователю делать дополнительный клик. Но это так, мелочи. Общая проблема в том, что мы снова пускаемся в догадки.. Вместо вашего предположения было бы интересно увидеть сколько пользователей того или иного салона переходили от одной модели к другой в рамках одной сессии, и сравнить эту чиселку с пропорцией «выбирающих», например. Я за аргументированное обсуждение, ибо иначе — это флейм и офф топ. Ну и да, конечно, я не буду приводить статистику по спец размещению :).
Seo, на чем вы основываете свое суждение о нуждах пользователя по приведенному запросу? Я вот вижу в статистике примерно такую картину по переформулировкам (замкнутая по графу переформулировок статистика частотностей одной коммерческой ИПС :)): hyundai solaris 888 kia ceed 697 kia rio фото 673 kia rio 2012 635 kia 629 kia cerato 589 kia sportage 474 kia rio отзывы 469 hyundai 419 kia rio цена 357 Что явно говорит о том, что выбирают на порядок больше людей чем ищут «где купить». И это при совсем даже не аномальной кликабельности результатов приведенных салонов. Вобщем мы, конечно, можем поспорить в традиционном ключе «мирового блага», но блин, это не совсем честно, вы ж фактов не приводите, а оперируете догадками. Если с основными интересами мы разобрались, то в данном случае персонализация покажет выше результаты с источников, которым вы больше верите. Для меня это будет 5-е колесо, а для вас за рулем, например.
Как бы это сказать? Вот, есть стадион — туда набиваются фанаты футбола, смотрят игру, обсуждают потом ее и т.п. Это факт их коллективного переживания. Снесем стадионы, вместо них построим торговые центры, зато каждому фанату выдадим по телевизору, в каждом телевизоре 100 спортивных каналов — смотри любой матч, какой хочешь. Будет лучше? Станет по-другому: можно будет пойти на стадион (отключить персонализацию), с шансами нарваться на бурного соседа (который хочет по запросу [вода] гей-сауну «voda» — был сайт такой пару лет назад :)), или посмотреть из дому (свою википедию). Ну и как вы думаете, аудитория футбола при этом вырастет? Если вы беспокоитесь о том, что «информация уменьшится», то, наверное имелась в виду «ценность», или консистентность, так как информация, конечно, увеличится (больше разных ответов, большее разнообразие кликов за счет разного positional bias). С «ценностью» у меня проблемы: я не умею ее измерять, да бог бы с ним измерять, я точно не могу определить что это. Не готов спорить на эту тему. Да, с введением персонализации жизнь СЕО сообщества усложниться, но делается это не «со зла», а для большего «счастья» пользователей (ни о каких выгодах, кроме долгосрочных речи нет). Информацию об отчетности можно брать из Я.ВебМастера AFAIK. Думаю это не последнее изменение с которым надо смириться и научиться жить. С точки зрения внешней измеримости полученной системы: да, теперь получается во многом «цена на дрова», но IMHO на получаемые числа и так было трудно ориентироваться, так как методика не предполагала оценку достоверности.
Алексей, странно видеть подобное мнение от известного в области эксперта. Вот смотрите, с одной стороны вы приводите пример с сыном, которому передаете запрос, на который вчера видели какие-то результаты, с другой стороны подчеркиваете необходимость актуального сегодня ответа. Так же вы, конечно, знаете о том, что поиск учитывает регион пользователя, и сами же меряете это, считая положительным сигналом. Без цифр по количеству фейлов сценария «послать ссылку другу» (большинство подобных запросов навигационные, которые персонализация в большинстве случаев не трогает) рассуждаете о масштабе проблемы на уровне «развал Союза» и «субъективных категорий». На мой непросвещенный взгляд, для рядового пользователя существенно поменялись несколько случаев поиска: — поиск файла/торрента/просмотра online: в этом случае есть несколько источников на которых вы зарегистрированы, и персональный результат содержит именно эти источники; — большая ориентированность выдачи на ваши задачи в случае многозначных запросов. В этих классах задач с внедрением персонализации пользователи получили измеряемый и ощущаемый на практике эффект (что довольно редко для внедрений в современном поиске). Понятно, что как любое изменение, для кого-то персонализация работает в минус, но в среднем на всем потоке пользователей — это очень ощутимое улучшение «релевантности» результатов.
Дискуссии пользователя
Иван, вы все рассказываете про новостные порталы, а я апеллирую к посту artemkv, в котором он жалуется на вертикаль поиска. Оценить — давайте, будет повод поговорить предметно, да может быть новый какой взгляд на оценку получите, что интересно. Андрей, попробуйте представить, что вы знаете не все про «системы такого плана», иначе это выглядит как зашоренность. «Ручка» не там, и не такая как вам кажется.
Охохох. Почему же даже тут больше всего о предмете рассуждают люди в нем не понимающие? Господа, не путайте топ на выдаче и топ5 на морде. Появление на выдаче почти никак не связано с важностью в новостях. А главный цензор на выдаче — непопулярность wizard’а новостей, которая меняется со временем и может убрать новости по запросу в течении дня. Жмите на новости, и это будет держать их выше!
Складывается ощущение, что процентов 90 перечисленных в этой дискуссии проблем может решить введение относительного рейтинга (когда водителя оценивают по сравнению с другими, а не абсолютно) и более аккуратное моделирование входного сигнала (часто 2 хуже чем 1).
Автор забывает что пишет. Действительно топик существенно разросся, напомню: ИА: «Если в Ромипе есть дорожка, то можно быть уверенным, что тема уже старая, а участвуют в ней в основном аутсайдеры.» ИА: «Типа, да я там не сбоку в углу семнадцатый фактор подкручиваю ключом на 19, а я там главный ваще. Архитектор, лингвист и релевантщик в одном лице. Начальник поиска, начальник релевантности или как там. Давайте, расчехляйтесь, самолюбие же вы не на помойке нашли!» ИА: «Я не вижу смысла доказывать, что у нас самая крутая морфология (для целей проверки правописания, то есть по точности и покрытию языка, соответствию правилам). Я это и так знаю, а ваше мнение мне лично неинтересно и нерелевантно — вы не разбираетесь в предмете. Морфология ОРФО разрабатывается с 1987 года (26 лет), входит в любой Микрософт Офис в нашей стране, куплена Яндексом и т.п. Никто в нашей стране или за рубежом не вложил столько сотен человеколет в словари и морфмодель, сколько вложено в ОРФО.»
Ну вот, теперь РОМИП не по нраву. Для справки Рамблер тоже его спонсировал, и кажись участвовал, если мне память не изменяет. В итоге: Яндекс, Rambler и Mail не считают зазорным спонсировать и участвовать в РОМИП, а вот для АиП — это слишком мелко. Ок. Более того, для справки опять же, ни одного спонсорского взноса от АиП я тоже как-то не наблюдаю, да и Ашманова не видел ни на одной сессии, хотя большинство что-то сделавших за последнее время ребят там были. Тот же Сегалович, Костин, Гулин, Расковалов, Добров, etc. Соответственно и предложений как-то нету от Ашманова, как по формату проведения, так и по дорожкам. Так что критика странная, опять все намеки на героя Дюма. Прийдите и выскажите открыто что хотите, и, возможно, все так и будет. Критиковать довольно просто, а вот что-то сделать — значительно тяжелее. На счет должностей, уважаемый Игорь Станиславович действительно считает, что Волож разбирается круче всех в технических вопросах поиска в России? Или может Путин? Или все же это посчитаем шуткой. У меня вот кот мышей ловит, мне по вашей логике в специалисты по мышам записаться?
Игорь, извините, но это вы «не вкуриваете» в поисковых технологиях последнего времени, судя по вашим высказываниям и попыткам свести дискуссию в русло «все в трико, а я Д’Артаньян». Вам несколько человек, которые занимаются проблемой 24/7 пишут: морфология важна, клики и потыреный ранкинг — решают, базу можно сократить не слишком слив в качестве. Поймите наконец, на той стороне провода тоже не школоло сидит и, в отличии от вас, владеет результатами экспериментов на реальных данных, которые вы в прямом эфире опровергаете сомнительными умозаключениями. Ситуация далека от «хомячки и пациенты vs. Ашманов», правда. Ваши достижения в области биздева по продаже технологии говорят скорее о том, что вы талантливый продажник, что несомненно круто, но к обсуждаемой проблематике не имеет отношения.
Исследование приводилось не как источник информации (там обсуждаемых морфологий просто нету), а как пример того, что хочется получить в аргументации. Я лучше не знаю, может быть Игорь знает, и обоснованно говорит про то, что у них самая крутая морфология. Если это утверждение снято (я про цифры в 98%, etc.), то предмет спора пропадает, и нам действительно не о чем спорить. Пикировку про историческую значимость продолжать не хочется: все мы пылинки на колесе истории :).
Нет, что вы, просто поднять обзоры, в которых не только kia, что к салонам относится в последнюю очередь. Но это _точно_ офф топ :). Что касается аномальной кликабельности, то очевидно имеется ввиду аномальная в условиях positional bias данного запроса. Кликабельность даже ниже чем положено на той позиции, на которой салоны находятся. Про размещение статистику не буду приводить не потому, что не хочу открывать чисел по данному запросу, а потому, что не хочу их сравнивать с «средним по больнице».
Seo, вы давно машину меняли? Народ обычно выбирает между несколькими марками, а объективность оценки салоном KIA деятельности соседей из Hyundai у меня вызывает сомнения. + вы прелагаете пользователю делать дополнительный клик. Но это так, мелочи. Общая проблема в том, что мы снова пускаемся в догадки.. Вместо вашего предположения было бы интересно увидеть сколько пользователей того или иного салона переходили от одной модели к другой в рамках одной сессии, и сравнить эту чиселку с пропорцией «выбирающих», например. Я за аргументированное обсуждение, ибо иначе — это флейм и офф топ. Ну и да, конечно, я не буду приводить статистику по спец размещению :).
Seo, на чем вы основываете свое суждение о нуждах пользователя по приведенному запросу? Я вот вижу в статистике примерно такую картину по переформулировкам (замкнутая по графу переформулировок статистика частотностей одной коммерческой ИПС :)): hyundai solaris 888 kia ceed 697 kia rio фото 673 kia rio 2012 635 kia 629 kia cerato 589 kia sportage 474 kia rio отзывы 469 hyundai 419 kia rio цена 357 Что явно говорит о том, что выбирают на порядок больше людей чем ищут «где купить». И это при совсем даже не аномальной кликабельности результатов приведенных салонов. Вобщем мы, конечно, можем поспорить в традиционном ключе «мирового блага», но блин, это не совсем честно, вы ж фактов не приводите, а оперируете догадками. Если с основными интересами мы разобрались, то в данном случае персонализация покажет выше результаты с источников, которым вы больше верите. Для меня это будет 5-е колесо, а для вас за рулем, например.
Как бы это сказать? Вот, есть стадион — туда набиваются фанаты футбола, смотрят игру, обсуждают потом ее и т.п. Это факт их коллективного переживания. Снесем стадионы, вместо них построим торговые центры, зато каждому фанату выдадим по телевизору, в каждом телевизоре 100 спортивных каналов — смотри любой матч, какой хочешь. Будет лучше? Станет по-другому: можно будет пойти на стадион (отключить персонализацию), с шансами нарваться на бурного соседа (который хочет по запросу [вода] гей-сауну «voda» — был сайт такой пару лет назад :)), или посмотреть из дому (свою википедию). Ну и как вы думаете, аудитория футбола при этом вырастет? Если вы беспокоитесь о том, что «информация уменьшится», то, наверное имелась в виду «ценность», или консистентность, так как информация, конечно, увеличится (больше разных ответов, большее разнообразие кликов за счет разного positional bias). С «ценностью» у меня проблемы: я не умею ее измерять, да бог бы с ним измерять, я точно не могу определить что это. Не готов спорить на эту тему. Да, с введением персонализации жизнь СЕО сообщества усложниться, но делается это не «со зла», а для большего «счастья» пользователей (ни о каких выгодах, кроме долгосрочных речи нет). Информацию об отчетности можно брать из Я.ВебМастера AFAIK. Думаю это не последнее изменение с которым надо смириться и научиться жить. С точки зрения внешней измеримости полученной системы: да, теперь получается во многом «цена на дрова», но IMHO на получаемые числа и так было трудно ориентироваться, так как методика не предполагала оценку достоверности.
Алексей, странно видеть подобное мнение от известного в области эксперта. Вот смотрите, с одной стороны вы приводите пример с сыном, которому передаете запрос, на который вчера видели какие-то результаты, с другой стороны подчеркиваете необходимость актуального сегодня ответа. Так же вы, конечно, знаете о том, что поиск учитывает регион пользователя, и сами же меряете это, считая положительным сигналом. Без цифр по количеству фейлов сценария «послать ссылку другу» (большинство подобных запросов навигационные, которые персонализация в большинстве случаев не трогает) рассуждаете о масштабе проблемы на уровне «развал Союза» и «субъективных категорий». На мой непросвещенный взгляд, для рядового пользователя существенно поменялись несколько случаев поиска: — поиск файла/торрента/просмотра online: в этом случае есть несколько источников на которых вы зарегистрированы, и персональный результат содержит именно эти источники; — большая ориентированность выдачи на ваши задачи в случае многозначных запросов. В этих классах задач с внедрением персонализации пользователи получили измеряемый и ощущаемый на практике эффект (что довольно редко для внедрений в современном поиске). Понятно, что как любое изменение, для кого-то персонализация работает в минус, но в среднем на всем потоке пользователей — это очень ощутимое улучшение «релевантности» результатов.