Американцы узнали о новинках, которые подготовил для них поисковик Google. Параллельного анонса, но для русских пользователей в официальном блоге Google на момент публикации нет. «Коммерсант» обратил внимание на следующие изменения:
- В поиск изображений интегрируются Google Lens, объекты на картинках будут распознаваться, а клик по ним запустит новый поиск, уже по выбранному объекту.
- Для запросов, которые вводятся регулярно, Google отобразит карточку, со связанными запросами и страницами которые посещались в прошлом. Результаты из карточек можно сохранять и рекомендовать связанные ссылки.
И, наконец, новая Google функция Discover («Открой для себя») будет предоставлять рекомендации пользователю, основанные на «его интересах»*. Похожий блок, под названием «Вам может быть интересно» уже известен по российскому Яндекс.Поиску. Теоретически он позволяет поисковику раздавать больше трафика на интернет-сайты, что повышает значимость поисковика в глазах владельцев онлайн-площадок.
* В прошлом, хотя явного блока рекомендаций не было, поисковики-конкуренты старались формировать результаты поиска так, чтобы они хотя бы в небольшой мере подпадали под «интересы» конкретного посетителя (в частности Яндекс, ещё в 2012 году начал учитывать интересы с того, что персонализировал 60% всех запросов). Альтернативная гипотеза гласит, в частности её придерживается президент США Дональд Трамп, что Google формировал результаты выдачи для него таким образом, чтобы они соответствовали Google-интересам, а не интересам Трампа. В действительности же ситуация с жизнью Трампа внутри «Google-пузыря» ещё более запутанная. Общеизвестно что Трамп и до и после своего избрания интересовался и интересуется лживой левой прессой, хотя и не разделяет её идеалов. Материалы именно из таких изданий в 96% случаев и находит для него Google.
Добавить 14 комментариев
Они лезут на небо, что первые, что вторые, методом «хвост и рога вверх» — и это откровенно неприятно.
В человеческом масштабе восприятия мне может быть интересно (в смысле «полезно») нечто, что на сегодняшний день Больше Моих знаний, что-то более тонкое, мудрое или сложное, а не то, что я знал и вчера. Но что первые, что вторые «учитывают мои интересы», моё ограниченное знание и оно становится определяющим для написания безумного алгоритма, сырьем для консервации «незнания». Google, вообще молоток, я смотрю. И так экранного места мало, и так всем очевидно, что поиск ограничивается поиском внутри «пузыря» (а иначе и быть не может, чисто технологическое же ограничение — народный поиск должен быть быстрый и крайне дешёвый, значит ухищрения, которые применяет инженер, для создания «пузыря» по умолчанию считаются хорошими. Не искать же по всему интернету, действительно!) Так гуглы намерены ещё и половину результатов поиска завалить старьём, тем, что и так есть в истории браузера. Большое спасибо!
Если двигаться в направлении «вам может быть интересно» — в один прекрасный момент мы обнаружим, что Яндекс и Google превратились в эдакие «Дзены» и Facebook. Из которых, валится валом разный рекомендованный шлак. Не особенно раздражающий (эту метрику отслеживают капитальнейше), но и не особо-то и нужный.
>в один прекрасный момент мы обнаружим, что Яндекс и Google превратились в эдакие «Дзены» и Facebook.
Это же здорово, так они сами родят возможность для появления новых компаний, пустят свежую кровь в отрасль, такую же, какой они сами когда-то были.
Яркий пример того, как технологической развитие стоит на страже конкуренции.
Монополизировали почту?
Получите телеграф!
Монополизировали телеграф?
Получите телефонию!
Опять построили монополию?
Получите мобильных операторов!
Мобильные операторы организовали уютный картельчик?
Мессенджеры и wifi!
Так думаю будет и с поисковиками, в погоне за монетизацией они деградируют, зациклятся на рядовом плебсе и его скудных интересах, потеряют гиков, которые начнут пробовать что-то другое, перетащив за собой впоследствии и массы.
Забавно читать как моськи-комментаторы лают на слона-поиск.
Яндекс и Гугл давно стали инструментом, где качество поиска определяется в первую очередь персонализацией. Сейчас просто внедрили еще один элемент делающий удобно обычным пользователям, который показывает отличные результаты на многомиллионной аудитории в совокупности итд.
Но некоторым личностям очень трудно признать, что компания может быть успешной, когда она делает что-то нарушающее их чувство прекрасного.
Вы половину содержания поняли исключительно верно. А вторую часть — не поняли совсем.
Зачем мне, «Моське», система, что всеми силами держится за концепцию статичной персонализации, о том, что я «Моська», а не человек, хотя бы. Пусть туповатый, но не безнадёжный, по сути-то по своей. Нет — она, видите ли, учитывает, что я «Моська» и кормит меня кормом для «Моськи» :)
Дальше. Если между рекомендательными системами той же Яндекс.Музыки и рекомендациями-персонализациями поисковиков есть какая-нибудь генетическая связь — то дело обстоит хуже, чем кажется на первый взгляд. Просто по рекомендациям Яндекс.Музыки очень легко понять — а чем тебя кормят? Тема сфокусированная, метрик на порядки меньше, чем во «всеобъемлющей системе рекомендации всего». В Я.Музыке то чётко на понижение идут. Откровенно. Не стесняясь. Мосек кормят кормом, не знаю уж для кого — для червей? Например, в распоряжении Яндекса есть лог всех моих прослушиваний с 2004 года, за 14 лет получается. Но в каждой рекомендации Яндекс.Музыки есть пачка записей, которых, по утверждению Я.М «я не слышал». Или другой аспект — если Яндекс как-то догадывается, что меня примерно интересует, что же он мне порекомендует? На основе своих знаний. Прааааавильно, самого пахабного и растиражированного представителя формально как-то связанного с исходным стилем, исполнителем и т.д. и т.п. Порекомендует ли Я.М не что-то более глубокое и неочевидное, сделает ли она настоящую рекомендацию, что будет мне полезна? Нет. Это исключено.
И к прежнему возвратимся. А что если персонализация по всем тематикам сделана на таком же уровне, как персонализация в Я.Музыке? И людей и Мосек и всех подряд кормят кормом для червей? Что тогда?
Плевать на качество поиска. Проблема в качестве найденного. Я сильно сомневаюсь, что найденное под меня — офигенно полезно и хорошо, я ж не Менделеев и не Бах, и не Декарт…
Я не знаю как можно говорить с людьми, которые для отрицания какого-то общего утверждения начинают использовать аргументы частного характера, часто с единичным примером. Причем у вас, «Мосек», даже не возникает никакого сомнения в том, что единичный пример нельзя распространять до общего случая.
С яндекс.музыкой ваш пример настолько плохой, как если бы в больнице, специализирующейся на хирургии, вы судили о работе хирургов по тому, как хорошо работает окулист. Формально и те и другие — это врачи в одной больнице. Только вот на этом всё сходство заканчивается.
Поиск — это та часть компании, которая приносит 90% выручки. Яндекс.музыка — нишевый сервис, который скорее всего еще и убыточен. Поиск — это сервис, где на каждого пользователя есть сотни (или даже тысячи) фичей, легко проводятся параллели с другими юзерами итд итп.
В музыке же фичей пара десятков от силы, а самые релевантные рекомендации — это допотопный принцип «пользователи, которые слушали эти треки так же слушали еще это».
Я вас немного поправлю.
«В музыке же фичей пара десятков от силы» — нет, это не так (точнее у Яндексо-Гугла, очень даже возможно, что именно пара десятков или меньше, а так и должно быть на миллионной аудитории, иначе всё будет дико тормозить, но итог-то известен, рекомендовать они не умеют). В работающей же рекомендательной системе, работающей с точки зрения слушателя, а не экономики процесса фичей… Ну, например, в «List of Music Genome Project attributes» почти семьсот атрибутов было уже в 2009-м году (потом список разросся ещё, но авторы его засекретили). Фичи начинались с чего-то на А, вроде: Acousti-Lectric Sonority, Acousti-Synthetic Sonority, Acoustic Bass Playing, Acoustic Bass Riff, Acoustic Bass Solo, далее огромные списки продолжались на все буквы алфавита и заканчивались чем-то на W типа: Wah-Wah Guitar, Well-Articulated Acoustic Guitar Solo, Well-Articulated Alto Sax Solo, Well-Articulated Electric Guitar Solo, Well-Articulated Piano Solo, Well-Articulated Tenor Sax Solo, Well-Articulated Trombone Solo, Well-Articulated Trumpet Solo и чем-нибудь на Z. На Геноме работала ранняя Pandora (которую сначала лишили Генома, погоняли десять лет как попало и продали третьего дня Сириусу). Ранняя Пандора рекомендовала изумительно. Но были и две проблемы. Невозможно тщательно разметить все 30 млн треков (или 45, как у Амазона в продаже). Поэтому, когда у конкурентов уже были в каталогах десятки миллионов треков, Пандора играла из базы в сотни тысяч треков, на два порядка меньшей базы. Правда базы размеченных треков, и каждый последующий рекомендованный удачно вставал за рекомендованным ранее, что невозможно в системе для дебилов с очень короткими длинными хвостами. Но это первая проблема. Вторая проблема заключается в том, что рекомендовать надо не только то, что похоже (а это чётко видно после разметки), рекомендовать надо ещё и то, что НЕ похоже, но тоже понравится. Это они не умели. У Генома, который создавался вручную, был алгоритмический соперник, назывался Predixis MusicMagic Mixer, он индексировал музыку по «саунду», приблизительно с тем же подробнейшим «отпечатком фич» на выходе, просто отпечаток этого типа невозможно дешифровать для восприятия человеком. Дальше отпечатки сравнивались и из близких – получались настоящие рекомендации «похожей» музыки. Совсем непохожую, но ту, что понравится – Predixis искать тоже не умел. На компьютерах образца так 2004-2005 годов Predixis снимал отпечатки так тяжко (сутками, на больших коллекциях — неделями), что им почти никто не пользовался и толковой общедоступной всемирной базы отпечатков в «облаке» собрать не удалось. Проект загнулся. И тут уже попёрли стриминги и амазоновская дичь — если кто-то слушает «первое» и «второе», рекомендуй другому дураку, слушателю первого — «втрое». И эта копеечная рекомендовало-порнография продолжается до сих пор. Хотя компьютеры-то у народа, спустя 13 лет, намного мощнее, а серверы вообще никогда маломощными не были.
на каждого пользователя есть сотни (или даже тысячи) фичей, легко проводятся параллели с другими юзерами итд итп.
Представьте себе, что Яндекс.Крипта выделила группу студентов. И отслеживается следующая картина: Все 100% студентов искали нечто на тему «вулканизация в парах мазута». 80% из них кликнули по первым трём ссылкам, и больше никогда в жизни не искали ничего про вулканизацию мазутом. Всё что надо — они гарантированно нашли. 20% первоначально искали тоже «вулканизацию в парах мазута», но затем переформулировали запрос, искали данные о мазуте и вулканизации по отдельности, часто убегали по ссылкам на гугл, так как не находили ничего подходящего в Яндексе, короче долго возились, и сказать определённо, что покликанные ими ссылки складываются хоть в какую-нибудь систему — нельзя. Эта группа 20процентников кликала всё подряд. Тогда как 80типроцентрики по первым трём ссылкам и сразу нашли себе подходящие сайты. Изучив статистику поисковик может решить, что 20процентники — это дебилы какие-то. Другое дело 80типроцентники и особенно найденные ими документы. Это очень хорошие документы значит!
В действительности же, может оказаться, что всё не так, что дебилами были 80типроцентники, которые качнули себе по рефератику с грязных сайтов, с вангами на баннерах. Каждый дебил получил по двойке или тройке. А, вот, те, кто казалось бы, ничего подходящего не нашёл и возился с неподходящими документами — эти 20типроцентники — все получили 4, 5. Поэтому что именно эти люди нашли по-настоящему подходящие документы, разобрались в теме, написали работу самостоятельно (альтернативный вариант — работу они не писали, тоже качнули, но поняли, чем она должна отличаться от одинаковых работ 80типроцентников дурчков).
Система устроена таким образом, что с большой вероятностью Яндексо-Гугл решит, что надо ориентироваться на мартышек и мосек, всё-таки по запросу их было 80% и они так синхронно себя вели!
А где тут претензии к успешности?
Ну сделали — и слава Богу
Пускай ещё что-то придумывают, персонализированное или нет — уж как смогут, мы не в обиде.
Есть полное ощущение, что вы пишите только ради того, чтобы написать.
Пандора в вашем конкретном единичном случае работала хорошо, яндекс.музыка в вашем конкретном единичном случае работает плохо. Ни то, ни другое ничего не говорит о качестве сервисов, потому что это единичные примеры и они ничего не говорят об общем случае. Не говоря уже про субъективность восприятия, которое, как общеизвестно, весьма недостоверно.
С вашим примером про поиск я могу только сослаться на типичное школьное: «а если все с крыши пойдут прыгать?».
Кроме субъективности есть и объективные факты.
20 июня 2015 (больше трёх лет назад) я пожаловался на навязчивую «рекомендацию» Яндекс.Музыки послушать Zorge. Это крайне известная группа для любителей Tequilajazzz. Её вообще им (мне) рекомендовать не нужно. Все знают и так. Это как порекомендовать «прочесть букварь» — или ироничная шутка или издевательство. Более того, Я.Музыка знала, что я слушал Zorge… непосредственно в Я.Музыке. Тем не менее Я.Музыка рекомендовала Zorge через день и не перестала давать подобные рекомендации вплоть до сегодняшнего дня, до 26 сентября 2018 года:
А разгадка очень и очень простая. Данных много, алгоритмы должны быть максимально дешёвые иначе они будут работать непозволительно долго. Прекрасно видно, что Я.Музыка предпочитает экстремальную степень огрубления данных и их усреднение до примитивнейшей системы, состоящей из крупнейших имен плюс подуровень имен-сателитов. Слушал ли человек Tequilajazzz? Да. Рекомендуй Zorge и Optimystica Orchestra. Слушал Zorge? Рекомендуй Tequilajazzz. Это тот самый эффект, когда вместо индивидуализации, погружения вглубь тематики, перехода над подуровень Zorge — происходит дебилизация, делается формально верное, а по сути самое вульгарное огрубление. Усреднение по максимуму, низведение «пузыря» до уровня моськи. И, вот, слушатель моська сидит в пузырьке.
У Поиска в 40 раз больше пользователей, чем у Музыки, а число тематик, помимо музыки, которые надо охватить вообще стремится в бесконечность. Можно ли предположить, что гуглояндекс не смогли справится с индивидуализацией объектов из базы в 25 млн треков, но справились с индивидуализацией миллиардов веб-документов для десятков миллионов человек ежедневно? Да нельзя, конечно. Можно предположить обратное, гуглояндекс наделали технологий огрубления данных, принципов по которым можно отбросить из поиска 99,999999% найденного, а из усреднённых остатков лучше всего производить инфопузыри — вон, Трамп в таком сидит. Да и все остальные, я полагаю… Остальное — маркетинг. Огрублению и вульгаризации нужны какие-нибудь приличные имена. «Персонализация» вполне приличное название…
P.S. Перед подвигом инженеров и лингвистов Яндекса — я преклоняюсь. В персонализацию и в то, что поиск помогает мне моське стать лучше, потому что он персонализирован — и близко не верю.
Перефразирую: кроме субъективности есть ещё субъективность с сомнительными фактами.
>Данных много, алгоритмы должны быть максимально дешёвые иначе они будут работать непозволительно долго.
Когда я писал рекомендалку для своего магазина, то наглядно увидел какое это ресурсоемкое дело, а у меня всего 10000 sku и рекомендовать товары по принципу пользователи смотревшие этот товар также смотрели/положили в корзину/купили это намного менее железозатратное дело, чем подсказать музыку.
Яндекс и гугл делают свой бизнес на посредничестве между пользователем и контентом, все что сложнее уже не впишется в их бизнес модель, возможно пока не появятся квантовые компьютеры.
>Перефразирую: кроме субъективности есть ещё субъективность с сомнительными фактами.
Михаил, не сотвори себе кумира (с)
Ну, а что же вы хотели иного? Гуглояндекс традиционно рассказывает о себе, как о чёрном ящике. В действительности это и есть «чёрный ящик» — даже инженер Гуглояндекса не знает достоверно на 100%: «что ввалится в ответ на тот или иной запрос?» Умалчивается только то, что это управляемый чёрный ящик, а встроенное в него «зеркало интернета», оно не своими ногами пришло и встало на место установки… И если в зеркале показывают помойку — то это не вина зеркала и не вина интернета вообще.
То, как «гуглояндекс» о себе рассказывает, никак не оправдывает ваше дилетантство в вопросах поиска, произведении общих выводов из частных случаев, а так же рассмотрения умозрительных примеров, заведомо не существующих в жизни.