В пятницу, 17 февраля, в Яндексе презентовали журналистам новый сервис компании. Он представляет собой "поиск людей", который будет существовать как отдельный сервис и как вертикаль для основного поиска. По сути он представляет собой метапоисковик по наиболее популярным социальным сетям Рунета. Выдача будет состоять из метапрофайлов людей, собранных из их аккаунтов в разных социальных сетях.
Поиск на субдомене people.yandex.ru станет первым шагом в реализации "глобальной программы социального поиска", которая запланирована Яндексом на 2012 год. В этом году у Яндекса будет много запусков, связанных с социальными сетями. В том числе, как сказал Илья Сегалович, "поиск, который знает про вас лично и помогает искать вам лично" - персонализированный на основе данных из соцсетей.
Яндекс не имеет и не планирует заводить собственной крупной социальной сети. Вместо этого он завёл дружественные отношения со всеми важными соцсетями Рунета и договорился о развитии совместных сервисов.
Найти контакт одноклассника в фейсбуке
Илья Сегалович рассказал, что примерно 4%-5% поисковых запросов - это запросы о людях. Из них около 2% - это не запросы о знаменитостях, литературных героях и т.п., а запросы с целью поиска "обычных людей". Традиционно поисковые системы отвечают на эти запросы, просто отыскивая в индексе страницы с упоминаниями этих людей. В выдаче оказываются социальные профили, блоги, ссылки на упоминания в СМИ... На такие запросы можно отвечать гораздо качественнее, если относиться к ним как к поиску объекта. У такого объекта есть определенные свойства - дата рождения, место жительства, работа, и т.д. Один и тот же объект может быть представлен несколькими профилями в социальных сетях.
С поиском "обычных людей" есть проблема: если спросить в Яндексе, например, "Сергей Иванов", то вся выдача будет занята знаменитыми Сергеями Ивановыми, а пользователь может искать своего школьного друга, который не имеет к ним отношения. В новом поиске по людям любая звезда будет занимать только одну строчку в выдаче, а остальные будут заняты разными Сергеями Ивановыми. Справа в интерфейсе поиска по людям есть поля для ввода дополнительных данных - возраста, места работы, и прочих - что поможет точнее и быстрее найти нужного пользователя, особенно если у него распространенная фамилия.
Присутствующим на презентации журналистам восприятие этой идеи далось не очень легко: тестируя новый сервис, гости вводили туда имена Путина, Медведева, Прохорова и выражали недовольство тем, что в выдаче не тот Медведев. Яндексоиды терпеливо объясняли, что так и должно быть. "Большой" Яндекс умеет понимать, чего хочет автор поискового запроса, и если у него спросить про Дмитрия Медведева, то он покажет президента.
Аскетизм во имя приватности
Яндекс получает из социальных сетей достаточно много данных о людях, и может их анализировать и извлекать немало информации о связях между пользователями. Но в компании сознательно ограничивают свои возможности принципом: заниматься только явными, публично продемонстированными пользователем связями. И не заниматься неявными связями, не пытаться "объединять профили на основании каких-то эвристик", чтобы не нарушить правила приватности.
В частности, поэтому сейчас профили в результатах поиска ранжируются по степени заполненности информации "о себе". Такие данные, как посещаемость, количество подписчиков, кто такие эти подписчики, Яндекс в первой версии алгоритма не использует - создатели сервиса "пока не понимают, насколько важно для пользователя сохранить такую информацию приватной". Такой принцип ранжирования удобен тем, что по наиболее заполненным профилям можно понять, тот ли это человек, который нужен, не заходя в социальную сеть - сразу в выдаче Яндекса.
Минусом ранжирования по заполненности данных является то, что наверх могут вылезти старые, заброшенные аккаунты. Но создатели вертикали видят в этом положительные стороны: поискав себя и обнаружив такой аккаунт, пользователь о нём вспомнит, и либо актуализирует, либо свяжет с новыми аккаунтами, либо удалит.
Принцип "опираться только на открытые данные" заставляет Яндекс относить к одному человеку только те его представительства в социальных сетях, которые он сам связал. Есть два способа связать аккаунты. Первый - поставить в них взаимные ссылки друг на друга. Второй вариант - "ссылки, когда из одного социального сервиса можно войти в другой, введя свой пароль". Наконец, в Яндекс.Паспорте есть раздел "социальные профили", где можно сообщить Яндексу о своих аккаунтах в разных социальных сетях.
Помимо забот о приватности, Яндекс увидел и другие причины требовать от пользователя сознательной связи аккаунтов. Во-первых, спамеры или просто "шутники" могут создать в одной из социальных сетей профайл с вашим именем, фото и другими данными, и написать там что-то в своих интересах. Такой профайл нельзя автоматически добавлять к уже имеющимся ссылкам на человека.
Во-вторых, некоторые люди ведут в Сети "двойную жизнь", и, связав их аккаунты автоматически, можно нечаяно показать "вторую жизнь" друзьям из "первой жизни".
Индексация, добровольная и принудительная
Яндекс уже имеет в своем распоряжении 250 млн. профайлов из социальных сетей. Он получает их двумя способами. От сервисов, с кем есть соответствующая договоренность, Яндекс получает специально сформированный фид. В число таких соцсетей не входят "Одноклассники", "Мой Мир@Mail.ru" и пока не входит "ВКонтакте", так как у них технические проблемы и они пока могут отдавать не всё, что нужно.
Второй способ - самостоятельная индексация Яндексом открытой информации в социальной сети.
Среди отдающих фид - ЖЖ, Facebook и Twitter. Последние две соцсети хранят настолько большой объем данных, что проиндексировать их для Яндекса стало бы неподъемной задачей. И Twitter, и Google+ из-за интереса к ним поисковых машин имеют возможность зарабатывать, отдавая им специальный фид, и стоят такие фиды достаточно дорого. Но с "Твиттером" Яндексу "удалось договориться", а с Google не удалось - "кроме того, у Google есть свои амбиции". Подробностей о договоренностях журналистам не сообщили.
Скорость обновления информации в поиске по людям зависит как раз от способа получения данных. Если соцсеть отдает их Яндексу сама, то изменения, внесенные в свои профайлы пользователями социальной сети, отразятся в поиске по людям в течение суток, "а может и быстрее". Если Яндекс самостоятельно индексирует, то данные обновятся, "когда робот дойдет". Это может занять и неделю.
Удалиться из результатов поиска нельзя - можно только пойти в конкретную соцсеть и там закрыть или отредактировать свой профайл. Яндекс старается не держать в кэше удаленную или изменившуюся информацию - это, конечно, пригодилось бы ищущим, но вступило бы в противоречия с правами и интересами владельцев информации.
В планах есть связь, но нет контактов
Журналистам позволили заглянуть в недалекое будущее people.yandex.ru. Может поменяться принцип ранжирования профилей в выдаче. Ранжирование результатов по заполненности профиля - это первая, экспериментальная версия. Разработчики пока не придумали хороших метрик, по которым можно мерять качество поиска людей.
Планируется верификация аккаунтов селебрити, интеграция с Пресс-портретами, сервисом Яндекс.Новостей.
Известно также, чего скорее всего не будет. Яндекс не планирует показывать контактную информацию пользователя и искать людей по контактам. Во-первых потому, что тот мог указать ее в соцсети непродуманно, не понимая, что "всем это видно". Во-вторых, людям свойственно писать в полях для контактной информации вообще всё, что угодно, вольный текст, и это сложно автоматически обработать и отличить от "полноценных" контактов.
Зато, если соцсети-партнеру это будет интересно, Яндекс сможет добавить в свои результаты поиска по людям кнопки для добавления в друзья и отправки сообщения найденному пользователю через конкретную соцсеть.
На данный момент принято решение не учитывать регион в поиске людей (искомый не обязан быть из одного региона с ищущим, мало ли, кого куда жизнь разбросала).
Новый сервис может повлиять на всю экосистему Рунета. Например, дать Яндексу информацию для размышления о сравнительном качестве социальных сетей: где больше заполненных профайлов, где больше разных людей и т.д. Журналисты поинтересовались, не упадет ли резко количество открытых профилей в социальных сетях, не испугаются ли люди своей видимости в поиске, но Илья Сегалович предположил, что пользователи этой видимости захотят и, наоборот, станут открывать профайлы.
People.yandex.ru возник в Яндексе как внутренний стартап, его сделали "люди, которым было больше всех надо" - они придумали идею и реализовали ее. Такой сервис особенно ценен для Рунета, в большинстве других стран он был бы лишним, потому что там "все сидят в Facebook", и поиска по Фейсбуку для обнаружения людей в Сети вполне достаточно.
Хотелось бы прояснить ситуацию о технической составляющей реализации поиска профилей пользователей в социальных сетях Одноклассники и Мой Мир@Mail.ru. В данной публикации наше внимание привлекла вот такая фраза: «От сервисов, с кем есть соответствующая договоренность, Яндекс получает специально сформированный фид. В число таких соцсетей не входят «Одноклассники», «Мой Мир@Mail.ru» и пока не входит «ВКонтакте», так как у них технические проблемы и они пока могут отдавать не всё, что нужно. » Мы попытались выяснить, какие же технические сложности у нас возникли в момент запуска поиска по соцсетям? И не нашли их. Вот комментарий руководителя сервиса «Поиск Людей» Александра Чубинского, полученный в ответ на наше письмо в Яндекс с просьбой прокомментировать приведенную выше фразу: «Между «Одноклассниками» и Яндексом не имеется каких-либо технических и/или организационных трудностей. На данный момент ведется работа по улучшению качества индексации профилей данной социальной сети. Что касается «Мой Мир@Mail.ru», то, насколько мне известно, на текущий момент времени данные по профилям этой социальной сети, нам не предоставляются. Но этот вопрос также не связан с техническими или организационными трудностями». Действительно, Мой Мир@Mail.ru пока не предоставляет информацию для индексации – так как в начале года мы решали другие, более приоритетные для нас на данный момент, задачи. Но в ближайшее время мы подготовим и предоставим необходимые данные для подключения сети Мой Мир@Mail.ru к поисковому сервису. При этом хочу подчеркнуть, что мы технически хорошо подготовились для передачи в Яндекс информации об Одноклассниках – и на данный момент все открытые профили успешно индексируются.