Mail.ru схедхантила опытного специалиста по поиску из Яндекса

Сергей Бурдов, менеджер проектов из Яндекса, перешел на работу в Mail.ru. В Яндексе Сергей проработал пять лет, занимался поиском, был одним из создателей Матрикснета, в 2008 году руководил разработкой поиска книг по ISBN в рамках Яндекс.Маркета. Похоже, у Mail.ru Group действительно серьезные намерения относительно рынка поиска в Рунете.

Добавить 60 комментариев

  • Ответить
    Альтер Эго

    Серега, конечно, клевый, но про матрикснет — вранье. Он, вообще, менеджер, а не математик по роду деятельности. Удачи на новом месте я уже желал, да.

  • Ответить
    Альтер Эго

    > был одним из создателей Матрикснета У Матрикснета один-единственный создатель, плюс еще несколько человек постояли рядом. Но Серёжа даже рядом не постоял (что, естественно, не умаляет прочих его достоинств). Очень надеюсь, что автор этой фразы — не он.

  • Ответить
    Альтер Эго

    у мейла вообще аццкие хантеры они где то услышали и теперь всем рассказывают на собеседовании, что одиозная команда разработчиков поиска пишет поисковик _второго_ !! поколения, т.е. по сути Апорт времен 98 года. Удачи !

  • Ответить
    Альтер Эго

    Jerome H. Friedman — создатель TreeNet. MatrixNet отличается от машинки Фридмана несколькими улучшениями, хорошо показавшими себя на практике (в частности, другие модели регуляризации и bagging’а, использование oblivious trees). Кроме этого, MatrixNet — это просто очень много кода. Идеально работающего, хорошо оптимизированного, масштабируемого (в отличие от TreeNet) под разные объемы обучающих выборок и вообще под разные сценарии. Создателя MatrixNet зовут Андрей Гулин.

  • Ответить
    Альтер Эго

    > Jerome H. Friedman — создатель TreeNet. MatrixNet отличается от машинки Фридмана несколькими улучшениями, Как и писали выше, кто-то придумал, а кто-то рядом постоял (улучшения придумал, код написал).

  • Ответить
    Альтер Эго

    Ну естественно! Всё вообще придумал Ньютон. Даже не просто какой-то там градиентный спуск, а сразу метод второго порядка. Подумаешь, ну какие-то там люди потом через триста с лишним лет сообразили применять упрощенный аналог великих итеративных методов, изобретенных самим Ньютоном, не к R^n, а к банаховым пространствам. В любом случае они все только рядом постояли. Oh wait, до Ньютона был ведь Аристотель еще. Вам, кстати, что чаще говорят, что вы толстый тролль, или что вы бесполезный (хоть и, возможно, эрудированный) идиот, умеющий в основном надувать щёки? Я как-то начинаю в последнее время подозревать, что верно второе, а не первое.

  • Ответить
    Альтер Эго

    То, что градиентный спуск и gradient boost имеют общим слово «градиентный», не означает, что у них так уж много общего. Гораздо меньше, чем у MatrixNet и TreeNet. А разница между двумя последними — то, что первое — немного допиленное для применения в Яндексе второе. Т.е. научную работу сделали в Стенфорде, а результатами воспользовались в Яндексе. Вам, кстати, что чаще говорят, что вы толстый тролль, или что вы бесполезный (хоть и, возможно, эрудированный) идиот, умеющий в основном надувать щёки? И то, и другое, говорят одинаково часто. (вы первый, кто сказал и то, и другое)

  • Ответить
    Альтер Эго

    потому что люди все меньше стоят у станка и все больше сидят за _стартапами_ по спамо-сео продвижению.

  • Ответить

    Про буратину был зачетный коммент. :D Когда-то плодились «дети лейтенанта Шмидта», теперь в анкетах хантеров начнут плодиться «дети Гулина»? :D

  • Ответить
    Альтер Эго

    Сережа Бурдов — один из авторов жалкой копии творения Фридмана, писульку про которую не принимают никуда? Спасибо, Роём. Mail.Ru — признанный гранд поисковой науки, опустился до такого?

  • Ответить
    Альтер Эго

    Началось В проекте участвовали разные люди, но лавры только Гулину. А про того кто ушел, надо забыть, и забыть все его огромные услуги, огромнейшее влияние на поисковую машину.

  • Ответить
    Альтер Эго

    Введите «Бурдов» в строке поиска! Ввели. А что такого? (кошмар, одни альтерэги в треде)

  • Ответить
    Альтер Эго

    значение некоторых дам в индустрии настолько преувеличено что просто стыдно читать.

  • Ответить
    Альтер Эго

    Противно когда при уходе специалиста и человека много сделавшего его компания начинает распускать слухи что он ничего не сделал, а вместо него поработал Гулин Иванов или Сидоров Неоднократно замечал такое за раблеровцами и яндексюшками — поливать грязью бывших коллег там считается самое комильфо

  • Ответить
    Альтер Эго

    По поводу МатриксНет Кто-нибудь может указать время на графиках Ашманова когда был запущен МатриксНет? А то ходят слухи, что никакого МатриксНет нет, это исключительно рекламная акция придуманная в ПР отделе Яндекса. «Новый вкус Кока колы разработанный лучшими в мире химиками путем невероятных усилий! Теперь она голубая!»

  • Ответить
    Альтер Эго

    Противно, когда какие-то странные люди начинают врать, и то приписывают заслуги одного конкретного человека совершенно другим людям, не имеющим к ним ни малейшего отношения (в т.ч. и в целом вполне достойным, но просто, вот так получилось, работавшим ну совсем совсем над другими вещами), то пишут, что и заслуги никакой не было, ибо градиентный спуск в пространстве сумм слабых решателей с регуляризацией кто-то придумал до Гулина (ДА НУ?) Вот что действительно противно. Тут как бы уже неважно, ради троллинга это делается, или просто по причине полной дурости.

  • Ответить
    Альтер Эго

    градиентный спуск в пространстве сумм слабых решателей с регуляризацией кто-то придумал до Гулина Фридман? Даже использования этого метода для ранжирования это придумали до Гулина Если Гулин такой умный почему он опубликовать ничего не может? Если бы были стоящие результаты в этой области SIGIR с радостью бы их приняло А то что курилка создает культ одного из членов этой курилки — мало кого интересует за пределами этой курилки

  • Ответить
    Альтер Эго

    ехал фридман через фридман видит фридман фридман фридман сунул фридман фридман в фридман фридман фридман фридман фридман Вам самому не смешно? Разучили тут умные слова «Фридман» и «SIGIR», и повторяете, как попугай в разных комбинациях. Идите уже сделайте что-нибудь полезное. Или хотя бы «придумайте» (тм), если делать не получается.

  • Ответить

    > Если Гулин такой умный почему он опубликовать ничего не может? Мало что знаю про Гулина, но это довольно смешная претензия. Думаете, Гулину заняться больше нечем?

  • Ответить

    Если Гулин такой умный почему он опубликовать ничего не может? Гулин не «такой умный», а даже немного умнее, имхо. :) Что вы так пристали с публикациями? В соседней ветке другая альтерэга вроде на пальцАх уже [URL=http://roem.ru/links/29287/?c#message95099]объяснила[/URL], что не все статьи одинаково полезны. И не нужно думать, что человек с кучей англоязычных статей и высоким ИЦ — гений IR, а человек без такой кучи — лох. Иногда бывает совсем наоборот, вы бы статьи эти почитали, получите немеряно лулзов при определенном усердии. :)

  • Ответить
    Альтер Эго

    > Если Гулин такой умный почему он опубликовать ничего не может? Yahoo! Learning to Rank Challenge смешное, конешно, соревнование (когда результаты разнятся на доли процента). Но все-таки Гулин и Кураленок показали лучший результат в одной из дорожек. А вот умеющие публиковаться за редким исключением чего-нибудь полезное сделать не могут. И вообще, как много карьер таких, что публиковался-публиковался, а как в Гугл взяли — так и отрезало. Наверное, глупеют? :) Или все же жизненные приоритеты меняются и не надо теперь в полные профессора или в комерческую контору стремится (уже там)?

  • Ответить

    )Но все-таки Гулин и Кураленок показали лучший результат в одной из дорожек. Было бы намного круче и полезнее (всем) если бы соревнование было по прогнозу погоды или цене на нефть.

  • Ответить
    Альтер Эго

    Yahoo! Learning to Rank Challenge Задача весьма специфическая Пару месяцев сидеть и тупо настраивать параметры алгоритма, чтобы добиться слегка большей циферки. Далеко не всем это интересно. Статья на VLDB/SIGIR/ICML это что-то новое, это плюс в твоем CV, хочешь ты получить tenure или что-то еще, это важно А Yahoo! challenge кому нужно? Сравните с нетфликсовским соревнованием, в Яху соревновании не было серьезных людей, какие-то чуваки из яндекса, какой-то чувак из коммерческого поиска микрософт и все. Публикации это всегда полезно.

  • Ответить
    Альтер Эго

    Было бы намного круче и полезнее (всем) если бы соревнование было по прогнозу погоды или цене на нефть. С точки зрения математики это гораздо более сложные задачи, чем Learning to Rank Там пробиться гораздо сложнее. Там полно PhDшников математиков, физиков, статистиков.

  • Ответить
    Альтер Эго

    Статьи и книги пишут дураки, их клад в развитие человечества минимален Какие статьи написал человек придумавший паровоз, самолет, пылесос, пароход, лампочку? Эти люди делали дела, а не писали статьи. Люди делятся на две категории — мыслители и делатели. Мыслители пишут статьи, делатели делают дела. Кому нужна теория относительности, теория вероятности, теория категорий, постмодернизм? Их придумали делатели, чтобы оправдать свои места в университетах. Они не принесли пользу ни одному человеку. Паровоз, лампочка, фотооаппарат принесли огромную пользу, а люди, сделавшие их не написали не одной статьи. Так выпьем же за тех кто делает дела и делает нашу жизнь счастливее, а не за тех кто думает и бесполезен обществу!

  • Ответить
    Альтер Эго

    Да мы все дураки тут. По-настоящему умные люди деньги зарабатывают, пока кто-то статьи пишет и матрикснеты кодит. Гулин-Фридман-Шмидман. Вот Волож — миллиардер, или там Ашманов — муж миллиардера. А мы неудачники все.

  • Ответить
    Альтер Эго

    Глупо сравнивать университетских работников с сотрудниками Яндекса Что есть у типичного университеского работника, работающего в поиске логи альтависты за 2001 год, которые меньше логов яндекса за один час логи людей, установивших специальный тулбар, чтобы жертвовать свои логи науке, которые меньше логов яндекса за час медленный доступ к n-gram серверу от гуглу, 10 компьютеров, которые можно использовать для вычислений против тысяч компьютеров в датацентрах почти полного корпуса веба с отличной инфраструктурой для написания каких-либо угодных вычислений над этим огромнейших массивов приобретенной или разработанной информации- синонимы, классификация картинов Все равно что сравнивать человека с детской лопаткой с экскаваторщиком Если работаешь в Яндексе, то на СИГИР публиковаться неинтересно.

  • Ответить

    Было бы намного круче и полезнее (всем) если бы соревнование было по прогнозу погоды или цене на нефть. Ну, с метриками типа «примерно вверх» и оценками «почти угадал» — такие методы бы прокатили в биржевых прогнозах. :D Там пробиться гораздо сложнее. Там полно PhDшников математиков, физиков, статистиков. Если говорить о финансовой математике, то там большей частью люди не известные в публичной науке, т.к. финансовые исследования любят тишину. Адепты публичных школ, типа школы Ширяева, как правило не добиваются успехов в реальном прогнозировании, стиль мышления не тот. Но с другой стороны, их теоретические работы очень важны, т.к. иногда они ложатся в основу непубличных исследований. В прогнозировании погоды я общался только с одним теоретиком, который к тому времени был достаточно известным профессором у нас и в штатах, хотя самый успешный его прогноз — погода в аэропорте Ташкента, где вроде бы всегда солнечно. Он пытался в финансовую математику влезть и в итоге ничего не добился. А мы неудачники все. Не все. :)

  • Ответить

    Если работаешь в Яндексе, то на СИГИР публиковаться неинтересно. Вы бы лучше посмотрели, кто там публикуется. У некоторых логов и серверов гораздо больше, чем у Яндекса. :)

  • Ответить
    Альтер Эго

    У некоторых логов и серверов гораздо больше, чем у Яндекса. :) Зато у них нет бесплатного жрача в столовке, корпоративной маршрутки и опционов Лузеры!

  • Ответить
    Альтер Эго

    Очень просто ответить почему не все результаты важные для Яндекса не публикуемы на СИГИР, а не все что нужно для публикации на СИГИР интересно Яндекса СИГИР и прочие все же научные конференции Что нужно чтобы результат был «научным» и мог быть опубликован на научной конференции 1 верифицируемость Утверждение о том, что такой метод работает должно быть верифицируемым, это самый важный принцип в науке Если вы утверждаете, что заменив число ссылок на статью на eigen value такой матрицы таким-то образом сконструированной из ссылочной структуры веба, то это утверждение верифицируемое при наличии кое-каких ресурсов, которые доступны сравнительно много верификатороам Если вы утверждаете, что используя какой-то можно поднять какую-то метрику на какой-то коллекции на каком-то секретном списке запросов и результатов секретно оценненных ассесорами на пять процентов, то это утверждение за пределами вашей лаборатории не верифицируемо и научной ценности не представляет 2 обобщаемость результатов Большинство выигрышей в индустриальном поиске приходят не от красивых элегантных обобщений и подмеченных закономерностей, которые важны, случаются редко, а от кропотливого пиления пилой «если понизить рейтинг документов, которые содержат больше пяти раз слово «бля», то мы повысим такую-то метрику на пол процента» . Такие правила важны для повышения качества Яндекса. Но не обобщаемы так как имеют ценность только для одного языка и слова вроде «бля» выведены не каким-то умным алгоритмом, которые будет легко применим к другим языкам, а кропотливой работой ручного датамайнера 3 новизна. Большинство проектов в поисковиках подобно курсовым работам студентов по machine learning. Напишите классификатор текста, который будет отсеивать спамные электронные письма Студент решает проект берет известный метод, или 10 методов, применяет из к колекции, выбирает наилучший. Такая работа не публикуема. Так как нет новизны «еще один метод применемый еще к одной коллекции» Как говорили у нас в МИАНе про подобные диссертации «о еще одном решении еще одного дифференциального уравнения» Новизны тут нет. Не публикуемо. Но огромная индустриальная ценность То есть работа в Яндексе ортогональна научной работе Нет верифицируемости, нет новизны, не обобщаемости Есть огромное количество пользователей и немедленная практическая выгода Ни то, ни другое не является хуже, чем другое направление. Просто они разные.

  • Ответить
    Альтер Эго

    > Зато у них нет бесплатного жрача в столовке Так и в яндексе он небесплатный! 6 штук в месяц из зарплаты вычитается.

  • Ответить
    Альтер Эго

    Так и в яндексе он небесплатный! 6 штук в месяц из зарплаты вычитается. Не верю, Яндекс — хороший и не может так поступать с собственными сотрудниками.

  • Ответить
    Роман Иванов Яндекс, а также ljsear.ch по выходным

    > Так и в яндексе он небесплатный! 6 штук в месяц из зарплаты вычитается. Это неправда. Вычитается налог на эти 6000 рублей, не вычитаться он не может, так устроено законодательство.

  • Ответить

    >С точки зрения математики это гораздо более сложные задачи, чем Learning to Rank С точки зрения математики это одно и то же. Смотрите. Задача — прогноз температуры. Запрос — это дата — например 20.06.2011 Задача — взять отсортировать 100 самых крупных городов России по средней температуре в эту дату. Берете Learning to Rank и обучаете. А мы берем вашу сортировку и , через среднюю температуру, восстанавливаем температуру в каждом городе. Видите — с точки зрения математики все одинаково. А если вы типа возмущенно скажете, что так делать нельзя, ибо тут сложные атмосферные процессы, то я вам тут же отвечу, что поиск Яндекса — это тоже сложный процесс, а не просто Learning to Rank

  • Ответить
    Альтер Эго

    > Это неправда. Вычитается налог на эти 6000 рублей, не вычитаться он не может, так устроено законодательство. Ну некоторые люди возможно предпочли бы получать ежемесяно бонус в размере 6000 рублей минус налог к зарплате, чем «бесплатно» питаться в столовой. Но вы не даете им выбора.

  • Ответить
    Альтер Эго

    Ну некоторые люди возможно предпочли бы получать ежемесяно бонус в размере 6000 рублей минус налог к зарплате, чем «бесплатно» питаться в столовой. Но вы не даете им выбора Все ДОЛЖНЫ питаться в столовке, В столовке вкусная и полезная пища для развития мозгов. Иначе они будут приносить на работу пельмени в коробочках, а это плохо для мозгов и негативно влияет на продуктивность работника.

  • Ответить
    Роман Иванов Яндекс, а также ljsear.ch по выходным

    Да как же не даём, даём. Можно работать в Яндексе, а можно не работать. Никакого насилия, к столам, в отличие от Ашманова и партнёров, у нас никого не приковывают :) А если хочется работать, то кроме столовой у нас есть возможность тратить эти деньги ещё в нескольких заведениях вокруг, Segafredo, скажем, кафе Лебедева, Жан-Жак, Джон Донн etc.

  • Ответить
    Альтер Эго

    Индицидуальное питание — признак индивидуализма. Питаясь в столовке сотрудник общается с коллегами, проникается духом компании, слышать новости компании, обмениваеся мнениями о мудрых решения руководства компании, слышит о недостатках конкурентов компании. В дружеской обстановке столовки товарищи могут указать сотрудники на его ошибки в работе, баги в го коде, нелояльности проявленной в мнениях на форуме и наставить его на правильный путь лояльности руководству и написании безошибочного кода.

  • Ответить
    Альтер Эго

    шикарный флуд. Служба PR Яндекса тут потрудилась. А по существу — видимо сильный баттхерт.

  • Ответить
    Альтер Эго

    В столовке низя обсуждать «ошибки в работе». Она общая. «Осторожно, в курилке посторонний» )

  • Ответить
    Альтер Эго

    После столовки можно заняться строго настрого запрещенным просматривать фотки людей, которые ищут гуглом, программируют на хаскеле, а не С++, любят своих женщин или мужчин, а не начальство и работу.