Стал доступен широкой публике (на английском, на русском) доклад компании "Яндекс", подготовленный для конференциии WWW 2009, прошедшей в конце апреля в Мадриде. В нем говорится о новом методе идентификации платных ссылок, разработанном на основе алгоритма HITS, ранее использовавшегося для выявления спама.
При этом в докладе отмечается, что платные ссылки "не считаются спамом, поскольку встречаются в основном на вполне приличных страницах наряду с другими полезными ссылками и часто указывают на ценные коммерческие сайты". Тем не менее, умение выявлять платные ссылки значительно повышает эффективность рейтингов поисковых машин, отмечают представители "Яндекса".
Аккуратный подход к проблеме платных ссылок (и отношений оптимизаторов с поисковой системой) демонстрирует следующая фраза: "Главная задача алгоритма — выявление непосредственно платных ссылок, а не сайтов, их продающих и покупающих".
Проверка алгоритма на сформированных вручную тестовых выборках доказала его высокую точность (95%) и эффективность (93-96%). Удивительным открытием, которое можно сделать на основе материалов доклада, заключается в том, что "Яндекс" считает платные ссылки более вредными в некоммерческих запросах, а не по популярным конкурентным запросам, где и размещается значительное число платных ссылок:
"Идентификация платных ссылок позволяет оценивать релевантность ссылок для коммерческих и некоммерческих запросов независимо друг от друга. В первом случае, платные ссылки учитываются при вычислении коммерческого рейтинга, а во втором — игнорируются. Это делает формулу вычисления рейтингов более эффективной и повышает качество поиска, нейтрализуя влияние чрезмерной оптимизации на некоммерческие поисковые запросы и делая результаты поиска более разнообразными".
Отечественные блогеры уже попытались "перевести" это заявление на простой язык. В частности, разработчик поиска Леонид Бойцов пишет: "По поводу некоммерческих запросов, идея, видимо, такова. Поскольку покупные ссылки сильно поднимают рейтинг страницы, то по некоммерческим запросам оптимизированные страницы начинают выплывать там, где они не (очень) релевантны. При этом обычный контент не может с ними конкурировать. У коммерческих запросов другая история - там есть огромная конкуренция. В результате, по каждому коммерческому запросу есть много релевантных результатов, а пользователю может быть не так важно, какие именно компании выплывают по запросу "поставить окна".
Добавить 396 комментариев
все-таки «precision and recall» принято переводить на русский как «точность и полнота», а не «точность и эффективность». Так как переведено смысл несколько искажается.
а в целом перевод там как по качеству?
О, Яндекс стал настолько аккуратнее относиться к SEO? Это приятно, очень приятно! Если это правда, конечно :). Как по мне, SEO как вид рекламы имеет те же права, что и контекстная реклама.
Вот ведь. Делаю как раз для начальства отчет — там прогноз динамики роста нашего SEO-бюджета до 2012 года. А тут такое ;)
а поделитесь, каким образом у вас доклады Яндекса на отчеты для начальства влияют? :)
Яндекс и Гугл бесит SEO бизнес по одной простой причине — все бабло в этом бизнесе идет мимо их карманов
Роман, не надо демонизировать Яндекс с Гуглом без необходимости. Будем честны: со стороны SEO на Яндекс и Гугл постоянно оказывается огромное давление. Все вплоть до проклятий и угроз. А надо как-то еще со спамом бороться. Ну как это может не бесить? :-)
Это не доклад Это «постер» Доклады не являются постерами, постеры не являются докладами Требования к качеству работы на настоящих сессиях и на постерных абсолютно разные
2 itman это не демонизирование) это всего лишь взгляд на бизнес с точки зрения бизнеса
>RomanAS А почему Яндексов и Гуглов не должно это бесить ? Особенно в период затягивания ремней и корсетов. СЕО-торговцы платными ссылками, получают прибыль с аудитории, часть которой могла бы идти «правильным путем» Адсенса и Яда. Вполне понятно, что пока слон большой и жирный, проблема глистов его мало волнует. Но вот неурожай, слон отощал, и на клубок мелких червячков, пользующих большого друга за здорово живешь, смотрит уже как на врага.
Слишком эмоциональный. Можно также сказать, что оптимизаторов бесит тот факт, что куча денег идет в карман Яндекса мимо их кармана. Истина, наверное, где-то посередине. Бесятся и те и другие, но от комбинации факторов. Кто-то на кого-то наехал (нахамил), кому-то службы поддержки ответила не адекватно (или вообще не ответила) итд итп… Гугль, например, не говорит какой процент бабла он отгребает на адсенсе, тут много факторов :-)
Все это порно про снаряд и броню.
Poster Session — это стендовые доклады?
2 ego 21.05.2009 19:31:25 Хотя доклады не являются постерами, а постеры тостерами, Вы все же не правы :) и этот наезд на яндекс не очень к месту :(
вообще-то, в Директ и Адсенс кучу клиентов как раз сео-конторы приводят. А большой бизнес привык руководствоваться не эмоциями, когда кто-то «бесит», а соображениями прибыли и долгосрочного развития.
По-моему плох тот СЕОшник, который не продаёт клиентам Директ. И плохо тот рекламщик, который не продаёт своим клиентам услуги СЕО. Деньги есть и там, и там. И там, и там их хватает. А поисковики просто пытаются навести порядок в своём огороде — понимая, что от СЕО никуда не деться, они хотя бы облагораживают некоммерческую выдачу. Радует, что наконец-то пошли на контакт, перестали раздувать конфликт и начинают развиваться в сложившихся условиях, а не стремятся эти условия переделать. Кстати, интересно было бы узнать, насколько мощными остались скачки роста продаж Директа после каждой смены поискового алгоритма… :)
Какой же это наезд на Яндекс? Яндекс делает неплохую работу по русскоязычному поиску, за это я его очень уважаю, причем тут «наезд» Просто настоящая публикация и постер (стендовый доклад) это две совершенно разные несоизмеремые вещи и я поправил человека, написавшего этот пост. Постер это обычно работа, отклоненная от главного потока, но в силу каких-то причин ПС решает предложить автору доложить ее в постерной сессии. Если автор понимает, что работу он может улучшить и опубликовать на настоящей конференции, он отказывается. Если понимает, что сказать нечего, то идет на постер. Обычно постеры считаются отрицательными пунктами в резюме, если вы не студент 1-2-3 курса.
Мы сразу подавали заявку на постер. От «главного потока» работу никто не отклонял.
Alter Ego с постерами, у вас какие-то странные идеи, ей-богу. Множество людей, которым не очень нужна самореклама (а выступление в большой аудитории именно реклама в первую очередь) любят стендовые доклады. На стенде есть отличная возможность поговорить с заинтересованными людьми и обсудить какие-то частные проблемы, которые не вписываются в вопросы/ответы (а подойти в частном порядке те же люди могут и полениться). И уж во всяком случае постер продуктивнее 10-минутного доклада на сессии.
Не знаю, как www 2009. Но на научных конференциях стендовые доклады делали, когда материала не хватало, а на международную конференцию нужно съездить: например, студенты-старшекурсники, собирающиеся в аспирантуру за рубеж, и аналогичные товарищи.
слушайте, а какая вообще разница, в каком статусе доклад? если постер — там всё фигня или неправда? или о чем тут спор?
извините, не с того аккаунта написал :)
» если постер — там всё фигня или неправда? » Нет. Просто аккуратные новости на главной странице лучше смотрятся. Есть понятия доклад и стендовый доклад.
Модератору просто во всем аккуратность нужна. Ну, никак постер за доклад не считается. Я когда оцениваю нового кандидата, постеры даже не считаю, хотя надо бы их минусовать. Кстати, не первый раз. Мне какой-то яндексоид тоже помню говорил про «статью на СИГИР», а потом когда я проверил эта «статья» оказалось постером, там была какая-то совсем примитивная линейная модель для новостей Интересно, есть ли у Яндекса достаточно инноваций, чтобы хватило хотя бы на одну статью (ср с Яху, Микрософт, Гугл)
>хотя надо бы их минусовать Какая реакция ожидается: «дрожу» или «ржунимагу»? У меня лично первая что-то никак не выходит.
Вообще, уже хорошо, что хоть что-то публикуется и исследуется. В условиях полного пофигизма к IR и прохладного отношения к науке в целом, это практически подвиг. И пинать несчастный Яндекс, что они там не делают результаты мирового уровня, с одной стороны, конечно правильно, но с другой стороны не слишком гуманно. Это ведь не Майкрософт с Гуглом, где исследовательские бюджеты составляют десятки (если не сотни) миллионов долларов в год и, которые могут позволить себе нанять лучших людей со всей планеты.
Кстати, много раз слышу про этот «исследовательский бюджет» и не могу понять о чем идет речь Большинства статей в SIGIR/WWW написано на «исследовательский бюджет» равный зарплате постдока (в Европе примерно 2500 тыс евро в месяц) и минимальное оборудование в виде парочки компьютеров У этих постдоков нет и в помине того, что есть у Яндекса, Гугла, Микрософота (датацентров, огромных текстовых коллекций и всевозможных данных извлеченных из них). Тем не менее как-то пишет без всяких особых «исследовательских бюджетов».
Раз уж мы говорим про Майкрософот с Гуглом, то там большинство статей пишут не постдоки получают они 2.5 тысяч евро в месяц.
Кроме того, постдоки работают в научном институте, получают зарплату, ведут исследовательску работу полный рабочий день и прочее. И только тогда они способны быстро написать статью и презентовать ее на конференциях? Естественно, что ничего этого у Яндекса нет. Может ли он себе это позволить — вопрос не ко мне. По моему опыту, все что делается в Яндексе — все очень сугубо прикладное и без особых излишеств, по-минимуму. Даже школа Яндекса, с моей точки зрения, не является излишеством. Яндекс просто пытается подготовить специалистов для работы у себя любимого. Не исследователями, а программистами-разработчикам. К науке, опять-таки, это не имеет почти никакого отношения.
Извините, а кто это — постдоки?
Постдок, это — должность, которую занимают ученые, защитившие PhD (получившие докторскую степень), и не дослужившиеся до чего-то более высокого. Низшая ступень в научной иерархии после студентов. :-)
как низшая? а бакалавры?
Я же пишу, что после студентов, в том числе студентов-докторантов (кандидантов :-).
>Большинства статей в SIGIR/WWW написано на «исследовательский бюджет» равный зарплате постдока (в Европе примерно 2500 тыс евро в месяц) 1. Про большинство как-то не уверен. Одно из эг справедливо заметило, что доля текстов из гигантов индустрии (в т.ч. поисково-провального MS) весьма высока :) 2 ( =считаем чужие деньги :). Да, 2.5. Плюс гранты и, по-советски говоря, хоздоговора. Тысячи четыре (евро, а того хуже, фунтов выходит) выходит, что позволяет работать, не дергаясь про прокормку и не уточнять порядок различия (20-ичный, 30-чный) своих доходов и доходами удаков из того же института/университета (ситуация чисто российская и правда не характерная ни для Европы, ни для того же Китая, где удаков ничуть не меньше, но вот как-то в науках :) живется им заметно хуже, чем у нас). У некоторых (не у всех!) в университетах получается заметно больше, в т.ч. больше, чем в индустрии.
Постдоки из приличных университетов на «хоздоговора» не работают Это какая-то российская практика. Постдок обычно сидит на один проект, который оплачивается NSF еврокомиссией или кем-то еще
MS дает весьма неплохое качество поиска для английского Несмотря на то, что на рынок они вышли совсем недавно, а поисковый отдел в Микрософт сравним по размеру с поисковым отделом Яндекса. Просто рынок уже поделен, и почти невозможно добиться выигрыша в аудитории предлагая тоже, а не гораздо лучшее качество продукта.
«Просто рынок уже поделен» Есть еще вопрос маркетинга.
itman А при чем тут бюджеты к «нанять»? Лаборатории Яндекс под Сан Франциско предлагали экстра-приличные зарплаты и тем не менее никого из звезд не наняли. Просто деньгами вы сильных ученых или разработчиков не купите.
Экстра-приличные это сколько? :-) Кроме того, я уверен, что этих людей не для исследований нанимали и публикаций на WWW2009, а для пиара и IPO. Но я говорю про исследовательский отдел в целом. Чтобы Яндексу СЕЙЧАС можно было публиковать действительно сильные работы, нужно было этот исследовательский отдел лет 10 кормить, холить и лелеять. Всячески поощрять публикации и давать возможность делать исследования. Очевидно, что ничего такого себе Яндекс позволить не мог.
> Постдоки из приличных университетов на «хоздоговора» не работают Извините, у меня ассоциации с “наши люди в булочную на такси не ездят” (я, правда-правда, не обидеть хочу, просто такая ассоциация :). Я не знаю, как оно в “приличных университетах”. К примеру, в Британии академический IR — это Glasgow U.. Queen Mary U. или Open U., но никак не Oxford или Cambridge(универ, не MS Cambridge). К тому же я говорил, что ~2.2 килофунта безнапряжно превращаемы в ~3.5, а вовсе не в 35.
itman русский студент из Голландии в прошлом году опубликовал три статьи на SIGIR сразу И это все без всяких «лелеять, холить 10 лет», средств и датацентров. Это как разруха, тут все дело в голове, а не датацентрах и деньгах .
Бузик да никто не превращает эти 2.2 килофунта в 3.5 Это Вы видимо по-российской практике судите, может по своей левой конторе в Австралии, не подрабатывают постдоки на левые проекты.
Опс, простите за Австралию, перепутал вас с товарищем Бачеком, имена похожие.
Естественно, что ничего этого у Яндекса нет. Может ли он себе это позволить — вопрос не ко мне. По моему опыту, все что делается в Яндексе — все очень сугубо прикладное и без особых излишеств, по-минимуму. А чего этого нет у Яндекса? Статей? А почему они у него должны быть? Зачем Яндексу «публиковать сильные работы»? От амбиций? Чтобы поощрять сотрудников? Слабые мотивы, вообще-то. Вот IBM постоянно массово публикуется, раз в год объявляет об очередном создании ИИ, имунной системы компьютера и т.п., и что? Может, у московского метро тоже маловато научных публикаций? По-моему, вы жанры смешиваете. Яндексу нужно долю рынка удержать, а не искать «сильных», а скорее писучих людей, чтобы они публиковались в рабочее время. Чтобы Яндексу СЕЙЧАС можно было публиковать действительно сильные работы, нужно было этот исследовательский отдел лет 10 кормить, холить и лелеять. Как вы отличаете «сильные работы»? Если студент, аспирант или постдок напишет какую-то статью, которая выглядит умной и инновационной, то из чего следует, что предложенный подход заработает в реальной жизни? Судьи кто? Ведь для статей основное — сам факт публикации N статей в год, это такая валюта у постдоков и профессоров. Я понимаю публикации в химии там или физике, их можно проверять и применять. А где применять «сильную статью» про IR на SIGIR? В трёх поисковых компаниях в мире? Тогда эти статьи имеют второе применение — служат резюме для подачи в Гугл. А куда ж ещё. Мне вообще кажется что в поисковой отрасли, в этом самом IR, никакой большой науки вообще нет, бльше прагматика с небольшим количеством арифметики, всё как раз прикладное, включая тот самый Pagerank и т.п. Ну, есть какие-то методы оптимизации, статистики. Ну да. Успех-то здесь не от науки.
1. ego с одного постдока ровно на один проект : 1) про левые конторы, левые проекты, откаты (гордо называемые распилами) — не ко мне, 2) вы не засечали, что есть места выполняющие больше проектов и имеющие больше грантов, чем число сотрудников, включая аспирантов? 3) а что, вашего знакомого тоже зовут Николай Евгеньевич? 2 ашманов — я так понял, вывсячески порицаете ребят из яндекса, сделавших постер? Да не убивайтесь вы так :)
Вообще, странное дело, я защищаю Яндекс. Альтер, у меня уверенность, что кто-то в этой дискуссии — постдок из Голландии. Ну, что Вы как маленький, прямо. Я же еще раз говорю, постдок наукой занимается — Яндекс он сугубо прикладной. Приходит, например, Сегалович или кто другой к Воложу и говорит: нам надо научную публикацию, чтобы все видели какие мы инновационные и прочие. А Волож ему отвечает: Илюша бабло и так капает, давай мы лучше блоги сделаем. Вот и вся инновация. Игорь, мне кажется Вы упорно мешаете мухи с котлетами. Во-первых, есть публикации с уклоном в эмпирику, а есть с уклоном в алгоритмику. Но Вы последних, видимо, просто не читаете. Поэтому считаете, что их совсем нет, как метро в Париже. Результаты этих публикаций могут применяться не только в текстовом поиске, но и, например, в молекулярной биологии. Да что там говорит, алгоритмы текстового поиска ваяют даже контракторы для министерства окружающей среды США. Конечно, вопрос внедрения публикаций в жизнь непростой и неоднозначный. Да, большая часть публикаций мало кому нужное унылое говно. Да профессорам надо публиковаться много. Но изюминка-то тут в том, что звезды публикуют много хороших публикаций и их за это любят и знают, берут возглавлять отделы поиска, как Уди Манбера или Баеза Йайтеса, а посредственные прозябают. Ну и напоследок про исследовательские отделы, который Вы Игорь так презираете (видимо, на примере советской науке). Яндексу, Гуглу и Майкрософту НУЖНЫ люди, которые знают как делать инновационные проекты, такие поиск по изображениям, распознавание речи и пр… Проблема-то в том, что такие люди все обычно с академическим уклоном, а не программисты. Для них среда нужна, без среды они зачахнут. А среда — это дело дороге. Люди должны постоянно читать и писать, быть в курсе тенденций, а не блоги программировать, а в свободное время изредка почитывать литературу.
Эмпирика тоже важна, но ее значимость, конечно же, сложнее оценить чем алгоритмику.
Коля, Игорь научных сотрудников презирает, как сообщество людей, протирающих штаны и занимающихся всякой фигней.
itman Вы зря принижаете Яндекс. Яндес очень хочет вносить фундаментальный вклад. Именно из этого желания зародилась Школа Анализа Данных. Там читает лекции статистик и теорвещик Ширяев, а не программист Вася, который владеет перлом. И Райгородский со своими людьми и весьма немалым бюджетом, занимается вовсе не программирование поиска по блогам.
Но-но, Бацека с его птичкой попрошу не обижать :-)
Проверка алгоритма на сформированных вручную тестовых выборках доказала его высокую точность (95%) и эффективность (93-96%) Одна из больших проблем подобных статей это неверифицируемость результатов. С этим решили бороться на SIGMOD (http://www-rocq.inria.fr/~manolesc/PAPERS/SIGRecRepeatability.pdf), ученые могут публиковать исходный код и данные, используемые для проверки алгоритмов Надеюсь со временем в WWW/SIGIR сообществе займутся тем же
Альтер Эго 24.05.2009 01:10:14 Я ничуть не принижаю Яндекс, наооборот, хвалю его, как весьма практичную компанию. По поводу того, что Яндекс хочет внести фундаментальный вклад, а не просто обучить сотрудников основам магии, хочется верить, но… замена Интернет-математики на конкурс для программистов и отсутствие значимого количества публикаций, наводит меня на мысль, что не очень-то и хочется. Я, конечно, мог бы предположить, что Яндекс просто не может совсем и, что у него нет для этого ресурсов, но, очевидно, это не так. Скорее всего, не очень хочет. Или, скорее всего, какие-то люди в Яндексе хотят, а какие-то нет.
2 itman > игорь презирает я понимаю, что такой «солипсизм» (из нашей деревне никто не был в Лихтенштейне, значить и никакой лихтенштейны нет и не нужна она) возможен, хотя и потешен. но я не очень понимаю, когда типа-защищая яндекс (ашманов в своем посте защищает?) человек вместо защиты обсирает. правда, какие-то неустранимые проблемы с логикой. или передергивание — отличие всех, кто возле власти трется (в надежде ;)
Вы зря на Ашманова напали Более умного, яркого и преданного пропонента Яндекса, чем Ашманов Вам не найти
> Проверка алгоритма на сформированных вручную тестовых выборках доказала его высокую точность (95%) и > эффективность (93-96%) Молодежь, сразу видно. Ребята, представляя алгоритм впервые, надо называть цифры полноты и точности в 85-90 %. Через год — 89 — 92 %. А 95 % и полноты, и точности называть не надо вообще никогда, ибо на практике они всё равно недостижимы. Ничего, со временем научитесь писать научные статьи.
Более умного, яркого и преданного пропонента Яндекса, чем Ашманов Вам не найти А в соседнем треде меня ругают за нападки на Яндекс, и лично Сегалович говорит. что ему я отвратителен и велит заткнуться. … отличие всех, кто возле власти трется Это про меня, что ли? Ну и как же я это делаю? Вы даже не поняли, что я сказал — то ли я защищаю Яндекс, то ли «обсираю», и решили, что проблема с логикой у меня, а не у вас. А проблема у вас: вы считаете, что можно либо защищать, либо обсирать. Эта ложная дихотомия не даёт вам ничего понимать в реальном мире. А, нуда, ещё вы. как я понял считаете. что всё, что тут говорится, надо объяснять интересами. Власти, Яндекса и т.п. Вам нужно протереть своё закопчённое стекло. Я говорил дословно следующее: здесь заняли очень странную позицию: хорошо, когда интернет-компания много публикуется. Дальше стали обсуждать, дураки ли в Яндексе, могут ли они претендовать на что-то кроме жалкого постера и т.п. Ребята, у вас основная посылка неверна. Ничего не показывает количество публикаций относительно качества интернет-компании. Академический мир и мир реальных массовых проектов между собой почти не связаны. Не может Яндекс много публиковать. а если какой-нибудь Гугл много публикует, это значит, скорее всего, что у него завёлся жирок, который он сейчас в эпоху кризиса и почистит. Много ли публикаций у Фейсбука и зачем они ему? И трансфер мозгов из академического мира в прикладной происходит обычно в виде чтения статей и попыток их применения, либо — как у Гугла. Нашли идею — сделали стартап. А не поехали на SIGIR с нею. Если есть запал делать, а не публиковаться. Изредка учёного берут в какой-нибудь Microsoft Research, где он прямо в интервью говорит «у нас полностью академическая атмосфера, за одним отличием — много бабла» (это реальная цитата из Мирвольда). Ну и результаты потом соответствующие — никакие. И опубликовались в урезанной форме типа «The Anatomy of ….» для маркетинга, а не для PhD. Да, у Яндекса есть амбиция публиковаться и быть научным центром. На мой взгляд, она скорее вредна, но это их проблема. Если для маркетинга и недорого — нормально.
Игорь, из фейсбука ненулевое количество публикаций («как наши мемкэшеды обрабатывают 10 миллионов транзакций в секунду») и они достаточно любопытные, когда пробегают мимо — я с удовольствием читаю. Помимо маркетинга, это должен быть еще неплохо работающий способ найма технарей.
> Обычно постеры считаются отрицательными пунктами в резюме, если вы не студент 1-2-3 курса. Смотря что за конференция. На нормальных конференциях типа той же WWW стендовые доклады нередко бывают интереснее сессионных. > В условиях полного пофигизма к IR Это в «Яндексе» полный пофигизм к IR? Смешно.
2 ашманов По существу: > Вам нужно протереть своё закопчённое стекло Спасибо за очередное и, прямо скажем, с неожиданной стороны, напоминание. Уже лет пять все собираюсь сделать очки. И все никак :( Не по существу: > если какой-нибудь Гугл много публикует, это значит, скорее всего, Я так понял, это очередные фантазии на тему как-там-у-них. В Google человек просто не имеет права печататься на “неотвлеченные” темы. Откуда практически ПОЛНОЕ ОТСУТСТВИЕ IR-работ из Google. PS Надеюсь, вы все же позволите ребятам из яндекса делать работы :) и не станете — не в период затишья, а как раз после очередной нормальной работы :) — убеждать, что отсутствие работ на полноценных мероприятиях [желательно, в комбинации их с наличием на мухосранских] есть главный предмет мужской гордости ;) Не будьте столь жестоки :)
Лёха, ну во-первых, какая это наука? Инженерия. Во-вторых, чем это помогло Фейсбуку — не умение обрабатывать зиллионы запросов, а рассказ об том всему миру? Да, в смысле найма и удержания специалистов (которые могу себе льстить, что они вот ещё и выступают/публикуются) — наверно, полезно. Ну так это пиар такой. Один из видов. Вспомни мотивы. по которым в Яндексе разрабатывались Спамооборона, Яндекс-Сайт и ещё кое-какие отчуждаемые программы. Они были простые — хотелось чувствовать себя также и разработчиком ПО. Это же круто. А бизнесу это было просто вредно — отнимало ресурсы, размывало фокус. У Гугла с его поисковиком — та же фигня наверняка, тоже чистые амбиции. И тоже результаты близки к нулю в сравнении с основным бизнесом. Ну вот и со статусом «научного лидера», «центра исследований» — то же самое. Ну если пиар-люди одобряют, это недорого — почему нет.
Инженерия, конечно. Но тоже интересно. У фейсбука должны/могут быть еще публикации по поведению массовой аудитории, но это мимо меня идет, я на всякие high-performance вещи подписан, а на массовую психиатрию — нет. Как инструмент найма («они там не только гламурные менюшки рисуют») должно работать, кроме того это демонстрация «технологического лидерства», которую прекрасно можно пиарить. Кроме того, публикации — прекрасный маркетинговый инструмент. Работает, конечно, если есть гики (и журналисты), которые оказываются точкой влияния на массовую аудиторию. Вот PageRank — прекрасный ведь пример, на практике сегодня — уже работает плохо, однако в мозгах засел. Байес вот тоже.
Это в «Яндексе» полный пофигизм к IR? Смешно. Яндекс — это всего лишь Яндекс, а не вся Россия.
> ПОЛНОЕ ОТСУТСТВИЕ IR-работ из Google. Да, кстати, публикаций из Гугла совсем немного, особенно по сравнению с валом статей из Майкрософта или Яху, например. При том, что число исследований, проводимых в Гугле, явно не меньше, чем в том же Яху, просто предназначены они для внутреннего пользования.
> Яндекс — это всего лишь Яндекс, а не вся Россия. Т. е. уже не полный пофигизм все-таки? Есть лучи света в темном царстве? И что не так с IR в России? Разве мало людей им тут интересуются? По ощущениям — совсем немало.
2 itman Судя по явлению iRman, твой, Леня, itman, оказывается, — бренд. Скоро it_man и itman_ полвалят (с IR-фальсификатом?)
> …ну во-первых, какая это наука? Инженерия. Технические науки — тоже науки. Пишутся же технарями диссертации с названиями типа «Модели, методы и программное обеспечение для построения объединенного интернет/интранет сервера организации».
Ладно, хорошо, мои извинения iRman’у. Хотя выбор чрезмерно схожего ника, по-моему, не есть комильфо.
Технические науки — тоже науки. Пишутся же технарями диссертации с названиями типа «Модели, методы и программное обеспечение для построения объединенного интернет/интранет сервера организации». Я в курсе. Я сам диплом на Мехмате защищал на тему «Об асферических копредставлениях подгрупп свободной группы и одной проблеме Филипа Холла» и статьи в журналах были такие же, по теории групп, а вот диссертацию на ктн — уже на тему «Разработка и практическая реализация промышленных лингвистических систем на примере грамматического и стилистического корректора ОРФО» или что-то в этом роде. Так вот работ первого рода ждать из интернет-компании глупо (они будут частным делом сотрудников), а второго рода — тоже не очень осмысленно, потому что копирайт, коммерческая тайна и пр. В любом случае, чаще всего самых интимностей там точно не будет. Будет что-то в стиле «ну, ква». Следовательно, сами работы будут для того, чтобы греть эго сотрудника, а иногда и руководителя компании («у нас очень умная компания»). Если это входит частью в построение пиар-имиджа «умной инновационной компании» — нормально. Ничего плохого в этом нет. Но тогда разговоры в стиле «а вот у этих много работ, а у этих мало» означают, что вы повелись на эту пиар-компанию. Есть ещё вопрос патентов, он совершенно по-другому устроен, по-другому связан с бизнесом и мотивации там другие, но это отдельный разговор.
По поводу публикаций в Гугле — весьма неоднозначно Из моей области, несколько лет назад в Гугл в ушел один из лучших и продуктивных ученых в области machine learning Томас Хофман. Сейчас он публикуется заметно меньше, чем во время своего академического периода, но что-то публикует, написал весьма неплохую книгу с Бакиром. Ученый из Гугл вместе с ученым из Яхуу! написал и опубликовал Search Engines: Information Retrieval in Practice, W. Bruce Croft, Donald Metzler, Trevor Strohman. Весьма важная публикация для подготовки молодых ученых, отлично совместима с другой новой отличной книгой по ИР, написанной Маннингом. Обе заменяют весьма устаревшую книгу Байеза-Йетса. А вообще этот список довольно большой (например, гугловский Бар-Йосеф делает много важных работ по оценке индекса поисковых систем) http://research.google.com/pubs/InformationRetrieval.html http://research.google.com/pubs/HypertextandtheWeb.html
Во-вторых, чем это помогло Фейсбуку — не умение обрабатывать зиллионы запросов, а рассказ об том всему миру? А вот это неплохой и непростой вопрос Фейсбук рассказал по всему миру. Микрософт, Яху и Гугл рассказывают и делают еще много чело полезного. Гугл поддержал талантливых студентов Программа им Аниты Борг для талантливых студентов в информатике http://googleblog.blogspot.com/2009/05/announcing-2009-anita-borg-scholars-and.html Просто поддержка лучших студентов в информатике http://googleblog.blogspot.com/2009/05/best-and-brightest.html тем же занимаются ИБМ, Микрософт, Яху! Микрософт имеет целых четыре программы поддержки студентов просто талантливые студенты, женщины, меньшинства, и студенты с проблемами здоровья http://www.microsoft.com/college/ss_overview.mspx Ашманов спрашивает зачем тратить деньги не на бизнес? Зачем «вбухивать» драгоценное «бабло» на что-то помимо компании? Есть ли ответ на ашмановский вопрос? Мне кажется
к предыдущему помимо студенческих програм Микрософт поддерживает аспирантов в Европе http://research.microsoft.com/en-us/collaboration/global/apply-europe.aspx Микрософт оплачивает полностью деньги за обучение и пр Неужто в Гугл и Микрософт тахие лохи, что тратят зря деньги?
Также Яндекс поддерживает школу анализа данных, организует лекции. Ашманов, все зря? Все они — Яндекс и прочие компании — делают полезное дело. Каждый доллар в вложенный в студентов, обучение обернется в большее число талантливых студентов, ученых в информатике, а значит новые знания, стартапы, новые идеи, лучшие сети, поиск, базы данных, оптическое распознование образов, итд итп Выиграет все общество, а значит и Яндекс, и Гугл, и Микрософт.
Понравилось Аккуратный подход к проблеме платных ссылок (и отношений оптимизаторов с поисковой системой) демонстрирует следующая фраза: «Главная задача алгоритма — выявление непосредственно платных ссылок, а не сайтов, их продающих и покупающих». Сами авторы оригинальной статьи писали этот комментарий на роем? Себя не похвалишь ….
Ашманов спрашивает зачем тратить деньги не на бизнес? Зачем «вбухивать» драгоценное «бабло» на что-то помимо компании? Есть ли ответ на ашмановский вопрос? … Также Яндекс поддерживает школу анализа данных, организует лекции. Ашманов, все зря? Нет, я не об этом спрашиваю. Я вообще у вас ничего не спрашиваю, мне у вас нечего узнавать, у меня своё мнение имеется. Я говорю о том, что беспонтовые наезды на Яндекс в этом треде устроены так: Яндекс — лохи, потому что мало публикуются и даже на SIGIR их пустили со стендовым докладом постоят, типа носом не вышли ещё. Это детские разговоры, не по делу. Я же говорю, что коммерческую компанию нужно оценивать по продукту, а не по количеству публикаций. Это если вообще вставать в позицию категорической оценки, которая здесь очень популярна: Яндекс лохи, Гугл рулит. Джобс рулит, МС империя зла и так далее. Что касается улучшения внешнего мира и пользы публикаций для всех, это совершенно другая тема. Опять-таки, компания меняет мир к лучшему в первую очередь своим продуктом . Это легко проверить от противного: если основной продукт дрянь, какое значение имеет количество публикаций? Можно, конечно, рассматривать косвенное влияние, ну вот публикации, например. Тогда, если опять-таки хочется оценок, найти лохов и жлобов, нужно писать: компания Х — жлобская компания, она не рассказывает миру о своих изобретениях. Заодно можно обсудить и благотворительную деятельность интернет-компаний. Боюсь только, что тут тоже уже давно намазан толстый слой пиара, и мы опять начнём спорить с объектами пропаганды «инновационных компаний», «этичных компаний», «креативных компаний», борьбы за спасение китов от СО2, езду на электромобилях и приведение собак в офис, и так далее.
Не было никакой нападки на Яндекс. Просто указали неточность в этой новости. Игорь, ну что за паранойя тоталитарной секты?!. Это все равно, что Вас за мнение о посте про насилье над немками обвинять в нападках на Яндекс.
Я не член этой секты. У меня своя. Эта секта — мой всегдашний конкурент. Просто раздражает, когда говорят не по делу и мусолят мифы.
> Я вообще … ничего не спрашиваю, мне … нечего узнавать, у меня свое мнение имеется (!) > Я не член этой секты. У меня своя. А Наполеон у вас где лежит?
Ашманову То, что яндекс успешная компания с хорошим продуктом никто не отрицает. Дело в том, что без серьезных исследовательских работ компания напоминает успешного бизнесмена ПэТэУшника. Это само по себе не плохо, но является предметом нападок любящего поглумиться сообщества умников со степенью. Еще приходит на ум сходство с оборотистым и малообразованным фермером, которого не принимает в городе никчемное светское общество. Короче, яндексу нужно где-то развести/купить себе диплом о высшем образовании и, наконец, почувствовать себя человеком :-D
А Наполеон у вас где лежит? Наполеон у меня в комоде лежит, рядом с шарлоткой.
umkalive: я понимаю, если вести речь о торговле, там можно быть «тупым, но оборотистым» и жить на эти «2 процента в месяц», но если вы занимаетесь бизнесом, сама суть которого быть умным, или smart, как модно говорить, о чем вообще речь? Как можно выглядеть тупым, делая интеллектуальный продукт?
Делать интеллектуальный продукт и выглядеть тупым — совершенно несложно. Ну, например, ввести регистрацию по SMS, иметь интерфейс в духе прошлого века и так далее.
Главному Слово «smart» очень подходит сегодняшнему Яндексу, так как в отличие от «clever» имеет ряд других значений, типа ловкий, смекалистый и пр. Сегодня, правда, понятия «умный» и «ловкий» сливаются в сознании пипла, но было время, когда один уважаемый мною профессор утверждал, что «хитрость — это от недостатка ума».
Интересно, считаете ли вы тупым Бобби Фишера, на основании того, что он был нелюдим и статьи про дебюты не писал?
Синодову интеллектуальным является не продукт, а процесс производства Продукт же должен быть простым Это так же как в случае с кока-колой. Продукт простой, а производство сложное. Или вон с моим мерседесом. Очень просто вводить, отлично слушается руля, мягкий и быстрый тормоз, продукт простой, а за этим сложное и интеллектуальное производство В случае простого продукта, большинство пользователей понятия не имеют об интеллектуальности производства. Чем умнее производство, тем проще и не интеллектуальнее продукт. Вспомните какими были «интеллектуальными» поисковики лет назад, хотите найти рисунок — ищите так, навигациооный сайт — ищите по-другому, а сейчас поисковик сам все делает. Продукт «упростился», а производство усложнилось. Ню пользователи этого не видя Делая «простой» с точки зрения продукт, вполне можно выглядеть тупым с точки зрения пользователей Я недавно своему однокурснику, специалисту по написанию баз данных для коммерческих предприятий, у него куча сертификатов, САП Р-3 и прочее пытался рассказать как работают базы данных «внутри», индексы, распаралелливание, транзации. Он не мог поверить, что это сложно, и что в Оракле работает больше, чем 10 человек, «ведь это так все просто и быстро и тривиальное работает в моих приложениях»
К Alter Ego: я неправильно сказал, имел в виду то, что вы описали — интеллектуальный процесс производства. К Антифишинг: про Бобби Фишера огромное количество информации, у него много интервью, возможно, вследствие большей «зубастости» американских журналистов. Хотя да, никакой «общественной нагрузки» в виде редактирования 64 ШО у него не было, это правда. Зато книги писал про тюрьмы в Штатах и выступал с заявлениями про несуществующий холокост — это может быть даже сложнее.
опечатка 100 инженеров
Мне кажется часто спорящие здесь впадают в крайности. Мы всегда пытались по мере сил писать статьи. Яндекс пишет статьи примерно потому же, почему существует и РОМИП и RUSSIR и ruscorpora.ru и ШАД и Интернет-Математика. Это ОЧЕНЬ полезно, это и технопиар и привлечение новых сотрудников и наш имидж, да и вообще повышает температуру в отрасли. Конечно того что мы делаем недостаточно, нужно больше. И действительно есть, как пишет Игорь, объективные причины, почему это трудно делать в производственной компании. Будем думать, как стимулировать людей писать больше. Еще от Кирилла (автора статьи) комментарий к дискуссии > Мы сразу подавали на постер, никто работу от главного потока не отклонял. > Наоборот, нас на конференции спрашивали, почему мы не подали на доклад, > ведь на основе данной работы можно сделать два хороших доклада. > 1) У нас нет времени и возможности тратить дополнительные усилия на > подготовку «полноценных» докладов/статей. > 2) «Полноценный» доклад подразумевает гораздо более полное описание алгоритма, > в чем мы не заинтересованы. > 3) Для наших целей, вполне достаточно стендового доклада. Прокомментирую еще конкретные реплики (не все, но те, что заметил) > (анонимно) Мне какой-то яндексоид тоже помню говорил про «статью на СИГИР», > а потом когда я проверил эта «статья» оказалось постером, там была какая-то > совсем примитивная линейная модель для новостей У нас никогда в жизни не было постера на SIGIR. К сожалению не могу в силу анонимности автора этой реплики, утверждать уверенно, но этот Яндексоид похоже был я. Я когда говорю, делаю это довольно быстро. Иногда меня трудно понять. Я сначала говорил про то, что мы как-то раз неудачно подавали большую работу про Новости на SIGIR, а потом про то, что мы не часто пишем большие статьи, обходимся постерами, правда на конференции первого ранга (что, замечу специально для постероненавистников, по уровню и дальнейшей судьбе в видимости и цитируемости примерно соответствует статье на конференции второго-третьего ранга) У анонимного слушателя эти два факта как-то склеились в голове. Ну а про то, что он «потом проверил», он здесь слегка сочинил, тем более что слышал он нечто близкое лично от меня, так что проверять как бы необязательно. > (Ashmanov) в поисковой отрасли, в этом самом IR, никакой большой науки вообще нет Игорь, по-моему, как раз тут и есть наука. :) Все бурлит, куча публикаций именно про поиск в лучших конференциях по Computer Science. Ну, то есть, если в поиске нет науки, то вся информатика, сиречь computer science, тем более не наука. > (анонимно) поисковый отдел в Микрософт сравним по размеру с поисковым отделом Яндекса Я слышал, что побольше. Как вы измеряете? > (itman) замена Интернет-математики на конкурс для программистов Леонид, я тебе в твоем дневнике кажется уже отвечал, что мы намеренно пытались снизить планку для повышения массовости и вовлечению большего числа новых людей, как бы «ACM-щиков». Старый формат, как нам кажется, во-многом исчерпал себя.
Ага, у Яндекса есть другой постер, но не SIGIR, a WWW 2006 http://portal.acm.org/citation.cfm?doid=1135777.1135950 > Наоборот, нас на конференции спрашивали, почему мы не подали на доклад, > ведь на основе данной работы можно сделать два хороших доклада. Я отношусь с симпатией к авторам статьи, но с трудом могу представить, чтобы на какой-то конференции к подходили к стенду и спрашивали докладчиков «почему же вы не сделали полноценную статью». Формат стендового общения совсем другой. Могут попросить опубликовать код и разместить в сети данные, могут попросить опубликовать более полный доклад в arxive, но вряд ли будут спрашивать про «почему же не полноценный доклад» > 3) Для наших целей, вполне достаточно стендового доклада. Это какая-же цель? Сегалович приводит список целей Это ОЧЕНЬ полезно, это и технопиар и привлечение новых сотрудников и наш имидж, да и вообще повышает температуру в отрасли. Ни для одной из них стендового доклада недостаточно Его достаточно только для одной цели Сьездить на халяву за счет компании в Мадрид. Тогда » 3) Для наших целей, вполне достаточно стендового доклада. » Именно для этого пишут стендовые доклады плохие студенты — прокатится на халяву, особенно если конференции на Гавайах или в прочих интересных местах. Я слышал, что побольше. Как вы измеряете? Размер никогда не узнаешь, но вроде сотрудники и той и другой компании говорят про сотню с чем-то
как бы «ACM-щиков» Новый формат хорош, но и старый был очень хорош. Они просто разные. У вас было опубликовано много хороших статей,поддержанных Яндексом. Жалко, что в этом году этого нет. А эти соревнования это совсем другой формат, расчитанный на совсем других людей. Кстати, уже конец мая, довольны ли соревнованиями? Принес ли кто-то новые идеи или выигрыши за счет долговременной настройки параметров?
Уважаемый Аноним, который про Гавайи. Ослепительный блеск вашей мудрости, в частности умение (одним пальцем левой ноги?) писать постеры для курортных поездки на Гавайи и статьи для более серьезных целей, заставляют меня думать, что если вы снизойдете до Яндекса, вы с легкостью сможете стать у нас директором по науке. Нам остро не хватает ни ваших умений, вообще, ни такого человека как Вы, в частности. Без шуток, я прямо сейчас открываю для вас вакансию. Приходите, смиренно и трепетно ждем.
Программисту Ваша высокомерная уверенность в том, что всякий смертный мечтает работать в яндексе вряд ли работает на имидж компании. Вам есть с кого брать пример. :-D
Гы, а Сегаловича Роем реально заводит. Юра, мои поздравления!
Это не Роем в моем лице, это читатели Роема, мнение которых расходится с мнением Ильи Я не могу вспомнить, когда Илья отвечал на роемовские тексты
А, нет, могу, но не буду. Вроде бы слово «асессор» я писать с тех пор научился
Уважаемый Илья Валентинович спасибо огромное, Ваше предложение — большая честь для меня. Но я человек очень технический и мне интересно получать новые результаты и писать код, а не протирать штаны на заседаниях директоров и прочих балаболов. Пока я молодой, я буду совершенствовать себя технически, синекуры меня не интересуют.
Вот так всегда, начинаем про сео-ссылки, а заканчиваем «конфронтацией» бизнеса и науки ) Браво, Рунет!
iRman, По поводу лучей в темном царстве, спорить лениво, достаточно посмотреть, что Илья отвечает про Интернет-математику. Сегодня исчерпается Интернет-математика, завтра школа анализа данных. Люди, интересующиися IR и поиском, конечно же, имеются. Но они а) почти не делают ничего мирового уровня б) почти не поддерживаются на уровне текущей вузовской системы в) компании Яндекс и Гугл в них чисто теоретически заинтересованы, но им больше нужны специалисты писать фултайм на Перле. Ну, такая у них тяжелая жизнь, они этим деньги зарабатывают. Я здесь так аккуратненько ставлю почти, но рука очень порывается их зачеркнуть.
компании Яндекс и Гугл в них чисто теоретически заинтересованы, но им больше нужны специалисты писать фултайм на Перле. А чем занимаются московский и питерский офис гугла? Поиском или чем-то еще?
>К сожалению не могу в силу анонимности автора этой реплики, утверждать уверенно, но этот Яндексоид похоже был я. Я > когда говорю, делаю это довольно быстро. И Не помню, может это были Вы. У меня плохая память на лица, по Вашему юзерпику не могу распознать. А Вы не говорили, что сделали работу по оценке индекса аналогичную Бар Йосефу, но не успели ее опубликовать?
Говорил. Я говорил, что обе наши попытки пгпасть на СИГИР с большими статьями оказались неудачны. Одна про стат.значимость оценок в условиях недооцененности и протухания оценок и вторая про оригинальный способ кластеризации новостей. И там и там не хватило языка и логики изложения. А во втором случае еще и бича СИГИРА доказательной эвалюации. Кто тут не знает могу рассказать, что ровно по этой причине на СИГИР не взяли статью Пейджа и Брина про Пейджранк и они были вынуждены пересабмиттить её на WWW. Прошлой осенью была мощная дискуссия на форуме сигира. Крофт жжёг не подеццки. Суммируя модно сказать что недели спешных усилий пары неанглоговорящих пусть даже гениал ных русских разработчиков без опыта доказательного гладкописания для Сигиров на инглише — недостаточно. Нужен месяц для полировки и вылизывания. А его просто нет никогда
На сколько я понимаю платные ссылки бывают разные, а именно платные ссылки для манипуляции результатами выдачи поисковиков и платные ссылки для получения трафика. Классифицирует ли такие ссылки Яндекс? Покупными ссылками для получения трафика являются также ссылки купленные через директ и адсенс, при этом и Яндекс и Гугл стараются подбирать площадки подходящие по контенту для этих платных ссылок. Интересно учитываются ли эти ссылки при формировании поисковой выдачи в Гугле или в Яндексе. На мой взгляд, для улучшения выдачи поиска их тоже стоит учитывать.
Вообще, идея, та что лежит на helpcontext.ru безусловно хороша.
Только вот «некоммерческая» выдача у гугла все равно лучше…
Только вот «некоммерческая» выдача у гугла все равно лучше… откуда такие данные?
У Яндекса теперь много википедии в выдаче на первых местах. Яндекс тоже хорошо обслуживает некоммерческие вопросы!
Все же статья Брина немного невписывалась в СИРИР тех времен. ИР сообщество очень консервативное и нововведения веба всегда воспринимало с опаской, особенно в конце 90х, поэтому неклассические нетекстовые методы тогда не проходили на СИГИР за редким исключением. СИГИР стал вебовым примерно с 2001-2002. А гениальная статья всегда пройдет, даже если английский не гладкий. Тем более я не могу понять Ваших проблем с английским. Месяц усилий это два-три дня усилий технического переводчика. Сколько стоят в России день-два технического переводчика? Долларов 500? Если переводчик не силен в теме статьи, нужен дополнительный день, чтобы заново пройти через статью и прилизать термины. Никаких «месяцев усилий» не нужно. Я с трудом могу себе представить, что такая огромная и денежная мегакорпорация как Яндекс не может себе позволить 500 долларов на переводчика, если она посылает на туже конференцию сотрудников без статей, которые на поездку и развлечения тратят гораздо большие деньги (Гунин и пр).
2 лондонер Заранее прошу прощения — этим материалом я владею ненамного лучше ашманова, болтающего про ВАЛ!!!:) публикаций “из какого-то Гугла”. Тем не менее, штука прикольная, возможно, кого-то удручающая. Поэтому пересказ: WWW задумывался как “отвечающая запросам индустрии, практически значимая” АЛЬТЕРНАТИВА SIGIR’у, “погрязшему в отвлеченном теоретизировании” (мотивация понятная и что-то в этой дискуссии напоминающая, не правда ли) Однако, со слов рассказчика, буквально за несколько лет “мы” (университетская публика) потеснили “их” (индустрию) и обжили пространство WWW. Или, как сказал бы лично мотивированный нелюбитель ученых, “загадили и WWW”. И сегодня WWW вполне брат SIGIR’у, хотя и не однояйцевый. Я это к тому, что IR-ученые, они (мы) как кролики (а того хуже, как тараканы), Впрочем, у них (нас) все же немного другие поводы для гордости — не отсутствие, а наличие, например, работ (правда, я сам последние месяца три типа беспробудного enjoy life, впрочем, жизнь она разнообразна ;) PS Надеюсь, этим постом я никого не обидел. Он про дрейф индустриальной альтернативы, не более.
2Лондонер > неклассические нетекстовые методы тогда не проходили на СИГИР за редким исключением нет конечно. факторы тут СОВЕРШЕННО не при чем. я понимаю что вы не читатель а писатель, но все-таки ПОЧИТАЙТЕ дискуссию на sigir-форуме и ответы Крофта прошлой осенью. Там были и возмущенные фанаты Брина и сторонники жесткой линии. Крофт и СЕЙЧАС бы зарезал эту работу. Понимаете?! Несмотря на коммерческий суперуспех и суперпиар в научной среде (которому поддаются даже такие независимо мыслящие ученые как вы). Дело как в математическом формализме/академизме СИГИРа, так и, главное, в жестких требованиям к эвалюации и доказательной силе работы. > а гениальная статья А кто сказал что наши статьи была гениальные? Я? Перечитал себя, не нашел. Я сказал только что разработчики гениальные. А гениальные разработчики далеко не всегда пишут гениальные статьи. Гениальные статьи — это ваша прерогатива.
Товарищу про «некоммерческую» выдачу Вот Вам пример от моей жены… :-) Есть такая женская книга имеющая двойное название. Одно звучит типа «Дневник Жюстин», другое что-то типа «этим утром я решила перестать есть». Вот две выдачи по запросу «Дневник Жюстин скачать»: 1. http://yandex.ru/yandsearch?text=++&stpar2=h0tm71s3&stpar4=s3 2. http://www.google.ru/search?hl=ru&newwindow=1&q=++&btnG=&lr=&aq=f&oq= В выдаче яндекса ни разу не встречается «этим утром я решила перестать есть». В выдаче гугла я насчитал 4-ре сниппета с «этим утром я решила перестать есть». Где Вы найдете нужную Вам ссылку? Куда вы вернетесь еще раз за «некоммерческим» запросом? Это конечно не статистика, но по-моему показательно. Что до статистики, то пики гугла в нерабочее время говорят сами за меня :-D
> Одна из больших проблем подобных статей это неверифицируемость результатов. С этим решили бороться … > Надеюсь со временем в WWW/SIGIR сообществе займутся тем же Вам слово «TREC» ничего не говорит? > А гениальная статья всегда пройдет, даже если английский не гладкий. К сожалению, далеко не так. Когда принимаются 16% статей и 35% постеров (SIGIR 2009), рецензенты отвергают статьи с малейшими недостатками. А часто принимается на ура «скучное унылое говно» — красиво написанное, и с много греческих букофф. Кстати, такие статьи часто из MSR-A (для любителей индустрии). Очень рад что Яндех побликует хоть постеры — конечно, хотелось бы увидеть детали (и более реалистичные результаты) в полновесной статье… например, в WSDM 2010?
К сожалению, далеко не так. Когда принимаются 16% статей и 35% постеров (SIGIR 2009), рецензенты отвергают статьи с малейшими недостатками Вы были в PC SIGIR? Откуда такие познания? Почему предпологаете, что Ваши собеседники тут знают меньше Вас? Из Микрософт всегда были хорошие статьи, дайте пример «унылого говна», а также пояснения почему Вы эту статью занесли в «унылое говно». Интересуют, конечно, нормальные пояснения, а не «в курилке Яндекса так решили»
> Вы были в PC SIGIR? Да. > Из Микрософт всегда были хорошие статьи Есть MSR Redmond, MSR Cambridge и Live Labs. От туда — статьи нормальные и даже бывают гениальные. А есть еше MSRA (MSR Asia) — они посылают по 30 статей на каждый SIGIR, WWW, итд, и качество соответствует (иногда случайно несколько и принимают). > дайте пример «унылого говна», а также пояснения почему Вы эту статью… Я в сортах говна не разбираюсь :-) (c) — да и в принципе все не так плохо (itman так сказал, я цитировал) , но вот примеры (SIGIR 2008), вообше ни одной новой идеи: — Exploring Traversal Strategy for Web Forum Crawling Y. Wang, J. M. Yang, W. Lai, R. Cai, L. Zhang and W. Y. Ma (Chinese Academy of Science/Microsft Research Asia) — Finding Question-Answer Pairs from Online Forums G. Cong, L. Wang, C.Y. Lin, Y.I. Song and Y. Sun (Aalborg University/Tianjin University/Microsoft Research Asia/Korea University) … п.с. Я совсем не в Яндексе, было бы интересно узнать что там у них, в курилке.
Про WWW Это конференция еще не стоит на уровне СИГИР В WWW есть несколько неплохих траков, в которых принимают хорошие статьи (например, текст майнинг, например, все что связано с интернет ads), есть несколько плохих траков, где принимают все подряд («семантик веб»). Почетно попасть в один трак, другой трак никаких плюсов вашей работе и вашему СВ не дает
Да. Не можете назват ваше имя-фамилию? Русскоязычных там совсем мало.
А гениальные разработчики далеко не всегда пишут гениальные статьи. Гениальные статьи — это ваша прерогатива. А в чем проявляется гениальность разработчиков? Если нет гениальный статей, можете мне указать гениальные разработки?
Что до статистики, то пики гугла в нерабочее время говорят сами за меня :-D А о чем говорят пики Гугла в нерабочее время?
Женя Это Вы?
ДА, мама, это я! Просто здесь темно.
@А о чем говорят пики Гугла в нерабочее время? @ Пики Гугла в нерабочее время могут говорить о многом пытливому уму: — 30 000 энергичных сотрудников Гугла так наяривают поиск для написания гениальных статей, закупки items на Ибей и рассылки резюме, что обычным пользователям поработать с Гуглом удается только в нерабочие часы. — Работающие люди не пользуются подобной хуйней. А вот бездельники завсегда. — Никаких пиков нет, а есть смещение доли. То есть смещение лобной доли у того, кто это написал про пики.
Грубому джентельмену, **************** Смещение и пик суть синонимы, ну, для нас с вами, для математиков. Другому парню или тому же ****************, не в курсе, прошу простить если чего не так Пики гугла в нерабочее время говорят о большей популярности гугла в нерабочее время, как я полагаю. :-) Если предположить, что дизайн, юзабилити и поисковый алгоритм гугла не зависят от времени суток и дня недели, то можно набрести на мысль о влиянии выдачи на популярность ресурса. Кроме того, если отмести увеселительную часть про пидоросексуалистов от интернета и их гениальных ненавистиков, предметом этого обсуждения является публикация об улучшении некоммерческой выдачи яндекса, которая, почти наверняка, заботит этих замечательных ребят не просто так. ЗЫ Я здесь недавно, но мне здесь определенно нравится. Главному почет и уважение.
> Одна из больших проблем подобных статей это неверифицируемость результатов. Да это не бог весть какая проблема, в принципе. Все равно в циферках полноты, точности и прочих F1-мер для читателей/слушателей особого смысла нет. Интересны алгоритмы и разные другие прикольные идеи. А измерять эффективность в любом случае придется самому, на своих данных, под свои задачи и своими методами (и результаты в любом случае не совпадут с теми, что названы в статье).
Видимо я воспитан в такой среде где слово гениальность что-то означает. Никогда не мог понять когда называли гениальным поэта, пишущего стихи в местную корпоративную стенгазету Илья — начальник очень сильный ведет компанию вперед с его могучим руководством растет наш деньгооборот! Следует ли признать гениальным Филипа Киркорова? Ведь популярен?! А Аллу Пугачеву? Вот если бы компания из 10 разработчиков сделала независимо русскояызчный поиск сравнимый по качеству с Яндекс и Гуглом, я бы их признал гениальными. А то, что разработчики решают какие-то маленькие задачки уровня курсовой работы западного университета местного назначения никак их гениальными не делают. Следует ли признать тогда все студентов гениальными?
Интересны алгоритмы и разные другие прикольные идеи. А измерять эффективность в любом случае придется самому, на своих данных, под свои задачи и своими методами (и результаты в любом случае не совпадут с теми, что названы в статье). Сами алгоритмы малоинтересны. Andrew Gelman как-то на лекции предложил классификацию статей (=задач) по степени сложности и интересности. Там было по-моему то ли четыре, то ли пять уровней Крайние 5 Взять крайне сложную нерешеную проблему, к которой сводятся многие другие нерешенные проблемы, и найти новое решение к ней 1 Взять маленькую частную задачуприменить к ней парочек стандартных методов machine learning или ir или чего-то еще и посмотреть что получится Само по себе упоминание «математического алгоритма» не делает статью интересной. Просто набор формул делает статью солидной разве, что для какой-нибудь RCDL. Интересность статьи определяется фундаментельностью и нерешеностью проблемы, а также сводимостью к ней других проблем.
2 лондонер 1. Рад, что RCDL становится именем нарицательным. 2. Мерси за идеальный корпора-стих, чрезвычайно понравился. Непременно попрошу почти полностью собравшуюся в Москве группу из типа шестидесяти двух соавторов «алгоритма шестидесяти четырех русских» (а может, четырех, все время путаюсь) хором и с чувством исполнить на осеннем чествовании шестьдесят третьего соавтора.
А то, что разработчики решают какие-то маленькие задачки уровня курсовой работы западного университета местного назначения никак их гениальными не делают. А ну вот и стандартный мем: «да я ваш Яндекс на третьем курсе в курсовой за два месяца написал». Использование этого мема с головой выдаёт его распространителя. Знаете, я за последние три года встречался с гуглоидами раз десять-пятнадцать. Они сюда активно ездили по поводу открытия офиса. В том числе с вице-президентами по разработке, по ЕМЕА, по маркетингу и так далее. Все задавали главный вопрос: «почему Гугл в России не первый?». Я даже как-то по просьбе Долгова прочёл 20 странствующим по локальным офисам маркетоидам Гугла лекцию ровно под этим названием. С этого же вопроса начал и Брин в 2003, когда мы сидели с ним в ресторане. Вероятно, в Гугле не могут решить эту задачку для третьего курса? А в Яндексе как-то левой ногой всё-таки решают эту простенькую задачку. Так-то конечно, задачи поиска по Рунету — это простейшие задачи, для студентов. Я предлагаю талантливым студентам из Лондона всё-таки изучить наш тест качества поисковиков http://analyzethis.ru, чтобы задуматься, сколько там задач, каких именно, и почему Яндекс первый по 80% анализаторов, включая полноту. Замечу, что наши разговоры с гуглерами в 2005-2007 пришлись на тот период, когда Яндекс был заметно хуже Гугла именно по качеству поиска в Рунете. С тех пор Яндекс совершил значительный скачок , стал первым по качеству, стабилизировал и начал увеличивать свою долю поискового рынка. Это, очевидно, борьба двух недоумков, умственно отсталых, которым мог бы помочь любой талантливый студент за пару месяцев. P.S. На прямой (в оригинале риторический) вопрос студентов про гениальность Аллы Пугачёвой отвечу — да, это с очевидностью гениальная эстрадная певица. А Киркоров, вероятно, нет.
Пики гугла в нерабочее время говорят о большей популярности гугла в нерабочее время, как я полагаю. :-) Если предположить, что дизайн, юзабилити и поисковый алгоритм гугла не зависят от времени суток и дня недели, то можно набрести на мысль о влиянии выдачи на популярность ресурса. Думаю, вы не пытались пока всерьёз обдумать эту историю. Вам неспроста написали вверху про смещение доли. Это не пик популярности, а сдвиг процентной доли Гугла относительно Яндекса. Это Яндексом больше пользуются на работе. Это может показывать следующее: а) пользователи Гугла в России — гики, у которых много интернет-активности — дома. А у Яндекса массовый пользователь, которому хватает интернет-активности на работе. б) вообще русская аудитория имеет больше компьютеров на работе, чем в офисе. Про соотношение коммерческой/некоммерческой выдачи это вообще не говорит ничего. Я лично склоняюсь к а). Из этого предположения, кстати, следует, что и подсчёт доли Гугла может быть завышен, потому что считаются переходы, а не пользователи. А гик Гугла, по идее, должен производить в среднем больше поисков на рыло, чем массовый пользователь Яндекса.
Что-то я не могу понять вашей членомерки гениальности по популярности. Вот в России Яндекс популярнее гугла, а в(на?) Украине гугл популярнее Яндекса (намеренно, сравниваю только русскозычный поиск). Причем в процентах выигрыш Гугла на Украины выше выигрыша Яндекса на России. Значит ли это, что в одном отношении Гугл гениальнее Яндекса, а в другом Яндекс гениальнее Гугла? В каком отношении? Вроде бы качество поиска и для того и для другого региона должно быть более менее одинаковым, судя по ашмановским метрикам, качественные результаты должны быть одинакова, почти теже информационный и навигационные сайты, а аудитории абсолютно разные. Кто гениальнее? И еще. Был ли Наполеон до Ватерлоо гениальным полководцем, а после Ватерлоо он перестал быть гениальным полководцем?
Временной разрез В феврале доля Яндекса росла, а в апреле и мае падала http://www.liveinternet.ru/stat/ru/searches.html?slice=ru;date=2009-05-04;period=month Значит ли это, что в феврале в Яндексе работали более гениальные программисты, чем в Гугле, а в апреле и мае в Гугле программисты стали более гениальными?
Я ничего про гениальность не говорил. Это вы тут с вашей склонностью, как у бабушек у подъезда, бросаться в крайности — то про гениальность, то про курсовые. Я говорил о том, что дурацкие заявления в стиле «это уровень студенческой работы» не имеют отношения к реальности. Задачи очень сложные, чуть-чуть расслабился и снизил темп — потерпел неудачу. Яндекс проиграл Украину, это неудача. Но и местные игроки ещё сильнее проиграли, они-то могли бы быть первыми, они свой Уанет знают лучше всех. Заметим, что по миру в подавляющем большинстве локальные игроки проиграли Гуглу. Это значит, что Гугл изначально задал высокую планку, а русские, чехи, корейцы, китайцы и кое-кто ещё её преодолели.
И еще. Был ли Наполеон до Ватерлоо гениальным полководцем, а после Ватерлоо он перестал быть гениальным полководцем? До Ватерлоо он был национальным лидером, а после перестал им быть. Так понятнее в смысле поисковиков? Ну и вообще вроде бы это общее место, что он был гениальным тактиком, а стратег он был паршивый, поэтому сражения он выигрывал, а войны он проигрывал.
Про гениальность разработчиков начал говорить Сегалович
Ну так он и должен своих разработчиков любить, считать гениальными, а слабых выгонять. И это, похоже, у них работает. Есть ещё одна проблема, что гении в смысле ума далеко не всегда успешны и даже не всегда результативны. Поэтому нужно брать ещё одно слагаемое — результат. Скажем, в Апорте разработчики придумали и сделали многие инновации значительно раньше Яндекса и Гугла. И где тот Апорт?
Все же гениальная эстрада это, например, Эдит Пиаф. А Пугачева далеко не дотягивает до такого уровня.
Ашманову Дружище, я знаком с Вашей версией «а» причины большей гениальности гугла в нерабочее время. Мне она кажется неубедительной вот почему: Согласно Вашей версии в выходные мы должны наблюдать общее по рунету увеличение отношения просмотров к посетителям, а этого согласно статистике лайвинтернет не происходит. В пользу же моей гениальной версии говорит тот факт, что на коммерческих ресурсах вышеупомянутое отношение в нерабочее время падает, а на развлекательных растет. Таким образом, гениально было бы отнести яндекс к коммерческим ресурсам, а гугл к развлекательным, так как это уже сделали рекламодатели. Думаю, что мужчины и женщины, использующие адвордз и директ в целях личного обогащения, засвидетельствуют Вам, что на коммерческих сайтах рентабельнее директ, а на развлекательных гугл адвордз. ЗЫ В дискуссии о гениальности разработчиков яндекса я на Вашей стороне, не поймите превратно.
сорри, там адсенс надо читать…
Граждане, прекратите ругаться, мне же потом вычищать.
И где тот Апорт? А вот я не знаю этой истории. Ладно, Апорт не стал лидером рынка, а как он повлиял на развитие поиска в России? Какие идеи Аппорта были адаптированы другими системами?
Ашманову А вы не собираетесь написать историю российского поиска? Я читал Вашу «жизнь в пузыре» — Вы очень талантливо и интересно пишете. Было бы интересно почитать техническую историю поиска, какие идеи кем были придуманы, какие идеи кем были адаптированы, какие идеи остались, какие умерли.
Раз уж заговорили о научном вкладе, непонятно почему говорят только о SIGIR и WWW Вот, конференции на которых публикуются большие поисковики вроде Yahoo! и Google, так как поиск неизбежно порождает решение проблем в этих областях VLDB/SIGMOD/ICDE — управление большими объемами данных — индексы, логи, онлайновый анализ огромных объемов данных. даже многие web темы начались там, например, работа важная работа Diligenti по machine learning для тематического индекса была опубликована в VLDB 2001. Deep web публикуется на таких конференциях, см недавние работы да и cloud computing конференции по Natural Language Processing, Computational Linguistics ICML и прочие конференции по machine learning — распознование образов, речи, фундаментельны проблемы machine learning конференции по security и privacy
> Было бы интересно почитать техническую историю поиска. +1. А если бы не только российского, то совсем хорошо. Может, исторические труды в области IR уже существуют, кто знает? > Рад, что RCDL становится именем нарицательным. А чему тут радоваться? Да и хотя RCDL — это далеко не SIGIR, но и здесь попадаются полезные статьи, в том числе из «Яндекса». > Взять крайне сложную нерешеную проблему, к которой сводятся многие другие нерешенные проблемы, и найти новое решение к ней. Это самое интересное, спору нет, но ведь решение все равно будет алгоритмическим. Так что вот этого заявления я не понимаю: > Сами алгоритмы малоинтересны.
> недели спешных усилий пары неанглоговорящих пусть даже гениальных русских разработчиков «пусть даже», «пусть даже», «пусть даже» Чтобы значили эти два простых русских слова? Как их можно было бы интерпретировать? Еще немного и я сойду с ума. (бормочет про себя «пусть даже», «пусть даже», «пусть даже», уходит, вздрагивая и нервно оборачиваясь)
Илья А Вы тоже гениальный разработчик? Или Вы гениальный геофизик?
А если бы не только российского, то совсем хорошо. Джон Баттеле написал неплохую книгу.
я гениальный флеймер. но прямо сейчас я бьюсь в истерике от глубины этой дискуссии.
а) пользователи Гугла в России — гики, у которых много интернет-активности — дома. А у Яндекса массовый пользователь, которому хватает интернет-активности на работе. ——————————————————— Почему именно «гики»? Может, это люди тех профессий, у которых на работе интернета просто нет и не может быть. Спортсмены, врачи, технологи, учителя. Да даже офисные служащие часто не пользуются интернетом (ибо данные по работе есть во внутренней документации). Или сотрудницы в операционном отделе банков — ни разу не видел интернета, сидят в банк-клиенте и не ходят ни по каким сайтам. Кстати, у многих строгий контроль: может и хотели бы, но нельзя (ибо не нужно, не зачем время тратить рабочее). Или рабочих и работниц сборочных заводов калининградской области тоже к гикам отнесем?
>>Рад, что RCDL становится именем нарицательным >А чему тут радоваться? Тому, что это сильно упрощает ориентацию — «молодых неиспорченных» (а равно и «испорченных» :) SIGIR/WWW в России еще более нарицательное имя (что огорчает, все же это не более чем конференции, пусть и хорошие, но не небеса обетованные) С нарицательными как-то все сразу понятно: вам на — условно говоря — SIGIR/WWW, а вам — на RCDL :)) Статус реальной (не нарицательной) штуковины полностью определяется именами организаторов. Иногда имена одиозны, иногда невзрачны, а иногда — напротив
Интересно, а кто-то проводил исследование вроде «интернет активность» пользователей рунета? Скажем, если разделить пользователей рунета на какие-то категории — профессионалы (врачи, программисты, юристы, ученые), служащий персонал (клерки всех видов, секретари), рабочие, итд Сколько пользователй в каждой категории? Как использует интернет каждая категория? Сколько скажем информационных запросов за месяц? Сколько интернет покупок за месяц? Сколько запросов «поиск товара» за месяц? Сколько развлекательных запросов за месяц? Ищут информацию по каждой категории запросов преимущественно с работы или из дома
Было бы интересно увидеть распределение пользователей Yandex vs Google vs Seatch.Mail.ru vs Rambler в зависимости от уровня образования (среднее, высшее, кандидатская степень и выше) и дохода
SIGIR/WWW в России еще более нарицательное имя (что огорчает, все же это не более чем конференции, пусть и хорошие, но не небеса обетованные) А почему не сделать ассоциированный workshop или даже сессию по поиску в восточной европе? есть же секция по китайскому поиску. Все эти проблемы «платные ссылки» никому интересны за пределами рунета, а в пределах специализированной секции или воркшопа можно было найти заинтересованых участников для дискуссии
>есть же секция по китайскому поиску Ну, как известно, Москва находится в России, Россия в Евразии, Евразия — на Земле, а Земля — это просто такая часть Китая. :) > в восточной европе…. я — свое, совершенно личное, ничего не определяющее мнение. — «в восточной европе» — категорически против!!! (я не помню названия DB-конференции — восточноевропейской сестры RCDL с тем же заведующим ** и тем же научным статусом, но сегодня нет никакой «восточно-европейской науки» ). — для «славянских языков» — да и еще раз да! Темы тут все, включая, например, очень популярный patent IR ————— ** (‘это сноска) для знакомых с подводными перепетиями советской околонаучной DB-жизни поясню, что это не позиция одной из сторон в сношениях Калиниченко( и ко.) и Арлазарова (и ко.) Обе стороны одинаково милы мне. И обе вызывают в памяти афоризм юности: «возиться[там другое слово:) с крысами» ;)))
> Все эти проблемы «платные ссылки» никому интересны за пределами рунета… Ето шутка, да? Ети проблемы очень даже интересны (см. AIRWeb, те же SIGIR/WWW/CIKM/VLDB/KDD). > А почему не сделать ассоциированный workshop … по поиску в восточной европе? Если кто-то из Яндекса (условно — то есть, из тех кто с Рунетом работает) готовы организовать такой Workshop, я думаю SIGIR очень серьёзно рассмотрит заявку. п.с. SIGIR 2010 в Европе: http://www.sigir2010.org/doku.php?id=home
Восточная Европа это потенциально 150 млн пользователей интернет с собственными языками (богатая инфлексия итд) и кучей других проблем специфичных для этого региона я думаю вполне заслуживает отдельной сессии Много больших независимых поисковиков — Rambler, Яндекса, seznam
Евгений, это Вы?
судя по суточной активности (мск), похоже, во внерабочее время некоторые гики уходят не в гугл, а в этот тред
Ну, я. Случайно заглянул, оказалось интересно. А Вы кто?
Спасибо Узнал по стилю письма Видно остался у меня еще «стилистический глаз»
Ага. Стиль письма. А не стропы от парашюта? да я не конспирировался особо. п.с. сорри за ощибки, транслит глючит
А что с транлитом? Помочь русский поставить на Ваш компьютер, сосед?
… что-то с первого раза коммент не появился, как бы не появилась сразу пара… > Если кто-то из Яндекса (условно — то есть, из тех кто с Рунетом работает) готовы организовать такой Workshop, я думаю SIGIR очень серьёзно рассмотрит заявку. А зачем? Есть два самодостаточных экономически мира, практически не нуждающихся друг в друге. На фига нам SIGIR? Будет здесь больше денег чем там — сами прибегут кучами, не будет — так всякие временные акции будут иметь весьма жалкий вид. Большинство российских игроков и так уже объединены в рамках РОМИП, задачи которого даже ближе к жизни, чем задачи TREC или CLEF. Русский язык Запад практически не интересует (воевать пока не собираемся, тайны чиновники сами выбалтывают, на рынок их сюда не пускают). Основных российских игроков пока не интересует английский, испанский или китайский. Все-таки в основе каждого опубликованного исследования лежит некий шкурный интерес — прорекламировать себя, прежде всего. Как тут уже откровенно прозвучало — западные люди (кроме небольшого числа несомненно достойных фулл-профессоров, которые в университетах могут делать что хотят, а могут и ничего не делать), прежде всего озабочены тем, чтобы набрать очков для CV. А набрать очков для CV — чтобы устроиться на работу в корпорацию и прекратить, наконец, писать статейки с безумным требуемым уровнем evaluation, выполняемым причем на сомнительных, но открытых коллекциях. У нас же все участники уже в корпорациях (иначе не выжить), где работают с реальными данными своих фирм или данными клиентов. Устроиться в разработку яндекса, рамблера, российских гугла или майкрософта не является проблемой для студентов основных вузов. Выполнение evaluation на чужих данных полезно для исправления ошибок в своих подходах, но мало что дает для доказательства правильности. evaluation в западном стиле имеет чисто диссертационный интерес, что в настоящее время не является приоритетным для «российских» ученых — диссер можно защищать и проще. Более важно умение решать реальные задачи, история выполненных проектов. Конечно, в статьи на SIGIR обычно вложено много труда (в хорошую типа человеко-года), по коэффициент полезных из них не такой уж и большой, а уж применить на практике можно просто единицы (обширный, но игрушечный evaluation плодит часто концептуально неточные выводы). Например, посмотрите сколько умных статей опубликовано по классификации текстов. А потом посмотрите как работает Рейтерс или Lexis-Nexis, а также материалы OTC-1, OTC-2. Поэтому, пока нет реального поискового рынка, в РФ хватает РОМИПа, как тусовки, и чтения статей SIGIR как повода для «поговорить». А просто «отапливать» Запад — писать на SIGIR за свой счет без надежды получить компенсацию — получается довольно бессмысленным занятием. Если будет найден механизм компенсации, пусть бы как у китайцев — по $3000 за публикацию на Западе (это мало, но хоть что-то), тогда будет другая жизнь. Кстати насчет Восточной Европы. Что за снобизм? Посмотрите на чешский TSD или польские конференции — уже почти SIGIR. Если вернуться к началу разговора. Зачем Яндекс опубликовал статью с информацией о РЕАЛЬНОЙ проблеме — не очень понятно, можно объяснить только тем, что борьба с накрутками является общественно полезным делом… Почему не принимали у них статью с новостями — тем более непонятно с человеческой точки зрения — новый метод, который технологически очень элегантен. Но понятно, почему по SIGIRовским меркам — не mainstream, нет ссылок на игрушечные работы. Любителям сослаться на Гугл можно только сказать, что если Гугл что-то опубликовал, то это в Гугле либо уже не используется, либо никогда не использовалось. У них жесткая цензура
коэффициент полезных из них не такой уж и большой, а уж применить на практике можно просто единицы (обширный, но игрушечный evaluation плодит часто концептуально неточные выводы). Например, посмотрите сколько умных статей опубликовано по классификации текстов. А потом посмотрите как работает Рейтерс или Lexis-Nexis, а также материалы OTC-1, OTC-2. Это не очень большой секрет, что за исключением нескольких экзотических областей академическое сообщество (SIGIR, WWW) отстает от индустрии от 3 до 5 лет. Это относится не только к университетам, но и research департаментам многих компаний, которые держатся отдельно от инженерных департментов и работают на конференции, а не на продукт.
Роем становится все интереснее и интереснее
Мне эта глубоко научна ядискуссия напоминает http://www.phdcomics.com/comics.php?f=1178
TSD это вычислительная лингвистика. Тема близкая к IR, но не тождественная. В России, Чехии Польше есть (было) несколько очень сильных лингвистических школ, но они не смыкаются с поисковиками. В индустрии они более близки к распознавованию речи. Интересно, будет ли Яндекс делать какой-то проект по поиску в аудио и видео файлах наподобие гугловского поиска по речам президентских кандидатов на ютубе
Вопрос не в тему, но хотелось бы знать. А кто лучшие яндексовские олимпиадники? Петю Митричева в Яндекс уже взяли? А bladerunner?
http://projecteuler.net/index.php?section=profile&profile=tolstopuz — наш ответ Митричеву ;)
Сегалович и Юра Лифшиц — математики-международники в школьные годы.
Программист Яша из отдела платежных систем Четвертое место на районной олимпиаде по ботанике в пятом классе.
куриным пометом-то зачем кидаться :( рефлекторное?
> Например, посмотрите сколько умных статей опубликовано по классификации текстов. А потом посмотрите как работает Рейтерс или Lexis-Nexis, а также материалы OTC-1, OTC-2. Да, с классификацией особый прикол — ученые исследуют разные умные методы машинного обучения, а реальные коммерческие системы основаны преимущественно на ручном труде и тупом (с точки зрения ученых) выделении и описании ключевых терминов. Сказанное относится не ко 100 % ученых и коммерческих систем, но общая тенденция такова, и с момента проведения OTC она не изменилась.
Это не кидание пометом? Это ирония и сатира. А про элегантное решение в статье 2006 года понравилось, спасибо, расмешили.
> А про элегантное решение в статье 2006 года понравилось, спасибо, расмешили. возможно не все поняли, что речь идет не о статье Яндекса на WWW2006 про определение новостных запросов — достаточно простую а упомянутую Сегаловичем не принятую статью о кластеризации новостей, которая, кажется, так в результате нигде и не опубликована, кроме записей в блогах они кластеризуют новости путем исполнения специального типа запросов — это, с моей точки зрения, не самый идеальный способ с точки зрения полноты, точности и т.п. но технологически этот способ элегантен, так как позволяет им использовать стандартный engine, включая стандартное распараллеливание при выполнении запроса, что весьма и весьма полезно для оперативной кластеризации потока новостей кроме того, сам способ кажется мне новым (по крайней мере на 2006 год)
Спасибо ща информацию, я не знал про это исследование.
Кстати, это неплохая задачка на сравнение поисковиков. Найти статью Сегаловича про алгоритм кластеризации новостей, которая написана примерно в начале 200х.
Ваша высокомерная уверенность в том, что всякий смертный мечтает работать в яндексе вряд ли работает на имидж компании. Вам есть с кого брать пример. :-D Вполне закономерная уверенность для человека, отдавшего много (15?) лет своей жизни какой-то компании.
Яндекс находится в довольно щекотливой ситуации. Дураков они не возьмут. А умные…. сейчас активно нанимают на работу Facebook и twitter. Если ты умный, молодой и хочешь сделать что-то большое и заметное, то тебя привлечет возможность сделать рекламу в социальных сетях (пока никто не умеет этого делать), поиск и аггрегацию микроблогов (7 поисковиков по твиттеру, ничего нового и революционного нет, а потребность есть), а не разбираться в провинциальном поисковике в каких случаях «Сочи» должно склоняться в «сочиться», а «какой» в «какать»
«Дураков они не возьмут.» Ах если бы, ах если бы. Не жизнь была-б, а песня бы. Берём, и ещё как.
«в провициальном поисковике». Ага, ага. Есть еще провинциальный Байду, да. — Скажите, а вот эти брюки, они где пошиты? — Это джинсы, они из Америки. — А это далеко от Жмеринки? — 5000 верст. — Скажите пожалуйста, какая глушь, а как неплохо шьют! Что ж так Гугл и Микрософт стараются в рунет влезть и все никак не могут? Где то Фейсбук, что-то его тут не видно? Майспейс где? И вообще, они откуда? Из США, этой депрессивной страны, с самым большим национальным долгом, наполненной человеческими отбросами из всех стран мира, с самым тупым и жирным населением, самой агрессивной на свете, являющейся административным регионом Кении? Фу.
а не разбираться в провинциальном поисковике в каких случаях «Сочи» должно склоняться в «сочиться», а «какой» в «какать» Да это было про сочинский поисковик Захарова небось. Какать и сочиться все равно придется.
Где то Фейсбук, что-то его тут не видно? Майспейс где? Вроде бы у Фейсбука несколько сотен миллионов пользователей. Что на порядок превышает общее число пользователей Рунета. Предпологаю, что сейчас они каждые 2-3 месяца прирастают дополнительным «рунетом» не влезая в рунет.
Да-да, тридцать тыщ одних курьеров, миллиарды пользователей. Господи, какое умственное убожество и иллюзорная картина мира! Вы бы хоть Алексу почитали, что ли, если до остальных метрик ума не хватает дотянуться. В мире всего примерно 1 (прописью один) миллиард пользователей Интернета, включая Китай . А то и меньше, по некоторым данным. Значит, у Фейсбука каждый месяц 25 миллионов новых пользователей? За год — триста миллионов? Мальчик! Тебе сто тысяч миллиардов раз говорили — не преувеличивай!!! П.С. И пиши «предполагаю», пожалуйста.
Апрель 2009 года — 200 млн (техкранч считает, что гораздо больше и ФБ занижает ) http://blog.facebook.com/blog.php?post=72353897130 Апрель 2008 года — 100 млн http://blog.facebook.com/blog.php?post=28111272130 Итого 100 млн за год, или 25 млн (рунет) каждые три месяца.
> 25 млн (рунет) В Контакте 30 млн пользователей. Рунет меньше, чем ВКонтакте?
Пользователей которые открылы эккаунт, пользователей, которые захотят хотя бы раз в год, или пользователей, которые заходят хотя бы раз в месяц? Из моего села почти все одноклассники есть в «одноклассниках», но многие на сообщения и письма отвечают примерно раз в месяц, так часто они выходят в «интернеты».
Сегаловичу Илья, мне всегда было интересно, почему яндекс ограничивается рунетом? Почему бы вам не попытаться замутить, может и на деньги государства, экспортный проект? Даже если чего не получится, вы получите капусту, чиновники откаты и пиар, наш пипл, возможность в перспективе гордиться своей страной чем-то еще кроме Гагарина, а пипл стран импортеров возможность не пользоваться американскими поисковиками… Ну, и в любом случае — это более перспективно, чем пытаться продавать жигули в Германии, а ведь они там продаются.
Идите к Путину за баблом! Он даст — зуб даю. :-)
> Идите к Путину за баблом! Он даст — зуб даю. :-) давайте зубы! Мин науки сейчас собирается вычеркнуть в целом информационные технологии из перечня критичных технологий, что автоматом сократит в разы финансирование.
Прогульщику Я грю, пусь идут к Путину. Пусь позвонят ему на мобильник. Объяснят ему как он выгодно будет смотреться в телевизоре перерезающий ленточку перед новым мегаофисом нашего IT-флагмана, потрясая кулаками в сторону американских партнеров! Кароче, пусь делают чего-нибудь, не всем же здесь сидеть, лясы точить.
Не, ну ниву же он купил недавно, значит можно развести :-)
>ниву же он купил недавно, значит можно развести :-) на ниву ушли все сбережения последних 8 лет ;( разводить не будем
Подумайте, последний раз предлагаю :-D
Делать джиру за 30 государственных лимонов, это не канифоль. Нужно давать откаты, портится карма, ухудшается настроение, аппетит, климат в коллективе. Не умеем мы это, никогда не умели, и уметь начинать не хочется.
>портится карма, ухудшается настроение, аппетит, климат в коллективе… а вот про аппетит ошибаешься. он-то как раз разыгрывается ;) как наблюдатель откатообразующего возлегосударственного програзма говорю
Аноним про жирных и тупых америкосов зажег. Забыл, правда, про грязные американские города. Только вот есть один нюанс: чего бы там в стране не происходило, практически все самое интересное в области айти происходит именно в этой «вонючей дыре бологое». Поэтому, конечно, у того же Яндекса невероятно мало шансов завлечь того же Петю Митричева, или крутых парней в Силиконовой долине.
Лёня, ты плохо исполняешь добровольно взятые обязательства. Я — в некоторм смысле лучше, хотя результат все равно не нравится: да, трезвый, за куркулятором, но — не работаю, т.е. совершенно не хочется :)
> Делать джиру за 30 государственных лимонов, это не канифоль. Потребуйте больше. Объясните, что Гугл дороже Газпрома в разы. > Не умеем мы это, никогда не умели, и уметь начинать не хочется. Найдите того, кто хочет и умеет, иначе рано или поздно придется заканчивать. Заклюют…
Делать джиру за 30 государственных лимонов, это не канифоль. Нужно давать откаты, портится карма, ухудшается настроение, аппетит, климат в коллективе. Не умеем мы это, никогда не умели, и уметь начинать не хочется. + 100 Но кроме гика и любителя технологий есть еще и и Волож, а Волож это «золотая акция сбербанку».
Почему бы вам не попытаться замутить, может и на деньги государства, экспортный проект? Кто сделает поиск (а поиск ли нужен) по микроблогам заработает милиларды. Все что делают сейчас — поиск по дате и с «релевантностью» по записям, поиск по ссылкам с записей, облако тагов — это все маленькие добавки и давно известные технологии, которых будет недостаточно. Нужно что-то принципиально новое. Чтобы сделать поиск по микроблогам сейчас, не нужно огромных датацентров и кода в десятки миллионов строк. Нужно что-то принципиально новое. Брин с Пейджем тоже начинали с парочки компьютеров, небольшого кода и одной идеи.
объем информации в микроблогах интересный от глобальных новостей (речь обамы) и локальных новостей (открылся новый ресторан, солнечно) до чего угодно (интересная статья, растет ребенок) что с ней делать? если вы будете искать «обама» на твиттере то получите милилоны записей, которые вам не интересны «релевантность» совсем не связана с «интересностью пользователю» (которая может быть вовсе не функций одного поста, а функцией множества постов или их «аггрегации») короче, никто не знает что делать есть золотая росыпь, а как рыть? всяко лучше, чем «Сочи»-Сочиться Какать-какую
Объясните, что Гугл дороже Газпрома в разы. Совсем ебанулись наши ИТ-эмигранты. То в Фейсбуке 30 миллионов пользователей в месяц прибавляется и СОТНИ миллионов всего. То Гугль дороже Газпрома. Ну вы сходите, низкопоклонники перед западом, на какой-нибуль ГугльФинанс, посмотрите уже. Газпром не так давно был второй-третьей компанией мира по капитализации. Гугль и близко не валялся.
На текущий момент капитализация газпрома 4.2 трлн. рублей или $135 ярдов по текущему курсу. У гугла — $131 млрд. Галактека опасносте, гугл догоняет! Впрочем, капитализация сбербанка на прошлой неделе была больше чем у сити, поэтому что отражает данная невидимая рука рынка — большой вопрос.
Леха, ты не финансист, не эбимоск. Но невидимая рука рынка доставляет, да.
> Газпром не так давно был второй-третьей компанией мира по капитализации. Гугль и близко не валялся. Буа-га-га. Чую я, Вы еще не сняли георгиевскую ленточку с антенны своего фокуса…
Не понял про какие 25 млн в месяц идет речь? Изначально было сказано Предполагаю, что сейчас они каждые 2-3 месяца прирастают дополнительным «рунетом» не влезая в рунет. так и оказалось Рунет — 25 млн пользователей (Яндекс 60 процентов рунета, беря статистику яндекс с их статистического сайта) фейсбук прирастает 100 млн пользователей в гож итого получаем каждый три месяца на фейсбук приходит по рунету (надо учитывать что рост фейсбука растет, а рост рунета замедлился, по мнению статистики ЛИ, которая дает завышенные данные в марте было 43.4 млн пользователей, в апреле 43.8млн в мае 41.7, то есть сезонные месячные колебания уже преаышают любой рост и роста рунета больше не наблюдается)
На текущий момент капитализация газпрома 4.2 трлн. рублей или $135 ярдов по текущему курсу. У гугла — $131 млрд. Когда Вы сравниваете две компании в долгосрочной перспетиве, относительные изменения важнее абсолютных цифр http://moneycentral.msn.com/investor/charts/chartdl.aspx?PT=9&showchartbt=Redraw+chart&compsyms=GOOG&D4=1&DD=1&D5=0&DCS=2&MA0=0&MA1=0&C5=1&C5D=1&C6=&C7=1&C7D=1&C8=&C9=0&CF=0&D7=&D6=&symbol=OGZPY&nocookie=1&SZ=
«надо учитывать что рост фейсбука растет, а рост рунета замедлился» А зачем это надо учитывать? Что вообще сравнивается и зачем? Что следует из того, что в Фейсбуке много пользователей, а в Рунете в целом как бы меньше? У меня ощущение, что вы просто хотите сказать, что там всё круто, а в говнорашке как всегда — нет. Ну это мы уже много раз слышали. Рунет всегда составлял 1-2% от мирового Интернета по пользователям, контенту, трафику — и какой смысл его сравнивать с глобальными проектами? Тем более, что скоро все глобальные проекты будут покрываться локальными проектами Китая, как овца быком. Достаточно на Ку-Ку посмотреть. Ну и вообще сравниваете вы разные вещи, яблоки с апельсинами: регистрации Фейсбука (где процентов 3040% точно мертвяки) и реальных, живых пользователей. А если сложить «пользователей» Яндекса, Одноклассников и ВКонтакте, их окажется 100 миллионов — и что? Это регистрации, заходы, показы, а не пользователи. А в Майспейсе, Гугле, Хомейле, Фейсбуке в сумме миллиард получится — и что? В общем, мысль-то какая? Только содержательно, а не «провинциальный поисковик», «в Фейсбуке десять Рунетов» и так далее.
Вопрос, стоял не о том большой или малый рунет, а о том могут ли российские компании (Яндекс, Рамблер) делать большие проекты и придумывать что-то новое на глобальном уровне. Сегалович же говорил, что «разработчики гениальные» Я, конечно, могу поверить, что по каким-то прихотям судьбы гениальный программист пишет окошки в 1С бухгалтерии, гениальный поэт ограничивается статьями в заводскую малотиражку, гениальный композитор за всю жизнь не написал ничего кроме небольшого этюда для детского садика («не раскрылся»), гениальный математик ограничивается решениями задач из демидовича, мне просто непонятно зачем гениальными разработчикам терять свой талант на «какать-какую», а не решать большие и сложные задачи уровня фейсбука или твиттера.
Ашманову говорится о честолюбии ученого или разработчика-изобретателя, желании отвечать на сложнык вызовы и решать сложные проблемы, а не об «экономической целесообразности» «и в России можно заработать на домик и машинку».
Вы знаете, уже из используемом вами лексики, в том числе несуществующего в русском языке слова «вызовы» в значении challenges, видно, что вы предубеждены и имеете твёрдый предрассудок, что вся жизнь — «там». Ну, нравится вам идея делать что-то глобальное — так делайте (какие, кстати, на данный момент ваши глобальные достижения?) Но зачем других-то стараться опустить? Русский поисковик не может нормально работать, если он проблемы типа «какая» не решает. Гуглу тоже, кстати, пришлось как-то проблему машинной морфологии решать, хотя они годами рассказывали, что это не нужно. Как, по-вашему, проверка правописания в Ворде нужна или нет? А если нужно, то кто её должен делать? Там приходится решать все эти проблемы, а глобальный игрок их решить не может, как правило. Насчёт ваших «вызовы» — ну вот Антивирус Касперского решает именно глобальную задачу, является 3-4 в мире по обороту, 1-3 по качеству (как считать). Finerader — где второй, а где и первый на локальных рынках, твёрдо второй в мире. Что не устраивает? Parallels — бесспорный номер 1 в своей сфере. Гениальные там разработчики? Да какая разница, мы же про продукт говорим. Как вообще связана «гениальность» разработчика с его локальностью, не понимаю. Достоевский писал на русском и для русских. Пушкин — гениальный русский поэт, бесспорный номер 1 в нашем мире, совершенно неизвестный на Западе, потому что его невозможно перевести адекватно, все переводы превращают его в салонного французского поэта средней руки. И что? Он не гениален теперь?
Альтерэге от 7:23 утра: если вы на том же msn.com возьмете другой период, 10 лет, а не 5, то увидите, что гугл — лишь плесень на трубах газпрома: http://moneycentral.msn.com/investor/charts/chartdl.aspx?showchartbt=Redraw+chart&compsyms=GOOG&D4=1&DD=1&D5=0&DCS=2&MA0=0&MA1=0&C5=1&C5D=1&C7=1&C7D=1&C9=0&CF=0&symbol=OGZPY&nocookie=1&CP=0&PT=10 Что, впрочем, не мешало в некий момент GM-у стоить меньше, чем складские остатки автоваза. Надо было менять….
Гениальность разработчиков Касперского — без сомнения. 1 по качеству, в числе лидеров по обороту на рынке с огромной конкуренцией, среди конкурентов компании с огромным капиталом, огромными человеческими ресурсами. Finereader Parallels — тоже продукты гениальных разработчиков, тут я с Вами на все сто Достоевский очень популярен на Западе, не менее, чем Шиллер (пример, «иностранного» для англоязычных стран). Он есть почти в любой серьезной университетской литературной программе, и даже в продвинутых школьных. Книги достоевского (ПиН) входят во все списки 10 наиболее значимых книг 19 столетия Число продаж на Амазоне для Преступления и Наказания Amazon.com Sales Rank: #1,229 in Books http://www.amazon.com/Crime-Punishment-Fyodor-Dostoevsky/dp/0679734503/ref=sr_1_2?ie=UTF8&s=books&qid=1243750122&sr=8-2 1229ое место это очень много, это Амазон. Пушкин менее читаем, как и все поэты, но не менее известен. В любом курсе вы найдете по меньшей миру критику его основных произведений (как можно изучать Достоевского не изучая Пушкина? ) Глинка и Мусоргский писали русскую музыку, но они оказывали влияние на мировую культуры. Им было бы не интересно ограничиться залами Петербурга и Москвы. Вообщем, локальных гениев не бывает.
Игорь, parallels одно время был «первым на маках» (ибо ничего другого не было), возможно там первым и остается, но «глобальный лидер» — VMWare. Что не мешает тамошним (VMWare) разработчикам рассказывать про эту компанию *всякое*. Вообще, мне удивительно, что размер рынка/компании считается тут коррелированным с «возможностями для гениального разработчика». Отвлекаясь от убыточных интернет-стартапов (и неубыточного гугла — тоже), Adobe-Microsoft-Oracle-Symantec-SAP — это что, место где хочется гениально работать? Да вы охренели.
Вы хоть понимаете о чем говорит тот график? Вы сравниваете рост газпрома по отношению к газпрому 1998 года и рост гугла по отношению к гуглу 2004 года. Если вы хотите справедливой оценки, вам надо найти оценки гугла на 1998-2004 год и перестроить график по отношению к ним. Сколько стоил Гугл в 1998 году? 10000 долларов? 50000? Если вы перестроите график, то Газпром будет небольшая загогулина
размер рынка/компании считается тут коррелированным с «возможностями для гениального разработчика» Не размер рынка важен, а возможность решать большие глобальные задачи, которые влияют на большую область индустрии (и решают проблемы огромного числа юзеров) Гениальность абби не в том, что они завоевали рынок (это следствие), а в том, что умеют решать задачи, которые хотят решать все (распознование текстов на многих языков, перевод), так как никто решать не умеет. Если бы они решали задачи распознование текстов на фарси и только, то вряд ли бы их кто-то зачислил в гениальные
Ну да, сравниваю публичные компании. Если гугл брать с 98-го года, то надо и газпром брать с момента появления решения «а не заслать ли на Ямал геофизиков….»
opyatzabyl, вы действительно считаете, что гениальному разработчику надо стремиться в FB/Google/MS/Adobe/Oracle в их текущей фазе? Становиться ведущим инженером по кручению гайки №6 ключом на 18? «Да вы ох..ли» (как говорили избиратели Монголии про гусиную х…ню) Ну вот Adobe и их флагманский продукт — Фотошоп. Миллионы пользователей, продукт действительно флагманский. Много ли глобальных задач там решено за последние 4 версии (~10 лет)? И можно ли их вообще там решать, если все устоялось и пользователи ругаются даже от смены хоткеев?
Гениальному разработчику надо стремиться решать большие и сложные задачи. Будет ли он их решать в FB/Google/MS/Adobe/Oracle , создаст свой собственный стартап или будет решать там где он работает, это личное дело разработчика. Но было бы странно делать вывод о гениальности разработчика на том основании, что он написал прикольный перловый скрипт (все умеют писать перловые скрипты) или научил сервера компании справляться с нагрузкой в 30 млн пользователей в день (таких сайтов пруд пруди).
Патриотам про фейсбук и яндекс Мужчина просто хотел сказать, что задачи которые стоят перед фейсбуком интересней с точки зрения зарплаты и самореализации. Где вы там увидели про говнорашку? Понятно, что в доме повешенного не говорят о веревках, но неужели так все плохо? Патриотам про гугл и газпром Мужчина в моем лице просто хотел сказать, что товарищи у руля, по причине собственной ограниченности, сделали газпром «национальным достоянием», а яндекс забыли. И это им, по возможности, нужно объяснять. Где вы там увидели про говнорашку? Понятно, что в доме повешенного не говорят о веревках, но неужели так все плохо? Патриотам про яндекс и гугл Мужчина назвал яндекс «провинциальным». Его тут же поправили, обратив внимание на долю яндекса в 1-2% в глобальном масштабе. Гы-гы. Понятно, что создателям локального поисковика не стоит говорить об их провинциальности, но неужели все так хреново? Хочу добавить, что яндекс запустился в 1997, а гугл в 1998. И на мой взгляд, именно, глобальность/локальность, мышления определила сегодняшнее положение дел на рынке.
Только не надо про говнорашку, плз…
> Хочу добавить, что яндекс запустился в 1997, а гугл в 1998. А апорт первый раз показали вроде в 1996. судя по всему, он должен был поработить мир к 2001-2002 году. А альтависта — вообще в 1995 году родилась…
Гениальность разработчиков Касперского — без сомнения. 1 по качеству, в числе лидеров по обороту на рынке с огромной конкуренцией, среди конкурентов компании с огромным капиталом, огромными человеческими ресурсами. Finereader Parallels — тоже продукты гениальных разработчиков, тут я с Вами на все сто… Да вы не со мной согласны, а с кем-то другим. При чём здесь гениальность? Вы тут систематически путаете гениальность с тиражом. Напомните, в чём гениальность разработчиков Касперского или Абби? ну какие там гениальные научные работы или гениальные, всем известные алгоритмы, патенты и прочее? Продукты хорошие, решения умные, да. Вот Лёхин пример про Адоуб и Фотошоп выше — безусловный лидер, продукт всех времён и народов, где там конкретно гениальность? Чтобы построить глобальный продукт, нужны каналы сбыта, локальные офисы по миру, глобальный маркетинг. Это решает. Вот этим ЛК, Абби, Параллелс и занимались последние годы. Качество здесь является необходимым, но далеко не достаточным компонентом. Первый ли Касперский по качеству — вопрос не очевидный. По одним тестам да, по другим Симантек с Маккафи гораздо круче. А вот то, что он глобальный игрок — очевидно. А уж гениальность разработчиков не является даже необходимым компонентом. Достаточно высокого профессионализма и умения угадать требования рынка в момент появления или подъёма рынка. Гениальность можно приписать создателям С++ или Юникса, Виндов или Мака в начале карьеры, Интернета и браузера, и в других подобных случаях. Насчёт локальности гениев: конечно, бывают такие, это вообще самый частый случай. Ну вот Шекспир тоже глобальный гений, так? А сколько ещё вы читали английских поэтов? Их там десятки великих. Сколько вы знаете? А сколько читали из тех, кого знаете? Киттса, например? Сколько вы знаете хитов всех времён и народов из детских и праздничных песен англичан? Вряд ли много, их нужно в детстве было слышать — по ним даже в 20-м веке засланных шпионов вылавливали. Ну разве что одержимый Западом человек без корней споёт зачем-то на собственном деньрожденьи Happy Birthday. А англичане сколько знают наших хитовых и вечных колыбельных, праздничных, застолльных песен? Да нисколько. То же самое с Фетом или Ахматовой — кто их читает в англоязычном мире? Да почти никто не читает. Да, с прозой полегче, её перевести проще. Да и то, скажем, бывают аномалии гениальности. Воннегут у нас популярнее, чем в США, насколько я читал. На съезде фантастов в 70-х кто-то из американцев удивлялся, что Воннегут так популярен в СССР. А он у нас очень хорошо переведён, сказали ему русские фантасты. «- А, ну да, Курт очень проигрывает в оригинале» — ответил тот.
Хочу добавить, что яндекс запустился в 1997, а гугл в 1998. И на мой взгляд, именно, глобальность/локальность, мышления определила сегодняшнее положение дел на рынке. Конечно, нет. Глобальность Гугла и локальность Яндекс определились не мышлением, а наличием среды и денег. Разрушенная депрессивная страна в начале девяностых или бурлящая от денег Долина — разные вещи. Где бы Яндекс взял 20 миллионов долларов на железо, которые Гугл получил буквально в самом начале? И следующие?
Интересно, а почему Янлекс не использовал сидящий у него под носом набор платных и бесплатных ссылок в виде его собственного каталога сайтов ? Возможно на этом примере его алгоритм не будет выглядеть успешным…
Ашманову Деньги были и в то депрессивное время. Ответ на ваш вопрос дает Сегалович: «> Не умеем мы это, никогда не умели, и уметь начинать не хочется. «
А сколько читали из тех, кого знаете? Киттса, например? Игорь, Вы, наверное, шутите. Вы и вправду думаете, что общаетесь с идиотами? Воннегут и, например, Шекли и Брэдбери, а также ряд других очень неплохих фантастов (насколько это можно говорить о Воннегуте, все же фантастика для него была только инструментов) были популярны в СССР за свои левые взгляды, а не за величие своего творчества (которым обладали, в США они активно читаются). Другой пример — Джанни Родари. Не так уж популярен на родине, но любим в СССР. За что? За левые взгляды. Большинство этих хитов несомненно приятны для слуха, но гениальностью не отличаются Времена года Вивальди, 5ый Брандебургский концерт Баха, Мессия Генделя, Моцартовский Eine Kliene Nachtmusic, 5ай симфония Бетхована, Fantastique Берлиоза, итд гениальны не тем, что прикольны и любимы современниками в стране композитора, а тем что полностью поменяли понятия о музыке в свое время среди композиторов разных народов. Это и есть гениальность.
Фотошоп вообще очень интересный пример. Сам фотошоп сделал Knoll. Дальше успех, развитие, все такое. Но у продукта — практическая стагнация с 5-й по 7-ю версию (более старых я не застал). Потом, опа, версия CS, которая отличается встроенным (на самом деле — отдельным) плагином для импорта картинок с цифровых камер. И опять — эту фишку сделал Knoll. Как разработчик — ну я не назвал бы его гениальным, я представляю как там внутри все работает, все обычное. А вот потребности пользователя Knoll два раза угадал (или сформировал) очень хорошо
> А вот потребности пользователя Knoll два раза угадал (или сформировал) очень хорошо В этом и гениальность :-) Мифы про «мыслить глобально», «быть на острие», «решать сложные задачи» — только мифы :-)
Разрушенная депрессивная страна в начале девяностых или бурлящая от денег Долина — разные вещи. Возьмите 2008 год. Страна, цветущая на нефтедолларах, Яндекс — огромная корпорация сравнимая по размеру с гуглом 2003 года, огромное число разработчиков, а воз и ныне там — маленькие локальные задачки. Парочка тысяч гугла в 2003 году сделала поиск (а также карты итд) для всего мира, а полторы тысячи яндекса работают на поиск для одного процента мирового траффика и мирового интернета.
Друзья, Вообще, тема абсолютной гениТальности раскрыта чрезмерно. Остаются только вопросы связанные с размерами Ваших личных гениТальностей, которые лучше решать при очной встрече. Ибо наглядней.
В этом треде о личной (своих разработчиков) латентной гениТальности говорил только один человек.
А сколько читали из тех, кого знаете? Киттса, например? / Ашманов Игорь, Вы, наверное, шутите. Вы и вправду думаете, что общаетесь с идиотами? Нет, сначала я так не думал. Тем более, что я вообще не знаю, с кем я тут общаюсь. Какие-то бесплотные голоса самомнения и невежества. Но теперь начинаю и так тоже думать временами. Я ведь вас спросил про английских великих поэтов, вы вспомнить ниасилели, стали фантастов вспоминать. Потом на музыку перекинулись. Ну и как о вас думать, в таком случае? Я уже написал там выше, что прозу проще переводить, а на самом деле — чем проза проще, тем ещё проще переводить. Так что Конан Дойль погениальнее будет, а уж Чейз и Кинг — вообще гении всех времён и народов. «Я распахнул дверь рукой, и он выстрели в меня пулей из пистолета». Фишка в том, что мы вообще говорили о локальности, о том, что обязательно нужно переводить. Именно потому, что Гугл не переведён на русский, он и не занимает 80% рынка здесь, как в Штатах. Он не работает с метным рынком, вот что значит «переведён». Вообще там, где есть сильный локальный игрок, понимающий рынок, Гуглу непросто. А то, что Яндекс мог бы стартовать глобальный проект и не сделал этого — правда. Это очень непростое решение, лежащее исключительно в бизнес-области, потому что никаких особенно новых технологий им бы не потребовалось. Только решение потратить десятки миллионов долларов на железо и создание кластерной платформы с распределённым индексом. Понятно, что когда у них были сотни тысяч, нужны были миллионы, а когда уже были миллионы, нужно было тратить уже десятки, то есть занимать, двигаться в долях и т.п. Но это было возможно (да это и сейчас возможно). Хотя сейчас десятки миллионов у Яндекса есть, а нужны сотни. Думаю, им помешали ваши единомышленники внутри компании, которые поклонялись Америке как источнику силы и знания и ужасались самой идее играть глобально для маленького провинциального игрока. А вот Касперские и Абби такое решение приняли с самого начала и выиграли.
вы действительно считаете, что гениальному разработчику надо стремиться в FB/Google/MS/Adobe/Oracle в их текущей фазе? Становиться ведущим инженером по кручению гайки №6 ключом на 18? «Да вы ох..ли» (как говорили избиратели Монголии про гусиную х…ню) Леха, ну а ты откуда знаешь-то ? Ты же никогда в таких местах не работал.
Я не работал — и не собираюсь. Потому что достаточно послушать что именно обсуждают друзья-коллеги, работающие в таких местах (а их навалом, я довольно общительный) — и сразу не хочется.
достаточно послушать что именно обсуждают друзья-коллеги, работающие в таких местах Ну и что же ? Без имен-фамилий-интимностей. А работать, конечно, нужно в вашей шаражке. Кстати, не подскажешь, что вы сделали значимого за последние пару-тройку лет ?
Гюльчатай, личико приоткрой…..
О parallels, vmware и гениальности. Вот Фабрис Беллар не спешит работать ни в adobe, ни в parallels/vmware http://en.wikipedia.org/wiki/Fabrice_Bellard а спокойно занимается ffmpeg и qemu. Что по алгоритмам вовсе не уступает названным выше продуктам.
Да, с прозой полегче, её перевести проще. Да и то, скажем, бывают аномалии гениальности. Воннегут у нас популярнее, чем в США, насколько я читал. На съезде фантастов в 70-х кто-то из американцев удивлялся, что Воннегут так популярен в СССР. А он у нас очень хорошо переведён, сказали ему русские фантасты. «- А, ну да, Курт очень проигрывает в оригинале» — ответил тот Падшая женщина, это бородая байка, которую, кажется, Довлатов придумал (могу ошибаться насчет Довлатова). Воннегут очень и очень популярен в США. Причем среди молодежи тоже. Гораздо популярнее, чем в России, где про него почти никто не знает. Это понимаешь, когда приходишь в гости, а там Воннегут на диване. Летишь в самолете, а молодая девушка рядом читает Воннегута. Видишь Воннегута у коллеги (правда русскоязычного) на работе. Завязывайте, короче, со своими глобально-локальными дискуссиями. Я это все так вижу: те, кто работает-живет за рубежном, включая меня, убеждают людей, почему нужно жить глобально. Те, кто сделал свой домик в деревне — почему — в России интереснее. Удивительно, до чего людей довел постер на две страницы.
Вот хороший пример того, как вы думаете и спорите. Это может быть и байка; я-то её точно рассказал как анекдот. Но только речь шла там про 70-е (а мне кажется, что вообще 60-е) годы. Воннегут с тех пор находился в США и писал как заведённый. А в России его практически не переиздавали с начала 90-х, то есть почти 20 лет. Естественно, он стал почти неизвестен, несколько новых поколений выросло. А вы ересказываете свой эмигрансткий опыт здесь и сейчас, думая, что он абсолютная истина. Дискуссия здесь была не про то, что «надо жить глобально». А про вашу гордость неофитов, что круто может быть только в США. Это стандартный эмигрантский синдром, не находите? Да вы и не живёте глобально. Вы живёте именно в США, в стране, которая нагибает или старается нагнуть весь остальной мир, которая бомбит кого не попадя и так далее. Это страна только в том смысле глобальна, что хочет быть мировым начальником и жандармом. Ну и ладно, дело ваше, живите. Только пальцы не гните: вы там приживальщики, интеллектуальные таджики. Да, вы свою тамошнюю зарплату наверняка отрабатываете, но мощь и слава этой страны не вами созданы и к вам не имеют отношения. Вы просто как тот Мойша, который уехал на Брайтон из Жмеринки и теперь Жмеринку презирает, безо всякого на то основания. И свысока смотрит на глупых родственников, которые приезжают в гости. Ну и причиной дискуссии послужил не сам пост, а ваши оттопыренная губа и отогнутые пальцы. Слова про мелкие задачи, провинциальность и прочее. На самом деле, провинциальность — она никуда не девается. Можно вывезти Мойшу из Жмеринки, но Жмеринку из Мойши не вывезешь. P.S. Это я специально вас провоцирую, а то что-то вы стали как бы примирительно закругляться.
Кстати, а вот тут Ашманов и к больше напоминают американцев. Есть у американцев одна черта совершенно непонятная мне, европейцу. В провинциальной Америке есть такая странная черта, все считают, что они лучшие Каждый маленький ресторанчик в Аризоне или Техасе пишет «лучшие куринные крылышки в мире!», «лучшие шашлыки в Аризоне», «лучшие такос за пределами Мексики!». Конечно, ни в одном из их ничего особого примечательного нет. В общении с руководителями российских фирм я заметил подобную тенденцию. «У меня сотрудники гении!», «мы уникальны, таких как мы в мире нет!». Причем на конкретные вопросы вроде «в чем проявляется гениальность сотрудников», «что особого, инноваинного сделали эти гении», «в чем заключается ваша уникальность» , эти руководите российских фирм ответить не могут.
Можно вывезти Мойшу из Жмеринки, А что itman еврей?
О, теперь по антисемитам пройдёмся! Гомифобов-то уже осудили. Понятия не имею, кто такой Итман. Эмигрантский синдром у всех одинаков, независимо от национальности. И связан с постоянной потребностью напоминать себе, что не зря уехал. А это можно сделать одним способом — гнобить место, откуда уехал. За провинциальность, мелкость, местечковость. Неизбывную неглобальность.
Кстати, а вот тут Ашманов и к больше напоминают американцев. Я-то здесь при чём? Я про гениальность своих сотрудников ничего не говорил.
Нет. Роем, это все же не Рио-де-Жанейро… :(
Ну наконец-то, а то мне уже надоело постоянно стирать белые штаны.
Действительно, как бы попросить товарищей не трогать грязными руками мечту детства? Может стоит повесить табличку типа «только для посетителей в белых штанах», или «любителей говнорашки и гениТальности не беспокоить»?
Правильно, То, что Вы, Игорь, анекдотами мыслите — это хороший пример Вашего мышления. Зачастую очень спорными анекдотами. Кстати, надеюсь, Вы поняли, что высказывание вначале моего предыдушего поста — это междометие :-))) а не обращение. Надеюсь, что Вы поняли, а не обиделись. Кроме того, Вы меня вечно путаете с другими людьми, что-то там когда-то говорившими про жизнь только там и только тут. И по поводу мышления, наверное, такая же путаница. Я не обижаюсь, нас таких много, а Ашманов — он один. То, что работа программиста на американскую компанию в среднем интереснее и приятнее, чем на российскую, это практически очевидный факт, который даже наверное такие зубры, как Сегалович и Ашманов в глубине души понимают, но просто признать боятся. Спорить о том, где лучше — очень глупо. Когда в начале девяностых в России было сааавсем плохо, этот вопрос был более или мнее очевиден. Теперь, когда в и России можно заработать на (кон)домик и гольфик, он спорный.
То, что работа программиста на американскую компанию в среднем интереснее и приятнее, чем на российскую, это практически очевидный факт … Этот факт очевиден, если и когда уже выбрана система ценностей. Сначала нужно определить, что такое интереснее, приятнее, в общем, лучше. Когда в начале девяностых в России было сааавсем плохо, этот вопрос был более или мнее очевиден. Не совсем. У нас в голодный 1991 уехала вся команда, которая делала ОРФО 1.0. Ехали всем колхозом, на подготовленное место. На меня с женой тоже был контракт, но я не поехал. Последние уезжали 21 августа 1991 года, если вам это ещё что-то говорит. Я не поехал. Хотя до этого побывал в Штатах и посмотрел, как что. Для меня там оказалось не лучше. Так вот уезжавшие оставили здесь стариков, которые перемерли. Про разрыв с друзьями уж не говорю. А дети приехали в первый раз уже на могилы. Когда лет через семь-восемь дали гринкарту (и они уже не боялись, что визу обратно не дадут). Так что лучше — это очень по-разному. От человека зависит. Да, уезжая, они мне говорили, что для родителей так тоже лучше — так они хоть денег будут присылать, а так, мол, что. А приезжая потом, постоянно сравнивали «у нас» и «у вас» и уезжали с твёрдым чувством, что всё было не зря. «У них тут» — херово. Причём всё, во всех аспектах. А как же иначе. А у меня в 1994 отец внезапно заболел раком и умер. Я его держал за руки, когда он делал последний вздох. Для меня это — лучше. И бабушка пролежала последний год в соседней квартире, я нанимал круглосуточных сиделок, умерла на глазах. Им так было лучше. А так бы я уехал в 1991, писал бы письма, узнал бы о смерти из звонков, приезжал на могилу и оправдывал себя всякой хернёй про материальные блага, про лучше для меня. Сейчас отъезд не такой кардинальный поступок, а если в 20 лет, то и не такой судьбоносный, родители ещё молоды, детей нет. Но всё равно «лучше» — очень зависит от. У нас в компании, кстати, говоря, нет утечки умов — отъезд в США не является конкурентом при найме и потом тоже. Видимо, у нас работают дураки, ведь умные обязательно уедут в Штаты.
Пиар Ашманова и партнеров утомил, воистину.
В ответ на тезис о работе — написать то, что Вы написали, Игорь … какие ещё нужну аргументы? Никаких.
Игорь, все уже давно поняли, что мы все вокруг дураки, один вы на коне в платье красивом стоите. Но не хватит ли? Тут не только дураки бывают.
«один вы Дарьтаньян на коне в платье красивом стоите», конечно же
> один вы на коне в платье красивом стоите В платье красивом? Стоите? Вот это фантазия, камрад.
На веки умолкли веселые хлопцы, Ашманов их всех утомил…
При чём тут это. Ни АиП, ни мой личный пиар тут не при чём. Я об устройстве реальной жизни говорю. Просто отъезд в другую страну — это всегда моральный выбор, а не прагматический. Потому что ты разрываешь кучу связей ради лучше, мир посмотреть и т.п. На это нужно смотреть трезво. Я в 91 году был дурак-дураком, хорошо, что чудом не уехал. Сейчас уже понимаю. Но я вижу, вас зацепило, сразу пошли обиды. Это показательно. Кстати, в западном мире вообще не принято публично разговаривать о смерти, её как бы не существует. Упоминание — неприличный поступок. Ну уж извините, пацаны.
Игорь, Вы даже совсем невнимательно прочитали то, что я написал много раз. Я написал на западную компанию. Специально, чтобы избежать этой гнилой за-и-против эммиграции дискуссии. Вспомните Митричева. И то, что от Вас или из Яндекса люди не уходят, получив хорошие опционы, это еще не значит, что Гугл — Вам не конкурент. Нужно еще посчитать, сколько людей к Вам не приходят, а вместо этого уходят в Гугл. Или в другую западную компанию.
А чего? В красивом платье Ашманов такой стоит на коне, вокруг партнеры, партнеры. Умиленный камрад рассуждает о «не только дураках», итман мелко подтусовывает где-то вдалеке. И тишина.
> Но я вижу, вас зацепило, сразу пошли обиды. А как меня зацепило! Сапсем в шоке от красноречия и убедительности.
Я написал на западную компанию. Это вы предлог on так перевели в уме? Специально, чтобы избежать этой гнилой за-и-против эммиграции дискуссии. Это вы написали про «лучше работать», А я просто пояснил, что работать на западную компанию — почти всегда штука с обременением в виде разрыва связей и покидания родных. И заодно напомнил про истоки презрения к провинциальной говнорашке. Да, можно работать и здесь в Гугле, но что-то на лицах местных гуглеров не видно райского счастья, да и зарплаты такие же. Что касается конкуренции по кадрам — ну тех, кто хочет уехать, удержать всё равно невозможно, а нанимать глупо. У нас проблема кадров решена, нас кадры в целом устраивают. Почему я должен беспокоиться, что конкретный олимпиадник Митричев ушёл работать куда-то там? Ум в смысле IQ или умения решать задачи на олимпиаде вообще не является основным условием успешного найма. Основное условие успешного найма — давать результат в нужные сроки. По-моему, кстати, давать задачки при найме — чудовищная глупость, просто поглаживание эго основателей и текущего менеджмента. Я вообще не слышал о производственных результатах олимпиадников, реальные продукты делают другие люди, по-моему. Впрочем, этот кусок дискуссии в точности повторяет уже прежде слышанное на Роеме, в том числе с участием того же Сегаловича, меня и пр. Пошли по второму кругу. Юра, наверно, может и ссылку дать, а мне местным паршивым поиском искать тот топик влом.
Нет, предлог на соответствует шаблону: работать на кого-то, на дядю? например. В любом случае, то, что написано про людей, это все очень эмоционально, далеко не всегда правда, и уж точно не имеет никакого отношения к качеству работы и ее интересности.
Дуэль, только дуэль!
Игорь Станиславович о вреде эмиграция Вы пишите простые понятные, но анекдотичные свидетельства «Родители умирали в одиночку». Это вовсе не зависит от того, где живет человек. Многие моих знакомых мигрантов, ездили в плохие моменты к родителям, мотаясь между США и Россией по 10 раз в год. Многие перевезли родителей в США. О разнице между жизнью пенсионера с детьми хорошими инженерами или учеными в США и в России надеюсь Вам говорить не надо. «гринкарт по 7 лет». Почти все русскоязычные моего круга получили гринкарт в срок до двух лет, многие менее, чем за год. Если Вы подаете как OR (Outstanding Researcher) Вы получаете ее почти мгновенно (менее, чем за год), Америка любит мозги. в отличие от России, которой наплевать на Вашу степень и которая даже не признает научные степени, полученные в зарубежных университетах
> По-моему, кстати, давать задачки при найме — чудовищная глупость, просто поглаживание эго основателей и текущего менеджмента А что нужно делать при найме?
Ашманова нужно приглашать собеседующим, ясно же. Расколет любого под орех.
Ашманов молодец.
Про гринкарты Игорь прав: это ближе к 7 годам, хотя ученые их получают быстрее, но тоже не всегда. Зависит от того, делают ли тебе EB-2 или EB-1.
> в отличие от России, которой наплевать на Вашу степень и которая даже не признает научные степени, полученные в зарубежных университетах Можно подумать, США признает степени, полученные в России.
itman Это зависит от страны рождения, скажем японцы получают быстрее, чем китайцы, а украинцы быстрее, чем русские и от степени OR требует хорошего СВ и пяти рекомендация от приличных ученых. Пролетает быстрее, чем за год. Это еще от штата зависит.
> А что нужно делать при найме? Ясно что. Собеседовать по тому предмету, которым будет заниматься потенциальный работник. Проверки айкью и олимпиадные задачки — от лукавого.
А что нужно делать при найме? Психологически опросы. Будет ли испытуемый исправно кричать корпоративные кричалки и выезжать в Сосновый Бор и прочие подмосковные дома отдыха на «корпоротив». Будет ли лоялен начальству. -Ваша компания подает на тендер на большой и денежный госпроект. Вы узнали, что Ваш начальник договорился об откате с госчиновников ответственным за тендер 1 Вы сообщите об этом в правоохранительные органы 2 Вы скажите начальнику, что он не прав 3 Вы сообщите высшему руководству миру, что Ваш начальник договориося об откате
проходной в России 4 4 Вы ничего делать не будете
Можно подумать, США признает степени, полученные в России. Конечно, признает Вон спросите у Юры Лифшицы, который получил кандидатскую в Питере и устроился в Яху, а также многочисленных русских ученых на професорских должностях в США и Европе.
> Конечно, признает. Наши кандидатские там обычно приравниваются к их магистерским. Но может и повезти, конечно. > Вон спросите у Юры Лифшицы, который получил кандидатскую в Питере и устроился в Яху. Как устройство в Яху связано с признанием США российских степеней?
Всегда поражает реакция мигрантов, когда говоришь, мол да зачем уезжать? большинство (большинство, не все) просто на г*вн* исходят. причём, никакого задней мысли и эмоциональной оценки за фразой нет. А начиналось, начиналось-то с SEO ссылок ;-)
Наши кандидатские там обычно приравниваются к их магистерским. Кем признается? Очевидно, Вы говорите не про исследовательские компании и университы, которые признают наши кандидатские. Видимо, Вы говорите об иммиграционных службах. Чем будет признана Ваша кандидатская зависит от той компании, которая пишет оценку Вашего образования. Если у Вас кандидатская и есть хорошие работы, то они могут приравнять вас в западному PhD
Можно ли в этой Америке купить раков к пиву?
>А что нужно делать при найме? http://asebrant.ya.ru/replies.xml?item_no=6978&ncrnd=2034 Ну, наверное, в ресторан водить нужно ;)
Уважаемый редактор! Может лучше про реактор? Создайте уж отдельную тему про ИТ-эммиграцию и обсуждайте там. Каждое обсуждение с большим числом комментариев стало сводиться к рассказам «почему я работаю на американскую компанию».
И в самом деле, прилипчивость этой темы про то, как там лучше, всего немного уступает теме о латентной гомосексуальности читателей Роем.ру. Чтобы всё же закончить про это: о вреде эмиграция Вы пишите простые понятные, но анекдотичные свидетельства «Родители умирали в одиночку». Это вовсе не зависит от того, где живет человек. Это всё верно. Но дело в том, что я рассказываю не анекдоты, а реальные случаи, которые наблюдал сам. Остальное может быть обобщением — а ведь вы тоже смотрите на то, что происходит с вами и вашими знакомыми, но потом бестрепетно обобщаете. Более того, я писал о начале 90-х, а вы берёте свой сегодняшний опыт и выводите, что мои примеры неправильные и нетипичные. В 90-х выехать было труднее, получить визу труднее, вывезти родителей ещё труднее и т.п. Конечно, если смотреть на это беспристрастно, виза, океан, работа заведомо создают дополнительные барьеры и разрывают связи. В любом случае уехавшие не видят своих престарелых родственников каждый день, не говоря уж про друзей. Конечно, жлобство конкретного сыночка может создать такой же барьер и здесь. Ну да ладно, что тут обсуждать, каждый решает для себя и обустраивает свою жизнь, как ему лучше. Просто не надо представлять дело так, что работать в США однозначно лучше и в Яндексе или Мыле работают сплошные провинциальные неудачники. Насчёт задачек — нет, меня звать на собеседование не надо, я психологически не гожусь для собеседований, слишком располагаюсь к интервьюируемому, не могу воспринимать критически, поэтому всегда прошу других партнёров компании разговаривать с программистами. Но задачки — это настолько распространённый миф, тесно связанный также и с «олимпиадниками», что надо было его зацепить краешком. На мой взгляд, задачки почти не выполняют свою роль фильтра, а решают пиар-задачи, а также задачу удовлетворения самолюбия тех, кто уже в компании работает. «Мы тут все умные и ты должен доказать, что не глупее». Масонский такой ритуал. Умный парень или нет — легко понять и так, поговорив десять минут; есть квалификация или нет — легко выясняется серией вопросов про предыдущие работы и чтением резюме. А вот будет ли устойчиво работать, нет ли личностных проблем и т.п. — задачками не выясняется, более того, ореол успешного решения таких задач может вуалировать проблемы. То есть вступительные задачки решают не деловые, а идеологические задачи. Мне кажется, задачки дают там, где пытаются создать секту «умных», это ритуал инициации для поддержания сплочённости и боевого духа, как обрезание или татуировка одростков у диких племён. Посмотрите, где их дают и спросите себя — «там секта?». Думаю, корреляция будет высокой.
работать в США однозначно лучше и в Яндексе или Мыле работают сплошные провинциальные неудачники. Как метко подметил один мой знакомый лучше быть CTO в российской компании, чем программистом в американской. А если сравнивать америка против России для одного и того же уровня, то лучше Америка. Дело даже не в лучшем жизненном уровне, безопасности от криминала, дело в стабильности. Российский программист не может ничего планировать на пять лет вперед. Помните, как кандидаты наук в 1987 планировали? Получу доктора, потом квартиру, со временем машину. А вместо этого получили сбор и сдачу стеклянных бутылок потому, что денег на еду не хватало, а кто на машинах «бомбил» (один весьма известный и уважаемый ученный-физик).
прошу прощения за опечатки и двойные буквы, клавиатура неудобная
Ашманову из олимпиадников, которых я знаю мало кто стал хорошим ученным, но много отличных программистов, работающих над проблемами статистического анализа, оптимизации, веб поиска, создания быстрых ядер для баз данных. Сама структура олимпиадных задач очень похожа на задачи в этих областях — найти какой-то «умный» хак, который задачу с оптимизирует или вытащит нужные данных из хаоса, при этом задачи обычно сравнительно маленькие по с точки зрения времени и умственных усилий по сравнению с наукой (фундаментальной, а не статьи SIGIR/WWW равные тем же олимпиадным задачкам) Так что если вы хотите набрать народ в веб поиск, оптимизацию ядер баз данных, то вам надо брать «задачо решателей»и прочие характеристи умного парня вас мало интересуют.
опять н западает Пр
А «знания» мало, что значат. Умный парень, решающий задачки не зная с++, через месяц будет равен «опытному программисту» с 5 летним опытом с мозгом не заточенным на решение задач, а через год это переплюнет любого «опытного программиста, 10 лет в индустрии» с бесконечным разрывом Если Вы нанимаете на работу, посмотрите на индийских ребят из хороших IIT (почти все крупные задачи современного ИТ в той или иной степени решены ими) Образование там плохое, никаких фундаментальных знаний нет. Но, у них конкурс 200 человек на место, и выигрывают его действительно лучшие. В любой области они через месяц будут равны опытным середнячкам с пятилетним опытом, зачем требовать от них знания «дизайна и паттернов», «архитектуры» «конструирования систем с большими нагрузками», они овладеют этими знаниями через пару месяцев, а то чем не овладеют сами придумают.
> Родители умирали в одиночку Джисус Крайст говаривал: — «Пусть прошлое хоронит своих мертвецов.» Ваше дело — будущее. Если ваши отцы-деды обеспечили вам нормальный паспорт, будьте добры обеспечить детям такой же, но не пропуск на нефтехранилище. Сдается мне, что в этом смысле больше шансов у амэриканских заокеанеров.
А нет опасения, что ваши дети отнесутся к вам так же, как вы к своим родителям? Не говоря о том, что воспитание без бабушек — неполноценное.
Гипотеза о том, что опыт заменяется умом — неверна.
> А нет опасения, что ваши дети отнесутся к вам так же, как вы к своим родителям? А вы за себя не сцыте. Все будет ровно, Джисусу стоит верить.
> Образование там плохое, никаких фундаментальных знаний нет. Но, у них конкурс 200 человек на место, и выигрывают его действительно лучшие. Как можно написать, скажем, модель ядерного взрыва без фундаментальных знаний? Отобрать из 200 полуграмотных (по вашим словам) самого достойного — это большое достижение, так? > Джисус Крайст говаривал: — «Пусть прошлое хоронит своих мертвецов.» Вы опять нифига не поняли. Ни «в этой» стране, ни «в той». > Ваше дело — будущее. Если ваши отцы-деды обеспечили вам нормальный паспорт, будьте добры обеспечить детям такой же. А потом спрашивают, а почему у нас всё так плохо.
полуграмотных (по вашим словам) Полуграмотный выпускник ИИТ имеет весьма неплохие познания в математике и заметно похуже знания в информатике. Скажем на уровне не лучшего undergraduate западного университета. Этого недостаточно чтобы построить модель ядерного взрыва, но за 2-3 месяца вполне можно наверстать базовые знания в какой-то одной области (конструирование компиляраторов, оптимизация запросов для много терабайтных БД) и успешно работать в этой области
2 Ego 01.06.2009 10:48:27 Да, именно так :)
> Полуграмотный выпускник ИИТ имеет весьма неплохие познания в математике и заметно похуже знания в информатике. Ну, тогда он не полуграмотный :-). Если вы хотели сказать, что отсутствие каких-то глубоких знаний по программированию можно наверстать за n месяцев усиленного натаскивания, при условии наличия хорошего физмат-базиса = я с вами согласен. Видимо, не так понял вначале.
вдогонку хотя опыт реальных проектов всё равно решает. А опыт + физмат-базис = вообще разрывает на куски.
Мне кажется, задачки дают там, где пытаются создать секту «умных», это ритуал инициации для поддержания сплочённости и боевого духа, как обрезание или татуировка одростков у диких племён. Посмотрите, где их дают и спросите себя — «там секта?». Думаю, корреляция будет высокой. Игорь, если в IT компании среди программистов нет «секты», то это значит: 1) либо там работают одни неопытные студенты, у которых еще не сформировалась точка зрения на то как правильно все делать. 2) либо сотрудникам все по барабану и они работают по принципу «мне башляют — я фигачу»
ах, да: >Посмотрите, где их дают и спросите себя — «там секта?». Думаю, корреляция будет высокой. Посмотрите, где их НЕ дают и спросите себя — «там секта?». Думаю, корреляция будет высокой. Это так, о логике статанализа ;)
Всюду секты! Мы опасносте!
>Мы опасносте! Все гораздо лучше ( = хуже). Секты зловешшше сплетаются в социально-сектантские сети.
Яндекс — секта. Задачки дают. Гугл — ясно, секта, задачки дают. Микрософт — секта? Не совсем ясно. Задачки дают. Абби — точно секта. Задачки дают. Мыло — не секта. Задачек не дают, вроде? Рамблер — не секта. Задачек не дают. Яха — не секта? Задачек не дают? Одноклассники — не секта? Задачек вроде не дают. ВКонтакте — неизвестно. Про задачки неизвестно. Наверно, секта, раз такая секретность. Или банда. РБК — не секта, скорее банда. Задачки не дают.
Уж лучше давать задачки, чем не давать. Этим вы помогаете понять кандидату, что из себя представляет компания, и что ценит в сотрудниках ;)
Ашманову: «сектанство» необходимый элемент успешной инженерной компании, без «сектантства» нет эмоциональной вовлеченности разработчиков. Со всеми вытекающими.
необходимый элемент — как раз вовлеченнность, а сектанство — метод. грубый, но вполне рабочий ;)
Кстати, Яндекс мне не давал задачек, а Рамблер — давал. Апорт давал, но не задачки. Я теперь затрудняюсь сказать, что секта, а что нет. Сильно подозреваю, что по сектанству их всех переплюнет АиП.
Это да, но мы не даём задачек. Мы делаем обрезание и татуировку, это лучше работает.
Что-то флейм поутих. Для разогрева: http://clubs.ya.ru/company/replies.xml?item_no=16790
>Мы делаем обрезание и татуировку «татуировку одростков» (ашманов 01.06.2009 09:24:30 ) И как одростки?
2 sadovsky ничего не поутихло ;) Мои поздравления, молодцы (особенно — молодец :) !!!
To sadovsky: > Для разогрева: > http://clubs.ya.ru/company/replies.xml?item_no=16790 To iseg: >Статья научного сотрудника Яндекса Дмитрия Павлова (Yandex.Labs) … > Ой что это? http://www.kdd.org/kdd/2009/papers.html Large-Scale Behavioral Targeting Ye Chen* Yahoo! Labs; Dmitry Pavlov Yahoo! Labs; John Canny Computer Science Division University of California Berkeley ———— Yahoo! Labs ———— ^^^^^^^^ По-видимому, теперь можно сказать, что все публикации Yahoo пишутся сотрудниками Yandex. Зря была вся эта дискуссия — сколько публикаций у Яндекса!
Игорь, я бы посоветовал сразу делать лоботомию. Работать вряд ли смогут, зато никуда не уйдут. Ни в яндекс, ни в гугл.
http://www.kdd.org/kdd/2009/papers.html Abstract Submission: February 2, 2009 23.59, Samoa time (GMT-11) (Expired) Electronic Paper Submission: February 6, 2009 23.59, Samoa time (GMT-11) (Expired) http://www.linkedin.com/pub/dmitry-pavlov/2/a7b/95 Director of Research and Data Mining Yahoo! (Public Company; YHOO; Internet industry) December 2006 — February 2009 Пока он этот paper писал, он еще в Yahoo работал Ай-яй-яй, недоглядели пиарщики из Яндекса :)
> Умный парень или нет — легко понять и так, поговорив десять минут; есть квалификация или нет — легко выясняется серией вопросов про предыдущие работы и чтением резюме. Игорь — ты не прав. Есть огромное количество людей, которые могут достаточно складно рассказывать о том какие у них предыдущие проекты и опыт, написать отличное резюме, но работать не умеют. Сейчас у нас на собеседовании программиста просят на ноуте написать кусочек кода. Не олимпиадный — просто из жизни. Ты не представляешь сколько складно разговаривающих умных людей с многолетним опытом не могут написать программу размером в 100 строк, которая на старте не падает. Мнение, что в Яндексе дают «задачки» наверное частично обосновано. 5 лет назад тут вообще никто не знал, что спрашивать человека на собеседовании. Их и сейчас по инерции дают — только уже приближенные к реальности, и факт их решения не играет решающую роль в принятии решения. Но с моей точки зрения посмотреть на код наиболее хорошо кореллирующий с полезностью человека фактор. > А вот будет ли устойчиво работать, нет ли личностных проблем и т.п. — задачками не выясняется, более того, ореол успешного решения таких задач может вуалировать проблемы. А что касается личностных проблем. Ну сам же рассказывал на РИТ как выглядят хорошие программисты. Они бывают маленько невменяемые с точки зрения нормального человека. Так зачем их отсекать по этому признаку. Если особенности характера мешают работать, ну расстанемся. Если не сильно, то этот человек может оказаться не смотря на странности тем самым «гениальным» программистом.
По десятилетнему опыту приема экзаменов/зачетов в МГУ (и более длинному — найма на работу) имею сказать, что все эти задачки и прочие вопросы на экзамене нужны самому студенту (соискателю), чтобы он считал полученную оценку справедливой. А экзаменатору(собеседующему) — не нужны, можно почти на любую тему говорить. Да и с программами не так все просто: само по себе собеседование — стресс, а если вдобавок испытуемый может программировать только в измененном состоянии сознания и ему на каждые 100 килобайт гениального кода нужно две дорожки и пять раз дунуть? Система с написанием программы на входе (не в привычных/комфортных условиях) будет уверенно отбирать именно олимпиадников, тренированных на стресс. На мой взгляд, самое важное на собеседовании — это установить, можете ли вы с испытуемым коммуницировать. Если не можете (система понятий-умолчаний не совпадает), то ничего хорошего не получится в любом случае — даже сверхгениальный человек потребует чудовищных расходов на управление.
Если ему обрезать и татуировать одростки — нормально.
Дима перешел в Яндекс? когда же это случилось, он же совсем недавно был в Яху. Смеюсь А почему Сегалович написал, что статья сотрудника Яндекс? Там же явно написана аффилиация Ye Chen* Yahoo! Labs; Dmitry Pavlov Yahoo! Labs; John Canny Computer Science Division University of California Berkeley и компании обычно не присваивают себе результаты сотрудников, которые разработаны в других компаниях Вон, в ИБМ Микрософт и прочих когда собирают список статей наших сотрудник явно указывают «присылать только статьи разработанные у нас и в которых аффлиация — наша компания» Или Яндекс уже в полной despair?
2 sadovsky + iseg 1) еще раз поздравления – с удачным приобретением :) 2) а про введение в заблуждение – разумеется, заслуживаете вытутаировки одростков ;) До основанья. И затем ;)
lexa, с понятиями всё более менее ясно (скажем, достаточное совпадение-то за пару часов не выявить — но можно выявить достаточные для невзятия несовпадения) — ну а как в такой системе отсеять тех, чья квалификация недостотачна? такая система хороша только в большой компании, которая, скажем, ежегодно на конвеер принимает выпускников, дальше уже как-то там чуваки растут, наставничество, то сё. в маленьких компаниях так сложно. я правда не давал никому писать программы, давал читать и исправлять. но мне кажется, что давать писать по мелочи — очень полезно. но именно по мелочи. если честно, я пока просто не придумал, как это всё комфортно для испытуемого обустроить — это действительно непросто, просто дать ноут и вперед — это, по-моему, тоже не выход.
надо будет Майклу Аррингтону подкинуть Все русскоязычные теоретики ИР (Борковский, Дима, там еще какой-то было индексом занимался) из Яху перешли в Яндекс, может на техкранч выкинет, это забавно.
Director of Research and Data Mining А откуда директор? Он же только доктора получил в прошлом году и статей совсем не много.
fisher, жизнь в любом случае богаче. Вот, например, понимание есть, квалификация есть, но человек всерьез бухает. И выясняется это только когда обнаруживается корреляция «получка — три дня нету» т.е. примерно через полгода. Но вообще мы же все привыкли к ситуации кадрового голода (2003-2008-го годов), когда брать приходилось что дают и таки да, доучивать, тренировать и все такое. Т.е. выбора большого и не было, если на вакансию возникал реальный выбор (среди потенциально сильных) — это было удивительно.
Для тех кто хочет писать статьи на www/sigir Яндекс Лаб в Бирлингеме по-прежнему нанимают народ http://www.eltisolutions.com/Eng_and_Research/ynd_sse.html http://www.eltisolutions.com/Eng_and_Research/dex_cpp.html
itman Леня, а ты собираешься в кремниеводолиновый Яндекс? Тебя бы туда директором взяли или принципальным инженером, ездил бы в Москву большим барином, бывшие начальники с поклоном будут тебе кофе подавать и кланяться.
Назовите, пожалуйста, результаты, полученные в YaLab за ~ год ее существования. Ну хотя бы один, пусть самый маленький, но все же как бы и результат :)
AE> Ну хотя бы один, пусть самый маленький, но все же как бы и результат :) Доказали, что в Яху, Майкрософтах работают не боги, а даже ровно наоборот. Ну и задолбали всех.
Доказать, что в Гугле работают не боги не удалось ?
Ну хотя бы один, пусть самый маленький, но все же как бы и результат :) Там работают над секретными проектами. С чего вы взяли, что какие-то данные будут опубликованы в сети? Инфраструктура яндекс улучшается, строится бОльшой индекс, новый поиск отвечает на английские вопросы, Вам этого мало?
В Яху и микрософт работают очень сильные разработчики. Поиск Яху по-прежнему очень сильный, непрерывно появляются новые иновационные фичи. Попробуйте Бинг
А каким макаром Яху и Бинг (творение Майрософта) связаны ? Вроде бы на днях Батц недвусмысленно и окончательно послана Майкрософт…
Я не стал бы отрицать связь между способностью решать задачи и умением хорошо работать Смех смехом, мы тут с одногруппником обсуждали наш курс Те кто сдал приемные экзамены в институт успешны, а те кто не очень — не очень успешны Четкой корреляции нет, но если разделить 20 балов приемных экзаменов на группы 16 и ниже 17 и выше 17 и выше — ученые и инженеры, весьма успешно устроившиеся на Западе и в России, руководители крупных банков и предприятий 16 и ниже — финансовые аналитики нижнего уровня иерархии в своих банках, финансовые директора каким-то мелких компаний, ученые, пишущие мало статей и работающий в третьеразрядных университетах Конечно есть разбросы в распределении, но в основном искуственные . 15 бальники у которых успешные предприятия, потому, что родственник обеспечил госзаказы итт Вообщем, Ашманову я не стал бы пренебрегать способностью решать задачи, это много говорит о человеке.
Альтер Эго, а что такое нечеткая корреляция? Кстати, я бы не стал бы искать корреляцию между успехом в административной карьере и умением решать олимпиадные задачи с математическим уклоном. Совершенно паралельные умения, ИМХО.
Совершенно паралельные умения, ИМХО Мне тоже так казалось, но экспериментальные данные на сотне человек вполне доказывают, что корреляция есть (при significance level 0.05) как это ни странно. Так что тут или казуальная зависимость или какие-то скрытые переменные которые ответственны и за то, и за другое Такие дела Миша
Я имеол ввиду, что гипотеза «зависимости нет» дает вероятность наблюдения экспериментальных данных с вероятностью меньше 0.05
точные цифры — шутка
Вообщем, Ашманову я не стал бы пренебрегать способностью решать задачи, это много говорит о человеке. Не думаю, что говорит. Более того, хороший балл на вступительных говорит тоже не об умении решать задачи, а о совсем других способностях и навыках. Поясню на примере: если кандидат на вакансию — кандидат наук, о чём это говорит? Это почти ничего не гарантирует относительно его будущих достижений в компании, но как минимум он он довольно сложный проект в своей жизни довёл до конца. Причём этот проект включал в себя не только изолированное умение чего-то там решить, но и умение договариваться, работать совместно, организовывать, писать документы и успевать в сроки. Это всё важно, особенно для менеджера. Вот и высокий балл при поступлении, особенно в хороший ВУЗ, показывает не изолированное умение решать задачки, а также упорство, умение готовиться, стрессоустойчивость, социальный интеллект, социальное положение и т.п. Главное, что умение решать задачки являет только необходимым навыком, но далеко не достаточным. Поэтому, если кандидат кончил, например, Мехмат или Физфак МГУ, Физтех или МИФИ (список неполный), то вообще задачки решать он гарантированно умеет, тогда зачем они на собеседовании? Гораздо интереснее наличие интереса к делу, опыт, коммуникационные навыки, наличие собственных идей. Если ещё не читали, то советую почитать Джоэла Спольски про то, как собеседовать программистов, очень разумные вещи он пишет: http://www.joelonsoftware.com/articles/GuerrillaInterviewing3.html
Я с Вами согласен Умение решать не достаточный, а необходимый навык. Все же необходимый, а значит проверять его надо В целом, конечно, кандидаты с физтеха и мехмата со средними баллами около 4.75 и выше всегда были хорошими таких можно брать не глядя Правда, в последние годы там обучение резко ухудшилось и я не стал бы доверять дипломам так как раньше
Понравилось сравнение Эйлера с ТопКодером Конкурсы принципиальное не сравнимые, как математическая олимпиада с задачами «на смекалку» и SAT GMAT etc экзамен где надо решить много очень простых задач быстро. В Эйлере задачи простые, не более часа на каждую, два часа на самые-самые тяжелые и побеждает тот кто может посвятить несколько месяцев по два часа в день на то, чтобы решить две сотни задач. Можно, конечно, но можно сделать какой-то проект, принести пользу людям, два-три месяца вечернего времени это большая затра ДенДен, а это не Вас я привел в 30 минутный ступор задачей кидаем монету, она падает на решку, то есть статистика из одного кидания одна решка, с какой вероятностью монета падает на решку? Опровергает ли падение на решку гипотезу, что монета с равной вероятностью может упасть и на решку, и на орла
Нет, не меня. Но то, что вы написали, приводит меня в ступор, да. Не ясна постановка задачи. Что есть «монета»? Если привычная для задач по тер. веру материальная реализация бернуллевской случайной величины с вероятностью исходов {1/2, 1/2}, то ответы очевидны. Если автор пытается сообщить нам, что «монета» — это объект с вероятностью исходов {p, 1 — p} и просит найти p, то в этом случае, если пользоваться методом максимального прадоподобия, то да, p = 1, монета падает только на решку.
Мне кажется, задачки дают там, где пытаются создать секту «умных», это ритуал инициации для поддержания сплочённости и боевого духа, как обрезание или татуировка одростков у диких племён. Посмотрите, где их дают и спросите себя — «там секта?». Думаю, корреляция будет высокой. Ну да, это почти так, смотря что называть сектой, правда. Игорь, а что плохого в секте? Что плохого в ритуале посвящения? В команде, которая решает большую амбициозную задачу обязательно будут элементы сектантства. Просто потому что большие задачи в одиночку маньяками не делаются. Начинаются — да, но потом этот маньяк начнет культивировать секту. На мой взгляд, где нет «секты» (в вашем понимании) — нет и процесса решения задачи.
>статистика из одного кидания … LOL:) Проверка гипотез по одному наблюдению — жто реально круто, а вот сам доверительный интервал по одному набл. — круто уже просто нереально.
…потом этот маньяк начнет культивировать секту… На мой взгляд, где нет «секты» (в вашем понимании) — нет и процесса решения задачи. Да, это примерно так: а) исходный продукт создают увлечённые люди с большой харизмой. б) большая харизма вовлекает второй слой адептов, нанимаемый во что-то вроде секты. в) иногда это начинает фиксироваться в виде ритуалов и иерархии, речёвок, задачек при поступлении, тимбилдингов, людей-легенд и т.п. Проблема только в том, что это а) секта — всегда влбом случае виртуальная реальность, то есть некий ментальный слой поверх реальной жизни; б) иногда секта создаётся не в интересах добра и разума, а для рубки бабла с лохов, как в компаниях сектора МЛМ или спамерских, например; в) самое важное: это всё работает только на начальном этапе, а когда бизнес входит в регулярную фазу, сектантство начинает сильно мешать — что и можно было наблюдать во многих компаниях, включая Яндекс. На этапе регулярного бизнеса внутреннюю секту надо потихоньку изживать, а всякие фиксаторы вроде ритуалов инициации этому мешают, фиксируют состояние секты. Отсюда и возникают феномены 1937 года с избиением «старых большевиков», которые уже неадекватны задачам, но зажрались, крепко держатся за иерархию и власть.
Игорь, а почему тогда у вас сильные разработчики в компании не задерживаются ? Коваленко, например, еще знаю пару примеров сильных спецов ушедших от вас относительно недавно.
Игорь, а почему вы считаете, что «когда бизнес входит в регулярную фазу, сектантство начинает сильно мешать»? На мой взгляд, секта не даёт покоя только дураку аудитору, у которого оценка компаний идёт по галочкам и пунктикам: — разделены ла разработчики и админы? у кого из разработки есть доступ на сервера? — как выстроен регламент? как происходит этап внедрения? — можно ли быдлокодера А заменить быдлокодером Б? И каждый балл даёт поправочные коэффициенты, что влияет на виртуальную стоимость компании. Только вот это тот самый процесс изживания секты разрушает саму команду, приводит её если не к полной импотенции, то уже точно к неспособности создавать новое. Это уже не маленькие тигрята, которые покорят мир, это стадо полудохлых дойных коров, которых через какое-то время отправят на бойню. Теперь самое главное? Исчезла ли секта? НЕТ! Теперь она переросла в корпоративную религию с новыми божествами. Религию, в которой уже нету «общего дела», но зато есть личные интересы, желание встроится поудобнее в систему, выстроить отношения. В такой команде думают не о том как и что сделать лучше, а о том как сделать что-то такое, чтобы лучше можно было о себе написать в отчете. В такой корпорации уже не важно делать хорошо, важно втирать очки, писать кляузы. Хороша та компания, которая выросла и сохранила в ядре секту. Секту, которая хочет делать продукт, а не играть в корпорацию.
Пианист, хорошо быть сказочником. Гораздо хуже быть практиком и работать с этим ядром. Особенно, когда успехи вскружили ядру голову и оно пребывает в состоянии неадаквата 90% времени.
Игорь, а почему тогда у вас сильные разработчики в компании не задерживаются ? Коваленко, например, еще знаю пару примеров сильных спецов ушедших от вас относительно недавно. Тогда — это когда? Я разве говорил, что у нас секта или пожизненный найм? А так у вас, похоже, просто неверные сведения, вы слышали звон, но не знаете, где он. Коваленко в нашей команде работает с 1997 года (с тех сменив МедиаЛингву, Рамблер, АиП, Поисковые Технологии). 12 лет — это называется «не задерживаются»? Он сейчас числится в отпуске, будучи при этом акционером в одной из наших компаний. Это называется, что он не задержался? Причины отпуска у него те, что он всегда ещё был параллельно техдиректором и акционером в Мете.уа, и ещё имел пару строительных/автомобильных бизнесов на стороне, сейчас увлёкся стройкой своего бизнес-центра. И кто там ещё от нас из «сильных разработчиков» ушёл? Хотелось бы конкретных фамилий. Я сам вспомнить пока не могу. А вообще в уходе людей нет ничего ужасного или постыдного; люди растут, должностей для них не всегда хватает, опционы всем не выдашь. Иногда люди, наоборот, отстают от роста бизнеса, устают, женятся-размножаются, уезжают и т.п., и т.п. Одна из самых сильных причин — открытие собственного проекта, этому противопоставить что-то трудно. Инстинкт предпринимателя если уж появится, то всё. Разве что подсунуть свеженький стартап. Самые важные, сильные, ценные становятся акционерами, но это не массовое решение.
Я спросил допустим дана момент с равновероятным распределением Подкидываем монету 10 раз Какая вероятность выпадения пяти решек? -Правильный ответ Семь решек? -правильный ответ Монета, 0.7 вероятность выпадения 5 решек? -правильный ответ 7 решек -правильный ответ А тепень наооборот Монету, на вид вроде симметричную, подкинули 10 раз, выпало 7 решек, что можете сказать о монете? -Ну, скорее всего, да, ну, ну, ммм, думаю, что монета кривая, вероятность выпадения решки 0.7, раз семь решек выпало, ну,, м-м-м-м-м-м, ну, 0.7 общая формула m/n Хорошо, а если один раз подкинули и решка выпала -ну, мм-м-м, ответ очевидный, значит вероятность выпадения решки равна 1, эээээ, мммм. (полчаса) ммм-мм ээээ ммммм
Проверка гипотез по одному наблюдению — жто реально круто, а вот сам доверительный интервал по одному набл. — круто уже просто нереально. Так про это и был вопрос. «ведущий разработчик поисковых систем» «эсперт-специалист по машинному обучения» должен был разбираться в таких совершенно простых примерах и хотя бы, иметь простейшее представление о байесовском методе
Я и ожидал ответа, что можно и что нельзя вывести на основе одного (нескольких примеров) и отклонения результатов опыта от ожидаемого результата, а получил какую-то муть про монету с одной стороной (монета Мебиуса!)
Люди из одной секты мочат людей из другой секты. Делаем ставки, господа, делаем ставки! Храбрые, умные и благородные люди!
А вообще в уходе людей нет ничего ужасного или постыдного; Скорее даже наооборот. Когда люди не уходят, не организуют своих новых компаний и стартапов, не делают новые большие проекты в других компаниях, это говорит о том, что ценность людей мала, что они ничего не способны сделать за пределами своей компании — своего коллектива и скорее всего их должность давно превратилась в синекуру. Это как в американских университетах. Аспирант почти обязан найти должность постдока не в том универе, где онбыл аспирантом. Если человек не способен работать не в рамках одного коллектива и одного круга задач, это говорит о том, что он плохой специалист тлт ученый.
itman Я не принадлежу ни к какой секте Я вообще не работал больше, чем 2года ни в одной компании )
>Я вообще не работал больше, чем 2года ни в одной компании ) … увольняли нах
Я не принадлежу ни к какой секте Чорт обидно, я уж было попкорн разложил. *Складывает поп-корн обратно в шкафчик*
… увольняли нах Обидел чем-то?
>Аспирант почти обязан найти должность постдока не в том универе, где онбыл аспирантом Ну да, сразу вспомнил очень яркое и в точности про наоборот — Лейф Аззопарди. Не самый малоприметный. И ооочень общительный, по всему свету. Я это просто так, и к тому, что правил нет = типа никаких ;) а сплошь исключения
Он же в Европе всю жизнь работал Там не такие требования
>Он же в Европе всю жизнь работал Да, не спорю. Просто между защитой и постдокством в Глазго он успел побыть — постдоком же — ровно типа неделю-другую;) в столице кофешопов (и в этом смысле удовлетворяет критерию «не туда, откуда»;) А так он из Австралии [, где много диких кенгуру]
> Так про это и был вопрос. «ведущий разработчик поисковых систем» «эсперт-специалист по машинному обучения» должен был разбираться в таких совершенно простых примерах и хотя бы, иметь простейшее представление о байесовском методе Это кто такой?
> Проверка гипотез по одному наблюдению — жто реально круто, а вот сам доверительный интервал по одному набл. — круто уже просто нереально. Горе мне, горе. Задача и правда не должна вводить в ступор, ибо постановка привычна для статистики и решение тривиально. Для уровня достоверности x, оценка вероятности выпадения решки — 1, с доверительным интервалом [1 — x, 1]. Мозг вправился.
> Монету, на вид вроде симметричную, подкинули 10 раз, выпало 7 решек, что можете сказать о монете? Например то, что с вероятностью 0.9 вероятность выпадения решки находится в [0.45, 0.86].
> Например то, что с вероятностью 0.9 вероятность выпадения решки находится в [0.45, 0.86]. Тьфу, что с уровнем достоверности 0.9. PS Рашид Ильфатович, я никому не скажу, что вы читали мне тервер ;)
О собеседованиях А в какой компании кого просили кубик-рубика собирать на собеседовании «на смекалку»? А то я слышал от моего друга в Москве….
[0.45, 0.86] Ожидание 0,65 что-ли?
Каким образом такой интервал получился? Не может быть 0,65 в среднем Ден? Вы что неправильно округлили или как?
Да ладно фигней страдать. Вы бы лучше обсудили, какая там может быть сходимость при 10 испытаниях. Вроде гарантированная теоретически близость функций распределений получается на уровне 0.3 и, поэтому гарантированный доверительный интервал практически от нуля до 1. Заодно вспомнили бы, что одно из последних (скорее всего просто последнее) теоретических достижений о скорости сходимости в центральной предельной теореме сделано российским математиком: http://ms.cs.msu.su/ishevtsova/2006-BEconst.pdf
itman Вроде гарантированная теоретически близость функций распределений При каких априори?
Рашид Ильфатович остался бы недоволен. «Это все ваши девичьи метчы, а геометрическая прогрессия (доверительный интервал) это нечто другое. Садитесь, два!»
Любопытно сравнить выдачу Гугла и Яндекса по запросу Рашид Ильфатович Яндекс http://yandex.ru/yandsearch?text=Рашид+Ильфатович Гугл http://www.google.ru/search?hl=ru&q=Рашид+Ильфатович Что лучше?
При каких априори? Биномиальное распределение.
> имхо оба нормально отвечают. Во всяком случае я свое любопытство удовлетворил за счет текстов в сниппетах, даже не переходя по ссылкам.
>Любопытно сравнить выдачу Гугла и Яндекса по запросу Рашид Ильфатович Что лучше? Однозначно — Гугла. Хотя это и не его заслуга, а создателя документа в 5-й позиции, со сниппетом «Автор: Рашид Ильфатович или Вера Олеговна» . Всегда любил трансформации. Но не знал, что и такие возможны. Понравилось
а создателя документа в 5-й позиции? Не понял. Гуглу веб мастера помогают правильные ответы находить?
>Не понял. Чего? «Автор: Рашид Ильфатович или Вера Олеговна» — по-моему,забавно. Какие вебмастера, какие ответы? (т.е. и я «не понял»)
Альтерэги, вы чего к человеку пристали? Ну не знает тервер, это ж мелочи. У каждого свои недостатки. Главное, что чел умеет на собеседованиях спрашивать про сжимающее отображение http://denraskovalov.ya.ru/replies.xml?item_no=134&ncrnd=3033
Значение статистики для мат. ожидания — 0.7. Симметричный доверительный интервал может быть несимметричен, если не симметрична плотность. Плотность для биномиальной с p != 0.5 не симметрична.
Симметричный доверительный интервал может быть несимметричен, если не симметрична плотность. А какая именно несимметричная функция распределения использовалась Вами для подсчета доверительного интервала?
Тут можно применять или стандартный статистический подход с корнем p(1-9)/n, основанный на равнораспределении или bayesian update В первом случае получаем 0.7 в качестве ожидаемой вероятности выпадения решки и с доверительным интервалом во втором случае все зависит от априорного распределения, но при вычисления надо начинать с априорного распределения ДУмаю эти 0,65 скорее всего ошибка в вычислениях, видимо ошибка в округления от бездумного использования какой-то статистической библиотеки или микрокалькулятора без знания как реально вычисляется это формула
опечатка p(1-p)
ДУмаю эти 0,65 скорее всего ошибка в вычислениях, видимо ошибка в округления от бездумного использования какой-то статистической библиотеки или микрокалькулятора без знания как реально вычисляется это формула Альтер, а Вы какое распределение используете для оценки доверительного интервала с уровнем достоверности 0.9? Надеюсь не считаете бездумно, что за 10 бросаний у Вас оно сходится к нормальному распределению?
Как меня утомило. OK. Во-первых, говоря «доверительный интервал» мы не определяем автоматически методику его расчета. Есть два подхода — фреквентистский и байесовый. При фреквентистском мы не позволяем себе вычислять вероятности событий в пространстве неизвестного, но фиксированного параметра (по-английски confidence interfal), при байесовом — позволяем (по-английски credible interval). В фреквентистском мы фиксируем статистику и тест, принимающий или отвергающий гипотезу о значении неизвестного параметра, потом ищем интервал неизвестного параметра, при котором мы принимаем гипотезу при наших результатах эксперимента с нужной степенью достоверности. В байесовом мы предполагаем известным распределение результатов эксперимента, а распределение неизвестного параметра принимаем априорно равномерным. После чего ищем апостериорное распределение и ищем нужные (a/2, 1-a/2) квантили. Для биномиального распределения можно доказать, что апостериорное распределение неизвестного параметра описывается соответствующей бета-функцией. Обращая ее получим приведенный мною интервал. Если m != n/2, то распределение бета-функции будет несимметричным => несимметричным будет доверительный интервал. Я, наверное, запутаю, но можно решить ту же задачу проще при фреквентистском подходе. Пусть тест (Clopper-Pearson) будет следующим: при заданном исходе мы принимаем гипотезу о значении неизвестного параметра при уровне достоверности a, если вероятность попадания числа исходов в [m, n] будет больше (1+a/2) и вероятность попадания числа исходов в [0, m] будет больше (1+a/2). Нужные скрины выкладок в mathcad (в том числе та самая несимметричная плотность): http://img-fotki.yandex.ru/get/3602/denraskovalov.f/0_2e2d7_96e840fa_XL.jpg Интервал получается немного другим, но тоже несимметричным. Зато без бета-функции проще представить (лично мне).
Вместо 1+a/2 читать (1+a)/2. На рисунке верхняя и нижняя границы перепутаны, да.
В байесовом мы предполагаем известным распределение результатов эксперимента, а распределение неизвестного параметра принимаем априорно равномерным. Денис, Вы чего? С каким это пор в байесе принимается равномерное априори? В этом-то и преимущество байеса, что априори выражает наше априорное знание о распределении. В данном случае, например, мы могли бы предположить, что вероятность, что монета идеальная … скажем 0.9 …. . Равномерное априорное распределение есть весьма частный случай байсовского подхода и почти никогда не используется
Не понял о чем спор. Разве сотрудники Яндекса не публикуются на таких весьма престижных международных конференциях как RCDL и «Высокие нагрузки»?
могу сказать что при снежинксе, всё поменялось, особенно сейчас когда изменили текстовое ранжирование
предыдущий комментарий скрыт за строкой «Комментарий экперта. Развернуть?» Юра, починяй экперта.
а чего его читать то?
Вы, когда пользуетесь каким-то сервисом, хорошо бы посмотрели, как им пользуются и каковы его результаты.
Грохнуть бы его. Залез в тему годичной давности, ссылок на себя наставил. Явный спамер.
Не могу понять чего тут все так парятся по поводу SIGIR/WWW и прочей лабуды. Никакой науки в Informational Retrieval нет, достаточно взглянуть в proceedings конференции и прочитать хотя бы награжденные статьи. Нет никаких серьезных теорем и доказательств фактов, эти конференции ни в коей мере нельзя со сравнивать с серьезными разделами Computer Science докладываемых на FOCS, LICS и прочих конференциях по логике, вычислительной сложности, коммуникационным процессам, формальным методам, вычислительной лингвистике, теории баз данных, функциональным языкам программировании, теории типов итд. Вся IR это набор случайных методов и хаков. Типичная статья по IR «мы хотели узнать есть ли такие запросы географическая распределенность которых меняется со временем, вот красивые картинки о запросе ураган такого-то числа, он двигался вместе с ураганом» , «решили сравнить 10 алгоритмов по вычислению нечетких дупликатов, предложиди три своих метода, всунули в машину, вот время и точность каждого метода, метод 3 лучший по точности, метод 5 лучший по покрытию, метод 7 наибыстрый, метод 9 оптимальный по такой то функции», «нужно было построить архитектуру индекса для того, чтобы его можно было создавать в течение трех минут после поступления информации, 100 млн страниц в минут, три метода вот результаты». Нет никакой теории и понимания, есть набор случайных фактов и эвристик. Нет никакой повторяемости и проверяемости результатов необходимых для любой науки. Доклад, что метод 2 самый точный, а метод 7 самый быстрый почти не проверяем, так как не доступен код автора, а зачастую и описание метода опускает многие важные детали реализации. Вся эта Informational Retrieval по уровню научного развития похожа на ботанику 18 века.
Такова природа многих разделов практической компьютерной науки: строгих результатов нет, теорем нет, собственно науки (в смысле повторяемости, воспроизводимости, предсказательной силы) тоже нет, а работать надо. Но это судьба любой науки, имеющей дело с неповторимыми объектами и процессами, от геологии до социологии с экономикой: есть реальные объекты, а *экспериментов* (с повторяемостью и т.п.) — нет. И пользовательское поведение (как пример) — это те самые неповторимые процессы. Там где возможны повторяемые эксперименты, а тем более там, где имеют дело только с моделями (включая и чистую математику) — там проще, конечно (ну или сложнее: тамошняя наука не просто должна предсказывать, но это еще и проверить легко).
Вся эта Informational Retrieval по уровню научного развития похожа на ботанику 18 века. ну не на ботанику, а на основные элементы теории вероятностей и дискретной математики периода 1736-1763 гг.
Все же теория вероятностей тех времен это набор логических умозаключений из начальных посылок, а тут набор эмпирических наблюдений «этот алгоритм работает точнее на агглютинативных языках», «а эта трансформационная граматика дает почему-то повышение precision если ее используют таким способом, а если таким то почему-то понижает». Набор случайных классификаций в духе «роза похожа на шиповник, а на ирис не очень похожа». Больше на ботанику, чем на теорию вероятностей. Я думаю Сегалович очень жалеет, что ушел из красивой геофизики в такую херню.
Ну да, бегал бы сейчас по тайге с гравитометром, по вечерам бухал бы с работягами, романтика!
> очень жалеет, что ушел из красивой геофизики в такую херню. Наоборот, как раз в геофизике вполне в ходу соображения вида «если косинус азимута на северный магнитный полюс, умноженный на силу гравитационной аномалии и деленный на притяжение Венеры за 1937 год меньше 5 — то надо копать».
ушел из красивой геофизики Вот есть красивая теоретическая геохимия. Сидишь за компьютером, хрен к носу прикидываешь, строишь красивые модели. А есть настоящая, за кою основные деньги и платят, это когда из болотного сапога вынимаешь котлету из комаров из под коленки. Большая котлета — много комаров, маленькая — мало. Про геофизику я меньше знаю, но подозреваю что ситуация аналогичная: есть красивая геофизика, а есть практическая т.е. настоящая, тоже с котлетой из комаров, вся разница в том, что геофизики даже в сортир на машине ездят. Да, с теорией вероятностей и статистикой примерно та же хрень: есть чистая наука, с центральной предельной теоремой и прочими интегралами Лебега, а есть практика, которая гораздо веселее. Спросите у практиков (я — спрашиваю регулярно). Так у ежиков с IR то же самое.
Все же теория вероятностей тех времен это набор логических умозаключений из начальных посылок, а тут набор эмпирических наблюдений а откуда же брать предпосылки для поиска обоснований, как не из эмпирических наблюдений :)
Не согласен с теорией веселости. Я не спорю с тем, что деньги зарабатывать надо, но не вижу ничего в этом особого интересного и веселого. Просто «потребность», вроде потребности по утрам ходить в туалет по большому. Познание, конечно, важнее эффективности и «удовлетворения потребности юзеров», какой бы эта потребность ни была, в поиске информации или запивании гамбургера кока-колой Пример про кока-колу абсолютно аналогичный. Химики с образованием в квантовой химии работают технологами для кока-колы придумывая более эффективные методы и какие-то новые цвета напитка. Ситуация. Познание и красота науки против эффективности и потребностей юзеров.
Привет, Шабака!
Мне кажется, что сложный, эмпирический и эффективно работающий, но не обоснованный досконально теоретически алгоритм, приближающий нас капельку к искусственному интеллекту, гораздо красивее и интереснее голых и никому не нужных выкладок с интегралами Лебега.
С тем, что имели в виду, согласен, а с тем, что куда-то и зачем-то ввели — не очень: > Мне кажется, что сложный, эмпирический … гораздо красивее Мне кажется, что сложный ни-ког-да не бывает красивым. Другое дело, сама по себе, простота, она бывает и хуже…. > приближающий нас капельку к искусственному интеллекту Некоторые предпочитают обладать естественным. > голых с интегралами Лебега В IR не часто встречаются голые с интегралом Лебега, даже сам интеграл. И кстати, почему-то обычно по делу. Оставьте Лебега в покое. Все же умер человек.
Ну про искусственный интеллект я для красного словца ввернул, признаю.