мы порой предъявляем требования даже строже,
чем явно прописанные в законодательстве
Яндекс
Аналогии дело неблагодарное (статью на эту тему мне обещал написать Вячеслав Варванин", но ещё не написал), поэтому придётся проводить параллели исключительно с самим "Яндексом", чтобы позиция выглядела попрочнее.
Итак: с прошлой недели российская инфосфера сотрясается от постоянных публикаций на тему того, что с помощью "Яндекса" можно найти практически любую незащищенную от неавторизованного доступа информацию. Началось всё с "Мегафона" и злосчастных SMS его абонентов, которые им отправляли с сайта - они оказались в результатах поиска "Яндекса". При этом на сайте самого "Мегафона" их обнаружить уже не удавалось (по крайней мере автору этих строк о таких случаях неизвестно).
Позиция "Яндекса" по данному вопросу оказалась чиста как слеза младенца: компания индексирует доступные ей страницы в интернете и обслуживает тех, кто ищет данные. Если вебмастера незнакомы с тем, как работают поисковые системы и как использовать robots.txt - им рекомендуется расширить свой кругозор. Всё.
Вам это ничего не напоминает? Мне напоминает. "Яндекс" почти пять лет, с 2004-го по 2009-й год в связи с претензиями к рейтингу поиска по блогам постоянно утверждал, что рейтинг является зеркалом блогосферы (как сам "Яндекс" является зеркалом Рунета), поэтому все то плохое, что находится в блогосфере "Яндекс" просто отражает.
На смену концепции потребовалось почти пять лет и пролезание в блогорейтинг накануне девятого мая 2009-го поста поносящего советских солдат. За этот пост "Яндекс" огрёб по полной программе (дискуссии долетели и до Роема), а через две недели компания сделала разворот на 180 градусов и опубликовала эссе "Имеет ли Яндекс медийное влияние?". Ответ давался однозначный - имеет. Ещё через полгода, в ноябре 2009-го, рейтинг блогосферы "Яндекса" был закрыт
Тут очень интересно то, чем "Яндекс" мотивировал наличие у себя медийного влияния:
- медийное влияние имеют только несколько
действительно популярных страниц, которые
вся аудитория видит одинаково: главная
страница Яндекса и страницы, на которые
можно попасть по ссылкам, на ней
расположенным (находящимся «в одном клике»)
Компания, очевидно, подстелила соломку, чтобы её не дёргали всякий раз, когда по запросу "Путин" в "Яндексе" вылезает какая-нибудь ерунда. Но при этом не удержалась от того, чтобы показать, как поисковик может быть белым и пушистым. Если захочет:
По умолчанию мы считаем, что наша целевая аудитория — все пользователи интернета, любого пола и возраста. Поэтому к размещаемому на наших страницах контенту мы порой предъявляем требования даже строже, чем явно прописанные в законодательстве. Так, мы стараемся оберегать детей от недетского контента — на массовых страницах работают фильтры мата и порно
То есть, компания осознаёт, что её сервисы могут причинять вред. И принимает меры, для того, чтобы этот вред не причинять. Это не бизнес "Яндекса", продвигать мат и порнографию для детей. Я предполагаю (хотя на этот счет есть альтернативные мнения альтернативных главных редакторов), что искать клиентов секс-шопов или пользовательские SMS - тоже не бизнес "Яндекса".
И вот тут возникает расхождение: в одной ситуации "Яндекс" вред осознает и исправляет его, ничего не спрашивая у пользователей, а в другой - перекладывает все проблемы на вебмастеров.
Скорее всего, эта отмазка некоторое время будет работать, но недолго. Потому что до всех вебмастеров докричаться не получится в любом случае. В итоге будут страдать люди, которые никакой robots.txt нигде прописать не смогут - они лишь клиенты, а не владельцы сайтов. Их "Яндекс", в отличие от детей, жалеть не собирается
Дикий, дикий Запад
Было бы наивно предполагать, что данные проблемы свойственны лишь "Яндексу". В силу ошибок тех же вебмастеров, данные скачивают все поисковики. В Штатах проблемы подобного рода возникали еще полдесятка лет назад: в 2006-м данные номеров социального страхования 619 учащихся попали в Google.
Что сказали представители университета?
Catawba officials said Friday that, once they were notified about the discovery, they immediately removed the information from the school system's Web site and asked Google to eliminate access to the information on its end.
The Web page that contains the numbers should have been accessible to only a handful of school officials with a secret password, Catawba schools spokeswoman Beverly Lampe said. She said they don't know how an outside source accessed the protected information
(Представители университета Катауба были в курсе инцидента, удалили данные с сайта и попросили Google уничтожить доступ к информации.
Сведения о номерах социального страхования не были публичны и были доступны лишь после ввода секретного пароля)
И что ответил Google?
But Google said that its program that collects snapshots of Web pages is not able to enter passwords.
(Робот Google краулил страницы в интернете и не вводил никаких паролей)
Хоть убейте, но линия поведения Гугла и университета в точности совпадает с линией поведения "Яндекса" и "Мегафона". "Яндекс" просто краулил страницы, "Мегафон" просто ничего не выкладывал. Только в итоге люди оказались с опубликованными личными данными. (здесь надо разделять "персональные данные" в юридической формулировке 152-ФЗ и личные данные).
Не поверите, но такие инциденты на Западе в конечном счете приводят к тому, что Google будет вынужден проходить аудит FTC по пользовательским данным. У нас, если я правильно понял желание "Яндекса", все вебмастера должны будут выучить правила обращения с robots.txt. Вы в это верите? Я - нет.
А раз нет, то интересно, кто даст гарантию, что у "Яндекса" в кэше не окажется данных, подпадающих под определение 152-ФЗ? И что портал не будет признан (вместе с вебмастерами, скормившими ему эти данные) оператором этих данныех? Гарантии такой не даёт даже сам "Яндекс", недвусмысленно указавший противоречивость применения российского законодательства одним из факторов риска в своей деятельности при выходе на биржу.
"Яндекс", хочет он этого или нет, обладает "поисковым влиянием" и способностью вскрывать ошибки вебмастеров как консервный нож банку. Представим что завтра какая-то организация не спрячет ещё более чувствительные данные (номера паспортов, например). Яндексоиды, в общем-то прекрасные люди, смогут отпускать шуточки типа "Середина 2011 года останется в памяти людей великим открытием: поисковики индексируют интернет и ищут по нему" и ждать, пока вебмастер догадается исправить robots.txt (0:46 26 июля - пусто), плюя на юзеров, которые ни в чём не виноваты.
Многие меня упрекнут в том, что нельзя же всё валить на "Яндекс", так как эти страницы индексируются и другими поисковыми системами. Это верно. Также нельзя одновременно тыкать палкой в слоган Don't be evil Гугла и смеяться над людьми, пострадавшими из-за чужих ошибок: тут, как говорится, "или крестик, или трусы".
Ещё мне кажется, что "Яндексу" порой надо к размещаемому на его серверах контенту предъявлять требования более жесткие, чем явно прописанные в законодательстве. Рад, что мы в этом мнении с "Яндексом" совпадаем (смотрите эпиграф).
Осталось чтобы слово "Яндекса" не расходилось с его делом.
Юрий Синодов, главный редактор Roem.ru
Редакция Roem.ru приглашает авторов к публикации материалов на темы интернет-бизнеса. Пишите по адресу sinodov@roem.ru
Есть идея, чего в таких случаях делать Яндексу (знаю, что они прочитают и надеюсь подумают в этом направлении) Если опубликована дыра в защите сайта, то индекс нужно чистить, это забота о простых людях. А вот сайты, у которых прорвало, в назидание, вынести из выдачи совсем. Скажем, на год. В случае магазинов, которые построены на дырявом движке — вынести все магазины. На мой взгляд, это прямо соответствует тому, к чему Яндекс стремится — находить для людей хорошие ресурсы в Интернете. Зачем людям дырявые онлайн магазины, которые сливают данные пользователей?