Открытка компании: Зачем Гугл выкручивает руки пользователям? Химичит со статистикой и вымогает $150 тысяч

Развитие событий: Вьетнамский поисковик Coc Coc Виктора Лавренко получил $14 млн от ИД Hubert Burda Media (4 февраля 2015)

Виктор Лавренко, CEO вьетнамского поисковика Coccoc, столкнулся с неприятной особенностью Google Analytics, рассказывает он в своем Facebook. Когда ресурс начинает генерировать более 10 млн обращений к счетчику в месяц, Google настоятельно рекомендует или купить платный аккаунт за 150 тысяч долларов, или программно урезать количество запросов, установив значение _setSampleRate. Однако, во втором случае сервис начинает выдавать не совсем корректные результаты по статистике.

Лавренко поясняет: "Смотрите, у социологов есть такая фишка - называется "статистически значимая выборка". Вовсе не надо опрашивать всех людей в стране, чтобы узнать, допустим, какой телеканал они смотрят. Точно так же, по идее, и в статистике - можно посмотреть только часть кликов, и по этой части кликов "понять" всю картину". Например, если смотреть на каждый второй случайный клик и увидеть, что источник этого клика в 20% случаев - Яндекс, то скорее всего и у другой половины кликов 20% трафика - с Яндекса. Параметр _setSampleRate как раз и устанавливает значение: 100 - считать все клики, а 50 - только 50%, каждый второй.

Когда ресурс переступает порог в 10 млн просмотров за день, на бесплатном аккаунте Google пользователя просто банит - показывает в статистике одни нули, рассказывает Лавренко. Так случилось и с Coccoc. Однако, когда команда сервиса попробовала обойти ограничение, установив _setSampleRate = 50, оказалось, что Google необсчитанную часть данных просто выкидывает и не отображает в статистике. Если на сайт было 100 заходов, при _setSampleRate=50, то Google Analytics расскажет лишь о 50 заходах, а не домножит показатели до 100, как можно было бы ожидать. "Это довольно странно и похоже на выкручивание рук - чтобы заплатили 150 тыс. баксов, - говорит Лавренко. - Потому что рекламодатели, особенно в каком-нибудь Вьетнаме, они-то, конечно, не поверят в историю с семплингом, и что надо как-то там в уме домножать но два. Просто увидят 2.5 млн пользователей вместо 5 млн и будут думать, что мы их обманываем. Открывать наши исходники и видеть, что там есть строчка {cookieDomain:"coccoc.com",sampleRate:50}, конечно же, никто не будет".

В ситуации с Coccoc отдельно "радует" момент, что проапргейдить аккаунт просто невозможно. Лавренко пишет в своем Facebook: "Мы были бы и готовы обсудить, денег заплатить, так на форме заявки на апгрейд Вьетнама просто нет".

Лучшие комментарии

  • Контекст комментария

    Valentin Lyubimov

    Витя, если у liveinternet вдруг нет вьетнамской локализации — могу попросить дать тебе возможность такую локализацию сделать. Нашел тоже проблему — 10 млн в день. Я так вообще не могу понять — как люди пользуются для сколь-либо крупных проектов ГуглАналитикой

  • Контекст комментария

    vlad.shabanov

    А я правильно понимаю, что правильный (достоверный по мнению Вьетнамских рекламодателей) счётчик нужен, чтобы дороже/больше продавать рекламу? Если да, то странно было бы со стороны Гугла это делать задаром.

Добавить 45 комментариев

  • Ответить

    про piwik вьетнамцы, конечно, не слышали. 140 млн. — маловато. у нас проблема появилась при достижении 260 млн. за месяц, т.е. больше 10 млн. просмотров в день. но по мануалам на гугле они грозятся отключать начиная с 10 млн. в месяц

  • Ответить

    кстати, у VNExpress, следующего после нас по pageviews во Вьетнаме, 200 млн. страниц в месяц, и такой проблемы нет, и главное траф у них не растет :( если бы рос, то несколько компаний, конечно же, может быть и могли сделать стандартом обсчета трафа какой-то другой сервис.

  • Ответить

    Google Analytics дает бесплатный инструмент ( и очень крутой) всем, у кого посещение меньше 10 миллионов в день. То есть, большинству. При этом, предлагает варианты, как и дальше им пользоваться, с ограничениями. А MS все же не дает мне таких вариантов. Но, это только мое мнение.

  • Ответить

    это для вашей «этой страны» немного :) а для Вьетнама — таки многовато, да и даже если и не многовато, то как платить? там не только Вьетнама в форме нет, там еще и Сингапура, который за Вьетнам отвечает — нету. ну и, конечно, коробит платить 150 тыщ долларов просто за операцию умножения :) свою статистику собрать совершенно не проблема. проблема доказать, что все честно. тут, во Вьетнаме, мухлеж — национальный вид спорта — никто не поверит, что если у нас есть возможность смухлевать, то мы не смухлевали. нужен какой-то независимый аудитор.

  • Ответить
    Альтер Эго

    Да я и с аудитором бы не поверил. Отчего Alexa и Similarweb по вам — так сильно расходятся (даже по тенденциям, хрен с ними с абсолютными цифрами)?

  • Ответить
    Альтер Эго

    А они alexa’вскую приблуду вместе со своим браузером случайно не раздают? Это многое бы объяснило.

  • Ответить

    Домножать нужные цифры на два при _setSampleRate=50 Гугл едва ли станет. Сейчас он просто не знает, как эта настройка выставлена на сайте, менять такой подход и учитывать её — не очень ясное вложение средств. Можно написать кому-нибудь из GACP (http://www.google.com/analytics/partners/), там есть прямой выход на Гугл и они могут транслировать письмо. Есть небольшая вероятность, что гугл пойдёт на встречу так или иначе. Если нужны только цифры посещаемости для наличия независимого аудитора, я бы смотрел другие системы. Причём с самого начала, мухлевать с GA как раз просто.

  • Ответить
    Альтер Эго

    Да может и раздают. Но в similarweb + alexa *одновременно* я таки советую заглянуть. Особенно ежели вы рекламодатель. Или инвестор.

  • Ответить

    Аноним, а вы кто? :) Алекса показывает пять лямов юзеров в месяц: http://www.alexa.com/siteinfo/coccoc.com Аналитикс — тоже 5, правда, теперь уже включительно до декабря :( :( :( с января надо на 2 умножать :( :( :( не верите этим двум, оплатите мне невидимый счетчик liveinternet (вьетнамские кредитки ЯД не принимает), я повешу LI, потом при встрече верну пивом

  • Ответить

    партнеров ГА в Сингапуре уже тоже нашел, спасибо, завтра им отпишу (спать пора уже, у нас тут уже первый час утра :) )! счетчики мейла и li, тем более уж раз есть такой читерский ход — поставим. на самом деле это для вас Россия — $%@#% рашка, а так-то во всем мире — это великая держава, вполне возможно, что вьетамские рекламодатели этим счетчикам поверят, спасибо за идею!

  • Ответить
    Альтер Эго

    Вообще, имея четверть миллиарда просмотров страниц в мес. не имея при этом 12500$ я бы задумался, тем ли делом я занимаюсь.

  • Ответить
    Альтер Эго

    Петр, мне кажется вы должны для себя открыть буквы и научиться читать новости/посты/статьи и только после этого писать комментарии. Сэмплинг здесь вообще не при чем, прочитайте тоже про него внимательнее.

  • Ответить

    > Сэмплинг здесь вообще не при чем, прочитайте тоже про него внимательнее. Почему ни при чем? Из-за сэмплинга статистика получается корректной в относительных данных, но некорректной в абсолютных. Поэтому можно абсолютные смотреть по другому счетчику. Вообще, может, имеет смысл sample rate поставить 1:10, чтобы знать, что все цифры надо умножать на 10. Если при этом разрешающей способности счетчика будет хватать (т.е. аналитикам компании не нужно залезать в сегменты, где пользователей, скажем, меньше тысячи), то для внутренних нужд такой счетчик будет вполне пригоден. А для внешних таки придется другой счетчик использовать.

  • Ответить

    А я правильно понимаю, что правильный (достоверный по мнению Вьетнамских рекламодателей) счётчик нужен, чтобы дороже/больше продавать рекламу? Если да, то странно было бы со стороны Гугла это делать задаром.

  • Ответить

    да, но, извините, брать 12 с половиной косарей в месяц за операцию умножения на два в то время как Герман берет 3 бакса, да и то, как пишут в этом чатике, можно и не платить — это какая-то феерическая жадность :)

  • Ответить

    Напоминает старый анекдот: Приходит чувак в рюмочную, спрашивает у продавщицы — Скажите, сколько стоит капля водки? — Да нисколько — Ну тогда накапайте мне сто грамм, пожалуйста

  • Ответить

    почитав этот и многие другие тредики на эту тему, я думаю, что если мы станем первой вьетнамской компанией, которую злобный жадный завистливый :) Гугл забанит за слишком большой трафик, то мы в конечном итоге заработаем больше, чем если заплатим им $150K я уже попросил программистов отключить сэмплинг и поставить менее жадные счетчики.

  • Ответить

    Согласно TOS бесплатный Google Analytics действительно имеет лимит в 10 mln хитов в месяц (не путать с pageviews: events и transactions — это тоже хиты) Но с декабря 2013 такое предупреждение появилось не во всех, а только самых больших бесплатных аккаунтов. Кстати судя скриншоту в FB coccoc.com поместится в Tier 1. Если GA используется только как счетчик, наверняка можно найти более доступные варианты. Но GA Premium это не только больший лимит обрабатываемых данных, но и 200 Custom Dimenstions & Metrics, 4 часовой расчет, интеграция с BigQuery и т.д. Поэтому разработка своей аналогичной системы аналитики и тем более сервиса типа BigQuery обойдется наверняка дороже.

  • Ответить

    > Все твои миллионы посетителей это реально видимо весь трафик, который проходит через твой браузер. то есть утверждение о том, что у нас есть пять миллионов пользователей в месяц, вы не оспариваете, верно?

  • Ответить
    Альтер Эго

    Витя, но ты же всех натурально обманываешь, когда постишь задорные картинки в своем ФБ с кококом, обошедшим по посещаемости youtube.

  • Ответить

    кстати, про ютуб… вот я сегодня опубликовал пост в ФБ, в котором обращаю внимание аудитории на то, что ссылки на карты на вьетнамском Гугле нету: https://www.facebook.com/photo.php?fbid=10152186994264610&set=a.10151705069104610.1073741827.618674609&type=1&theater , т.к. качество локального поиска у Гугла во Вьетнаме мягко говоря оставляет желать лучшего, а Гугл все ж таки хоть и жадная, но компания добра, и плохой продукт, даже пусть и собственный, пользователям рекламировать не будет. если внимательно присмотреться к скриншотам, можно заметить, что и Ютуба там тоже нет. как думаете, почему?

  • Ответить

    Витя, если у liveinternet вдруг нет вьетнамской локализации — могу попросить дать тебе возможность такую локализацию сделать. Нашел тоже проблему — 10 млн в день. Я так вообще не могу понять — как люди пользуются для сколь-либо крупных проектов ГуглАналитикой

  • Ответить
    Альтер Эго

    >зато Россия — великая держава kikap, ты ильфа и петрова не читал? там про тебя прямо целый фрагмент есть.

  • Ответить
    Альтер Эго

    >> о есть утверждение о том, что у нас есть пять миллионов пользователей в месяц, вы не оспариваете, верно? В случае с Alexa — это интересный такой вопрос. У них же панель. Т.е. они знают (примерно), что вот «в бантустане у нас 1% пользователей имеет наш тулбар». Дальше если 50килопользователей сделало им «хит» — они делят на 0.01 и получают 5 млн. бантустанцев. Если в какой-то выборке реальная доля пользователей Alexa выше, скажем не 1% а 30%, а сама Alexa про это не знает — данные будут в 30 раз завышены. Второй интересный вопрос с вашей алексовой/гугловой статистикой — это cuacua.coccoc.com Так, на взгляд, это какой-то информер, вроде маркетгида. Внутри зовется гугл-аналитика и алексовский счетчик (который грузится с клаудфронта). Вот вопрос — эта куакуа — где показывается по жизни? Это вроде маркетгида «обмен трафиком» (не вашими сайтами) или что вообще?

  • Ответить
    Альтер Эго

    Остался второй вопрос: == Вот вопрос — эта куакуа — где показывается по жизни? Это вроде маркетгида «обмен трафиком» (не вашими сайтами) или что вообще? ==

  • Ответить

    действительно, у нас есть партнерская сеть обмена трафиком, вместе с ней у нас порядка 10 млн. пользователей в месяц (ну может чуточку меньше, точных данных сейчас пока нет). на партнерских сайтах мы продавать конекст не можем, если пользователь не наш, т.к. мы не знаем его ключевых слов, поэтому особо ею не занимаемся. так что давайте мы сначала поставим русские счетчики на чисто наши страницы, а потом уже с партнеркой разберемся. все, что вы видите в алексе — это все полностью наше, без партнерства.

  • Ответить

    у нас бизнес-модель — browser-based search engine. с точки зрения пользователя, наш поиск — это еще одно конкурентное преимущество нашего браузера. чуть подробнее написано тут: https://www.facebook.com/photo.php?fbid=489197507844850&set=a.491078160990118.1073741830.340066139424655&type=1&stream_ref=10 . людям такая модель нравится (обратите внимание на 3,862 лайков в этом посте, например). надеюсь, сомнений, что у нас 5 лямов юзеров, больше ни у кого не осталось. ну а через месяц с небольшим, когда русские счетчики покажут результаты, даже и тени не будет. а на счет остальных деталей — вообще вы это… денег-то заносите, и мы вам все детально расскажем :) если я не ошибаюсь, Игорь предлагал нам занести два ляма за все детали. ну мы тогда согласны на полтора :)