Исправленная Яндексом "ошибка" позволила за один месяц на порядки увеличить число страниц проиндексированных большим поиском в дневниках Liveinternet.ru, сообщает руководитель разработки li.ru Валентин Любимов. Однако по его оценке проникновение индекса нужно поднять ещё в 2-3 раза, неудовлетворительна так же и частота обхода пауком.
К очень неохотной индексации блог-площадок большим "Яндексом", привело засилье спама, сообщил господин Любимов в разговоре с коллективом блога Roem.ru — например в сфере интересов "быстрого бота" блогов не существует вообще. По мнению Валентина, сегодня, спама в блогах не меньше чем в вебе и только в одном "Живом Журнале" в сутки генерируются до полумиллиона спам-сообщений (в Li.ru до сотни разных алгоритмов позволяют подобной ситуации избежать, отметил Любимов). Достаточно лояльное отношение площадок к спамерам негативно сказывается на окружающих сервисах. Аналогичных по типу или иных, пример последних дней — не справляющийся с нагрузкой Поиск по Блогам Яндекса.
По мнению руководителя разработки Li.ru, ресурсы, выделяемые на ППБ, недостаточно большие, а решаемая задача, по очистке сообщений от мусора, стала сопоставимой по масштабам с самим большим поиском. В то же время неработающий Поиск по Блогам сильно влияет на лояльность к бренду "Яндекса" в целом. По мнению Валентина Любимова нужно стратегическое решение: "или закрыться, или упроститься, или навалиться и разобраться".
Добавить 30 комментариев
а что это за ошибка яндекса была? любопытно…
А я считаю, что жежешечке надо бороться со спамом у себя, например. Ну хотя бы на базовом уровне — отсеять спам в сообщества. Пользоваться может в один момент стать невозможно.
Я бы сделал интереснее на месте яндекса — передал бы частично функционал ЯППБ на площадки некоторых блогхостингов
> жежешечке надо бороться жежешечка — просто технологическая платформа.. ей не надо бороться.. ей надо предоставлять.. конечно, кровавая гебня может заставить фильтровать.. но.. пока нет.. пока: тебе дают бумагу (ЖЖ) — ты на ней пиши.. если хочешь.. что хочешь.. в ответе за то, что напишешь — пока ты лично.. когда будет жежежыджка.. ы.. Яндекс — не гебня.. спам — его проблема , не ЖиЖи..
vnaz, я подписан на десять сообществ, в которые всё время постится разный спам. Мне неприятно. Технологическая платформа — миф. Технические проблемы неотделимы от организационных, это давно обсосанная тема.
вы можете подписаться ходить по десятку улиц.. или даже по одной.. в Бутово.. Южном.. Вас никто не заставляет там ходить.. так получилось, что там построили много спальных мест.. те, кто их занял, не обязаны следовать Вашим представлениям о культуре.. у них других проблем хватает, которые Вам скорее непонятны.. как Вы поступите в такой ситуации — перестанете ходить? будете ждать, когда милиция (Яндекс или другая спамооборона) справится? свалите не Кипр? ;)
Никто никаких мест не занимал. Это спам. За утверждение, что спам — это такой контент, в 2010 году полагается лопатой по лбу.
лан, лан.. я ниче не утверждаю.. я типа моделирую.. кто-то во дворике.. Бутово.. пусть Выхино.. построил такой скверик.. со скамеечками.. на них удобно культурно пить пиво.. говорить о культуре.. и так оказалось, что там же удобно пить.. даже не самогон.. тройной.. и говорить о бабах, наркоте.. хм.. придурках учителях.. Вы вот там сидите.. а приходят те, другие.. Вы расскажете им про лопату?.. и про лоб?..
Если где-то соотношение спам не спам 1 к 5ти — туда и ходить индексировать хочется и нужно раз так в 700 реже, чем в добродетельные места. А так да. Это личное дело площадок, разводить у себя гаюшник или нет.
Вот уже все говорят о том, что такой ЯППБ позорит Яндекс, наносит бренду репутационный ущерб. Не один я такой, теперь и другие голого короля заметили. А Волнухину и Иванову на весь этот ущерб насрать и розами засыпать..
Да, кстати, а о какой вообще ошибке речь? На данный момент весь ЯППБ — одна сплошная ошибка, начиная от критериев наполнения базы и заканчивая алгоритмами выдачи.
Слушай, макака, тебя забанили в ЯППБ или что-то личное к Волнухину и Иванову? Не нравится — не пользуйся, есть правильно сделаная альтернатива — покажи. А г-мет засунь туда, от куда достал.
По-моему, в заголовке ошибка: не Яндекс набросился на LI, а LI на Яндекс. Валентин, за что ты их так?
Тупые альтерэги заиппали: я как раз уже давно пытаюсь добиться, чтобы меня забанили в рейтинге ЯППБ, но даже это они сделать не хотят и не могут. Альтернативу я показываю внятно: удалить нaxyй рейтинги. Что ещё тебе неясно, дурачок ты анонимный?
mkozloff а как я набросился? Мне глубоко симпатичен Яндекс, несмотря на то, что нас преследует цепь постоянных ошибок и случайностей, мешающих полноценной работе. Сервис Яндекс.Блоги — глубоко странный, это долгая история со скриншотами и прочим, но я думаю это мнение разделяют многие. Мне бы очень хотелось, чтобы Яндекс вложил в десять раз больше ресурсов в ППБ и сделал из него космический корабль. Но я представляю себе сложность задачи и размер отдачи, поэтому, помимо вложиться и доделать, вполне рассматривал бы и еще раз урезать тот функционал, который работает неправильно (количество «неспамовых» и «неботовых» записей в блогхостингах за сутки) и нестабильно (крутые сложные функции в поиске), взамен на урон бренду Яндекса, в лице самой «крикливой» аудитории -блогеров (а кричат они в том числе и мне в техподдержку), который, повторюсь, мне глубоко симпатичен.
как приятно, что в компании Яндекс работают такие высокультурные сотрудники как «Alter Ego 22.07.2010 09:50:13», несущие свет корпоративной этики в ряды недочеловеков-неяндексоидов. Аминь.
В Яндексе не работают сотрудники, которые неспособны правильно написать слово «откуда».
@pe3yc Об «ошибке» другого порядка. Подобные данные не раскрываются сторонами, но судя по всему, блог-платформы по умолчанию считаются большим Яндексом (а не ППБ) — заведомо спамерскими и не требующими индексации.
2illyn Разумеется — иначе бы и не было отдельного проекта ЯППБ. Только вот реализация ЯППБ получилась такой, что лучше бы её не было: оно и работает криво и способствует дальнейшему увеличению и без того высокой доли спама в общем блоговом контенте. Если рассматривать ту базу (в данный момент немногим менее 19 миллионов эккаунтов), которую ЯППБ считает базой блогов, то Большой Яндекс совершенно прав: неспамового, нормального честного контента там от 2.5% до 8% (в зависимости от критериев подсчёта), остальное и в самом деле лучше не индексировать. И это по количеству эккаунтов, а если считать контент по объёму, то процент спама ещё больше. Но, во-первых, никто не заставлял ЯППБ набирать в базу всякое гамно, во-вторых, никто не мешал ЯППБ использовать качественные и зарекомендовавшие себя технологии Большого Яндекса (как поисковые общего характера, так и специфические антиспамные/антисеошные), а в-третьих, самой большой ошибкой было делать под вывеской Яндекса тухлый привокзальный сортир — я имею в виду рейтинги, которые, как известно, убивают контент и нагоняют спам.
таки я запутался о _Большом_поиске_ речь или _ЯППБ_?
О большом. В ЯППБ сообщения закачиваются с Ли.ру очень плотно и хорошо. Но из за того, что это блог-сервис раньше их и не думали включать в Большой.
> Alter Ego, 22.07.2010 16:27:25 > В Яндексе не работают сотрудники, которые неспособны правильно написать слово «откуда». А тех, которые не способны правильно написать «не способны», значит, берут? :)
Да, таких берут :)
@illyn Не стоит с такой увереностью говорить о том, что неизвестно. Яндекс извинился и достаточно быстро исправился, как я им указал на проблему, об этом и было мое сообщение в моем блоге, спасибо Яндексу. Причины того, что такая ошибка была мне тоже конечно интересны, но утверждать, что я или Вы их знаете — это не правильно
У меня есть журнальчик на лиру — так вот поиск яндекса нихрена не находит те материалы, которые у меня есть. Приходится вручную листать страницы.
На днях в Li.ru появился Sitemap дневника, для установленных на собственные домены только.
@valez Я только в рамках предположения. Не более. Но. В своё время мне было нужно “мониторить”, что пишут о конкретной географической области. Города такие-то и такие-то и такие-то. А когда так плотно смотришь и делаешь это методично, то немедленно собственными глазами обнаруживаешь — блоги дико заспамлены. Прям на Роеме была “открытка” такая. Какой город не введи — дико торгуют понятно чем, понятно кто, человеческих сообщений в выдаче нет.
to illyn: Да что тут говорить: вот вчера мне понадобилось посмотреть, что пишут в блогах в связи с отменой рейса AirВaltic из Барселоны. Чтобы понять, насколько ЯППБ ничего не ищет, достаточно было ввести в поисковую строку «AirВaltic». И это ещё относительно низкочастотный запрос. По более высокочастотным ключевикам там такое вылезает, что смотреть страшно. Я вообще не понимаю, в каких заповедниках ещё остались такие люди, которым нужно доказывать, что ЯППБ превратился в спаммерскую помойку. В самом Яндексе разве что. Всем прочим уже давно всё понятно.
pe3yc, вы чего? В пик летнего сезона название авиакомпании, которая сосет трафик со всего ЦФО и СЗФО и раскидывает его по всей Европе по демпинговым ценам, это просто золотой, если не платиновый, запрос. Во-вторых, где тут спам? http://blogs.yandex.ru/search.xml?text=airbaltic Обычная выдача — кому-то что-то не понравилось, кто-то что-то ищет
Сейчас чуть получше — а пару часов назад запись «Общие инвестиции вступить в Европейский союз вывести район, скачать бесплатно программу для открытая игр она утроил бы принципы и идеала. airBaltic считает, заменить нашего положительное решение, Долгополов выступил половины намеченных в том на европейском детям шести» была на первом месте выдачи, да и другие результаты были в том же духе (сплоги+агрегаторы новостей, выдающие себя за блоги и индексируемые блогопоиском). Ну да, согласен, что это не самый наглядный пример, просто к слову пришлось. Наглядных много, ну вот например — http://blogs.yandex.ru/search.xml?text=&full=1 — по слову «пожарная». Да мало ли. Если в базе «поиска по блогам» из девятнадцати миллионов эккаунтов находится меньше миллиона собственно блогов, а сплоговые боты из этой базы генерируют более полумиллиона записей в сутки, то выдача релевантной быть не может.