Изучаем метод парного сравнения для диагностики санкций в Яндексе: три наблюдения | topinup.pro - 2018

Изучаем метод парного сравнения для диагностики санкций в Яндексе: три наблюдения

Изучаем метод парного сравнения для диагностики санкций в Яндексе: три наблюдения

парного сравнения — одна из методик определения текстовых фильтров в Яндексе. Очень широко применяется оптимизаторами, лежит в основе ряда SEO-сервисов (инструменты Арсёнкина, Кулакова и Пиксель.Тулс).

Суть метода, коротко

  1. Проверяется позиция сайта по запросу.
  2. Затем в Яндекс отправляется тот же запрос, для которого с помощью операторов область поиска сужена на два сайта — «пациента» и конкурента, который в обычной выдаче находится выше. То есть запрос типа «ключевое слово (site: patsient.ru | site: konkurent.ru)».
  3. Если в расширенном поиске наш сайт выше конкурента — значит, на него наложен фильтр.
  4. Изменение релевантного url — дополнительный негативный признак.

Есть много вариаций подхода (например, сравнение по раз нескольких сайтов, сравнение не с одним конкурентом, а с десятком, последовательное сравнение со всем ТОП-100).

Интересно, что никаких экспериментальных обоснований для методики в публичном доступе найти не удалось . Нет и четкого теоретического обоснования. Только ничем не подкрепленное утверждение, что при использовании операторов расширенного поиска снимаются текстовые санкции.

Кстати: оператор »()» в Яндексе вроде бы должен быть отменен. Но именно для запросов с оператором site: работает корректно — по крайней мере в выдаче действительно остаются только страницы с указанных доменов.

Я решил исправить положение и сделал несколько простых наблюдений.

Наблюдение 1: релевантная страница в основном поиске и полученная с помощью «site:" часто отличаются

Для начала я попытался изучить один из элементов метода — выдачу, которая получается при использовании оператора site:. У меня нашлось несколько очень интересных о & # 39 объектов для изучения. Это сайты, которые я создал, готовя доклад на BDD об учете возраста документа . Там используется генерируемый по особой методике контент. на сайтах есть страницы-близнецы, заточенные под одни и те же запросы и обладают очень близкой текстовой Релеве нтнисть.

Схема генерации страниц (слайд из доклада):

Анализ site: для старых доменов

В эксперименте использовано 522 запроса (по 6 на пару сторинок- близнецов) для 3 сайтов. Сначала проверялись позиции в Яндексе по запросу без оператора, затем добавлялся site: domen.ru.

Читайте также:   Влияет ли размер сайта на ранжирование в Google или Как правильно читать заявления поисковиков

для 28 запросов релевантная страница в нормальном поиска и в поиске с оператором оказалась разной.

При этом:

  • в 26 случаях в нормальном поиска показывалась молодая страница, а в расширенном — старая.
  • в 2 случаях одна старая страница изменилась другой старой.

Напомню, разница в возрасте между «близнецами» — более трех лет.

Напрашивается идея, что возраст имеет большее значение для поиска с оператором, чем для нормального (аль тернативная гипотеза — в расширенном поиски не свирепствует многорукий Бандит). Выборка недостаточно велика, чтобы делать обоснованные выводы, поэтому пока просто запомнить & # 39; помнит сам факт.

Анализ site: для молодых доменов

Здесь картина гораздо интереснее.

Расхождение релевантного url в обычном и расширенном поиске проявилось на 301 запросе с 522 . То есть в 58% случаев (!). На самом деле различия могут быть еще больше — для нескольких десятков запросов страницы с домена были найдены в ТОП-100 и не рассматривались.

Еще более интересный момент: очень часто релевантная при поиске с оператором определялась неверно .

Запросы использовались довольно длинные — с 5 и 6 слов. Поисковые фразы генерировались по следующей схеме: «слово1 слово2 {уникальное слово} слово4 слово5». Было 6 групп запросов, внутри каждой из них ключи отличались только одним термином.

Каждому запросу соответствовало как минимум одно точное вхождение на двух страницах-близнецах. Более того, на других страницах сайта уникальное слово не использовалось.

Так вот, при запросе с оператором очень часто уникальное слово игнорировалось. По ряду запросов весь ТОП-5 был забит страницами, которые вообще его не содержали. А документы с вхождением в title и h1 оставались где-то на 7-10 позиции.

Количественную оценку я делать поленился. Просто проверил вручную 30 различных запросов, чтобы убедиться, что наблюдаемое явление — не случайно баг. Действительно, если вы ищете оператором на длинных запросах в ТОП-1 постоянно показываются не адекватны ИНТЕНТ страницы. Зато в нормальном поиска Яндекс справлялся отлично.

Читайте также:   Как я выжимал приличные тексты для статейника. Обзор бюро копирайтинга textbroker.ru.

Промежуточный вывод: при использовании «site:" применяется другой алгоритм ранжирования

Все изложенное выше наводит на мысль, что при ранжировании внутри домена используется другой алгоритм, сильно отличается от основного. Как минимум иначе рассчитывается текстовая релевантность.

Показательно, что свистопляска с релевантными наблюдается именно на новых сайтах, где все документы одного возраста. В таких условиях ранжировать приходится чисто по текстовым характеристикам, и раскрывает несовершенство применяемого в расширенном поиске алгоритма.

Наблюдение 2: при попарном сравнении проблемы с выбором релевантной сохраняются

Теперь я тестировал те же запросы, но уже используя попарное сравнение для старого и нового доменов. Как несложно предположить, тотально доминировали старые сайты и страницы . Url со старого домена занимали по 10-15 мест в выдаче. Причем url с нового домена с высокой позицией по-прежнему очень часто оказывался не релевантным запросу (и совпадал с тем, что обнаруженный с помощью одиночного site :).

Можно было предполагать, что в случае поиска по нескольким сайтов подключается более продвинутый основной алгоритм. Однако эта гипотеза не подтвердилась. Все указывает на то, что в случае парного сравнения действуют те же закономерности, что и при поиске с одиночным «site:".

Наблюдение 3: при попарном сравнении могут расти позиции незафильтрованного сайта

Все, кто использовал методику для анализа спамных текстов наверняка видели, как сайт улучшает свои позиции в поиске с операторами. Однако чтобы признать методику полностью валидной этого недостаточно. Нужно, чтобы росли только такие сайты. нельзя строить достоверные выводы исключительно на положительных примерах. Тем, кто не согласен с этим абзацем, предлагаю для начала загугли «положительная предвзятость». А мы идем дальше.

Посмотрим, как себя ведут априори никак переоптимизированные страницы .

Возьмем страницу справки «Чем отличается качественный сайт от некачественного с точки зрения Яндекса? »: https: //yandex.ru/support/webmaster/yandex-indexing/webmaster-advice.xml. Очень маловероятно, что на нее наложены санкции, не так ли?

Читайте также:   Мой бурный июль: новости и анонсы

Я разбил текст на 125 цитат из 4-8 слов. Сначала Спарс выдачу по ним без операторов. Затем добавил к запросу попарное сравнение yandex.ru с сайтом, который имел в обычной выдаче максимальную позицию. Повторял по 3 раза в сутки в течение 5 дней.

В каждой из проб оказывалось 10-13 запросов, по которым в основной выдаче страница Яндекса была ТОП-1, а вот в попарном сравнении проявлялась в ТОП.

Например (обычный запрос):

С операторами:

Состав подобных запросов время от времени менялся ( бандит?). Однако как минимум 5 запросов демонстрируют описанное выше поведение стабильно.

Обратите внимание: наблюдение сделаны для первой попавшейся, выбранной наугад страницы.

Выводы

  1. Поиск с использованием site: качественно отличается от обычного. Вероятно, в этом случае действительно не учитываются пост-фильтры, но наверняка есть и масса других различий.
  2. Изменение релевантной страницы при попарном сравнении не является свидетельством проблем.
  3. Полагаться на поиск с site: как методика определения релевантной запросу страницы неправильно (а часто даже вредно!).

Все это, однако, не означает, что попарное сравнение нужно исключить из арсенала. Очевидно, что если сайт на позиции 80 в последовательно побеждает всех своих конкурентов, это серьезный сигнал, с посадочной страницей то не так. Просто потому что такие существенные различия не очень часто встречаются. (Другой вопрос, что еще более серьезные сигналы могут с Метрики или системы мониторинга позиций).

А вот применять методику «в лоб», чтобы нивелировать влияние Бандита, делать вывод именно о текстовых санкции или автоматизировано очищать выборку в масштабных исследованиях — очень, очень спорный подход.

Планирую продолжить исследования по вопросу. Сегодня я только слегка попробовал его на зуб — все наблюдения достаточно простые и сделанные на небольших выборках. Думаю, самое интересное впереди.

Опубликовано topinup / Февраль 13, 2018
Рубрики: SEO
1 Звезда2 Звезды3 Звезды4 Звезды5 Звезд (Пока оценок нет)
Загрузка...


Заказ сайта на WordPress

Заполните форму, и наши специалисты свяжутся с вами в ближайшее время для создания сайта на выбранной теме WordPress.

Будьте в курсе последних новостей.

Подписывайтесь на наши страницы в соцсетях и на канал в Telegram.

Заказ бесплатной консультации

Ваше имя (обязательно)

Ваш телефон (обязательно)

Ваш e-mail (обязательно)