Отправить заявку на SEO-продвижение сайта от Ant-Team.ru

Заказать

Что делать с дублями страниц по семантике

Что делать, если на сайте есть дубли — несколько страниц с подозрительно похожим контентом? Чем это грозит и как это устранить? Рассказываем, как безболезненно избежать каннибализации, даже если вы новичок в SEO.

Вы наверняка сталкивались или обязательно столкнетесь с ситуацией, когда на сайте обнаружено две, три, а то и больше посадочных, которые очень похожи друг на друга по смыслу.

Обычно у новичков это вызывает много вопросов и затруднений: с одной стороны кажется, что страницы про одно и то же, с другой — что они похожи, но все же различаются. И со всеми этими вопросами и сомнениями новички идут к старшему seo-специалисту за правильным решением.

Приведем пример из практики. Мы работали над сайтом пластического хирурга и обнаружили 3 посадочные про блефаропластику (пластику век):

  1. Блефаропластика.
  2. Блефаропластика нижнего века.
  3. Блефаропластика верхнего века.
Рисунок 1. Пример похожих страниц.

Эти посадочные, действительно, очень похожи по контенту, но есть и некоторые различия. И в такой ситуации нужно обязательно провести анализ и разобраться, должна ли это быть одна страница на сайте или разные.

Рисунок 2. Как определить дубликаты посадочных.

Чем опасны дубли страниц?

Дубли страниц могут вызвать так называемую каннибализацию.

Каннибализация в поисковой выдаче — это когда у нас по одному и тому же запросу ранжируется сразу несколько посадочных. В этом случае страницы одного и того же сайта конкурируют друг с другом, и это вызывает большие проблемы. Во-первых, поисковик может подумать, что вы пытаетесь его обмануть. А во-вторых, все показатели CTR, трафик, конверсия и поведенческие факторы разбиваются между этими посадочными вместо того, чтобы идти на одну страницу и приносить результат. Таким образом, страницы на сайте съедают трафик друг друга, и в итоге ни одна из них не будет иметь хороших показателей. 

Поэтому, если две или более страниц ранжируются в поиске по одному запросу, необходимо избавиться от дублей, объединив их в одну посадочную. Как правило, в результате такая страница будет занимать более высокую позицию в выдаче, чем было ранее у каждой из дубликатов.

Откуда берутся дубли страниц

Причины могут быть разные. Например, при создании сайта владелец совсем не думал о SEO и не учитывал требования к структуре сайта, которые нужны для его продвижения в поисковой выдаче. Он просто создавал посадочные на основе своей логики, не зная и не думая о том, что такое дубли и к чему они могут привести. 

Другая причина может быть в том, что кластеризация сайта делалась давно и уже не является актуальной. Так произошло, например, в описанном нами случае с блефаропластикой. Кластеризацию делали 3 года назад, и тогда это действительно было 3 разных кластера. Но поисковая выдача может меняться. И спустя несколько лет оказалось, что теперь и верхняя, и нижняя блефаропластика относятся к одному кластеру. 

Но не столь важно, откуда возникли эти дубликаты. Важнее вовремя их обнаружить и убрать с сайта.

Рисунок 3. Дубликаты.

Как искать дубли страниц

Для новичка такая задача может показаться сложной. Но в реальности все довольно просто. И в этой статье мы даем пошаговую инструкцию, как это делать. 

Для того чтобы находить и исправлять дубли, нам нужен следующий софт:

  • Яндекс.Wordstat — для сбора запросов.
  • Яндекс.Метрика, в которой мы можем посмотреть, по каким запросам какая страница ранжируется, а также посмотреть трафик.
  • Key Collector — для работы с запросами, сбором частотности и позиций.
  • Таблицы, например, Google Sheets или Excel.
  • Keys.so (опционально)мы любим его использовать для нахождения  запросов, по которым ранжируются страницы.
  • Топ-10Арсенкина и/или KeyAssort — чтобы посмотреть кластеризацию.
Рисунок 4. Необходимый софт для поиска дублей.

Существует разные варианты, как можно обнаружить дубли страниц. 

Вариант 1. Вы увидели где-то похожие страницы (например, в ссылках меню). 

На рисунке 5 представлено меню со ссылками с одного сайта. Мы видим, что некоторые страницы, действительно, очень похожи между собой.

Рисунок 5. Похожие страницы в меню.

Это серьезный повод задуматься, не являются ли страницы дублями и не нужно ли их объединить. 

Вариант 2. Поиск по релевантным страницам в поисковике.

Это тот вариант, когда вы изначально подозреваете о существовании дублей по какой-то теме. 

В этом случае мы вбиваем в строке поиска Яндекс или Google такой запрос:

site: + оператор вашего домена + какое-то общее слово, которое, скорее всего, встречается на этих посадочных.

Например: site:ant-team.ru семантика

И поисковик показывает, какие страницы на вашем сайте релевантны этому запросу.

Рисунок 6. Поиск дублей по релевантным запросам.

Вариант 3. Если вы парсили свой сайт в каком-то парсере (Netpeak Spider, лягушка и т.п.), вы можете найти там такие ошибки, как дубликаты страниц. В этом случае парсер находит полностью одинаковые посадочные, и здесь все очевидно.

Рисунок 7. Поиск дублей в парсере.

Также парсер может найти дубли по метатегам title, description или по H1. Это не обязательно будет означать, что страницы являются дублями, но станет серьезным поводом проверить это. Ведь часто причина такой проблемы не в том, что кто-то случайно скопировал метатеги, а в том, что эти посадочные действительно настолько похожи по своему содержанию, что для них могли автоматически сгенерироваться одинаковые метатеги.

Как проверить, являются ли страницы дублями

Итак, если вы нашли подозрительно похожие страницы, нужно обязательно проверить, действительно ли они являются дублями. Что для этого нужно сделать?

Собираем семантику

Прежде всего необходимо собрать семантику для этих посадочных. Это можно сделать с помощью Яндекс.Вордстат. В нашем случае будет достаточно поверхностного сбора семантики. Если вы не умеете этого делать, посмотрите наш видеоурок и запись практического занятия с подробной инструкцией. 

Также мы обычно заходим в Keys.so, закидываем туда похожие страницы и смотрим, есть ли там запросы, по которым они ранжируются.

Кроме того, мы заходим в Яндекс.Метрику, так как там могут быть запросы, по которым искали эти страницы в последнее время.

Рисунок 8. Собираем семантику.

Проверяем визуально

Следующий шаг — пробегаемся глазами по полученным запросам. Бывает так, что на этом этапе уже понятно, что у нас собралось два (или более) идентичных кластера. Логично, что в таком случае эти посадочные, скорее всего, будут дублями. Но может быть и такое, что у вас просто крайне похожие формулировки в запросах. В любом случае их нужно подвергнуть дальнейшему анализу.

Рисунок 9. Пример очень похожих запросов.

Проверка кластеров

Далее вы можете открыть инструмент топ-10, загрузить туда полученные кластеры или хотя бы несколько самых частотных запросов из этих кластеров и посмотреть, действительно ли они являются одним и тем же кластером.
Мы обычно пользуемся кластеризацией hard 3, и наш опыт показывает, что она почти всегда уместна. 

Итак, если вы видите, что все ваши запросы в итоге относятся к одному кластеру, поздравляем — у вас дубль! 

Но если они разделяются на два или более кластеров, то на этом этапе можете остановить анализ, так как это будет означать, что страницы не являются дубликатами, а просто похожи друг на друга по контенту.

Рисунок 10. Запросы не относятся к одному кластеру.

Как определить основную страницу

Если кластеризация подтвердила наличие дублей, то далее необходимо понять, какая из этих страниц является основной и должна остаться на сайте, а какие посадочные ее дублируют и должны быть удалены. 

Мы крайне не рекомендуем делать это “на глаз”, даже если выбор основной посадочной кажется очевидным. 

Лучше зайдите в Яндекс.Метрику, откройте отчет поисковой системы, выберите период – квартал или лучше год — и посмотрите, на какую из этих страниц было больше визитов за это время. Ее следует оставить на сайте.

Рисунок 11. Смотрим визиты в метрике, чтобы определить основную посадочную.

На рисунке выше показан пример двух очень похожих по смыслу страниц. Обе они про доставку товаров. Но на странице слева показано существенно больше визитов за год, поэтому очевидно, что она является основной. 

Если в метрике нет трафика или он примерно одинаковый, то вы можете воспользоваться вторым способом — снять позиции по кластеру. В этом случае лучше обращать внимание на более высокочастотные запросы: по каким запросам позиции выше, та посадочная и будет считаться основной.

Рисунок 12. Определяем, по каким запросам позиции выше.

Как корректно убрать дубли

Итак, вы определили, что у вас есть дубли, и нашли среди них основную посадочную. Теперь вам нужно избавиться от дубликатов. Но как это правильно сделать?

Если вы совсем новичок, то запомните, что нельзя просто так удалять страницы с сайта. Чтобы не плодить посадочные с ошибкой 404, нужно обязательно сделать с них редирект 301 на нашу основную страницу.

Если вы еще не умеете этого делать, то можете обратиться к вашему программисту – он сделает это за пару минут.

Рисунок 13. Как правильно удалять дубли.

Как объяснить клиенту необходимость удаления страниц

При работе с сайтом клиента важно запомнить правило, что seo-специалист ничего не должен удалять без согласования с самим клиентом. 

Часто заказчики плохо понимают требования SEO, поэтому они могут настаивать на том, что это разные страницы и все они должны остаться на сайте. Обязательно потратьте свое время на то, чтобы максимально понятно и просто объяснить клиенту причину удаления каких-то страниц с его сайта: чем это ему грозит, что такое каннибализация и как это отражается на трафике. 

Как правило, хорошее и четкое разъяснение приводит к тому, что клиент соглашается с вами и разрешает объединить дублирующиеся страницы. 

Но бывает и так, что, даже прослушав все ваши аргументы, заказчик все равно хочет оставить дубли на сайте. В этом случае, если вы уверены, что он действительно вас услышал и все же остался при своем мнении, не спешите отчаиваться и вступать в споры. Постарайтесь услышать его логику. Никто не знает данную тематику лучше, чем сам владелец бизнеса. Возможно, он сможет объяснить вам разницу между этими статьями или услугами, и вы сумеете подобрать для дубликатов новую семантику, которая действительно относится к другому кластеру. В этом случае вы сможете просто дооптимизировать дублирующиеся посадочные под новую семантику и не нарушите ничьих интересов: клиент останется доволен и сохранит нужные ему страницы, а вы выполните требования SEO и не будете терять трафик из-за каннибализации.

P.s. Подписывайтесь на наш телеграм-канал t.me/seoantteam, чтобы первыми узнавать о выходе новых материалов. Мы подготовили целый видеокурс для новичков, где подробно рассказали про все основные задачи seo-специалиста:как сделать технический seo-аудит сайта, как собрать ядро для сайта, как работать с микроразметкой сайта и многое другое.