Отправить заявку на SEO-продвижение сайта от Ant-Team.ru

Заказать

Как найти и удалить дубли страниц на сайте

Перевод статьи с портала MOZ.

Что такое дубли страниц и как их удалить? И почему вообще они могут стать проблемой для вашего сайта?

В этой статье Меган, специалист по обучению в команде Moz, проведет несколько интересных аналогий, которые помогут вам ответить на эти вопросы! 

Anatomy of a Perfect Pitch Email

Рисунок 1. Дубли

Дубли контента — довольно распространенная проблема, которая может навредить вашему сайту.

Что такое дубли страниц

По сути, это контент, который появляется более чем в одном месте в интернете. Однако здесь не все так просто. Даже если страницы не полностью идентичны, а просто похожи друг на друга, они могут считаться дублями. 

Дело не только в том, что видят пользователи, когда переходят на ваш сайт и сравнивают две страницы. Ведь помимо людей, контент на сайте просматривают поисковые системы и роботы. Поскольку они не могут видеть отображаемую страницу, то анализируют ее исходный код. Если код двух посадочных слишком похож, поисковый робот может подумать, что просматривает две версии одной и той же страницы. 

Представьте, что вы пришли в пекарню и увидели два кекса, которые выглядят почти одинаково. Как вы узнаете, какой именно кекс вы хотите попробовать? Нечто подобное происходит, когда поисковая система обнаруживает две слишком похожие страницы. 

Эта путаница может привести к проблемам с ранжированием, поскольку поисковые системы либо не смогут определить, какую страницу они должны ранжировать, либо начнут ранжирование неправильной страницы. В инструментах Moz мы установили 90%-ный порог для дублирующегося контента. Это означает, что любые страницы, код которых совпадает хотя бы на 90%, будут отмечены как дубли.

Решение

Теперь давайте разберемся, как поступать с дублями. Есть несколько способов убрать дублирующийся контент. 

301 редирект

Рисунок 2. 301 редирект

Первый способ — применить 301 редирект. Приведем пример. Допустим, у вас есть фильм, записанный на VHS-кассете. Само собой, в наше время посмотреть его будет весьма проблематично.

Поэтому вы должны быть уверены, что его цифровая версия доступна в интернете. На своем сайте вы можете перенаправлять пользователей со старых страниц на их обновленные версии. Это актуально в случае проблем, связанных с поддоменами или изменением протоколов, а также при обновлении контента, когда вы хотите исключить доступ пользователей к его старой версии.

Rel=canonicals

Рисунок 3. Rel=canonicals

Следующий вариант — использование на странице тега rel=canonicals. Допустим, вы работаете продавцом сладостей и предлагаете людям два вида печенья: с сахаром и шоколадной крошкой. Вы считаете печенье с сахаром просто бесподобным. Поэтому, когда покупатели спрашивают совета, вы указываете на печенье с сахаром, при этом у людей остается возможность попробовать и печенье с шоколадной крошкой.

Нечто подобное происходит, когда на своем сайте вы продаете два одинаковых товара разного цвета. Таким образом, посетители могут видеть оба товара, но вы должны использовать канонический тег, чтобы сообщить поисковым роботам, какая из посадочных на сайте должна иметь приоритет при ранжировании. 

Тег noindex

Рисунок 4. Тег noindex

Вы также можете отметить страницы тегом noindex.

Например, у вас может быть два издания вашей любимой книги. При этом вы предпочитаете читать и ссылаться на второе издание, поскольку оно более новое и актуальное. Но вы по-прежнему можете в любой момент взять в руки и старую книгу. Теги noindex сообщают поисковому роботу, что те могут сканировать этот дубль страницы, но не должны включать его в индекс. Этот способ будет полезен, когда текст, например, разбит на несколько посадочных. 

Добавить контент

Рисунок 5. Новый контент

Но что делать, если страницы, которые вообще не похожи друг на друга, помечаются как дубли? Они посвящены разным темам и должны рассматриваться как отдельные части контента. В этом случае вы можете добавить на каждую из них больше отличающегося контента, чтобы не сбивать с толку  поискового робота. Тогда страницы будут сильнее отличаться друг от друга. Это похоже на то, как если украсить вишней один кекс и цветной глазурью другой. 

Используйте Moz Pro для поиска и удаления дублей страниц

Если вам понадобится помощь в поиске дублей контента, воспользуйтесь инструментами Moz Pro — Site Crawl и On-Demand Crawl.

Оба инструмента отмечают страницы, являющиеся дублями, и позволяют экспортировать эти данные в CSV, чтобы вы могли анализировать их вне инструмента. Небольшой лайфхак: при экспорте этих данных в CSV группы дублирующегося контента подскажут вам, какие страницы считаются дублями. Любые урлы с одинаковым номером являются частью одной и той же группы дублей страниц.

Разумеется, это далеко не полный список способов удаления дублей страниц. Но я надеюсь, что статья поможет вам найти верное решение проблемы.

Автор: Меган Пахинуи (Meghan Pahinui)

P.s. Подписывайтесь на наш телеграм-канал t.me/seoantteam, чтобы первыми узнавать о выходе новых материалов. Мы публикуем только полезный контент, например, как защитить форму обратной связи от спама, чего ждать от нового фактора ранжирования Google Core Web Vitals или что такое метрики тщеславия и почему они могут навредить вашему сайту.