Отправить заявку на SEO-продвижение сайта от Ant-Team.ru

Заказать

Как правильно собирать семантическое ядро: классический способ с примерами

В этой статье вы найдете подробную инструкцию по сбору семантического ядра для сайта с примерами и скриншотами. А те, кому больше нравится обучаться в формате видео, могут посмотреть наш видеоурок по классическому сбору семантики.

Существует четыре основных способа сбора семантического ядра (СЯ):

  1. классический;
  2. генережка (больше подходит для интернет-магазинов);
  3. сбор ядра с конкурентов;
  4. поверхностный (подходит для малого количества страниц).
Рис.1. Способы сбора семантического ядра.

Если вам интересно узнать про них подробнее, то посмотрите наше видео про способы сбора семантики.  Также у нас есть отдельный видеоурок, посвященный поверхностному сбору семантики. Поэтому мы не будем останавливаться на них в данной статье и сразу перейдем к разбору классического способа сбора семантического ядра для сайта.

Особенности классического сбора семантического ядра

Классический способ используют, чтобы собирать семантику для целого сайта  или какого-то крупного раздела. Не стоит использовать его, если вам нужно создать всего нескольких страниц, так как он довольно трудозатратен. 

И хотя он требует немалого количества времени и усилий, но зато позволяет собрать максимально полное семантическое ядро, ничего не упустив (при условии, что вы сделали все правильно). 

Если вы готовитесь создавать сайт или добавлять новый раздел на уже существующий сайт, то на основе полученного семантического ядра вы сможете грамотно построить подробную структуру вашего будущего сайта или отдельного раздела для дальнейшего seo-продвижения.

Рис.2. Особенности классического способа сбора семантического ядра.

Этапы сбора семантики классическим способом

Весь алгоритм по сбору семантического ядра для сайта выглядит примерно так:

Рис.3. Этапы классического сбора семантического ядра для сайтов.

Расскажем подробнее про каждый этап.

Понимание тематики сайта

Очень важно начинать классический сбор семантики с подробного и внимательного изучения тематики сайта и бизнеса клиента. Это необходимо, чтобы создать качественное ядро. 

Нередко начинающие seo-специалисты ленятся и пытаются избежать этого этапа, оправдываясь тем, что они сеошники, зачем им подробно разбираться, скажем, в комплектующих для ЛЭП или гель-лаках. Но это серьезное заблуждение. Без погружения в тематику сайта вы просто не сможете качественно выполнить свою работу и собрать полное семантическое ядро. 

К тому же, на следующих этапах вам все равно придется глубоко погружаться в тему сайта, поэтому лучше сделать это сразу, чтобы ничего не упустить при сборе СЯ.

Как понять, о чем собирать семантику?

Если у вашего нового клиента уже есть сайт, то это очень упрощает задачу. Очевидно, что вам необходимо посмотреть, какие разделы и страницы есть на этом сайте, изучить меню, sitemap и т.д. Обязательно уточните у клиента, насколько полная информация о его бизнесе представлена на сайте и есть ли там неактуальные данные. 

Помните, что клиент сам является важным источником информации и может дать вам небольшое описание того раздела или всего сайта, для которого вы готовитесь собирать семантическое ядро. Также обязательно попросите его выделить приоритетные направления. Выясните, какие товары или услуги являются для него наиболее маржинальными, и начните прорабатывать именно их. Кроме того, клиент может назвать вам так называемые стоп-слова, то есть те услуги или товары, которые встречаются в его нише, но он их не предлагает. Например, сайт вашего клиента посвящен стоматологии. И он сообщает вам, что оказывает стоматологические услуги только для совершеннолетних. Соответственно, все ключи про детскую стоматологию будут являться для вас стоп-темами, которые вы не станете брать в работу при продвижении сайта. 

Также при сборе семантического ядра необходимо ориентироваться на сайты конкурентов. Но как их правильно подобрать?

Частичный список конкурентов нам может дать сам клиент. Тут важно уточнить, что хотя клиенты и не всегда хорошо понимают, что такое конкурент с точки зрения seo-продвижения, но в данном случае речь идет именно об изучении тематики, а не каких-то seo-тонкостях. И поскольку никто не знает тематику лучше самого клиента, на этом этапе вы можете смело ориентироваться на тех клиентов, которых он вам предоставит. 

Остальных конкурентов вам придется искать самим. Но поскольку вы еще недостаточно глубоко разбираетесь в теме сайта, обязательно согласуйте их с вашим клиентом. 

Также на этом этапе нужно определить региональность — регион (чаще город), по которому приоритетнее создавать ядро. Если ваш клиент оказывает услуги в конкретном городе (например, чистка ковров в Уфе), то именно этот город и будет вашим регионом продвижения. Если он оказывает услуги по конкретному региону (например, по всему Краснодарскому краю), то вам нужно выбрать наиболее крупный город этого региона и собирать семантическое ядро под него. Если же клиент работает по всей России, то мы обычно берем при продвижении Москву как наиболее крупный город. А если сайт предоставляет услуги по целому ряду стран, то тут уже нужно смотреть индивидуально и либо отдельно создавать ядро под каждую страну, либо ориентироваться в первую очередь на наиболее приоритетную из них, а на следующих этапах прорабатывать остальные.

Рис.4. Источники для изучения тематики сайта, чтобы составить семантическое ядро.

Сбор маркеров

Чтобы собрать семантику, вам нужны слова-маркеры, по которым вы будете искать свои запросы. Откуда их взять? Изучая тематику, вы уже собрали на сайте клиента и сайтах конкурентов названия разделов, услуг или товаров, метатеги, заголовки, sitemap, приоритеты от клиента и т.д. Все эти слова, указывающие на тематику сайта, и есть ваши маркеры для будущего ядра. 

Маркеры являются фундаментом сбора семантики. Это почти всегда “однословники”, то есть они состоят из одного слова. В редких случаях они могут представлять собой несколько слов (например, название бренда).

То есть из всей собранной информации вы вычленяете отдельные слова (не фразы!) и записываете их в колонку. Удобно составить таблицу в Excel. 

Далее вы устраиваете мозговой штурм, подбираете слова, которые приходят вам в голову относительно данной тематики, и добавляете их в таблицу. 

Затем открываете Wordstat, забиваете туда полученные маркеры и смотрите, какие еще слова часто стоят рядом с ними в запросах в левой колонке и какие слова встречаются в похожих запросах в правой колонке.

Рис.5. Ищем в Wordstat слова-маркеры, чтобы составить семантическое ядро.

Также можно дополнить список маркеров поисковыми подсказками. Для этого существуют специальные сервисы. Но можно и просто воспользоваться поисковой строкой, начав вводить туда какой-то из главных запросов. Это может оказаться полезным в узких тематиках и дать вам новые идеи для маркеров.

Рис.6. Ищем маркеры в поисковых подсказках, чтобы составить семантическое ядро.

И, наконец, для пополнения базы маркеров вы можете использовать синонимайзеры и интернет-словари. Но забирайте оттуда только подходящие слова. Например, при поиске синонимов к слову “стоматолог” словарь предлагает такие слова, как рвач, дергач и зубопил. Понятно, что они вам не подходят =)

Рис.7. Поиск маркеров в словаре синонимов при сборе семантического ядра.

Итак, после того как вы собрали внушительный список маркеров, вам нужно разбить его на группы по тем или иным признакам. Это делается с помощью логики, тут нет никаких строгих правил.  

Вы можете видеть пример сгруппированных маркеров по тематике ортодонтия на рисунке 8.

Рис.8. Пример собранных маркеров для семантического ядра.

Пересечение маркеров

На следующем этапе сбора семантического ядра вам нужно пересечь между собой все полученные маркеры из разных столбцов. 

Для этого мы берем первое слово из одной колонки + первое слово из второй колонки и соединяем их, получая словосочетание. Затем берем второе слово из первой колонки + первое слово из второй колонки и соединяем, получая еще одно словосочетание, и т.д. Так мы мы пересекаем между собой все слова из разных колонок. Можно пересекать слова из двух, трех и четырех колонок одновременно, на ваше усмотрение. Но не советуем бездумно пересекать все колонки. Обязательно оцените, что в итоге у вас должно получиться. Например, если мы начнем пересекать столбец “Коммерческий” и столбец “Географический” (Рисунок 8), то получим совершенно бесполезные запросы: “частный спб”, “цена близко”, “кредит рядом” и т.д. В итоге мы наплодим кучу мусора, который потом придется вычищать руками.

Рис.9. Пересечение маркеров при сборе сем.ядра.

Разумеется, не нужно делать пересечения вручную. Вы можете использовать любой генератор ключевых фраз. В интернете есть много бесплатных вариантов. Вы можете найти их как по запросу “генератор ключевых фраз”, так и по запросу “пересечение слов”.

Выбираете любой понравившийся сервис, вставляете туда свои столбцы с маркерами, пересекаете их и получаете результат.

Рис.10. Используем генератор ключевых фраз, чтобы составить полное сем.ядро.
Рис.11. Пример пересечений при сборе ядра.

Базовая частотность

Следующий этап — нам нужно собрать базовую частотность пересечений и тематических однословников за год. 

Базовая частотность — это количество запросов, которые содержат в себе все слова из фразы и все их склонения. Мы берем ее из базы данных Яндекс.Wordstat. То есть, базовая частотность показывает нам, сколько раз за указанный нами период пользователи вводили запросы, которые содержат наши слова. 

Чтобы ее собрать, загрузите все маркеры и получившиеся пересечения в любую программу, которая умеет снимать частотность, и снимите базовую частотность по своему региону за один год. Зачем снимать ее именно за год, а не за месяц, квартал или другой период? Если вы выберете более короткий срок, то рискуете не учесть сезонность. И это будет серьезной ошибкой. Поэтому мы всегда рекомендуем (а внутри компании настаиваем) на сборе частотности именно за год.

Собрав базовую частотность, нам нужно удалить все наши пересечения, у которых данный показатель за год по выбранному региону равен нулю. Так мы существенно сэкономим свое время в будущем, потому что нам не придется парсить те сочетания, у которых базовая частотность равна нулю и которые, соответственно, не представляют для нас ценности.  

Парсинг левой колонки Yandex.Wordstat

Далее все оставшиеся пересечения нужно загрузить в программу, которая умеет парсить левую колонку Yandex.Wordstat.

Мы обычно используем для этого программу Key Collector. Загружаем туда наши пересечения в специальное окошко и запускаем парсинг.

Рисунок 12. Парсим левую колонку Yandex.Wordstat при сборе сем.ядра.

Приготовьтесь к тому, что этот процесс не будет быстрым. Это связано с тем, что Яндекс банит аккаунты, которые слишком часто обращаются к базе данных. Из-за этого происходит задержка, и в итоге парсинг может занять довольно длительное время. В некоторых случаях, когда у вас очень много пересечений, парсинг занимает вплоть до нескольких дней. Поэтому ранее мы отсекли все пересечения с нулевой базовой частотностью, чтобы не делать лишнюю работу и не тормозить процесс еще больше. 

Если вы когда-нибудь пользовались Вордстатом и вводили там какой-то запрос, то вы могли заметить, что он ограничен 41 страницей. То есть вы не сможете пролистать дальше 41 страницы.

Рис.13. Ограничение по количеству страниц в Yandex.Wordstat.

Ниже на рисунке 13 показан пример. Мы ввели в Вордстате запрос “стоматология”, открыли страницу 41, а далее программа нас не пускает. Последние запросы, которые мы можем видеть, имеют базовую частотность 1500. Это довольно высокая частотность, если учесть, что это показатели за месяц. Соответственно, если бы мы просто забили в наш парсер слово “стоматология”, то не смогли бы получить запросы дальше 41 страницы. И все запросы с частотностью менее 1500 у нас остались бы просто нетронутыми. Но наша цель — собрать все запросы. И именно поэтому мы задаем не только какой-то один основной запрос, но стараемся взять как можно больше разных пересечений, чтобы собрать максимально полное семантическое ядро.

Сбор частотности и чистка нулевок

Когда, наконец, этот долгий процесс завершился — все наши запросы собрались, спарсилась левая колонка Вордстата, то мы переходим к следующему этапу сбора ядра:

  • собираем по всем этим запросам базовую частотность за год по вашему региону;
  • собираем уточненную частотность за год по вашему региону.

Напомним различия базовой и уточненной частотности.

Базовая частотность показывает, сколько раз пользователи вводили запросы, включающие в себя ваши слова, то есть запросы с теми словами, которые у вас есть, плюс любыми другими словами.

А уточненная частотность показывает, сколько раз пользователи вводили конкретно этот запрос, без каких-либо дополнительных слов и конкретно в тех же словоформах, то есть слова в запросе были использованы в том же числе, тех же склонениях и так далее.  При этом сами слова в запросе могут меняться местами. 

Лично мы так формулируем для себя смысловое отличие базовой и уточненной частотности: базовая частотность — это анализ спроса на тематику в целом, а уточненная — спроса на конкретный ваш запрос.

Рис.14. Отличие базовой частотности от уточненной.

И тут мы можем поделиться с вами таким лайфхаком, который сами используем в Ant-Team.ru при seo-продвижении сайтов наших клиентов. Мы считаем коэффициент экономической выгоды проработки запроса — отношение базовой частотности к уточненной. То есть мы делим базовую частотность на уточненную, и если получившийся результат больше 25, то мы, как правило, не берем эти запросы в работу, так как считаем их проработку экономически не выгодной. Цифра 25 довольно условная, и она может варьироваться в зависимости от вашего случая.

Рис.15. Как рассчитать коэффициент экономической выгоды проработки запроса при сборе сем.ядра.

И тут стоит пояснить, зачем вообще считать этот коэффициент, и когда это стоит делать. 

Начинающие seo-специалисты часто путаются, нужно ли считать этот коэффициент, так как здесь нет каких-то строгих правил. На наш взгляд, этот коэффициент нужен, если у вас B2C-тематика с огромных количеством ключей и очень ограниченным бюджетом. То есть вам нужно как-то почистить все эти ключи, но бюджет проекта не позволяет проработать сразу все из них. Поэтому вам нужно как-то отсортировать те ключи, которые экономически выгодно прорабатывать. В этом случае коэффициент экономической выгоды проработки запроса позволит вам правильно распределить ваши силы в условиях ограниченных финансовых ресурсов и сконцентрироваться на более перспективных запросах.  

Но есть случаи, когда точно нельзя использовать этот коэффициент. Это касается очень узких тематик. Например, вы собираете семантическое ядро для очень узкой сферы B2B, где у вас и так собралось всего лишь 100 запросов. В этом случае, разумеется, нет никакого смысла использовать данный коэффициент, иначе вы вообще останетесь без запросов. Также не стоит использовать этот метод, если вы собираете семантическое ядро для сайта компании, которая является самым настоящим лидером в своей тематике, и сайт действительно хорошо ранжируются по многим запросам. Тогда эти запросы можно оставить, потому что компания сможет по ним нормально ранжироваться. 

У нас бывали ситуации с клиентами, когда младшие seo-специалисты, не зная таких нюансов, отсеивали какие-то ключи по этим коэффициентам, не анализируя ситуацию. А потом клиент внезапно спрашивал, почему в семантическом ядре нет его основного ключа. Оказывалось, что клиент был на второй позиции в топе по этому запросу, а мы отсеяли его из-за “экономической неэффективности”. Именно поэтому нужно очень аккуратно использовать данный коэффициент и обязательно анализировать ситуацию, а не просто бездумно работать по инструкции. 

Чистка в автоматическом режиме

Далее начинаем чистку наших запросов. Не пытайтесь на этом этапе вычитать все ключи вручную! Скорее всего, сейчас у вас их очень много, и сначала нужно удалить все лишнее.

Рис.16. Не нужно проверять каждый ключ на этапе чистки ядра в автоматическом режиме.

Первое, что мы можем сделать, — удалить все запросы с нулевой частотностью, как базовой, так и уточненной.

Опять же, если у вас суперузкая тематика, в которой вам удалось собрать, скажем, сто ключей для целого сайта, то вы можете оставить те ключи, у которых уточненная частотность равна нулю. Но важно понимать, что это актуально только в том случае, если у вас крайне мало ключей, и вы никак не можете подобрать другие запросы!

Для автоматической чистки ключей в программе Key Collector есть три классных инструмента, про которые обязательно должен знать любой сеошник:

  1. анализ неявных дублей;
  2. анализ групп;
  3. стоп-слова.

Неявные дубли

Анализ неявных дублей — это такой инструмент, который позволяет среди всей нашей семантики находить очень похожие запросы. Они могут не быть полными дублями, например, отличаться предлогами (купить тапки москва/ купить тапки в москве), порядком слов, склонением, словоформами и т.д.

Рис.17. Ищем неявные дубли в Key Collector, создавая качественное ядро.

Также в этом инструменте среди найденных дублей можно отметить запросы с меньшей частотностью. Соответственно, на этом этапе мы их находим и вычищаем.

Важный нюанс. Мы рекомендуем ничего не удалять при работе с семантикой. Создайте себе в Key Collector (а в будущем и в KeyAssort) отдельную папку под названием “Корзина” и скидывайте туда весь мусор. В дальнейшем могут возникнуть ситуации, когда это вам очень пригодится. Например, если вы где-то ошиблись: в программе файлы удаляются безвозвратно, а в папке “Корзина” вы всегда сможете найти то, что исключили по-ошибке. Другая ситуация: вы вычистили неявные дубли и из-за этого у вас ушел какой-то ключ, который, как выяснилось позже, очень нужен клиенту. В этом случае вам будет легко найти данный запрос и объяснить клиенту, по какой причине он не попал в семантическое ядро. 

Стоп-слова

Стоп-слова — это другой очень полезный инструмент в Key Collector, необходимый при сборе семантического ядра. Там вы вводите те слова, которые вам точно не нужны. Это очень похоже на простой текстовый фильтр.

Рис.18. Исключение стоп-слов с помощью Key Collector из сем.ядра.

Здесь важно быть аккуратными и не вычистить лишнее. Например, какое-то короткое слово может также входить в состав более длинных слов. Поэтому крайне внимательно следите за тем, что вычищаете. 

Анализ групп

Следующий инструмент в Key Collector для массовой работы со словами, который вам потребуется, называется “Анализ групп”. С его помощью вы можете лемматизировать все запросы из вашего семантического ядра.

Рис.19. Используем инструмент “Анализ групп”, чтобы составить список лемм для ядра.

Полученный список лемм вы можете отсортировать по количеству вхождений этих слов в запросы и вычистить лишнее, если уверены, что какие-то слова вам точно не подходят.

Что в итоге

Вероятно, на всех этапах вы удалили около 60-70 % всякого мусора. В результате получили более-менее чистый список ключей, с которым можно работать дальше. О том, как делать кластеризацию семантического ядра, мы очень подробно рассказываем тут

Теперь вы знаете весь алгоритм действий при сборе семантического ядра, знаете, что такое маркеры, частотность, как использовать лайфхак с коэффициентом экономической эффективности и какие подводные камни существуют. И чтобы научиться самостоятельно собирать семантическое ядро, вам осталось лишь посмотреть, как это делается на практике. Для этого рекомендуем наше практическое занятие по классическому сбору СЯ, где мы показали на примере конкретного сайта, как собираем семантику.

Пройдите короткий тест, чтобы проверить и лучше усвоить полученные знания: https://forms.gle/NDKUjHTrYNvEKRLc8

P.s. Подписывайтесь на наш телеграм-канал t.me/seoantteam, чтобы первыми узнавать о выходе новых материалов.