Отправить заявку на SEO-продвижение сайта от Ant-Team.ru

Заказать

Прогноз трафика на сайт в Google Таблицах

Перевод статьи с портала MOZ.

В этой статье я поделюсь бесплатным шаблоном инструмента для прогноза трафика, покажу, как его правильно использовать, а также объясню, как создать собственную (возможно, более продуманную) версию.

Еще в 2015 году я  писал про простой и бесплатный инструмент для прогнозирования трафика на сайт. Это был быстрый и эффективный способ узнать, является ли изменение трафика обычным сезонным явлением, поводом для радости или тревожным сигналом.

Если вкратце, то вы можете ввести определенный объем данных, и они отобразятся в виде графика, как показано на изображении.

Рисунок 1. График

С тех пор прошло более пяти лет, но меня продолжают спрашивать про этот инструмент, причем как бывшие коллеги, так и совершенно незнакомые люди.  Обычно всех интересует версия, которая работала бы непосредственно в электронных таблицах.

Причина такого интереса понятна: электронная таблица более гибкая, ее легче отлаживать, расширять и поддерживать, да и подобный формат хорошо знаком многим пользователям.

Побочный эффект заключается в том, что, хотя я улучшил этот инструмент несколько лет назад, таблицы в формате Excel/Google все еще остаются довольно капризными и требуют постоянного контроля. Таким образом, в опубликованном шаблоне используется более простая и чуть менее производительная модель, чем в некоторых инструментах с выполнением внешнего кода (например, Forecast Forge).

Если вам нужно освежить в памяти информацию о том, в каких случаях следует использовать прогнозирование трафика на сайте, а также вспомнить такие понятия, как доверительные интервалы, обратитесь к моей статье 2015 года.

Типы SEO-прогнозов

Прежде чем мы перейдем к электронным таблицам, я хотел бы остановиться на различных типах SEO-прогнозов.

В целом, их можно разделить на три группы:

1. «Я настроен оптимистично и ожидаю 20%-ого роста трафика на сайт в этом году» или аналогичные изменения текущих показателей. Более сложные варианты могут касаться роста трафика на те же 20% только в отношении определенных групп страниц или ключевых слов. Я думаю, что многие агентства используют результаты такого прогнозирования в презентациях, опираясь на свой опыт.

2. Модели ключевых слов и их кликабельность, когда вы оцениваете изменение ранжирования (или более широкий набор характеристик), а затем экстраполируете итоговое изменение трафика на основе объема поиска и данных кликабельности (аналогичная методика приведена по ссылке). Опять же, более сложные варианты могут иметь определенную основу для изменения рейтинга (например, «Что, если наш сайт поменяется местами с конкурентом А по каждому ключевому слову группы X, где его сайт в настоящее время опережает нас?»).

3. Статистическое прогнозирование, основанное на данных за период времени. Вы экстраполируете предыдущие тренды и сезонные колебания, чтобы увидеть, какие изменения произошли бы, если бы эти условия оставались постоянными (одинаковый уровень маркетинговой активности у вас и на сайтах конкурентов и т. д.).

У второго типа есть свои достоинства, но если вы сравните данные Ahrefs/SEMRush/Sistrix со своей собственной аналитикой, то увидите, насколько сложно обобщать такие сведения. Кроме того, я вовсе не считаю первый способ таким уж нелепым, но в этой статье не хочу на нем останавливаться. Так или иначе, дальше мы будем подробно обсуждать только третий способ — статистическое прогнозирование  трафика на сайт.

Как этот прогноз связан с SEO?

На самом деле, явные связи практически отсутствуют. Если вы внимательно читали описание прогнозов третьего типа, то не заметили ничего, что было бы напрямую связано с SEO. Такой прогноз может в равной степени относиться, например, к прямому трафику. Тем не менее есть несколько причин, почему я отношу его именно к SEO:

  • Это статья в блоге Moz, а я являюсь консультантом по SEO.
  • Для многих других каналов доступны более совершенные методики.

Я упомянул, что прогнозирование второго типа может быть очень сложным, главным образом из-за того, что SEO само по себе не является точной наукой. И кроме того, зачастую мы имеем дело с низким качеством данных из Search Console и других аналогичных сервисов. К тому же, чтобы получить точное представление о сезонности, вам необходимо хранить данные из Search Console как минимум пару лет.

Для многих других каналов существуют качественные и подробные данные за период времени, а их взаимосвязь гораздо более предсказуема, что позволяет прогнозировать с высокой точностью. Например, для контекстной рекламы (платного трафика) инструмент Forecast Forge, о котором я упоминал выше, учитывает такие факторы, как данные о конверсиях на уровне ключевых слов и цену за клик на основе ваших данных за период времени, что было бы крайне непрактично для SEO.

Тем не менее в приведенном ниже шаблоне мы все еще можем комбинировать несколько типов прогнозов. Например, вместо того чтобы прогнозировать трафик вашего сайта в целом, вы можете отдельно прогнозировать выборочные подкатегории, категории или данные, связанные и не связанные с брендом, а затем применить процентный рост к определенным областям или спрогнозировать ожидаемые изменения рейтинга. Но мы забегаем вперед…

Как использовать шаблон

БЕСПЛАТНЫЙ ШАБЛОН

Первым делом вам нужно сделать копию (в меню «Файл» в левом верхнем углу, но переход по ссылке выполняет эти действия автоматически). Это означает, что вы можете вводить свои собственные данные и использовать таблицу как угодно. При этом всегда можно вернуться и получить исходную копию.

Обратите внимание, что на первой вкладке некоторые ячейки выделены зеленым или синим цветом:

Рисунок 2. Изменяемые ячейки

Изменяйте значения только в цветных ячейках.

Синие ячейки в столбце E в основном предназначены для того, чтобы убедиться в правильной разметке итоговых данных. Настройте метку соответствующим образом, если вы вводите данные сеанса, данные о кликах или данные о доходах. Аналогичным образом, если вы введете начальный месяц 2018-01 и данные за 36 месяцев, прогноз трафика будет выводиться на январь 2021 года.

В таком случае данные должны вводиться за каждый месяц — это один из побочных эффектов упрощения, о чем было сказано ранее. Вы можете ввести ежемесячные данные за период вплоть до 10 лет в столбец B, начиная с ячейки B2, однако несколько моментов стоит обозначить отдельно:

  • Чтобы получить представление о сезонности, необходимы данные как минимум за 24 месяца. Если у вас есть данные всего за один январь, и в этом месяце на сайте наблюдался резкий рост трафика, то невозможно понять, было ли это разовым или ежегодным явлением.
  • Данные должны предоставляться за полный месяц. Так, если вы приступаете к созданию таблицы 25 марта 2021 года, последним месяцем должен быть февраль 2021 года.

Также убедитесь, что вы удалили из столбца B все данные исходной копии.

Результаты

Выполнив все описанные действия, перейдите на вкладку Outputs, где вы увидите следующие данные и график:

Рисунок 3. Вкладка Outputs

Вероятно, вас интересует столбец C («Прогноз»). Эти ячейки содержат множество формул, но вы можете скопировать и вставить значения на другую вкладку или просто перейти в меню «Файл > Загрузить > Значения, разделенные запятыми», чтобы получить необработанные данные.

Вы заметите, что по умолчанию на графике я показываю прогноз трафика на сайт только на 15 месяцев, и я рекомендую вам сделать то же самое. Как я упоминал выше, неявный вывод в документе говорит о сохранении исторического контекста, если вы непосредственно не включите в свою модель измененные сценарии, такие как карантин из-за COVID (подробнее об этом чуть позже!). Вероятность того, что это допущение останется в силе на следующие два-три года, невелика. Поэтому, несмотря на то что я предоставил прогноз трафика на сайт на более отдаленное будущее, не стоит об этом забывать.

Верхняя и нижняя границы представляют собой доверительные интервалы 95% (подробнее о них вы можете посмотреть в моей предыдущей статье).

Дополнительные варианты использования

Возможно, вы уже заметили вкладку Advanced:

Рисунок 4. Вкладка Advanced

Несмотря на то что я старался сделать модель как можно более простой, события 2020 года показали, что многим людям может потребоваться включение дополнительных внешних факторов.

В приведенном выше примере я заполнил столбец B переменной, указывающей, находилась ли Великобритания на карантине из-за COVID. Я использовал значение 0,5, чтобы обозначить введенную в середине марта изоляцию.

Вы, вероятно, можете указать более специфичные для вашего бизнеса факторы, но есть несколько важных вещей, которые следует учитывать при работе с этой вкладкой:

  • Можно вообще не трогать вкладку Advanced, если вы не хотите добавлять дополнительные переменные.
  • Двигайтесь слева направо — можно оставить столбец C пустым, если вы используете столбец B, но нельзя оставлять пустым столбец B, если вы решили ввести данные в столбец C.
  • Если вы используете фиктивную переменную (например, 1 для некоего активного параметра), необходимо убедиться, что вы ввели 0 в других ячейках, по крайней мере, за нужный вам период.
  • Вы можете ввести будущие значения. Например, если вы прогнозируете COVID-изоляцию в марте 2022 года, можно ввести некий параметр в соответствующую ячейку. Это будет включено в документ.
  • Если вы не введете будущие значения, модель выдаст прогноз, как если бы этот параметр был равен нулю. Таким образом, если вы указали параметр «контекстная реклама на бренд активна» в качестве фиктивной переменной для данных за нужный период времени, а для последующих периодов оставили ячейку пустой, модель посчитает, что в будущем вы отключите контекстную рекламу.
  • Добавление избыточного объема данных за небольшое количество периодов приведет к так называемому переобучению. Я не хочу подробно на этом останавливаться, ведь именно поэтому вкладка и называется «Дополнительно». Но постарайтесь не увлекаться.

Вот несколько примеров использования этой вкладки:

  • Укажите, была ли активна контекстная реклама на бренд (0 или 1).
  • Укажите, используете ли вы рекламу на телевидении.
  • Укажите, вводилась ли изоляция из-за COVID.
  • Укажите, выходили ли важные для вашего бизнеса обновления алгоритма (один столбец для каждого обновления).

Почему мои результаты отличаются от того, что было в старом инструменте?

Есть два основных различия между этим шаблоном и моим старым инструментом:

  • В старом инструменте использовалась библиотека Google Causal Impact, в новом шаблоне применяется обычная регрессия наименьших квадратов.
  • Старый инструмент фиксировал нелинейные тренды, используя период времени в квадрате в качестве прогностической переменной (например, месяц 1 = 1, месяц 2 = 4, месяц 3 = 9 и т. д.) и пытаясь подогнать кривую трафика к этой кривой. Это называется квадратичной регрессией. Новый инструмент фиксирует нелинейные тренды, подбирая каждый период времени как величину, кратную предыдущему периоду времени (например, месяц 1 = X * месяц 2, где X может быть любым значением). Это называется авторегрессионной моделью AR(1).

Если вы видите существенную разницу в прогнозируемых значениях, это почти наверняка сводится ко второй причине. Несмотря на определенные сложности, в подавляющем большинстве случаев новая модель отличается гибкостью и выдает более реалистичные прогнозы трафика.

Также она с довольно низкой вероятностью прогнозирует нулевой или отрицательный трафик на сайт в случае сильной нисходящей тенденции.

Как это работает?

В шаблоне есть скрытая вкладка, с содержанием которой вы при желании можете ознакомиться. Однако если вкратце, то речь идет о формуле электронной таблицы ЛИНЕЙН().

Я использую следующие входные данные:

  • Зависимые переменные
    • Все, что вы вводите в ячейки столбца B на вкладке ввода (например, трафик).
  • Независимые переменные
    • Линейное течение времени.
    • Трафик предыдущего периода.
    • Фиктивная переменная за 11 месяцев (12-й месяц представлен другими 11 переменными, равными 0).
    • До трех «дополнительных» переменных.

Затем формула дает ряд «коэффициентов» в качестве выходных данных, которые можно умножить на значения и сложить, чтобы сформировать прогноз, например:

  • Трафик «временной период 10» = отрезок + (коэффициент времени * 10) + (коэффициент предыдущего периода * трафик периода 9).

На скрытой вкладке вы можете увидеть, что я пометил и закодировал цветом многие выходные данные формулы ЛИНЕЙН. Это поможет, если вы решите поэкспериментировать с моделью самостоятельно.

Возможные расширения

Если вы хотите самостоятельно поэкспериментировать с моделью, то вот некоторые области для дальнейшего расширения, которые могут вас заинтересовать:

  • Ежедневные данные вместо месячных, с недельной сезонностью (например, падение каждое воскресенье).
  • Встроенные цели роста (например, выйти на 20% роста трафика к концу 2022 г.).

Ричард Ферги, чей инструмент Forecast Forge я упоминал ранее, также дал несколько отличных предложений по повышению точности прогнозов по трафику на сайт, которые не так уж сложны в реализации:

  • Сглаживайте данные и избегайте отрицательных прогнозов в крайних случаях, используя log() для входных данных и экспонирование для выходных данных (сглаживание данных полностью зависит от ваших целей!).
  • Используйте регрессию за предыдущие 12 месяцев вместо схемы «предыдущий 1 месяц + сезонность» (для этого требуются данные как минимум за 3 года).

Возможно, с течением времени я включу эти идеи в свою модель. В этом случае я внесу соответствующие изменения в шаблон, чтобы у вас под рукой всегда была самая актуальная версия.

Автор: Том Кэппер

P.s. Подписывайтесь на наш телеграм-канал t.me/seoantteam, чтобы первыми узнавать о выходе новых материалов. Мы публикуем только полезный контент по SEO, например, о том, как сделать самостоятельный аудит сайта, как помочь проекту, если упал трафик с Гугла, или как написать sео-текст для сайта.