Поисковое продвижение сайтов

Сергей Анисимов, 2020

В интернет-маркетинге существуют четкие критерии успешности веб-проекта: рост посещаемости, увеличение конверсии и прибыли. Задача книги – помочь читателю быстро и без лишних усилий достигнуть этих целевых показателей. В тексте изложены принципы работы поисковых систем, результаты исследований экспертов и авторские наработки по продвижению сайтов. При этом книга задумывалась именно как практическое руководство по поисковой оптимизации, поэтому материал представлен в максимально простой форме, а все рекомендации приведены по принципу «бери и делай». Книга адресована широкому кругу читателей: собственникам и топ-менеджерам бизнеса, начинающим и опытным специалистам по продвижению, интернет-маркетологам, дизайнерам, веб-программистам, студентам, а также всем, чьи интересы и деятельность непосредственно связаны с Интернетом. В формате PDF A4 сохранен издательский макет.

Оглавление

Из серии: 1000 бестселлеров

* * *

Приведённый ознакомительный фрагмент книги Поисковое продвижение сайтов предоставлен нашим книжным партнёром — компанией ЛитРес.

Купить и скачать полную версию книги в форматах FB2, ePub, MOBI, TXT, HTML, RTF и других

Техническая оптимизация сайта

Техническая оптимизация — это комплекс работ по выявлению и устранению программных и технических недоработок, мешающих сайту занять высокие места в выдаче поисковых систем. Это крайне важный процесс, без выполнения которого продвижение сайта либо существенно усложняется, либо становится невозможным.

Техническую оптимизацию условно можно разделить на два этапа:

1. Первоначальная оптимизация. Данная процедура выполняется на старте проекта и обеспечивает корректную индексацию сайта и правильную настройку его основных механизмов.

2. Периодический анализ состояния сайта, устранение выявленных недостатков и доработка новых возможностей. На этом этапе техническая доработка превращается в итерационный процесс, где в конкретный временной период (например, за календарный месяц) выполняется определенный перечень работ по улучшению сайта, объем которых зависит от финансовых возможностей в проекте по продвижению.

В данном разделе мы сосредоточимся на тех параметрах вебсайтов, которые оказывают влияние на ранжирование в поисковых системах, а также приведем рекомендации, которые помогут избежать самых распространенных технических ошибок.

7. Надежный, быстрый и удобный хостинг

Аптайм сервера

Аптайм сервера (от англ. uptime — время непрерывной работы) — это один из важнейших параметров, которые надо учесть при выборе хостинг-площадки для веб-сайта. Аптайм рассчитывают в процентах, как среднее время работы системы от общего времени измерения. Противоположным аптайму является «даунтайм» (от англ. downtime) — время, когда сервер не работает.

Хорошими показателями аптайма считаются цифры в пределах 99,8-99,9 %, что примерно соответствует часу-полутора даунтайма в месяц. Этого вполне достаточно для устойчивой работы сайта, да и добиться более высоких показателей может быть сложно, так как любой сервер требует критических обновлений (после которых идет перезагрузка), а иногда тормозит или подвисает, вследствие чего непрерывная работа может прерываться.

Чем опасен низкий аптайм? Во-первых, если сервер «упал», теряются посетители и клиенты, которые могли бы прийти на сайт. Особенно это критично при высоком уровне платного трафика из контекстной рекламы и других рекламных сетей, когда денежные потери могут выливаться во вполне ощутимые суммы.

Во-вторых, если сайт будет недоступен по причине неработоспособности хостинга, поисковые роботы не смогут получить к нему доступ. При кратковременных неполадках, конечно, ничего не произойдет, но постоянные отключения приведут к понижению сайта в результатах выдачи, вплоть до полного исключения ресурса из поискового индекса.

Чтобы избежать негативных последствий, нужно ответственно отнестись к выбору хостинга: провести анализ предложений на рынке; проверить отзывы; разобраться в том, насколько удобный интерфейс предоставляет хостинг-компания[6] и какие дополнительные услуги будут доступны. Такая работа сэкономит много сил в дальнейшем.

Отслеживать работоспособность сервера можно множеством способов. Самый простой — настроить уведомления о проблемах на сайте в системе веб-статистики, которую устанавливают на сайт для сбора информации о различных аспектах его работы (подойдет, например, Яндекс-метрика). Если нужно более подробное и гибкое решение, необходимо воспользоваться веб-сервисами проверки хостинга, ссылки на которые легко найти в Сети.

Местонахождение и скорость работы сервера

Физическое местонахождение сервера хоть и слабо, но может повлиять на ранжирование сайта. Особенно это актуально при поиске информации с геопривязкой, по определенному географическому региону.

Большое географическое удаление сервера может вызвать проблемы со скоростью загрузки сайта и обслуживанием сервера: общаться с технической поддержкой сервера, например, придется ночью, да еще и на иностранном языке.

Большое значение имеет скорость работы сервера, от которой напрямую зависит ряд аспектов, влияющих на скорость загрузки сайта. Для ускорения своих площадок хостинг-провайдерами используются различные технологии, вплоть до CDN[7] — географически распределенной сетевой инфраструктуры, позволяющей оптимизировать доставку контента пользователям. Соответственно, при продвижении нужно проанализировать предоставляемые разными компаниями возможности и выбрать самый быстрый сервер из всех доступных.

Отказоустойчивость

С ростом трафика сайта нагрузка на хостинг будет расти. Также нужен запас прочности сервера на случай внезапного лавинообразного роста трафика (например, из-за рекламных акций или случайных ссылок в социальных сетях, по которым одномоментно могут перейти множество пользователей).

В идеале выбранный для сайта сервер должен выдерживать даже критичную нагрузку. Проверить это можно с помощью специальных сервисов нагрузочного тестирования производительности[8].

Если у сайта слабый сервер и нет возможности увеличить его мощность, можно также оптимизировать нагрузку с помощью директивы crawl-delay[9]. Но это временная мера: проще и надежнее использовать более мощный хостинг.

8. Скорость загрузки сайта

Скорость загрузки является критично важным параметром при продвижении сайта.

Дело в том, что пользователи привыкли к быстрой загрузке и их раздражает ситуация, когда сайт долго не открывается. Поисковые системы учитывают этот момент и в погоне за удовлетворенностью пользователей ставят на высокие позиции в выдаче только быстрые сайты.

Как измеряется скорость сайта

Поисковые системы могут весьма точно просчитывать скорость загрузки страницы, основываясь только на ее коде и размере скачиваемых файлов. Однако для измерения скорости используется и множество других источников, например, статистика браузеров (Google Chrome, Яндекс Браузер), плагинов для браузеров и систем веб-мониторинга.

Чем выше будет скорость загрузки страниц, тем лучше. В общем случае время ожидания не должно превышать 3–5 секунд, а хорошие показатели составляют до 0.7 секунды для времени скачивания исходного кода документа и до 0.2 секунды для времени ответа сервера. То есть ваш сайт должен загружаться меньше чем за секунду.

Оценить скорость загрузки помогут специальные сервисы. Самый популярный из них — Google PageSpeed Insights[10], по оценке которого нужно набирать 90+ баллов и для мобильной, и для десктопной версии сайта. Помогут и другие сервисы анализа скорости загрузки веб-ресурсов, ссылки на которые легко найти в Интернете.

Работу по ускорению сайта должен выполнять профессиональный программист, результаты работы которого необходимо проверить с помощью специальных веб-сервисов и данных веб-статистики. Для общей информации приведем некоторые рекомендации, которые могут помочь выполнить задачу:

1. Использовать кэш браузера [11].

2. Включить сжатие[12].

3. Удалить код JavaScript, препятствующий показу страницы[13].

4. Оптимизировать код CSS[14].

5. Сократить объем ресурсов (HTML, CSS и JavaScript)[15].

6. Оптимизировать изображения[16].

7. Оптимизировать время ответа сервера[17].

Перечисленные рекомендации подходят для всех вебплатформ, поэтому их можно реализовать в первую очередь.

9. Оптимизация метатегов

Метатеги[18] (от англ. meta tags) — это html-теги, предназначенные для предоставления структурированных метаданных (дополнительных, сопроводительных данных) о веб-странице.

Метатегов очень много, но большинство из них для практического поискового продвижения бесполезны, поэтому в данном разделе мы рассмотрим только те теги, которые способны реально повлиять на позиции сайта в поисковых системах.

Для диагностики проблем с метатегами можно воспользоваться сервисами для веб-мастеров Яндекса и Гугла. В них представлена информация о проиндексированных страницах, и можно легко увидеть явные проблемы (например, разделы с отсутствующими или повторяющимися метатегами).

Однако о скрытых дефектах метатегов поисковые системы не рассказывают: продвигаемый сайт будет просто ранжироваться ниже конкурентов. Поэтому изучению метатегов и правил их заполнения стоит уделить особое внимание.

Тег <title> (название страницы)

Хотя <title>[19] с технической точки зрения не метатег, а просто тег, он часто используется вместе с метатегом <description>, поэтому обсуждать его мы будем именно в этом разделе[20].

<title> многими исследователями считается чуть ли не вторым по важности фактором при ранжировании страницы (на первое место ставится текстовое наполнение). Такое утверждение спорно, однако тег точно нельзя недооценивать. Как правило, на его основе поисковая система формирует заголовок страницы, который пользователь видит на странице поисковой выдачи[21]. Именно от него во многом зависит, какую позицию займет страница и перейдет ли на нее пользователь.

При заполнении тега нужно придерживаться следующих рекомендаций:

1. <title> должен отражать содержимое страницы.

2. В теле тега <title> должно присутствовать точное вхождение основного запроса, под который оптимизирована страница. Также в него можно включить вхождения второстепенных запросов и полезную информацию для пользователей (бренд, отзывы, цена, скидки, телефон, сведения о доставке). При этом нужно избегать переоптимизации (чрезмерного употребления) по главным и второстепенным ключевым словам.

3. Ключевые слова лучше размещать ближе к началу заголовка. Это влияет как на позицию в выдаче, так и на CTR (на такой заголовок больше кликают).

4. Текст заголовка должен быть осмысленным и привлекательным для клика. Нужно помнить, что именно его видит пользователь в результатах выдачи.

5. Весь заголовок рекомендуется вмещать в 70 символов, так как есть вероятность, что большее количество текста пользователь просто не увидит из-за ограничений верстки на странице выдачи поисковых систем. Приблизительно это 1–2 небольших словосочетания. Ограничениями можно пренебречь, чтобы разместить действительно важную для пользователей информацию (есть вероятность, что поисковая система покажет эту часть заголовка при вводе пользователем соответствующего запроса). При этом нужно помнить, что чем больше слов в <title>, тем меньше вес у каждого слова, поэтому чем заголовок содержательнее и короче, тем лучше.

6. Необходимо проанализировать заголовки успешных конкурентов, которые уже присутствуют в выдаче по нужным ключевым словам. Это не только поможет определить оптимальную длину заголовка, но и подскажет, какую информацию стоит в нем разместить.

7. <title> должен быть уникальным для всех страниц в пределах одного сайта.

Для больших сайтов часто кажется слишком трудоемким заполнение тега заголовка для всех страниц в ручном режиме. Зачастую это иллюзорное впечатление: объем усилий оказывается не таким уж большим и с лихвой окупается полученным эффектом.

Но если ручной режим представляется нецелесообразным, можно сгенерировать метатеги по шаблону. Подробнее мы поговорим об этом ниже.

Метатег <description> (описание страницы)

Метатег <description>[22] описывает содержимое веб-страницы. Он также очень важен, так как на его основе поисковые системы зачастую формируют сниппеты, и, следовательно, от его качества напрямую зависит популярность сайта.

На заметку

Сниппет — это небольшой фрагмент текста, который мы видим на странице поисковой выдачи вместе со ссылкой на сайт. Сниппеты напрямую влияют на кликабельность, и их оптимизации посвящен отдельный раздел в этой книге.

При формировании содержимого метатега < description> необходимо выполнять следующие рекомендации:

1. В теле < description> должно присутствовать точное вхождение основного запроса, под который оптимизирована страница. Также в него можно включить: вхождения второстепенных запросов и полезную информацию для пользователей (бренд, отзывы, цена, скидки, телефон, инфо о доставке и прочее). При этом нужно избегать переоптимизации (чрезмерного употребления) по главным и второстепенным ключевым словам.

2. Текст должен содержать призыв к действию и быть привлекательным для клика.

3. Желательно делать основное содержимое < description > короче 160 символов. Но нужно учитывать, что количество символов, которые выводятся в сниппете на странице с результатами поиска, может в любой момент измениться. Поэтому текст описания может быть и более 160 символов. Главное, чтобы это была полезная и нужная для пользователей информация. 160 символов — это 2–4 небольших предложения. Допускается, когда эти предложения взяты из текста на странице (желательно из верхней его части). Это почти гарантированно приведет к тому, что сниппет будет формироваться поисковыми системами именно на основе содержимого <description>.

4. <description> должен присутствовать на всех страницах и быть уникальным в пределах сайта.

5. Хорошим приемом повышения кликабельности сайта на странице поисковой выдачи может быть вставка в описании специальных символов и значков (самолет, телефон, решетка и прочее). О том как это сделать, можно легко найти информацию в Сети.

Шаблонизация

Для больших веб-проектов актуальна проблема ручного заполнения метатегов на всех страницах. Этих страниц просто слишком много, хотя выше мы отмечали, что часто эта проблема надуманная: на заполнение метатегов понадобится не так уж много времени, а затраченные усилия с лихвой окупятся хорошими позициями в поисковых системах.

Но если вопрос стоит остро, на помощь придут автоматические скрипты и конкатенация.

На заметку

Конкатенация — операция склеивания объектов линейной структуры, обычно строк. Например, конкатенация слов «микро» и «мир» даст слово «микромир»[23].

Заниматься написанием скриптов должны программисты, это технический вопрос. Важнее другой момент: как составить тексты для заголовков и описаний?

Универсальных рецептов нет, но важно понимать, что схема конкатенации — это составление шаблонов для определенных видов контента, где на место свободных полей можно подставить конкретные значения с каждой страницы.

Допустим, нужно заполнить метатеги для большого количества продуктовых страниц на сайте интернет-магазина парфюмерии. Для начала необходимо определить, как пользователи движутся по сайту. Пусть это происходит так: главная — категория — продукт. Эти три переменные необходимо заполнить.

Далее определяются дополнительные параметры и слова, которые важны для пользователей. Для этого необходимо проанализировать хвост низкочастотных запросов, который возникает при проверке основного запроса. Например, вот что мы видим при проверке в сервисе Яндекс. Wordstat[24] категории «женские духи»:

Анализируем таблицу и выбираем то, что волнует покупателей женских духов (цена, фото, отзывы, купить…).

Переходим к построению шаблона заголовка. Например, для страницы с товаром он мог бы быть таким:

{название категории} {название товара} — купить в {название магазина}. Цена от {цена} р., фото, отзывы, доставка.

После подстановки всех переменных получим:

Женские духи Dia Woman — купить в магазине Beauty. Цена от 17 800 р., фото, отзывы, доставка.

С мета-описанием аналогично. Если на страницах сайта есть подробное описание товара — можно планировать схемы детальнее, включать больше параметров и полезной для пользователей информации.

Рекомендуется делать схемы для каждого раздела сайта. Чем детальнее их проработать, тем лучше, хотя стоит помнить о балансе затрат и полученных результатов.

Метатег <keywords> (ключевые слова)

На заре развития поисковых систем появилась красивая, но наивная идея о том, что веб-мастера будут сами подсказывать поисковым системам те ключевые слова, которым релевантна та или иная веб-страница.

Для реализации этой теории ввели метатег <keywords >, слова из которого имели серьезное значение при ранжировании документов.

Что произошло дальше, догадаться нетрудно. Веб-мастера и специалисты по продвижению начали запихивать в <keywords> все ключевые слова, по которым они хотели продвинуть сайт в результатах поиска. На релевантность никто не обращал внимания: зачем эти тонкости, когда можно было в короткий срок продвинуться по всем нужным коммерческим запросам?

Масштаб злоупотреблений достиг такой величины, что поисковые системы вынуждены были свести влияние <keywords> буквально до нуля, поэтому на данный момент заполнять этот тег бессмысленно.

Если тег все-таки заполняется содержимым (так сказать, на всякий случай), необходимо соблюдать простые правила. Содержимое <keywords> должно быть уникальным в пределах сайта, все ключевые слова должны быть релевантны странице, и их должно быть немного.

В противном случае поисковые системы могут воспринять содержимое метатега <keywords> как веб-спам и понизить сайт в результатах поиска.

Метатег <robots>

Данный метатег[25] позволяет контролировать сканирование и индексирование сайта поисковыми системами. По умолчанию задаются значения «index, follow» (то же самое, что «all») — дополнительно их прописывать не нужно. Разные поисковики распознают разные значения тега, но универсальными являются два:

— noindex: запрещает индексирование страницы;

— nofollow: запрещает роботу переходить по ссылкам с этой страницы.

Эти значения можно комбинировать, разделяя их запятыми. Например, комбинация

<meta name=«robots» content=«noindex, follow»/> заставит робота поисковиков перейти по всем ссылкам на странице, но не индексировать ее содержимое.

Нужно отметить, что использование данного метатега, как правило, свидетельствует о проблемах со структурой сайта. С такими проблемами еще можно мириться на огромном портале, где регулярно возникают трудноустранимые с программной точки зрения «тупики» (страницы, представляющие мало интереса для пользователей и возникающие вследствие несовершенства архитектуры сайта). Но для небольшого проекта это недопустимо.

На заметку

Данное правило является частным случаем другого, более универсального, принципа, который звучит так: «Пользователи и поисковые системы должны видеть одинаковый контент». Если на сайте возникают страницы, содержимое которых нецелесообразно индексировать поисковому роботу, необходимо задуматься о том, а стоит ли их «индексировать» пользователям сайта и какое впечатление такие страницы на них произведут? Не проще ли просто их убрать?

Остается добавить, что использование данного тега для управления индексированием менее предпочтительно по сравнению с правильным формированием файла robots.txt (о нем мы поговорим позже).

10. Поиск и устранение дублей

Идентичный (дублированный) контент на разных страницах сайта может привести к ошибкам индексации и даже свести на нет все усилия по продвижению. Чем опасны дубликаты и почему от них стоит избавляться?

Во-первых, на дубли уходит часть статического веса, а неправильное распределение веса ухудшает ранжирование целевых разделов сайта.

На заметку

Статический вес — это один из важных параметров, влияющих на продвижение сайта в целом и конкретной страницы в частности. Вес определяется количеством и качеством ссылающихся на страницу документов (в основном, html-страниц, но учитываются еще pdf и doc-файлы, а также другие распознаваемые поисковиками документы с гиперссылками).

Во-вторых, на дубли тратится часть драгоценного краулингового бюджета. Особенно остро эта проблема стоит для крупных информационных и e<ommerce (онлайн-торговля) проектов.

На заметку

В Интернете триллионы веб-страниц, и каждый день появляются сотни миллионов новых веб-страниц. В этой связи перед поисковыми системами стоит серьезная проблема: как успевать обходить, скачивать и ранжировать все это огромное хозяйство.

Для обхода страниц используются роботы. Поисковый робот («веб-паук», «краулер») — программа, являющаяся составной частью поисковой системы и предназначенная для перебора страниц Интернета и занесения информации о них в базу данных. Очевидно, что каким бы мощным и быстрым не был краулер, скачать единовременно все обновления со всех сайтов у него не получится.

Из-за этого паук скачивает сайты постепенно, небольшими «порциями», например, по нескольку десятков или сотен страниц в день. Размер этой порции на профессиональном сленге специалистов по продвижению и называется краулинговым бюджетом.

По сути, бюджет — это то количество страниц сайта, которое обновится в базе поисковика за определенный период. Чем больше бюджет, тем лучше, так как при большом бюджете можно быть уверенным, что все изменения на сайте быстро попадут в базу данных поисковика.

Краулинговый бюджет зависит от многих факторов (уровня траста, размера сайта, частоты обновления, тематики, региона) и рассчитывается по специальному алгоритму. Самостоятельно увеличить его на нужную величину довольно сложно.

Поэтому при продвижении сайта стоит обратная задача: вместить в имеющийся бюджет все изменения, которые произошли на сайте. Для этого применяется комплекс мер, от удаления дублей до управления индексацией с помощью служебных файлов. Все эти меры мы последовательно рассмотрим на страницах данной книги.

Остается добавить, что получить представление о краулинговом бюджете для продвигаемого сайта можно с помощью статистики, которую предоставляют поисковые системы в панелях для веб-мастеров, или анализа логов сервера.

В-третьих, из-за ошибок в алгоритмах поисковых систем после очередного обновления поискового индекса дубль может заменить в выдаче целевую страницу. Как правило, после этого позиции сайта в выдаче существенно ухудшаются.

Но даже если этого не произойдет, может возникнуть ряд негативных эффектов: например, падение конверсии[26] и накопление поведенческой статистики на неправильной странице. Целевая страница при этом может вообще пропасть из индекса (в самом деле, зачем держать в базе несколько копий одной и той же страницы?).

В-четвертых, может возникнуть ситуация, когда поисковая система не сможет разобраться, какой из дублей следует считать основным. В этом случае алгоритм понизит обе страницы (и сайт в целом) в результатах выдачи.

Причины возникновения дублей и методы их обнаружения

Причины возникновения дублей могут быть разными:

1. Дубли штатно или по ошибке может генерировать движок сайта. Например, дублями могут быть страница и ее версия для печати, встречаются дубли главной страницы (site.ru и site.ru/index.php) или одинаковые страницы с разными расширениями (.php и. html).

2. Дубли могут возникнуть из-за невнимательности вебмастера (после изменения адреса страницы она становится доступна и по старому, и по новому URL).

3. Дубли могут генерироваться из-за дизайнерских или контентных особенностей проекта (в интернет-магазинах часто похожие товары отличаются лишь очень кратким описанием или несколькими техническими параметрами).

Для обнаружения дубликатов есть множество эффективных инструментов:

1. Панели для веб-мастеров поисковых систем[27]. С помощью этих веб-сервисов также можно следить за скачиваемыми страницами и находить дубли.

2. Расширенный поиск в поисковых системах. Для Гугла можно использовать site: имя_хоста[28]. В Яндексе можно смотреть индекс по отдельным разделам с помощью url: имя_хоста/категория/*[29] (для этого же можно использовать оператор inurl).

3. Специальные сервисы и программы. Например, можно воспользоваться программой XENU[30], а также некоторыми распространенными веб-сервисами, информацию о которых легко найти в Сети (см. рис. 2 на с. 54).

Устранение дублей может быть сложным и зачастую требует творческого подхода. Однако есть направления, которые однозначно стоит проверить.

Ошибки движка сайта

Разберем типичные ошибки работы движка сайта, которые приводят к появлению дублей:

1. Движок сайта не генерирует 301 редирект при смене адреса страницы (этот редирект либо нельзя поставить вообще, либо нужно ставить в ручном режиме, о чем легко забыть). Данный недостаток легко устранить на программном уровне.

Рис. 2. Результаты сканирования сайта программой XENU: интерфейс безнадежно устарел, но функционал остается полезным при выполнении практических задач

2. Движок отображает один и тот же контент по разным адресам:

a. Разные страницы могут возникать при перестановке частей URL-адреса. Например, одинаковый контент выводится на страницах site.ru/cars/volvo и site.ru/volvo/cars.

b. Отображение страницы происходит при частичном вводе адреса, например по URL site.ru/sumki/cristina-agilera и site.ru/sumki/cristina.

c. Одна и та же страница может отображаться в разных категориях. Особенно это актуально для карточек товаров в интернет-магазине: site.ru/moto/sc-234 и site. ru/moto-s-pricepom/sc-234. Проще всего решить эту проблему, присвоив каждой карточке раз и навсегда свой уникальный адрес.

3. Движок сайта может генерировать сессионные переменные в адресе страниц. Ниже мы разберемся с этим вопросом подробнее.

Сессия — промежуток времени, в течение которого пользователь находился на сайте[31]. Когда пользователь заходит на сайт, последний с помощью cookies[32] браузера его идентифицирует. Это необходимо, чтобы понять, кто этот посетитель, и помочь ему пользоваться сайтом. Например, если при авторизации пользователь поставил галочку «Запомнить меня», то при следующем заходе на сайт он сразу будет залогинен.

Но бывает, что cookies у пользователя отключены. В таком случае возможны три варианта:

— сайт будет работать, как обычно;

— сайт не сможет работать полноценно и выдаст сообщение, что для нормальной работы нужно включить cookies;

— движок сайта постарается компенсировать отсутствие cookies с помощью так называемых сессионных переменных (уникальных идентификаторов, которые будут добавляться к URL тех страниц, на которых побывал пользователь).

Последний подход создает дополнительные проблемы для поисковых систем. Их роботы приходят на сайт, видят новые URL с сессионными переменными и индексируют их. В результате в поисковую базу попадают полные дубликаты уже существующих страниц.

Конечно, поисковые системы отфильтровывают большинство таких страниц, но эта ситуация негативно влияет на индексацию и ранжирование сайта. Если движок сайта генерирует сессионные переменные, необходимо этот механизм отключить.

301 редирект

В основном 301 переадресацию[33] (жарг. «301 редирект») используют при смене URL-страницы, но эта технология пригодится и для борьбы с дублями.

Дело в том, что код статуса 301 означает, что запрашиваемая страница окончательно перемещена в новое местоположение. А поэтому, если настроить 301 редирект с дубля на основной документ, дубль пропадет из поисковой базы.

Необходимо настроить постраничный 301 редирект:

1. C домена без «www» на домен с «www» (или наоборот, в зависимости от того, какой вариант лучше проиндексирован поисковиками, накопленной ссылочной массой и индивидуальных предпочтений).

2. Со страниц без слэша («/») на конце адреса на страницы со слэшем (или наоборот, в зависимости от особенностей сервера и собственных предпочтений). Отметим, что адреса без косой черты на конце предпочтительнее, так как косая черта ассоциируется с каталогом, а не с конечной страницей на сайте.

3. Со страниц, адрес которых оканчивается на «.htm», на страницы вида «.html».

4. С версии сайта «http» на версию «https».

5. С дублей главной страницы сайта (вида «index.php», «index.html», «default.html») на главную. Если такой редирект невозможен из-за особенностей системы, необходимо запретить дубли в файле robots.txt, а также проверить актуальность проблемы для других разделов сайта.

6. После настройки ЧПУ (о чем мы поговорим позже) страницы сайта могут быть доступны и по старым, техническим адресам. Если это так, необходимо настроить 301 редирект на страницы с ЧПУ.

Атрибут rel=«canonical»

Часто на сайте присутствуют группы страниц с частичным дублированием контента. Например, это могут быть карточки товаров, отличающиеся только отдельными параметрами (например, один и тот же стол с разной длиной столешницы), или страницы блога с одной и той же статьей, но разными URL-адресами.

В этом случае необходимо оптимизировать индексацию страниц сайта с использованием вспомогательного атрибута rel=«canonical»[34], с помощью которого можно указать предпочитаемый (канонический) адрес, который будет участвовать в поиске.

Правильно настроенный атрибут rel=«canonical» помогает существенно упростить настройку индексации сайта и устранить дубликаты страниц для корректного учета всех поведенческих и ссылочных метрик документов. Другими словами, поисковые системы «склеят» страницы с частично дублированным контентом вместе со всеми метриками. Особенно это актуально при проведении рекламных кампаний, например, с использованием UTM-меток[35].

Общий план действий:

1. Проанализировать сайт и определить страницы с частично дублированным контентом (страницы с параметрами в URL, дубли одной страницы в разных категориях, похожие товары и прочее).

2. Из группы похожих страниц выбрать каноническую и добавить в код неканонических страниц атрибут rel=«canonical». Желательно, чтобы атрибут ставился программным способом — это существенно облегчит администрирование сайта.

Остается добавить, что из-за несовершенства алгоритмов rel=«canonical» не всегда обрабатывается корректно. Это приводит к отсутствию «склейки» поведенческих и ссылочных факторов ранжирования. Поэтому надежнее использовать 301 редирект везде, где это только возможно.

301 редирект или rel=«canonical»?

Давайте определим, какой способ и когда лучше использовать.

301 редирект лучше:

1. Просто по умолчанию. Это более предпочтительный метод вследствие того, что rel=«canonical» не всегда обрабатывается корректно.

2. Если у страницы навсегда изменился адрес.

3. Если сайт переехал на новый домен.

4. Если администратор сайта удалил какую-то страницу, но вместо 404 ошибки хочет показать пользователям другую, схожую с удаленной, информацию (например, другой товар взамен удаленного).

rel=«canonical» лучше:

1. Когда 301 редирект не может быть реализован или его внедрение потребует слишком больших затрат.

2. Когда имеет смысл показывать частично дублированный контент пользователям. Например, несколько страниц стола с разной длиной столешницы можно показывать в расчете на более высокую конверсию, особенно если на эти страницы ведут специальные объявления из систем контекстной рекламы.

3. Когда нужно показывать страницы с почти одинаковым содержимым (например, сортировки каталога, отслеживания партнерских ссылок).

4. Для кросс-доменов, когда оба сайта похожи, но похожий контент нужно оставить на каждом из доменов. Эта ситуация может быть опасна из-за аффилирования, о чем мы поговорим в разделе, посвященном санкциям поисковых систем.

Ошибки при использовании редиректов

Закрывая тему редиректов, хочется рассказать об ошибках, которых стоит избегать:

1. Необходимо делать правильный выбор между 301 редиректом и rel=«canonical».

2. Нужно избегать любых многошаговых редиректов. Одношаговый редирект быстрее работает и сохраняет максимум ссылочного веса. Кроме того, если на сайте будут замечены многошаговые редиректы, поисковая система может решить, что ваша страница — дорвей. А это повлечет серьезнейшие санкции для сайта.

На заметку

Дорвей[36] (от англ. doorway — входная дверь, портал) или входная страница, — один из видов поискового спама. Это веб-страница, специально оптимизированная под один или несколько поисковых запросов с целью ее проникновения на высокие места в результатах поиска и дальнейшего перенаправления посетителей на другой сайт или страницу.

Дорвей не представляет никакой ценности, и пользователь даже не успевает его рассмотреть — его сразу перенаправляют на другой сайт. Контент дорвея, как правило, лишен смысла и генерируется автоматически по специальным алгоритмам (писать руками слишком затратно). Часто это просто набор фраз, в который внедрены ключевые слова.

Дорвеи — это веб-мусор, поэтому все поисковые машины беспощадно с ними борются.

3. Нужно применять правильные виды редиректов[37], чтобы не запутать поискового робота.

4. При внедрении редиректа необходимо позаботиться о том, чтобы на сайте не осталось ссылок со старым URL-адресом (с которого и выполняется перенаправление).

5. Редирект желательно ставить на максимально релевантную страницу. Например, на похожую карточку товара или ветку каталога, к которому принадлежала страница. Если это невозможно, лучше выдавать 404 ошибку, о которой мы поговорим чуть позже.

6. Редирект должен вести на действующую страницу (с кодом ответа 200 ОК). Иначе нужно вернуть 404 ошибку.

Robots.txt

Robots.txt — это специальный служебный файл, расположенный в корневом каталоге сайта[38], который является незаменимым помощником в борьбе с дублями и нецелевыми страницами, попавшими в индекс. Следует обязательно создать этот файл в соответствии с рекомендациями поисковых систем[39], а затем указать в нем страницы и данные, которые поисковым роботам не следует индексировать.

Перечислим типичные разделы и страницы с дублированным контентом, индексацию которых стоит запретить в файле robots.txt:

— страницы фильтраций и сортировок с дублированным контентом;

— страницы с UTM-метками;

— результаты поиска;

— тестовые страницы, поддомены и серверы;

— RSS-фиды.

В файл также следует добавить разделы с малоинформативным и служебным контентом:

— служебные страницы и файлы, логи сайта, страницы с внутренней статистикой, вход в административную панель, кэш страниц, подгружаемые модули и другие технические страницы;

— страницы авторизации, смены и напоминания пароля;

— «висячие узлы», то есть страницы, с которых нет ссылок на другие страницы сайта (например, версия страницы для печати);

— страницы совершения действия (добавления в корзину, оформления заказа и прочее);

— страницы с динамическими параметрами[40];

— неинформативные или пустые doc — и pdf-файлы (такие файлы лучше не просто закрывать от индексации, а удалять с сайта). При этом надо помнить, что, если такие файлы уникальны и несут полезную информацию, их не закрывают от индексации.

Приведенные списки не являются исчерпывающими. Каждый движок имеет свои особенности, поэтому желательно делать регулярную проверку, выявлять дубли и «мусорные» страницы и запрещать их к индексации.

Надо отметить, что запрещение индексации разделов через файл robots.txt без скрытия ссылок на них может приводить к тому, что эти разделы все же попадут в индекс со всеми вытекающими последствиями.

Про robots.txt профессионалы даже шутят, что он как презерватив: вроде бы защищает, но гарантий никаких.

Поэтому желательно просто убирать ссылки на нежелательные разделы из клиентской части сайта: так вы надежно скроете их и от поисковых роботов, и от пользователей.

В файле robots.txt следует указать ссылку на карту сайта с помощью директивы Sitemap[41].

Остается добавить, что для анализа корректности файла robots.txt нужно воспользоваться валидаторами поисковых систем[42].

11. Оптимизация заголовков

При оптимизации заголовков встречается много ошибок. Давайте разберем типичные недостатки и поймем, как их избежать.

Заголовок hl

Согласно многим исследованиям, заголовок h1[43] зачастую работает как «второй тайтл», поэтому к нему нужно относиться максимально внимательно:

1. Заголовок h1 единожды должен присутствовать на каждой странице сайта. Повторное использование тегов заголовка h1 на странице недопустимо.

2. Заголовок должен «перекликаться» с тегом <title>, допускается частичное или даже полное дублирование.

3. Заголовок должен однозначно визуально идентифицироваться на странице, чтобы пользователь сразу понимал содержание текущего раздела. Добиться выделения заголовка можно с помощью размера букв, шрифта, цвета и других приемов.

4. В теле заголовка желательно использовать ключевые слова, но переоптимизация (чрезмерное употребление) недопустима.

Рис. 3. Сайт htmlbook.ru — полезный справочник для любого вебспециалиста

Теги h2-h6

Перечислим основные рекомендации, которые помогут правильно применять второстепенные заголовки:

1. Заголовки пришли в Интернет со страниц газетных полос и по возможности должны следовать газетной традиции визуального оформления: h1 должен быть самым крупным и заметным, h2 — меньше, h3 — еще мельче. Так пользователь сможет легче понять иерархию текста на странице.

2. Оптимально использовать только теги h1-h3. Теги h4-h6 почти бесполезны для поискового продвижения, а их использование свидетельствует о проблемах с текстом на странице: он слишком подробно поделен на отдельные части и его необходимо сделать более однородным. Для больших информационных порталов (словарей, справочников и т. п.) допускается также использование h4. Теги h5-h6 лучше не использовать никогда.

3. Ключевые слова в заголовках h2 и h3 могут быть слабым сигналом релевантности, поэтому этим надо пользоваться. Нужно размещать ключевые слова в этих элементах, но не во всех, так как это может быть признаком текстовой переоптимизации, за которую поисковые системы наложат на страницу санкции.

Типичные ошибки

Перечислим типичные ошибки, которых следует избегать:

1. Тегами заголовков можно выделять только заголовки в контентной (текстовой) части страницы. Другие варианты их применения в верстке недопустимы.

Для оформления контента вне основной области страницы (шапка, левая/правая колонка, подвал сайта) можно создать и использовать специальные css-классы.

2. По возможности нужно стараться делать код заголовков более «чистым», без дополнительных тегов и классов. Идеально: <й1>Текст заголовка< /h1>. Это не влияет на продвижение сайта, но поможет придерживаться единого стиля заголовков на всем сайте.

3. Не следует перебарщивать с количеством подзаголовков h2 и h3 на странице. Их количество должно быть адекватно количеству текста (в среднем — один подзаголовок на 800-1500 символов).

Помимо технических задач, связанных с продвижением, заголовки играют большую роль в удержании пользователей и повышении конверсии. Эти аспекты мы подробно разберем в соответствующих разделах.

12. Настройка адресации

Правильная адресация помогает пользователям ориентироваться на сайте и способствует повышению позиций сайта в поисковой выдаче. Ее необходимо оптимизировать на самом раннем этапе работ, иначе можно потерять часть уже достигнутых при продвижении результатов.

ЧПУ

Как известно, к сайту можно обратиться по его URL[44]. URL (англ. Uniform Resource Locator, «урл») — это единый указатель (адрес) ресурса. URL служит стандартизированным способом записи адреса ресурса в Интернете.

Все без исключения страницы сайта должны иметь человеко-понятный урл (ЧПУ). Так на профессиональном жаргоне называют веб-адрес, содержащий читаемые слова вместо служебных параметров, более удобных для компьютера, чем для людей (например, числовых идентификаторов страницы).

Такой адрес состоит из букв латинского (английского) алфавита, цифр и знака «-» (дефиса), который используется для отделения слов друг от друга вместо пробела. ЧПУ отражает виртуальную иерархическую структуру сайта (физически такая структура папок и файлов на сервере может и не существовать). Пример такого адреса: http://site.ru/katalog/igrushki/kubik-rubika

В Гугле такие адреса называют простыми[45]. И действительно, чтобы добиться такой адресации, структуру сайта нужно делать предельно простой, логичной и понятной. Это поможет пользователям просматривать сайт, а роботам — правильно его индексировать.

ЧПУ должен дублировать структуру сайта. Вот примеры того, как он должен выглядеть для разных разделов:

— [главная страница]

— [главная страница] + [раздел]

— [главная страница] + [раздел] + [подраздел]

— [главная страница] + [раздел] + [подраздел] + [страница]

Приведем простой алгоритм образования URL-адреса из заголовка страницы. Это оптимальный способ автоматического формирования ЧПУ, но важно соблюдать последовательность действий:

1. Преобразовать строку заголовка страницы в нижний регистр.

2. Заменить символы кириллицы согласно таблице ниже.

1. Все символы, кроме допустимых (знака тире, букв и цифр), заменить на «-» (включая пробел). Регулярное выражение для замены [^-a-zQ-9].

2. Заменить несколько идущих подряд «-» на один «-».

3. Проверить и удалить, в случае необходимости, символ «-» на первой и последней позиции в строке.

4. К полученному результату слева присоединить косую черту и ЧПУ раздела, находящегося на один уровень выше текущего. Понятно, что самым верхним уровнем будет домен сайта.

Для проверки качества ЧПУ можно провести простой тест: дать контрольной группе пользователей только URL-адрес нескольких разделов сайта и попросить описать, чему посвящены эти страницы. Если у них возникнут проблемы — стоит внести коррективы.

Важные замечания

Спам. ЧПУ не должен быть заспамлен, то есть в нем не должно быть слишком много ключевых слов (тем более они не должны повторяться!). Если ЧПУ формируется из заголовка, то сначала необходимо оптимизировать заголовки согласно ранее данным рекомендациям.

Длина. URL-адрес должен быть коротким. Хорошим тоном считается удерживать длину адреса в пределах 150–200 символов. Это удобно для пользователей и радует поисковых роботов.

Ключевые слова. В адресе обязательно нужно использовать ключевые слова. Это не только поможет пользователям лучше понимать структуру адресов сайта, но и может улучшить кликабельность на странице поисковой выдачи, так как ключевые слова там выделяются жирным шрифтом.

Подразделы вместо поддоменов. Без крайней необходимости не стоит выносить контент за пределы основного домена сайта (на поддомены).

В общем случае домен и его поддомен поисковыми системами воспринимаются как два разных сайта. Соответственно, если весь контент агрегируется на основном домене, можно получить синергетический эффект при продвижении за счет роста размера сайта, ссылочной массы и поведенческой статистики. Если вынести часть контента на поддомены, в общем случае вместо одного «сильного» сайта получится несколько «слабых», которые даже в совокупности будут генерировать гораздо меньше трафика.

Нижний регистр. Все URL должны быть в нижнем регистре. Если на сайте использовался верхний регистр, нужно настроить 301 редирект на страницы в нижнем регистре.

13. Файл Sitemap.xml

Sitemap.xml — это служебный файл[46] карты сайта в формате XML[47], который позволяет сообщить поисковым системам информацию о том, как организованы данные на продвигаемом вебресурсе. В нем содержатся ссылки на все разделы и страницы, которые должны быть проиндексированы поисковыми роботами.

Как правило, sitemap.xml на больших или часто изменяющихся сайтах генерируется на лету (этот процесс легко автоматизировать). Реальный адрес файла вовсе не обязан быть site. ru/sitemap.xml: он может быть абсолютно любым, например, site.com/anything (хотя лучше, конечно, чтобы у карты сайта был осмысленный адрес).

Поисковые роботы регулярно скачивают файл карты сайта, сравнивают его с имеющейся у них версией и, если файлы отличаются (например, в скачанной версии добавились новые ссылки), индексируют изменения на сайте.

Помимо новых ссылок, файлы Sitemap помогают передать поисковику метаданные о страницах сайта. Например, можно указать дату последнего изменения, периодичность обновления контента и важность страницы на сайте по сравнению с другими разделами.

Существуют отдельные виды файлов для разных типов контента, включая видео[48] и изображения[49]. Для абсолютного большинства веб-проектов генерировать их нет смысла, но, если для продвигаемого проекта это актуально, рекомендуется разработать в движке функционал, позволяющий автоматически генерировать и обновлять соответствующие документы.

Необходимость файла sitemap.xml

Некоторые исследователи придерживаются мнения, что файл sitemap.xml не нужен для большинства сайтов. Якобы структуру веб-ресурса нужно делать настолько простой и удобной, чтобы поисковые роботы смогли без проблем добраться до любой страницы сайта и проиндексировать ее. Такая структура гораздо лучше подходит не только для поисковиков, но и для пользователей. Им становится проще пользоваться сайтом, что улучшает поведенческие факторы ранжирования (например, количество и глубину переходов, время на сайте).

Исключение составляют масштабные информационные и e-commerce проекты, где просто-напросто слишком много страниц, и сделать их все относительно легкодоступными не всегда представляется возможным.

С тем, что структуру ресурса нужно делать удобной, никто не спорит (подробнее мы поговорим об этом в главе про структурную оптимизацию сайта). И действительно, если страницы сайта корректно и полно связаны друг с другом, поисковый робот сможет рано или поздно обнаружить все материалы. Однако это не отменяет необходимости настраивать sitemap.xml для всех сайтов.

Sitemap.xml является слабым сигналом качества сайта и повышает уровень траста сайта. Даже для небольших проектов он способен помочь поисковым роботам более точно и оперативно индексировать все изменения на сайте.

Кроме того, файл карты сайта однозначно нужен, если:

— Размер сайта очень велик. В этом случае роботы могут неделями и месяцами добираться до созданных или измененных разделов.

— Сайт содержит большой архив страниц, которые не связаны друг с другом. Чтобы они были успешно просканированы, их нужно перечислить в файле sitemap.xml. При этом отметим, что несвязанные или слабо связанные страницы скорее всего все равно выпадут из индекса из-за маленького статического веса (на такие страницы стоит мало ссылок) и плохих поведенческих факторов (такие страницы не посещают пользователи).

На заметку

По этой причине не всегда удается удержать в индексе поисковых систем нужные страницы.

Например, распространенным приемом является получение трафика с карточек старых товаров. Самих товаров уже нет и не будет в наличии (например, сняты с производства), поэтому карточки удаляются из каталога, но отображаются по прямым ссылкам, чтобы присутствовать в индексе и генерировать хоть какое-то количество трафика.

Чтобы удержать такие страницы в индексе поисковиков, можно попробовать оставить их в каталоге (пусть и на дальних позициях) с пометкой «Нет в наличии» и вариантами товаров-аналогов.

Настройка файла sitemap.xml

Помимо требований поисковых систем к оформлению файла и отдельных записей, при настройке sitemap.xml нужно выполнить следующие рекомендации:

1. Sitemap.xml должен генерироваться автоматически.

2. Sitemap.xml должен быть корректным, то есть в нем должны быть только те ссылки, которые представляют интерес для поисковых систем и пользователей. Служебные и малоинформативные разделы помещать в карту сайта нет смысла.

3. Для Sitemap лучше использовать формат XML, так как он позволяет предоставлять дополнительную информацию о страницах сайта. Для каждого URL нужно указать дату последнего обновления страницы (элемент lastmod). Также опционально можно указать:

a. частоту изменения страницы (элемент changefreq; слишком высокую частоту обновлений ставить не стоит, так как она может влиять на расходование краулингового бюджета);

b. относительную значимость страницы (элемент priority; этот параметр используется редко, так как корректно распределить веса самостоятельно на большом сайте проблематично).

4. Sitemap.xml должен обновляться не только при добавлении нового раздела, но и при изменении существующей страницы (меняется параметр lastmod).

5. Файл карты сайта не должен содержать синтаксических ошибок. Проверить это можно в панелях веб-мастеров поисковых систем.

6. Файл должен располагаться на том же домене, что и сайт, для которого он составлен, и отдавать HTTP-статус с кодом 200 OK.

7. Если Sitemap слишком большой (более 50 000 URL или весит более 10 Мб), нужно разбить его на несколько отдельных файлов, адреса которых указать в файле индекса Sitemap.

8. В файле нужно использовать кодировку UTF-8.

Остается добавить, что Sitemap.xml не дает гарантий, что роботы будут корректно сканировать и индексировать сайт, но повышает шансы на успех.

14. Оптимизация страниц с постраничной навигацией

Периодически возникает необходимость разбивать содержимое сайта на отдельные страницы. За примерами далеко ходить не надо: по страницам разбиваются списки товаров в интернет-магазинах или ветки обсуждений на форумах.

На заметку

В веб-дизайне разбиение информации по отдельным страницам называется пагинацией.[50]

Пагинация используется на сайтах повсеместно, поэтому поисковые алгоритмы давно научились корректно индексировать и ранжировать такие страницы. Это можно заметить по результатам поиска — нередко там можно увидеть, например, n-ую страницу ветки форума.

Но, несмотря на широкое распространение пагинации, такие страницы зачастую требуют дополнительных усилий по оптимизации из-за ряда возможных проблем, среди которых:

1. Медленная индексация. Чем больше страниц с пагинацией на сайте, тем больше тратится краулингового бюджета на их индексирование.

В результате целевые страницы могут медленно переиндексироваться, а новые разделы сайта долго не будут попадать в базу поисковых систем.

2. Рост малоинформативных страниц в индексе. Страницы пагинации мало отличаются друг от друга и редко отображаются в результатах выдачи поисковых систем. Если таких страниц очень много, это может снизить уровень траста сайта.

Дополнительно ситуация осложняется, если количество страниц в разделе с пагинацией велико. В таком случае, чтобы добраться, например, до сороковой страницы, и роботам, и пользователям нужно сделать очень много переходов. Большой уровень вложенности делает такие страницы и контент на них еще более малозначимыми и усложняет индексацию.

3. Появление в индексе страниц с частичным дублированием контента. Такая ситуация характерна, например, для случаев, когда описательный текст для первой страницы категории отображается на всех страницах пагинации.

В данной главе мы рассмотрим основные инструменты, которые помогут сделать пагинацию на сайте более понятной для пользователей и поисковых систем.

Снижение уровня вложенности

Разберем типичный пример. Допустим, на сайте есть категория, в которой 70 страниц, а пагинация выглядит стандартно:

Предыдущая 1 2 3 4 5 6 7 8 9 1 °Cледующая

Чтобы добраться до последней страницы, и поисковому роботу, и пользователю понадобится как минимум семь кликов, что сильно затрудняет индексацию раздела.

Выходом может быть создание пагинации с «опорными» страницами следующего вида:

Предыдущая 1 2 3 4 5 10 20 30 40 50 60 7 °Cледующая

Понятно, что при клике на двадцатую страницу пользователь увидит в строке пагинации страницы с 20 по 25 включительно и опять же перечень опорных страниц. К ним можно добавить ссылки на первую и последнюю страницу пагинации.

На заметку

В качестве возможного варианта можно еще попробовать выводить больше ссылок на страницы пагинации (например, не десять, а двадцать ссылок).

Ранее оптимизаторы часто выводили вообще все страницы пагинации, даже если их было несколько десятков; однако сейчас такой вариант будет смотреться слишком архаично.

Чтобы уменьшить количество страниц, также нужно повышать количество элементов на странице. Это понравится и поисковым системам, и пользователям, так как они не любят делать лишние клики — скроллить список колесиком мышки гораздо проще. Также можно доработать возможность для пользователей выбирать количество элементов на странице. Единственное, о чем нужно помнить, это скорость сайта — страницы должны грузиться быстро.

«Показать все»

Некоторые пользователи хотят увидеть информацию целиком, на одной странице. Для них стоит предусмотреть соответствующую ссылку — именно поисковая система порекомендует пользователю, если сочтет, что он ищет именно такой вариант.

При этом нужно помнить о скорости загрузки. Если информации слишком много, то страница «Показать все» будет грузиться слишком долго. В таком случае на сайте ее быть не должно.

Ссылку на страницу «Показать все» можно указать в качестве главной с помощью атрибута rel=«canonical» на всех страницах пагинации.

Оптимизация первой страницы пагинации

Так как именно первая страница пагинации зачастую участвует в ранжировании по целевым запросам, ее оптимизации следует уделить особое внимание.

Рассмотрим действия, которые нужно предпринять, на примере типичного кейса по оптимизации первой страницы категории на сайте интернет-магазина.

1. Первая страница категории должна быть оптимизирована под 2–4 целевых запроса. Для этого необходимо:

а. Заголовок категории поместить в тег <h1> (заголовок на второй и последующей страницах можно оставить таким же).

b. Под заголовком необходимо разместить краткий лид-абзац с описанием товаров категории и вхождением ключевых слов.

Такой текст необходим, чтобы показать поисковым системам, каким ключевым запросам релевантна страница. Текст желательно разместить именно сверху под заголовком — так его точно увидят пользователи, а следовательно, поисковые системы придадут ему больше значения при ранжировании страницы.

Лид-абзац нужно показывать только на первой странице категории, чтобы избежать дублирования контента.

c. Внизу страницы нужно разместить основной текст. Как написать такой текст, сколько в нем должно быть ключевых слов, какого он должен быть размера — эти и другие моменты мы рассмотрим в главе про текстовую оптимизацию.

Так же, как и лид-абзац, такой текст стоит выводить только на первой странице категории.

На заметку

Некоторые специалисты по продвижению предпочитают скрывать часть основного текста на первой странице пагинации с помощью специальных скриптов. По их мнению, большой текстовый блок портит внешний вид страницы и вредит имиджу сайта.

Такая точка зрения несостоятельна. Подробности мы разберем в главе о текстовой оптимизации, а здесь лишь отметим, что текст нужно не скрывать, а делать интересным и полезным для пользователей.

Тем не менее, если часть текста будет скрыта, необходимо убедиться, что этот текст будет доступен для поисковых роботов. Сделать это можно с помощью специальных сервисов и инструментов в панелях веб-мастеров поисковых систем[51].

2. Метатеги на первой странице необходимо задать в соответствии с ранее данными рекомендациями.

Чтобы они не повторялись на второй и последующей страницах категории, допустимо в конце тела тега заголовка автоматически добавлять идентификатор страницы, а метатег <description> заполнять только для первой страницы.

Страница категории, на которой есть пагинация, и первая страница пагинации должны иметь одинаковый URL (без цифрового идентификатора, то есть http://www.site.ru/kategorii/igrushki, а не http://www.site.ru/kategorii/igrushki?page=1).

Динамическая подгрузка контента

Часто вместо пагинации используется динамическая подгрузка контента, которая срабатывает, если посетитель проскроллит контент до определенного момента. В этот момент с помощью JavaScript загружается следующая «порция» контента (например, следующая партия товаров в категории).

Динамическая подгрузка далеко не всегда удобна, и решение о внедрении такого механизма должно быть хорошо продуманным. При ее реализации нужно выполнить следующие рекомендации[52]:

1. Сделать и отображать на странице дублирующую статическую пагинацию, по которой поисковые роботы точно смогут проиндексировать все страницы категории (без использования JavaScript).

2. Каждая порция контента должна иметь свой URL, который нужно показывать даже при загрузке контента с помощью JavaScript. Это улучшит также и юзабилити (можно будет дать ссылку, например, на третью страницу категории).

Если следовать рекомендациям проблематично, нужно по крайней мере убедиться, что весь контент на подгружаемых страницах доступен для роботов. Как уже упоминалось выше, сделать это можно с помощью специальных сервисов и инструментов в панелях веб-мастеров поисковых систем[53].

Некоторые важные замечания

Отметим дополнительно несколько важных моментов:

1. Страницы пагинации лучше не закрывать от индексации в файле robots.txt, чтобы контент, который на них находится, индексировался и имел какую-то значимость.

2. В файл sitemap.xml нужно добавить только первую страницу рубрики, остальные поисковый робот найдет сам.

3. Ссылки на страницы пагинации не нужно закрывать от индексации с помощью rel=nofollow[54].

15. 404 ошибка

404 ошибка отображается у пользователя, если он хочет просмотреть страницу, которой нет на сайте (например, она удалена или ее URL введен неправильно)[55]. Название возникло потому, что при такой ошибке веб-серверы отправляют код статуса HTTP 404[56].

Как правило, стандартная страница 404 выглядит непрезентабельно и не содержит никакой полезной информации. Пользователи, которые попадают на такую страницу, просто покидают сайт, что негативно влияет на трафик и конверсию, а также ухудшает поведенческие факторы ранжирования.

Чтобы исправить ситуацию, необходимо создать пользовательскую версию страницы 404, которая будет отвечать следующим требованиям:

1. Код ответа данной страницы должен быть «404» (Not Found). Проверить это можно с помощью специальных сервисов [57] или плагинов для браузера[58].

2. На странице ошибки 404 нежелательно размещать рекламу, длинные тексты или графику (кроме логотипа). Страница должна быть лаконичной и простой[59].

Как вариант, если есть возможность, можно сделать эту страницу «с изюминкой»: разместить здесь яркую иллюстрацию, анимацию или мини-игру.

3. Лучше не допускать, чтобы несуществующую страницу путали с обычной. Поэтому на странице с ошибкой 404 не должно быть основного меню сайта, верстки и цветовой гаммы типовой страницы. Чем скорее посетитель поймет, что страницы не существует, тем лучше.

4. Заголовок страницы («страница не найдена») должен однозначно указывать, что запрошенной страницы не существует.

5. Чтобы помочь человеку разобраться, на странице 404 ошибки нужно дать краткую информацию о том, что произошло (например, неправильно набран адрес; такой страницы никогда не было на этом сайте; такая страница была, но по этому адресу ее больше нет).

6. На странице обязательно должны быть варианты дальнейших действий:

a. Должны присутствовать ссылки на главную страницу, важнейшие разделы, а также на карту сайта и форму поиска (если они есть).

b. Нужно предоставить пользователям возможность сообщать о неработающих ссылках (по электронной почте или через форму обратной связи).

7. Очень важно проследить за тем, чтобы 404 ошибка выводилась для ошибочных URL-адресов во всех разделах сайта. В противном случае в индекс будут попадать пустые и мусорные разделы, что ухудшит общий уровень траста ресурса.

8. Нельзя производить переадресацию при попадании на несуществующий URL, чтобы можно было исправить опечатку в адресе.

9. Необходимо помнить о том, что если страница не удалена, а просто перенесена в другой раздел, то вместо 404 ошибки необходимо настроить 301 редирект.

Помимо прочего, можно отслеживать попадание пользователей на страницу 404 с помощью средств веб-статистики (например, с помощью отчета «Параметры визитов» в Яндекс. Метрике[60]). Такой анализ позволяет не только находить неработающие ссылки, но и оценивать функциональность раздела на основе поведения пользователей и их действий.

16. Оптимизация кода сайта

Валидность. С 1994 года функционирует Консорциум Всемирной паутины[61] (англ. World Wide Web Consortium, W3C). W3C разрабатывает для Интернета единые принципы и стандарты (называемые «рекомендациями», англ. W3C Recommendations), которые затем внедряются производителями программ и оборудования.

Проще говоря, консорциум разрабатывает стандарты, в соответствии с которыми веб-мастера создают сайты, а браузеры показывают эти сайты пользователям. По задумке это должно означать, что если код сайта соответствует стандартам (иначе говоря, код валидный), то браузеры должны его интерпретировать одинаково и у всех пользователей сайт будет отображаться корректно. Отсюда два вывода:

1. Множество ошибок в HTML-коде (несоответствий рекомендациям W3C) может свидетельствовать о плохом качестве сайта.

2. Наоборот, отсутствие ошибок в коде сайта должно свидетельствовать о высоком качестве сайта, поднимать уровень траста и позиции площадки в поисковой выдаче.

На практике все несколько сложнее. Во-первых, сами браузеры не во всем соответствуют стандарту. В отдельных технических нюансах каждый браузер умышленно не следует стандарту, а в других — его опережает, что приводит к появлению функций и механизмов, которых нет не только в стандарте, но и в других браузерах.

Во-вторых, браузеры научились справляться с ошибками в коде. Теперь, даже если сайт в отдельных моментах не соответствует стандарту, он все равно может вполне корректно отображаться у всех пользователей. Более того, требования W3C зачастую избыточны и неактуальны, а «подгонка» кода под стандарт требует от создателей сайта совершенно неоправданных затрат.

Рис. 4. Валидатор W3C — полезный инструмент для улучшения качества кода сайта

Подведем итог. Валидность (соответствие стандарту W3C) кода сайта является слабым сигналом качества сайта. Это означает, что нужно проверить код всех основных страниц сайта валидатором W3C[62] и по возможности исправить все критические (влияют на отображение сайта) и легкоустранимые ошибки.

На заметку

Из легкоустранимых ошибок стоит отметить распространенную ситуацию, при которой остаются незакрытыми парные html-теги. Это минимальное требование валидности кода легко исправить, поэтому оно должно обязательно выполняться.

В идеале верстка должна быть валидна. Если получится достичь этого малой кровью — отлично, если нет — следует исправить то, что целесообразно исправлять.

Обратите внимание: чем выше уровень валидности, тем лучше. Но даже высокие показатели не гарантируют кросс-браузерности[63], то есть идентичной и корректной работы сайта во всех популярных браузерах. Поэтому необходимо периодически тестировать продвигаемый ресурс на разных устройствах, в разных браузерах и при различных разрешениях экрана.

Пристальное внимание при тестировании следует обращать на ошибки отображения сайта — ведь именно их видят посетители. Все найденные недочеты нужно задокументировать и исправить.

Мусор в коде. Мусором в программном коде сайта называются куски кода, теги и стили, не несущие полезной нагрузки.

Мусор затрудняет модернизацию сайта и может тормозить его загрузку, поэтому от него нужно избавиться.

Кодировка. На сайте с помощью тега <meta charset=«имя кодировки»> должна быть указана кодировка html-страниц. Это нужно для того, чтобы браузер мог правильно отображать текст: если кодировка не указана и браузер ее не «угадает», вместо букв на сайте пользователь увидит иероглифы.

Тестирование. Необходимо регулярно тестировать сайт в разных режимах: отключать JavaScript, вводить неправильные URL-адреса и данные в формы обратной связи, «ломать» ресурс всеми способами, которые придут в голову. Найденные ошибки следует тщательно законспектировать, а затем устранить.

17. Распределение статических весов

Статический вес — это один из важных параметров, влияющих на продвижение сайта в целом и ранжирование конкретной страницы в частности.

Этот параметр рассчитывается индивидуально для каждой страницы и определяется количеством и качеством ссылающихся на страницу документов, к которым могут относиться html-страницы, pdf и. doc файлы, а также другие распознаваемые поисковыми системами документы с гиперссылками[64].

Вес можно разделить на внутренний (определяется количеством и качеством внутренних ссылок на страницу со всех других страниц и документов этого же сайта) и внешний (определяется внешними ссылками). Чем больше совокупный вес страницы, тем большую ценность она будет иметь в глазах поисковых систем.

SЕО-специалисты стараются всеми силами нарастить вес продвигаемых страниц. С «внешней» стороны проводится работа по наращиванию ссылочной массы (о чем мы поговорим позже). А для правильного распределения внутренних весов проводится оптимизация структуры сайта.

К каждому проекту в этом аспекте приходится подходить индивидуально, но общий принцип должен быть уже понятен: на все продвигаемые и важные страницы (услуги, категории, каталог, карточки товаров) должно стоять как можно больше внутренних ссылок. И наоборот — на нецелевые страницы (профили пользователей, технические страницы) должно вести как можно меньше ссылок (разумеется, без ущерба для удобства использования сайта).

Количественно статический вес страницы определить очень сложно, так как формулы, по которым он рассчитывается поисковыми системами, остаются неизвестными широкой аудитории. Однако это не мешает некоторым специалистам заниматься шаманством и пытаться рассчитать вес страниц с помощью каких-то формул, а на основе полученных результатов расставить внутренние ссылки на сайте. То же самое, с большим или меньшим успехом, делают специальные программы и плагины, которые автоматически расставляют ссылки на страницах сайтов, работающих на основе наиболее популярных в интернете CMS[65] (Content Management System, движок сайта).

В подобных расчетах мало смысла, так как они слишком примитивны по сравнению с математическим аппаратом, который используют поисковые системы. Однако о том, как сосредоточить вес на нужных страницах, нужно думать постоянно: в практике нередки случаи, когда добиться высоких мест по конкурентным запросам удается не в последнюю очередь благодаря правильной расстановке внутренних ссылок.

Рассмотрим несколько универсальных правил, которые помогут добиться нужного результата.

Закрываем ссылки на нецелевые страницы. Напомним, что на страницы, закрытые от индексации в файле robots.txt, лучше не ставить ссылок в пользовательской части сайта. Однако, если это все же необходимо, нужно скрыть ссылки на данные страницы посредством JavaScript таким образом, чтобы в исходном коде документов отсутствовали фрагменты вида «a href=«…».

Если в конкретном проекте это окажется сложно реализовать технически, можно попробовать закрыть ссылки на нецелевые страницы с помощью атрибута rel=«nofollow»[66]. Данный атрибут не является гарантией того, что поисковый робот не перейдет по ссылке (и не передаст вес), но это лучше, чем ничего.

Ставим ссылки на продвигаемые страницы в ручном режиме. На продвигаемые страницы следует поставить как можно больше ссылок внутри сайта. Тексты ссылок (анкоры) должны соответствовать запросам, по которым продвигаются страницы. Для простановки ссылок можно использовать:

— подвал сайта: сделать там блок с разделами каталога, поставить ссылки на продвигаемые товары и услуги);

— перелинковку (связывание страниц гиперссылками) в каталоге: блоки с самыми популярными товарами и категориями;

— виджеты, размещенные на всех внутренних страницах сайта (например, со списком услуг компании);

— основное меню сайта и другие элементы.

Ставим ссылки на продвигаемые страницы в автоматическом режиме. Неплохой вариант простановки ссылок в автоматическом режиме предложил в свое время Александр Люстик (создатель очень полезной программы KeyCollector[67]).

Рис. 5. Интерфейс программы KeyCollector — незаменимого помощника SEO-специалиста для работы с семантическим ядром сайта

Данный способ поможет увеличить посещаемость сайта с минимальными затратами и без риска санкций со стороны поисковых систем. Единственный недостаток алгоритма: он подойдет только для относительно больших проектов, уже имеющих неплохие показатели посещаемости и высокие позиции по ряду целевых запросов.

Суть алгоритма проста. Для больших проектов актуальна ситуация, когда одному и тому же запросу могут быть релевантны несколько страниц на сайте. Как уже упоминалось ранее, в таком случае поисковики могут понизить позиции сайта в выдаче. Поэтому необходимо собрать все эти страницы, выделить из них одну (наиболее релевантную, которая и будет показываться в выдаче) и поставить на нее ссылки с других релевантных страниц.

Таким образом мы повысим статический вес целевой страницы и подскажем поисковой машине, какой именно документ следует показывать в результатах поиска по целевому запросу. Особенно хорошо этот алгоритм может сработать при выходе сайта на «плато», когда, несмотря на усилия по продвижению, не удается повысить посещаемость сайта в течение долгого времени.

Приведем основные шаги, которые позволят реализовать алгоритм на практике:

1. Выгрузить из сервисов веб-статистики поисковые фразы, по которым пользователи заходили на продвигаемый сайт (например, за последние 3–6 месяцев).

2. Очистить полученный список:

a. Удалить запросы короче 2 и больше 4 слов.

b. Удалить «мусорные» запросы. Как правило, это запросы, содержащие цифры, латинские буквы, специальные символы (кавычки, наклонные черточки, звездочки и прочее). Чтобы ничего не пропустить, можно отсортировать список и выявить общие закономерности «мусорных» запросов.

c. Удалить низкочастотные запросы (как правило, это запросы с точной частотностью по Яндекс. Wordsial ниже 30–50, но все зависит от тематики). Опциально можно удалить и высокочастотные запросы.

Подробнее о формировании таких списков мы поговорим в разделе, посвященном формированию семантического ядра.

1. Кластеризовать (разбить на группы) полученный список запросов. Подробно об этом процессе мы поговорим в разделе, посвященном кластеризации запросов.

2. Получить позиции сайта по всем ключевым фразам. Выделить фразы, которые находятся в выдаче на 5-30-м месте. По таким запросам сайт с трудом дотягивает до зоны видимости, а то и вовсе не виден пользователям.

3. Определить наиболее релевантную страницу на сайте по каждому кластеру. Проще всего это сделать, задавая последовательно все запросы кластера в поисковую строку. Если поисковые машины в ответ выдадут одну и ту же страницу — берем ее. Если страницы будут разными — необходимо решить, какую из них целенаправленно продвигать. При выборе имеет смысл опираться на то, на какой странице конверсия будет выше.

В итоге получается список из кластеров, целевых фраз и соответствующих им страниц.

Далее, с помощью программиста, необходимо сделать скрипт, который будет сканировать сайт, находить целевые фразы в текстах и ставить под них ссылки на соответствующие страницы.

Сразу отметим, что многие описанные операции нужно автоматизировать. Сделать это можно с помощью КейКоллекто-ра, других программ или веб-сервисов, информацию о которых легко найти в Сети.

Приведенная последовательность действий является рекомендательной, и ее необходимо оптимизировать для конкретного веб-ресурса. Повторять алгоритм по автоматической расстановке ссылок можно каждые 3–6 месяцев, в зависимости от скорости публикации новых материалов.

Для автоматической расстановки внутренних ссылок можно воспользоваться и другими возможностями (например, специальным программным обеспечением). Однако работу таких средств нужно строго контролировать — в противном случае можно расставить ссылки неправильным образом и осложнить продвижение сайта.

18. Работа с внешними ссылками

Ссылки, которые ведут с продвигаемого сайта на сторонние ресурсы, называются внешними. Споры о том, что с ними делать, не утихают среди SEO-аналитиков уже долгое время.

Часть исследователей считает, что ссылки — это кровеносная система Интернета: их нужно размещать самостоятельно и поощрять к тому же пользователей сайта. Согласно анализу других экспертов, с внешними ссылками с сайта утекает статический вес, а следовательно, их надо ставить в минимальном количестве и закрывать от индексации.

Оптимальный подход должен учитывать оба приведенных полярных мнения. Внешние ссылки нужны, но к ним надо относиться внимательно: постоянно проводить мониторинг и избавляться от подозрительных или неоднозначных связей. Автоматизировать этот процесс непросто: большую часть работы приходится выполнять в ручном режиме.

Для начала необходимо сформировать список всех исходящих ссылок. Сделать это можно с помощью специальных программ (например, Xenu’s Link Sleuth[68]) или сервисов, информацию о которых легко найти в Сети.

После этого нужно выполнить следующие рекомендации:

1. Убедиться, что на сайте нет неизвестных ссылок. Это важно, так как «плохие» ссылки могут появиться без ведома владельца сайта, например, в результате взлома веб-ресурса или применения технологий ссылочного спама.

2. Все внешние ссылки должны быть модерируемыми. Это касается ссылок из комментариев, в ветках форума, разделов с вопросами, досками объявлений и других UGC[69] (user-generated content) элементов сайта.

Если для модерации не хватает ресурсов или времени, необходимо хотя бы закрыть ссылки с помощью атрибута rel=«nofollow».

3. Закрыть с помощью атрибута rel=«nofollow» рекламные и партнерские (особенно сквозные) ссылки. Также стоит закрыть от индексации ссылки на малопосещаемые ресурсы с низким уровнем траста.

На заметку

Если на сайте есть ссылки, которые приходится закрывать с помощью атрибута rel=«nofollow», нужно задаться вопросом, а не проще ли их просто удалить? Нужны ли эти ссылки сайту и его посетителям?

4. Ссылки на высокотрастовые площадки (например, Википедию) и авторитетные в тематике ресурсы могут помочь в продвижении сайта. Таких ссылок не стоит бояться: они будут помогать пользователям найти нужную информацию, а сайту — увеличить уровень траста в глазах поисковых систем.

При этом нужно помнить, что ссылаться желательно на страницы, подходящие по тематике: контент документа, на которую ведет ссылка, будет служить сигналом релевантности исходной страницы.

5. Все внешние ссылки должны открываться в новой вкладке браузера (это можно сделать с помощью атрибута target=«_blank»[70]). В противном случае можно потерять часть пользователей, которые забудут вернуться на исходный сайт. А чтобы дать понять пользователю, что ссылка внешняя, рядом с ней можно поставить соответствующую пиктограмму.

Работа с внешними ссылками не ограничивается перечисленными рекомендациями: зачастую она требует творческого подхода и нестандартных действий. Чтобы выработать оптимальную стратегию, рекомендуется анализировать лучшие сайты в тематике: их методы работы с внешними ссылками помогут найти правильный вариант действий.

19. Перелинковка сайта и улучшение индексации

Перелинковка представляет собой связывание страниц сайта гиперссылками. Этот процесс затрагивает многие аспекты поискового продвижения: распределение статических весов, увеличение конверсии, улучшение поведенческой статистики.

В данной главе мы сосредоточимся на связи перелинковки с индексацией сайта поисковыми роботами и приведем рекомендации, которые необходимо внедрить на продвигаемом ресурсе.

Основное навигационное меню

Навигационное меню должно быть понятным и удобным. Для его реализации необходимо использовать HTML-теги: другие технологии могут помешать корректной индексации и ранжированию сайта.

Хлебные крошки

Хлебные крошки[71] — это строка со ссылками, соответствующими иерархии сайта.

Это привычный и интуитивно понятный элемент архитектуры сайта, который помогает пользователям и поисковым роботам понять, в каком разделе сайта они находятся. Хлебные крошки желательно использовать всегда, особенно если на сайте есть страницы с глубоким уровнем вложенности.

Желательно, чтобы хлебные крошки четко совпадали с адресацией, то есть на любой странице сайта можно было вернуться на уровень выше двумя способами: либо стирая часть адреса до ближайшей косой черты, либо кликая на последнюю ссылку в хлебных крошках.

Html-карта сайта

Html-карта сайта — это отдельная страница, на которой списком представлены ссылки на основные разделы сайта. Такая карта помогает поисковым системам тщательнее и легче индексировать основные разделы, в результате чего повышается их видимость. Также карта может быть полезна для пользователей, если они привыкли работать с этим инструментом.

Несколько простых рекомендаций, которые стоит учесть при создании этого раздела:

1. Формирование карты и поддержание ее актуальности должно выполняться в автоматическом режиме: добавлять ссылки в ручном режиме затратно и неудобно.

2. В карте сайта должны быть ссылки только на важнейшие страницы (разделы, категории, посадочные).

3. Ссылку на карту сайта лучше сделать сквозной. Размещается она, как правило, в подвале сайта.

Битые ссылки

Битые ссылки — это ссылки на несуществующую страницу или ресурс сайта (документ, изображение, видео, форму). При клике на битую ссылку пользователь понимает, что произошла ошибка (страница не найдена, изображение не отображается, видео не проигрывается).

Битые ссылки ухудшают впечатление пользователей о сайте, что напрямую может сказаться на поведенческих факторах ранжирования (например, вырастет показатель отказов). Слишком большое количество битых ссылок может означать брошенный сайт, что серьезно снижает показатели траста.

Для выявления битых ссылок существует множество сервисов, информацию о которых легко найти в Интернете. Однозначно стоит отслеживать битые ссылки в панелях вебмастеров поисковых систем. Также время от времени стоит сканировать сайт с помощью специального ПО, например, программы Xenu’s Link Sleuth[72].

Полнота индексации

Полнота индексации — это очень важный параметр, который характеризуется простой формулой: в индексе поисковых систем должны присутствовать все нужные страницы и не должно быть постороннего «мусора». Именно к этому состоянию нужно стремиться при продвижении сайта.

Контролировать полноту индексации достаточно просто:

1. Все целевые страницы должны присутствовать в индексе Яндекса. Проверить это можно с помощью панели вебмастера[73].

2. Все целевые страницы должны присутствовать в индексе Гугла. Проверить это можно также в консоли для вебмастера[74].

На заметку

Если в индексе Яндекса и Гугла должны присутствовать все целевые страницы, но отсутствовать «мусор», логично предположить, что число страниц в индексе обеих поисковых систем должно быть примерно одинаковым.

Если это не так, у продвигаемого сайта могут быть проблемы.

Как правило, причин такой ситуации две:

— один или оба поисковика «не видят» целевые страницы или индексируют «мусор» (а иногда и то и другое);

— продвигаемый сайт попал под санкции, и страницы начали выпадать из базы.

Последний случай очень серьезный и требует неотложных мер для исправления ситуации.

3. В индексе поисковых систем не должно быть служебных поддоменов и страниц, дублей и прочего «мусора».

Полноту индексации иногда непросто проверить при работе с большими проектами. Для этого случая можно посоветовать проверять полноту по отдельным подразделам.

Коды ответа сервера

Все существующие страницы должны возвращать код ответа сервера 200 (ОК), а все удаленные или несуществующие документы — 404 (Not found).

Проверить выполнение этого правила можно с помощью специального программного обеспечения или веб-сервисов, информацию о которых легко найти в Сети.

Полезные советы и типичные ошибки

Перечислим некоторые типичные ошибки, которых стоит избегать, чтобы улучшить индексацию и перелинковку сайта:

1. На все ключевые разделы желательно поставить ссылку с главной страницы. Конечно, для масштабных информационных проектов и больших интернет-магазинов это может быть проблематично, но стремиться к этому необходимо.

2. Не следует ставить слишком много внутренних ссылок на одной странице.

Не так давно из-за технических ограничений поисковые системы не рекомендовали ставить больше 100–150 ссылок на странице. Сейчас таких жестких ограничений нет, поисковики лишь рекомендуют использовать «оправданное количество ссылок».

При этом нужно иметь в виду, что внутренний вес распределяется по каждой ссылке. Это значит, что если на странице 100 ссылок, то каждая получит 1/100 части веса, а если тысяча — лишь 1/1000. Кроме того, чрезмерное количество ссылок может восприниматься поисковыми системами как спам или попытка манипуляции выдачей, что автоматически приведет к наложению санкций.

Выводы:

a. Не стоит концентрироваться на точном ограничении количества ссылок.

b. Все ссылки нужно ставить для пользователей, а не поисковых роботов.

c. В пределах одной страницы ссылок не должно быть слишком много.

3. На все страницы сайта должен быть переход хотя бы по одной ссылке. Встречается ситуация, когда страница исчезает из навигационных цепочек, но остается доступной по прямой ссылке (например, при изменении каталога в интернет-магазине). Нужно быть готовым к тому, что такие страницы со временем выпадут из индекса.

4. В главе про улучшение скорости работы сайта мы говорили о важности использования http-кэширования[75]. Но использовать кэш важно не только для того, чтобы улучшить скорость загрузки.

Благодаря использованию нужных заголовков (один из пары Expires и Cache-Control max-age, а также один заголовок из пары Last-Modified и ETag) можно уменьшить объем передаваемого трафика за счет использования ресурсов из кэша, а не повторной их загрузки. Таким образом можно сэкономить краулинговый бюджет и улучшить полноту индексации сайта.

5. Не нужно использовать nofollow-ссылки во внутренней перелинковке. Это затруднит индексацию страниц сайта. Исключение составляют случаи приоритизации сканирования, когда для робота закрываются разделы, которые не имеет смысла индексировать (примером могут служить ссылки на вход, регистрацию или корзину на сайте интернет-магазина). Процитируем представителей Гугла: «Использование nofollow в таких случаях позволяет роботу заняться сканированием других страниц, которые вы хотели бы видеть в индексе Google. И все же гораздо важнее правильно организовывать информацию: применять интуитивно понятную навигацию, удобные для пользователей и поисковых систем URL и т. д.»[76].

6. Есть смысл подумать над использованием абсолютных (<a href=«http://site.ru/katalog»>Каталог продукции < /a>), а не относительных (<a href=«/katalog»>Каталог продукции</a>) внутренних ссылок.

Это поможет защитить контент от скраперов (парсеров) — мошеннических программ, которые воруют контент сайта и размещают его на других ресурсах.

При этом нужно помнить, что использование абсолютных адресов имеет ряд сложностей, которые встанут в полный рост при смене домена или протокола. Также сложно использовать абсолютные адреса при наличии нескольких доменов/поддоменов для разных языковых версий и при доработке сайта на тестовом сервере.

7. Следует использовать ключевые слова во внутренних ссылках. Мы уже касались этой темы в разделе про работу со статическими весами, но не лишним будет повторить: текст ссылки служит дополнительным сигналом релевантности. Нужно стремиться к тому, чтобы использовать в ссылке те ключевые слова, под которые оптимизирована страница.

8. Необходимо постоянно улучшать внутреннюю перелинковку:

a. Добавлять контекстные ссылки там, где это уместно.

b. Создавать рекомендательные блоки и виджеты.

c. Разместить в подвале сайты ссылки на важнейшие категории каталога и прочее.

Остается добавить, что приведенные рекомендации являются универсальными и подходят для любых типов проектов.

20. Повышение безопасности

К сожалению, в практике поискового продвижения нередко приходится сталкиваться с ситуациями злонамеренного взлома сайтов.

Взлом может быть сделан с разными целями, в том числе для понижения сайта-конкурента в результатах выдачи. Для этого случая, кроме простого удаления информации или нарушения программной работы ресурса (что легко исправить с использованием резервной копии сайта), могут использоваться и более тонкие приемы. Например, на взломанном ресурсе могут быть незаметно размещены материалы и ссылки, которые приведут к санкциям со стороны поисковиков. Простейший пример: размещение скрытого текста или ссылки на сомнительные сайты «взрослой» тематики и онлайн-казино.

Проникновение также выполняют безличные роботы, которые автоматически сканируют сайты на наличие типичных уязвимостей. Если такие уязвимости есть, сайт взламывается и на сервер закачивается вредоносный код или, например, страницы со ссылками на другие взломанные ресурсы и целевые сайты. Сети из таких взломанных сайтов могут достигать огромных размеров — до десятков, сотен и даже миллионов сайтов.

Чтобы избежать неприятных последствий, следует позаботиться о безопасности сайта. Рекомендаций здесь много, однако внедрить их без помощи профессионального программиста не всегда возможно.

Приведем некоторые приемы, которые помогут защитить сайт от взлома:

1. Проверить настройки сервера. Советы по безопасности легко найти для распространенных серверов, таких как Apache[77] или IIS (Internet Information Services) [78].

2. Составить список всего установленного ПО и регулярно его обновлять. Это касается как CMS, так и дополнительных сервисов, плагинов и программ.

3. Проверить сайт на наличие известных уязвимостей, например, межсайтового скриптинга (XSS, Cross-Site Scripting)[79] и SQL-инъекций[80].

4. Разграничить права доступа между всеми пользователями сайта. Ввести надежные пароли[81] и регулярно их обновлять.

5. Использовать безопасные протоколы для передачи данных между локальным компьютером и сервером (например, SSH и SFTP, а не обычными текстовыми протоколами без шифровки при аутентификации, например, Telnet или FTP).

6. Выбрать заслуживающий доверия хостинг и дополнительно проконсультироваться с его технической поддержкой о степени надежности сервера.

7. По возможности выполнить все рекомендации по безопасности, на которых настаивают разработчики CMS-сайта.

8. Следить за тем, что попадает с продвигаемого сайта в индекс поисковой системы. Если там обнаружатся подозрительные страницы и ссылки — следует немедленно принять меры.

Перечень средств защиты сайта постоянно обновляется. Нужно следить за появлением новых методик и по возможности внедрять их на продвигаемом сайте.

21. Оптимизация изображений

Использование изображений является хорошим способом привлечения дополнительных посетителей из поисковых систем. Однако для достижения нужного эффекта картинки должны быть SEO-дружественными[82].

При определении релевантности изображения какому-либо запросу поисковая система учитывает имя файла, альтернативный текст (значения атрибута alt у тега изображения img), описание содержимого (значения атрибута title у тега изображения img), текст рядом с изображением и подпись к изображению, которая находится в непосредственной близости от него.

Именование изображений

Имя файла — это один из важнейших сигналов, по которому поисковые системы могут определять тематику изображения. При его формировании следует придерживаться определенных рекомендаций:

— имена должны быть простые и удобные для пользователя;

— нужно вставлять ключевые слова в название файла;

— нельзя использовать ничего не значащие или технические имена (например: IMG027589.jpg);

— не более 4–5 слов в названии;

— вместо кириллицы нужно использовать транслит, вместо пробелов между словами ставим дефис;

— если нужно использовать одну смысловую основу для именования нескольких изображений, допускается поставить идентификатор (например, detskaya-igrush-ka-01.jpg, detskaya-igrushka-02.jpg…). Особенно актуальна эта ситуация для фотографий товаров в интернет-магазинах.

Формирование текста для атрибута alt

Атрибут alt служит для описания содержания графического файла. Он незаменим, если пользователи не могут видеть изображение (например, из-за нарушений зрения, в случае использования программ для чтения с экрана или низкой скорости Интернета).

Поисковикам атрибут alt дает полезную информацию о тематике изображения. Он служит общим сигналом релевантности страницы, а также используется при определении картинок, наиболее подходящих запросу пользователя.

Альтернативный текст для изображений должен быть коротким (менее 150 символов вместе с пробелами) и информативным. Помимо смыслового описания того, что изображено на картинке, в тексте нужно использовать целевые запросы, под которые оптимизирована страница с изображением. При этом лучше использовать соответствующие низкочастотные ключевые слова, для определения которых можно ввести в сервис Yandex.Wordstat[83] основной запрос, под который оптимизирована страница.

Некоторые правила, которые следует выполнять при заполнении атрибута alt:

1. Не следует злоупотреблять количеством вхождений ключевых слов. Такие действия квалифицируются как поисковый спам и могут иметь негативные последствия для продвижения, вплоть до наложения фильтров и понижения места сайта в поисковой выдаче. Нужно стараться создавать полезное и информационно насыщенное содержание, в котором ключевые слова используются уместно и не расходятся с контекстом.

2. Наиболее значимые ключевые слова должны находиться как можно ближе к началу описания.

3. Не нужно использовать специальные символы, например © или «»».

4. Нельзя дублировать один и тот же описательный текст для разных изображений.

Текст около изображения

Желательно обеспечить релевантный контекст для изображений.

Особенно важна семантическая составляющая окружающего текста, в качестве которого можно считать ~15 слов до и после графического элемента. Такая связь позволяет поисковым системам определить качество и уместность изображения.

Атрибут title и подпись

Универсальный атрибут title позволяет описывать содержание элемента. Данное описание появляется в виде всплывающей подсказки при наведении мыши на элемент. Его следует заполнять особенно тщательно в тех случаях, когда у изображения нет подписи.

Использовать подпись[84] нужно везде, где это уместно, так как без нее изображение может превратиться в бессмысленную декорацию. Исключением являются случаи, когда иллюстрация понятна без объяснений, расположена рядом с релевантным заголовком или текстовым содержанием.

К заполнению атрибута title и подписи применимы рекомендации для атрибута alt. Отметим, что допускается и во многих случаях уместно дублирование между отдельными элементами (например, между атрибутами alt, title и подписью).

Уникальность изображений

По возможности все изображения, публикуемые на сайте, должны быть уникальны. Иногда этого сложно достичь из-за экономических или организационных ограничений, но стремиться к этому необходимо.

Попутно заметим, что методы «уникализации» чужих изображений (накладывание своего водяного знака, цветовых фильтров, обрезка, инверсия) работают плохо. Поисковые системы без проблем определят фото-исходник, поэтому на выполнение таких манипуляций не стоит тратить время.

Отдельно упомянем, что в случае использования неуникальных изображений, они должны быть получены легальным путем. Помимо потенциальных проблем с законом, воровство картинок просто неэтично, и к нему не стоит прибегать, чтобы не испортить собственную репутацию.

Некоторые другие рекомендации

1. Всегда нужно помнить о том, что алгоритмы распознавания изображений на сегодняшний день далеки от совершенства, поэтому картинки не должны содержать значимый для индексации сайта текст. Заголовки, слоганы, подзаголовки, рекламные тексты должны быть сверстаны в формате html — в противном случае поисковые системы их не увидят.

2. Всегда в явном виде нужно устанавливать фактические размеры иллюстрации в атрибутах width и height (ширина и высота изображения). Это позволит браузеру до загрузки изображений правильно разметить страницу на экране пользователя. Так можно избежать кратковременной деформации верстки страницы при загрузке.

3. Все изображения на сайте должны быть качественными. «Сочные» фото способны значительно увеличить конверсию, улучшить поведенческие факторы ранжирования и позиции сайта в поисковых системах.

4. Картинки должны быть доступны для поисковых роботов (папки с изображениями не должны закрываться от индексации в файле robots.txt).

5. После выполнения рекомендаций желательно создать карту сайта для изображений[85].

6. Лучше не накладывать на изображения водяные знаки, так как такие действия сильно ухудшают качество фото и впечатление от сайта.

7. На сайте не должно быть битых (неотображающихся) изображений. Чтобы найти возможные проблемы, можно воспользоваться специальными веб-сервисами или программами[86].

Другие рекомендации по оптимизации изображений можно найти в разделе «Оптимизация веб-графики[87] на сайте гугловского проекта “Сделаем Интернет быстрее[88]”».

22. Размещение и оптимизация видеороликов

В Интернете есть сервисы, которые специализируются на размещении и просмотре видео. Самый знаменитый из таких сайтов — Youtube.com — имеет многомиллионную аудиторию, а его домен, по сути, стал именем нарицательным.

В данной главе мы не будем касаться продвижения таких проектов, а рассмотрим размещение роликов на сайте, который не специализируется на видеоконтенте. Давайте разберемся, нужны ли таким площадкам ролики, и если да, то какие правила стоит соблюдать при их размещении.

Вначале поговорим о минусах. Создание качественных роликов может быть достаточно затратным и хлопотным делом. Зачастую этот факт не позволяет владельцам сайтов даже рассмотреть возможность создания видео. А зря — современные технологии позволяют создавать достаточно дешевые, без дорогостоящих съемок и сопутствующих затрат, но эффективные видео.

Даже при ограниченном бюджете можно, например, заказать недорогой мультипликационный ролик или снять простое видео на смартфон, недорогую камеру или фотоаппарат. Монтаж можно сделать самостоятельно или с привлечением недорогого специалиста. Итоговый результат будет вполне удовлетворительным для решения большинства задач, которые ставятся перед роликами на сайте.

Также нужно отметить, что на сегодняшний день содержание роликов не распознается поисковыми машинами, поэтому в них нельзя помещать значимый для индексации контент. Кроме того, не все пользователи захотят смотреть видео, поэтому значимую информацию нужно дублировать текстом.

На этом минусы заканчиваются и начинаются плюсы. Самый главный из них — это увеличение доверия к сайту и повышение конверсии. Пользователи любят видео, особенно если ролик окажется полезным и интересным.

На заметку

Польза — ключевое понятие при продвижении в Интернете, да и в бизнесе вообще.

К каждому элементу на сайте стоит относиться критически и постоянно задавать вопрос: полезен ли он для пользователей?

Именно такой подход позволит сделать сайт для людей (а не поисковых машин) и быстро продвигаться в Сети.

Приемы создания видео

Что нужно, чтобы создать полезное и эффективное видео? Формат книги не позволяет подробно остановиться на этом вопросе, но мы обозначим возможные варианты.

Блокирование возражений. Можно нивелировать в ролике возражения, которые возникают в голове у посетителей сайта.

Например, компания оказывает сложные услуги, и новым клиентам трудно ей довериться. Такая ситуация характерна, например, для строительства, юриспруденции или создания сайтов. В этом случае можно снять ролик об организации и команде, показать лица сотрудников и рассказать об этапах работ.

Таким образом, чтобы снять эффективный ролик, нужно определить типичные возражения посетителей и дать на них аргументированный видеоответ.

Видеообзоры продукции. Сделать такой обзор проще, чем кажется. Недорогая камера, внятный рассказ и несложный монтаж — вот и все слагаемые успеха. Можно совместить рассказ о продукции с анбоксингом[89], это поможет ролику набрать популярность.

Кроме обзоров продукции, можно снимать ролики, в которых будут сравниваться однотипные товары (например, Кубики Рубика от разных производителей). Такое видео поможет пользователям сделать выбор между разными брендами и привлечет целевую аудиторию.

Конец ознакомительного фрагмента.

Оглавление

* * *

Приведённый ознакомительный фрагмент книги Поисковое продвижение сайтов предоставлен нашим книжным партнёром — компанией ЛитРес.

Купить и скачать полную версию книги в форматах FB2, ePub, MOBI, TXT, HTML, RTF и других

Примечания

6

https://ru.wikipedia.org/wiki/XocTHHroBaa_KOMnaHHa

7

https://ru.wikipedia.org/wiki/Content_Delivery_Network

8

https://loadimpact.com/

9

https://yandex.ru/support/webmaster/controlling-robot/robots-txt. xml#crawl-delay

10

https://developers.google.com/speed/pagespeed/insights/

11

https://developers.google.com/speed/docs/insights/ LeverageBrowserCaching

12

https://developers.google.com/speed/docs/insights/ EnableCompression

13

https://developers.google.com/speed/docs/insights/BlockingJS

14

https://developers.google.com/speed/docs/insights/OptimizeCSSDelivery

15

https://developers.google.com/speed/docs/insights/MinifyResources

16

https://developers.google.com/speed/docs/insights/OptimizeImages

17

https://developers.google.com/speed/docs/insights/Server

18

https://ru.wikipedia.org/wiki/MeTaTerH

19

https://yandex.ru/support/webmaster/recommendations/ presentation.html

20

https://support.google.com/webmasters/answer/798127hbru

21

https://support.google.com/webmasters/answer/35624

22

https://yandex.ru/support/webmaster/indexing-options/description.html

23

https://ru.wikipedia.org/wiki/KoHKaTeHau,Ha

24

https://wordstat.yandex.ru/

25

https://developers.google.com/search/reference/robots_metatag?hl=ru

26

https://ru.wikipedia.org/wiki/KoHBepcHa_(B_HHTepHeT-MapKeTHHre)

27

https://webmaster.yandex.ru/ и https://search.google.com/search-console

28

https://support.google.com/websearch/answer/24664337hHru

29

https://yandex.ru/support/search/query-language/search-operators.xml

30

http://home.snafu.de/tilman/xenulink.html

31

https://seopult.ru/library/CeccHGHHbie_nepeMeHHbie

32

https://ru.wikipedia.org/wiki/Cookie

33

https://support.google.com/webmasters/answer/936337hUru

34

https://support.google.com/webmasters/answer/139066?hl=ru& rd=1 и https://yandex.rU/support/webmaster/controlling-robot/html.xml# canonical

35

https://ru.wikipedia.org/wiki/UTM-MeTKH

36

https://ru.wikipedia.org/wiki/Дорвей

37

https://yandex.ru/support/webmaster/error-dictionary/http-codes.xml#redirect-3xx?lang=ru

38

https://support.google.com/webmasters/answei760626087hbru

39

https://yandex.ru/support/webmaster/controlling-robot/robots-txt.xml

40

https://yandex.ru/support/webmaster/controlling-robot/robots-txt. xml#clean-param

41

https://yandex.ru/support/webmaster/controlling-robot/robots-txt.xml #sitemap

42

https://webmaster.yandex.ru/robots.xml и https://www.google.com/ webmasters/tools/robots-testing-tool

43

http://htmlbook.ru/html/h1

44

https://ru.wikipedia.org/wiki/URL

45

https://support.google.com/webmasters/answei7763297hUru

46

https://yandex.ru/support/webmaster/controlling-robot/sitemap.xml и https://support.google.com/webmasters/answer/156184?hl=ru&ref_ topic=4581190

47

http://www.sitemaps.org/ru/protocol.html

48

https://support.google.com/webmasters/answer/80471

49

https://support.google.com/webmasters/answer/178636

50

https://ru.wikipedia.org/wiki/narHHau,Ha

51

Попробуйте, например, https://webmaster.yandex.ru/tools/server-response/

52

https://webmasters.googleblog.com/2014/02/infinite-scroll-search-friendly.html

53

https://webmaster.yandex.ru/tools/server-response/

54

https://support.google.com/webmasters/answer/965697hbru

55

https://support.google.com/webmasters/answei7936417hHru

56

https://en.wikipedia.org/wiki/HTTP_404#Custom_error_pages

57

https://webmaster.yandex.ru/tools/server-response/

58

HTTP Headers для Google Chrome

59

https://www.artlebedev.ru/kovodstvo/sections/93/

60

https://yandex.ru/support/metrika/reports/visit-params.xml

61

https://www.w3.org/standards/

62

https://validator.w3.org/

63

https://ru.wikipedia.org/wiki/Kpocc-6pay3epHocTb

64

https://devaka.ru/articles/checking-linkjuice

65

https://ru.wikipedia.org/wiki/Система_управления_содержимым

66

https://support.google.com/webmasters/answer/965697hbru

67

http://www.key-collector.ru/

68

http://home.snafu.de/tilman/xenulink.html

69

https://en.wikipedia.org/wiki/User-generated_content

70

http://htmlbook.ru/html/a/target

71

https://developers.google.com/search/docs/data-types/breadcrumbs

72

http://home.snafu.de/tilman/xenulink.html

73

https://webmaster.yandex.ru/site/indexing/indexing/?indicatorId= INDEXING_SEARCHABLE

74

https://search.google.com/search-console

75

https://developers.google.com/speed/docs/insights/Leverage BrowserCaching

76

https://support.google.com/webmasters/answei7965697hHru

77

https://httpd.apache.org/docs/1.3/misc/security_tips.html

78

https://technet.microsoft.com/ru-ru/library/jj635855(v=ws.11). aspx

79

https://bugtraq.ru/library/www/xssanatomy.html

80

https://ru.wikipedia.org/wiki/Внедрение_SQL-кода

81

https://support.google.com/accounts/answer/32040?hl=ru%20&rd=2

82

https://support.google.com/webmasters/answer/114016?hl=ru

83

https://wordstat.yandex.ru/

84

http://artgorbunov.ru/bb/soviet/20140728/

85

https://support.google.com/webmasters/answer/1786367hHru

86

http://home.snafu.de/tilman/xenulink.html

87

https://developers.google.com/web/fundamentals/performance/ optimizing-content-efficiency/image-optimization?csw=1

88

https://developers.google.com/speed/?csw=1

89

https://ru.wikipedia.org/wiki/AH6oKCHHr

Смотрите также

а б в г д е ё ж з и й к л м н о п р с т у ф х ц ч ш щ э ю я