Повторяющийся контент на сайте — как избежать санкций от поисковиков

Повторяющийся контент, или содержание будем называть большой объем информации на одном или нескольких доменах, которые ничем не отличаются или почти совпадают. Это может быть сделано без каких либо злых умыслов, например при разных версиях сайта (для мобильных устройств или печати).

При наличии на сайте множества страниц с одинаковым контентом, поисковые системы предлагает возможность указать предпочитаемые страницы. Сделать это довольно просто, используя разные способы. Сам процесс называется канонизацией.

Но много случаев таковых, что контент умышлено дублируется с какими то конкретно поставленными целями (манипуляция рейтингом поисковиков, увеличения объема трафика и т.п.). Естественно, это отразиться негативно на впечатлениях пользователей при поиске информации, и попадания на одинаковое содержание.

Поисковики предают большое внимание и ценят именно оригинальный (нигде не встречающийся раньше) контент. Именно поэтому в результатах поиска такая информация будет представлена в первую очередь. Если же на сайте есть несколько дублей статей или другого контента, робот выберет самостоятельно одну для индексации (если другие не были запрещены файлом robots.txt или тегом noindex). Если же поисковик посчитает страницы созданными для манипуляции, они будут исключены из индекса, рейтинг сайта будет понижен, или даже сайт совсем исключится из индекса (не будет отображаться в результатах поиска).

Дабы избежать подобных ситуаций с дублированием контента и получить в поиске результаты именно те, которые вам нужно, надо знать ряд действий:

  • Используйте разные способы для запрета индексации. Как было сказано выше, в зависимости от того, какой документ в дублях на вашем сайте для индексации не вполне подходит, такой и закрывайте. Например, та же версия страниц для печати легко блокируется с помощью закрытия доступа к папкам или каталогам, или с помощью файла robots.txt.
  • Осторожно при синдикации. Когда вы даете свой контент для размещения на других сайтах, поисковые системы будут выбирать тот вариант текста , который посчитают более приемлемым для пользователей. И как показывает практика, не всегда этот выбор совпадет с вашим сайтом. Для того чтобы избежать подобных казусов, надо проследить, чтобы на каждом сайте которому был предоставлен тот или другой контент поставил ссылку на источник, то есть на вас. Также можно потребовать от владельцев сайтов, чтобы заблокировали показ синдикатного текста при помощи файла robots.txt.
  • Используйте переадресацию 301. При изменении структуры сайта пользуйтесь 301 переадресацией. В зависимости от сервера это можно сделать или через консоль администратора (сервер IIS),или с помощью файла htaccess (сервер Apache).
  • Используйте последовательно внутренние ссылки. Например, не стоит создавать ссылки на страницы
    https://softobzor.com.ua/seo/seo-soft
    https://softobzor.com.ua/seo/seo-soft/
    https://softobzor.com.ua/seo/seo-soft/index.html.
  • Старайтесь использовать домены верхнего уровня. Домены верхнего уровня подскажут поисковым машинам, какую именно версию документа вы считаете наиболее приемлемой для той или иной страны. Например поисковые машины скорей всего будут считать что контент связанный с Украиной, будет находится на сайте https://softobzor.com.ua, а не на https://softobzor.com/ua или https://ua.softobzor.com.
  • Google предлагает в инструментах для вебмастеров указать какой вариант вы предпочитаете при индексации. Указать основной домен, например https://softobzor.com.ua или https://www.softobzor.com.ua. Для Yandexa основной домен стоит указать в файле robotx.txt в директиве Host.
  • Сторонитесь стандартных повторений. Например, что касается полного описание авторских прав, которые размещены снизу каждой страницы. Лучше сократить описание и поставить ссылку на отдельную страницу с подробным описанием этих прав.
  • Избегайте страниц-заглушок. Если страница еще недоделана, не используйте для нее заполнители. Рекомендовано не публиковать страницы с незаполненным содержанием. Если все же подобные заглушки есть – блокируйте их от поисковиков с помощью файла robots.txt.
  • Снизьте уровень идентичного контента. При наличии на сайте множества одинаковых страниц, добавляйте на каждую из них уникальное содержание, или объединяйте эти страницы в одну. Например, на сайте мебели есть страницы для двух диванов разных фирм, но описание одинаковое, можно либо объединить обе страницы и описать в одной статье два дивана, либо на каждую страницу добавить оригинальное содержание.

Но наличие на сайте повторяющегося контента, не будет служить основным основанием того, что поисковые системы примут какие-то меры по удалению сайта из индекса. Если же поисковые машины сочтут что дублированное содержание создано с целями завести пользователя в заблуждение или пробовать манипулировать результатами выдачи в результатах поиска тогда естественно это не останется незамеченным.

Если же по каким-то причинам ваш сайт вылетел из индекса, изучите детально по каких причинах это могло случится, внесите соответствующие изменения по исправлению допущенных ошибок. Только после этого вы сможете отправить запрос на пересмотр сайта. Для Yandex обычно в службу поддержки Яндекса, так называемому Платону (addurl@yandex-team.ru), а для Google в разделе запрос на пересмотр.

Если же вы увидели что на другом сайте, без вашего ведома используют контент вашего сайта, это скорей всего не отобразиться на рейтинге вашего сайта. Но если нарушение на ваш взгляд серьезное и использовалось незаконное присвоение содержания или повтор публикаций, вы можете подать на рассмотрение заявление о случившемся в соответствии с законом об авторском праве, после чего другой сайт будет удален из индекса.

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *