Где находится страница сайта: в основном индексе Google или дополнительном?
Основной индекс Google или Supplemental index?
Мысль написать данную статью пришла после общения на специальном форуме от Гугл, где вроде как помогают вебмастерам решить проблемы с ранжированием и индексацией сайта Гуглом. Дело в том, что не все понимают, что у Google имеются два индекса — основной и дополнительный, и если страница сайта проиндексирована, то это ещё не значит, что она будет участвовать в поисковой выдаче.
Я уже писал про такое явление, как дополнительный (Supplemental) индекс Google и причинах попадания страниц именно туда. А сейчас расскажу, как быстро проверить, куда отправилась ваша страница.
Как проверить — страница в основном индексе Google или дополнительном?
Делается всё очень просто. Во многом это аналогично просмотру кэша страницы сайта.
Сначала лучше проверить, проиндексирована ли вообще страница. Для этого в поисковую строку Гугла (или строку адреса браузера Chrome) вводим такой запрос:
site:адрес
вместо — «адрес» — пишем какой-нибудь URL-адрес документа, проиндексированность которого проверяем. Если он проиндексирован, то Google выдаст его в своей выдаче (в единственном экземпляре, если это уникальный адрес для всего сайта; или несколько результатов, если это адрес рубрики сайта и т.п.).
Например, если ввести site:http://web-ru.net/category/kontekstnaya-reklama/, то в выдаче будут все ссылки, содержащие в своём URL http://web-ru.net/category/kontekstnaya-reklama/ (естественно, если Гуглу они известны).
А если ввести что-нибудь такое site:http://web-ru.net/internet/yandeks-ili-gugl-chto-luchshe-1-e-rezultaty-oprosa.html, то Гугл выдаст этот документ (ели он есть в индексе).
Таким образом, проверить наличие документа в индексе Google — не проблема.
Но чтобы узнать, участвует ли этот документ в поиске, следует сделать ещё одну проверку:
cache:адрес
таким запросом мы проверим, отправил ли Гугл страницу в свой кэш. Если это произошло, то можно будет увидеть версию страницы вашего сайта, которая известна Google — он её подгрузит примерно по такому адресу — http://webcache.googleusercontent.com/… — во фрейме.
А если не произошло — то увидим такую картинку:
Документа нет в кэше Google
В большинстве случаев можно сказать, что если страница есть в кэше, то она включена в основной индекс Google.
Поэтому факт индексации сам по себе ещё ничего не значит, и не важно как быстро Гугл индексирует новые материалы на сайте и т.п. — важно, куда он их «отправляет» после этого (нужно, чтобы в основной индекс и побыстрее).
В дополнительный индекс Google часто отправляет некоторые страницы за дублированный контент. А также, если велика скорость загрузки сайта или объём веб-документов очень большой.
Сворованный контент обычно тоже там.
Вообще, для этого у Гугла есть множество причин. Главное, что следует понимать: если Google отправляет страницы «мимо» основного индекса, то он не считает их качественными. Вот и всё
Накрутка поведенческих факторов. СпособыСразу хочу предупредить, что я против какой-либо "накрутки" в поисковом продвиже...
Поиск людей в Яндексе. Использование...einternet, Livejournal и других. Запуск сервиса произошёл примерно
Теряется ли PageRank при 301 редиректе (moved permanently)?Пару дней назад Google прислал новое видео, где рассказывается о потерях PageRa...
ЧПУ URL - человеко-понятный урл, его влияние на релевантность...разбирает URL, за что ему спасибо. Влияние ЧПУ URL на релевантность запросу
SEO-аудит форума Inforiches-forum.ru. Видео...ием. Смотрим: SEO-аудит форума Inforiches-forum.ru: Скачать это видео (13 мб)
Ну да. Это называется «сопли». О5 же от Supplemental.
В Яндексе это принято называть фильтром «Ты последний». На самом деле как такового, этого фильтра нет. Но действие у него немного другое. Сайт появляется в основной выдаче только после нажатия на «Показать без исключения». При этом, «фильтр» накладывается на страницы с неуникальным контентом. Основой из причин, что чаще всего бывает, что страница с «объявлением» от Mainlink ранжируется как первоисточник. Здесь стоит учесть, что не стоит покупать ссылки на страницу ещё не проиндексированную и получившую достаточный трафик из ПС.
«Ты последний» может и на страницы с уникальным контентом «наложиться»
Но обычно он накладывается сразу на весь сайт, и все новые статьи оказываются вне выдачи.
Не совсем согласен с тем, что «фильтр» накладывается на весь сайт. Он может накладываться даже не на всю страницу. Дело в том, что по факту такого фильтра-то и нет. Когда-то давно так на форуме серча (searchengines) назвали именно такую неуникальную выдачу. А если статья новая и уникальная — она не может не быть в основной выдаче, ибо текст-то уникален))
Это большое заблуждение, что уникальные тексты спасут сайт от всего на свете.
А, что делать если уникальный вроде, как контент -но в сопли попал?
На попадание в «сопли» могут влиять разные факторы. Например, дублирование контента на сайте.
Или, может, он уникальный чисто технически — простой рерайт. И т.п.