Где находится страница сайта: в основном индексе Google или дополнительном?
Мысль написать данную статью пришла после общения на специальном форуме от Гугл, где вроде как помогают вебмастерам решить проблемы с ранжированием и индексацией сайта Гуглом. Дело в том, что не все понимают, что у Google имеются два индекса — основной и дополнительный, и если страница сайта проиндексирована, то это ещё не значит, что она будет участвовать в поисковой выдаче.
Я уже писал про такое явление, как дополнительный (Supplemental) индекс Google и причинах попадания страниц именно туда. А сейчас расскажу, как быстро проверить, куда отправилась ваша страница.
Как проверить — страница в основном индексе Google или дополнительном?
Делается всё очень просто. Во многом это аналогично просмотру кэша страницы сайта.
Сначала лучше проверить, проиндексирована ли вообще страница. Для этого в поисковую строку Гугла (или строку адреса браузера Chrome) вводим такой запрос:
site:адрес
вместо — «адрес» — пишем какой-нибудь URL-адрес документа, проиндексированность которого проверяем. Если он проиндексирован, то Google выдаст его в своей выдаче (в единственном экземпляре, если это уникальный адрес для всего сайта; или несколько результатов, если это адрес рубрики сайта и т.п.).
Например, если ввести site:http://web-ru.net/category/kontekstnaya-reklama/, то в выдаче будут все ссылки, содержащие в своём URL http://web-ru.net/category/kontekstnaya-reklama/ (естественно, если Гуглу они известны).
А если ввести что-нибудь такое site:http://web-ru.net/internet/yandeks-ili-gugl-chto-luchshe-1-e-rezultaty-oprosa.html, то Гугл выдаст этот документ (ели он есть в индексе).
Таким образом, проверить наличие документа в индексе Google — не проблема.
Но чтобы узнать, участвует ли этот документ в поиске, следует сделать ещё одну проверку:
cache:адрес
таким запросом мы проверим, отправил ли Гугл страницу в свой кэш. Если это произошло, то можно будет увидеть версию страницы вашего сайта, которая известна Google — он её подгрузит примерно по такому адресу — http://webcache.googleusercontent.com/… — во фрейме.
А если не произошло — то увидим такую картинку:
В большинстве случаев можно сказать, что если страница есть в кэше, то она включена в основной индекс Google.
Поэтому факт индексации сам по себе ещё ничего не значит, и не важно как быстро Гугл индексирует новые материалы на сайте и т.п. — важно, куда он их «отправляет» после этого (нужно, чтобы в основной индекс и побыстрее).
В дополнительный индекс Google часто отправляет некоторые страницы за дублированный контент. А также, если велика скорость загрузки сайта или объём веб-документов очень большой.
Сворованный контент обычно тоже там.
Вообще, для этого у Гугла есть множество причин. Главное, что следует понимать: если Google отправляет страницы «мимо» основного индекса, то он не считает их качественными. Вот и всё
- Что такое feedproxy.google.com в ссылках на Feedburner и как это убрать?Недавно я описал способ "склейки" RSS-ленты сайта и рассылки на Su...
- О чем можно написать статью для вашего сайта...статьи, крайне важная вещь при ведении своего сайта или блога. Если вы хорошо
- Facebook или ВКонтакте - что лучше? 1-е результаты опросаПродолжу подводить итоги опросов. Здесь опубликую результаты голосования...
- SEO или SMO - что важнее? 1-е результаты опроса...лько для иных целей, чем о том думает большинство начинающих блоггеров и
- Что такое CMS (движок сайта)?...придётся править всю тысячу страниц. Поэтому-то и появилась необходимость в
Ну да. Это называется «сопли». О5 же от Supplemental.
В Яндексе это принято называть фильтром «Ты последний». На самом деле как такового, этого фильтра нет. Но действие у него немного другое. Сайт появляется в основной выдаче только после нажатия на «Показать без исключения». При этом, «фильтр» накладывается на страницы с неуникальным контентом. Основой из причин, что чаще всего бывает, что страница с «объявлением» от Mainlink ранжируется как первоисточник. Здесь стоит учесть, что не стоит покупать ссылки на страницу ещё не проиндексированную и получившую достаточный трафик из ПС.
«Ты последний» может и на страницы с уникальным контентом «наложиться»
Но обычно он накладывается сразу на весь сайт, и все новые статьи оказываются вне выдачи.
Не совсем согласен с тем, что «фильтр» накладывается на весь сайт. Он может накладываться даже не на всю страницу. Дело в том, что по факту такого фильтра-то и нет. Когда-то давно так на форуме серча (searchengines) назвали именно такую неуникальную выдачу. А если статья новая и уникальная — она не может не быть в основной выдаче, ибо текст-то уникален))
Это большое заблуждение, что уникальные тексты спасут сайт от всего на свете.
А, что делать если уникальный вроде, как контент -но в сопли попал?
На попадание в «сопли» могут влиять разные факторы. Например, дублирование контента на сайте.
Или, может, он уникальный чисто технически — простой рерайт. И т.п.