Где находится страница сайта: в основном индексе Google или дополнительном?

Основной индекс Google или дополнительный

Основной индекс Google или Supplemental index?

Мысль написать данную статью пришла после общения на специальном форуме от Гугл, где вроде как помогают вебмастерам решить проблемы с ранжированием и индексацией сайта Гуглом. Дело в том, что не все понимают, что у Google имеются два индекса — основной и дополнительный, и если страница сайта проиндексирована, то это ещё не значит, что она будет участвовать в поисковой выдаче.

Я уже писал про такое явление, как дополнительный (Supplemental) индекс Google и причинах попадания страниц именно туда. А сейчас расскажу, как быстро проверить, куда отправилась ваша страница.

Как проверить — страница в основном индексе Google или дополнительном?

Делается всё очень просто. Во многом это аналогично просмотру кэша страницы сайта.

Сначала лучше проверить, проиндексирована ли вообще страница. Для этого в поисковую строку Гугла (или строку адреса браузера Chrome) вводим такой запрос:

site:адрес

вместо — «адрес» — пишем какой-нибудь URL-адрес документа, проиндексированность которого проверяем. Если он проиндексирован, то Google выдаст его в своей выдаче (в единственном экземпляре, если это уникальный адрес для всего сайта; или несколько результатов, если это адрес рубрики сайта и т.п.).

Например, если ввести site:http://web-ru.net/category/kontekstnaya-reklama/, то в выдаче будут все ссылки, содержащие в своём URL http://web-ru.net/category/kontekstnaya-reklama/ (естественно, если Гуглу они известны).

А если ввести что-нибудь такое site:http://web-ru.net/internet/yandeks-ili-gugl-chto-luchshe-1-e-rezultaty-oprosa.html, то Гугл выдаст этот документ (ели он есть в индексе).

Таким образом, проверить наличие документа в индексе Google — не проблема.

Но чтобы узнать, участвует ли этот документ в поиске, следует сделать ещё одну проверку:

cache:адрес

таким запросом мы проверим, отправил ли Гугл страницу в свой кэш. Если это произошло, то можно будет увидеть версию страницы вашего сайта, которая известна Google — он её подгрузит примерно по такому адресу — http://webcache.googleusercontent.com/… — во фрейме.

А если не произошло — то увидим такую картинку:

Документа нет в кэше Google

В большинстве случаев можно сказать, что если страница есть в кэше, то она включена в основной индекс Google.

Поэтому факт индексации сам по себе ещё ничего не значит, и не важно как быстро Гугл индексирует новые материалы на сайте и т.п. — важно, куда он их «отправляет» после этого (нужно, чтобы в основной индекс и побыстрее).

В дополнительный индекс Google часто отправляет некоторые страницы за дублированный контент. А также, если велика скорость загрузки сайта или объём веб-документов очень большой.

Сворованный контент обычно тоже там.

Вообще, для этого у Гугла есть множество причин. Главное, что следует понимать: если Google отправляет страницы «мимо» основного индекса, то он не считает их качественными. Вот и всё

(1 оценок, среднее: 5,00 из 5)

Случайные публикации:

Что такое feedproxy.google.com в ссылках на Feedburner и как это убрать?Недавно я описал способ "склейки" RSS-ленты сайта и рассылки на Su...
О чем можно написать статью для вашего сайта...статьи, крайне важная вещь при ведении своего сайта или блога. Если вы хорошо
Facebook или ВКонтакте - что лучше? 1-е результаты опросаПродолжу подводить итоги опросов. Здесь опубликую результаты голосования...
SEO или SMO - что важнее? 1-е результаты опроса...лько для иных целей, чем о том думает большинство начинающих блоггеров и
Что такое CMS (движок сайта)?...придётся править всю тысячу страниц. Поэтому-то и появилась необходимость в

Дата: 11.04.2013 |

Web-Ru.net › рубрика ➨✔➨ ❝sem❞+

| 6 комментариев | автор: Пётр

Оставьте комментарий:

комментариев 6

Lust:

29 апреля 2013 в 15:28

Ну да. Это называется «сопли». О5 же от Supplemental.
В Яндексе это принято называть фильтром «Ты последний». На самом деле как такового, этого фильтра нет. Но действие у него немного другое. Сайт появляется в основной выдаче только после нажатия на «Показать без исключения». При этом, «фильтр» накладывается на страницы с неуникальным контентом. Основой из причин, что чаще всего бывает, что страница с «объявлением» от Mainlink ранжируется как первоисточник. Здесь стоит учесть, что не стоит покупать ссылки на страницу ещё не проиндексированную и получившую достаточный трафик из ПС.

Ответить
- Пётр:
  
  29 апреля 2013 в 20:00
  
  «Ты последний» может и на страницы с уникальным контентом «наложиться»
  Но обычно он накладывается сразу на весь сайт, и все новые статьи оказываются вне выдачи.
  
  Ответить
  - Lust:
    
    30 апреля 2013 в 4:34
    
    Не совсем согласен с тем, что «фильтр» накладывается на весь сайт. Он может накладываться даже не на всю страницу. Дело в том, что по факту такого фильтра-то и нет. Когда-то давно так на форуме серча (searchengines) назвали именно такую неуникальную выдачу. А если статья новая и уникальная — она не может не быть в основной выдаче, ибо текст-то уникален))
    
    Ответить
    - Пётр:
      
      1 мая 2013 в 15:35
      
      Это большое заблуждение, что уникальные тексты спасут сайт от всего на свете.
      
      Ответить
Дизайнер Одесса:

19 октября 2014 в 16:10

А, что делать если уникальный вроде, как контент -но в сопли попал?

Ответить
- Пётр:
  
  7 ноября 2014 в 2:29
  
  На попадание в «сопли» могут влиять разные факторы. Например, дублирование контента на сайте.
  Или, может, он уникальный чисто технически — простой рерайт. И т.п.
  
  Ответить