|
Как Google сканирует веб-сайты,
индексирует их и показывает результаты.
Если отправить в Google поисковый запрос, почти мгновенно появляются результаты поиска, найденные по всему Интернету. Как Google находит веб-страницы, соответствующие введенному запросу, и определяет порядок расположения результатов поиска?
Грубо говоря, поиск в Интернете можно сравнить с
очень большой книгой, которая имеет впечатляющее оглавление, где можно точно узнать
где что находится. Когда вы выполяете поиск Google,
наша программа просматривает наш индекс и находит самые релевантные результаты поиска,
которые вам возвращаются (т.е. показываются).
За предоставление результатов поиска отвечают три основных процесса.
-
Сканирование: Есть ли в базе данных Google информация о вашем сайте? Можем ли мы ее найти?
-
Индексирование: Может ли Google проиндексировать ваш сайт?
-
Предоставление результатов: Насколько качественное, полезное и релевантное поиску содержание используется на вашем сайте?
Сканирование
Сканирование - это процесс, в ходе которого робот Google обнаруживает новые и обновленные страницы, добавляемые в индекс Google.
Мы используем огромную сеть компьютеров, чтобы извлечь (или "просканировать") содержание миллиардов
веб-страниц в Интернете. Программа, выполняющая сканирование, называется
роботом Google (или "пауком"). Робот Google использует
алгоритмические процессы: компьютерные программы определяют, какие сайты нужно сканировать,
как часто это нужно делать, а также какое количество страниц выбрать на каждом сайте.
Процесс сканирования Google начинается со списка URL-адресов веб-страниц, созданного на основе предыдущих сеансов сканирования. Его дополняют данные из файлов Sitemap, предоставленных веб-мастерами. Просматривая каждый из этих сайтов, робот Googlebot находит на каждой странице ссылки и добавляет их в список страниц, подлежащих сканированию. Робот отмечает все новые и обновленные сайты, а также неработающие ссылки. Полученная информация используется для обновления индекса Google.
Мы не берем плату за более частое сканирование сайта. Поисковая система представляет собой отдельную часть нашего бизнеса, не связанную с платной службой Google AdWords.
Индексирование
Googlebot обрабатывает каждую сканируемую страницу, чтобы составить полный индекс всех найденных слов, а также отметить, где именно на странице они находятся. Кроме того, мы обрабатываем данные из основных тегов и атрибутов, например тегов Title и атрибутов ALT. Робот Google способен обрабатывать многие (но не все) типы содержания. К примеру, обработке не поддается содержание некоторых файлов мультимедиа и динамически создаваемых страниц.
Показ результатов
Когда пользователь вводит поисковый запрос, наша система находит в индексе подходящие страницы и выдает наиболее релевантные, по нашему мнению, результаты. Релевантность определяется различными факторами, которых насчитывается более 200. Один из них - это рейтинг страницы PageRank. PageRank является показателем "важности" страницы и определяется по входящим ссылкам с других страниц. Говоря простыми словами, каждая ссылка на страницу вашего сайта, ведущая с другого сайта, увеличивает PageRank вашего сайта. Не все ссылки одинаковы: Персонал компании Google постоянно работает над улучшением качества обслуживания пользователей: мы выявляем ссылки со спамом и другие данные, негативно сказывающиеся на результатах поиска. Самыми лучшими считаются ссылки, размещение которых связано с качеством содержания вашего сайта.
Для обеспечения адекватного рейтинга сайта на страницах результатов поиска важно, чтобы робот Google мог корректно сканировать и индексировать сайт. В нашем руководстве для веб-мастеров описывается ряд оптимальных методов, позволяющих избежать появления распространенных ошибок и повысить рейтинг сайта.
|
|