Google Поиск изнутри. Как работает. Алгоритмы

Алоха, дорогие друзья ?. В этой статье хочу поделиться принципами работы Google Поиска, рассказать немного о общих алгоритмах. Я считаю эта информация будет интересна новичкам, которые желают ближе познакомится с гуглом и его идеологией поиска.

Три процесса работы Google Поиска:

  • Сканирование
  • Индексирование
  • Выдача результатов и ранжирование

С чего всё начинается? Правильно, с получения информации. Первый процесс называется Сканирование.Google Поиск собирает информацию из разных источников. Перечислю источники:

  • веб-страницы (прямое добавление сайта в Google Console, или индексирование чужого сайта с ссылкой на любую страницу Вашего сайта);
  • контент, добавленный пользователями, например опубликованный ими в сервисах «Google Мой бизнес» и «Google Карты»;
  • отсканированные книги;
  • открытые базы данных в Интернете;
  • множество других источников.

Google постоянно ищет новые страницы и добавляет их к общему списку. Следующий этап называется Индексирование. После того как Google Поиск просканировал страницу, он должен ее определить, какой теме посвящено ее содержание. На этом этапе Google анализирует информацию, контент страницы. Систематизирует найденные на ней изображения и встроенные видео. Вся полученная информация сохраняется в индексе Google – огромной базе данных.
Третий завершающий процесс называется Выдача результатов и ранжирование. Пользователь вводит запрос в поисковую строку, и Google на основе многочисленных факторов ищет в своем индексе самые подходящие результаты. Помните, это и есть та самая цель, которую будут преследовать все поисковые системы, то есть дать пользователю четкий подробный ответ на его запрос. Какие факторы Google учитывает:

  • местоположение (страна, город, регион)
  • язык
  • тип устройства пользователя (обычный компьютер или телефон)
  • другие алгоритмы

Например вводя запрос «Timand» будет различаться в зависимости от того, находитесь вы в Москве или в Нью-Йорке.

Google Поиск изнутри. Как работает. Алгоритмы

Рекомендации на этапах.

Есть несколько рекомендации как повысить эффективность на каждом этапе .

Сканирование

  1. Запросить сканирование отдельных URL, если изменения вносились только на соответствующих страницах.
  2. На страницах, которые уже известны роботу Google, размещайте ссылки на свои новые страницы при их публикации.

Индексирование

  1. Придумывайте короткие и информативные заголовки страниц TITLE.
  2. Используйте подходящие тематические заголовки.
  3. На страницах должно быть достаточное количество текста.

Выдача результатов и ранжирование

  1. Обеспечьте быструю загрузку своей страницы и оптимизируйте ее для мобильных устройств.
  2. Размещайте на странице полезный контент и своевременно обновляйте его.
  3. Следуйте рекомендациям, представленным в Руководстве Google для веб-мастеров, чтобы обеспечить удобство просмотра сайта.

Итак, мы кратко разобрали три этапа принципа работы Google, но как все же происходит упорядочение информации в выдаче? Советую посмотреть видеоролик, чтобы еще ближе приблизиться к сути:

Поисковой индекс Google содержит миллиарды страниц. Его объем – больше 100 млн ГБ. Это напоминает одну громадную книгу, в которой есть отдельная запись по каждому слову на всех проиндексированных страницах. Во время индексирования данные по странице добавляются в записи по всем словам, которые она содержит.

Поисковые алгоритмы

Допустим Google проиндексировал все сайты, которые имеют страницы с содержимым запросом например — Изготовление ключей. Как он формирует выдачу, почему одни сайты выше другие ниже? На этом этапе подключаются всевозможные факторы ранжирования, дополнительные алгоритмы, благодаря которым, посетитель в 90% случаев находит сразу ответ на свой вопрос.

Анализ слов и выражений

Например один из алгоритмов называется — Анализ слов и выражений. Если введенный запрос имеет несколько смыслов и значений, Google Поиск определит верное с помощью внедренной системы синонимов. Это стало возможным с недавних времен. Более 5 лет Google создавал данный алгоритм, и благодаря ему существенно увеличилось качество результатов выдачи на разных языках мира.

Алгоритм - Анализ слов и выражений

Подбор подходящих страниц

Еще одним алгоритмом является подбор подходящих страниц. Google определяет насколько хорош тот или иной сайт, содержащий информацию, которая соответствует запросу. Когда пользователь вводит запрос, наши алгоритмы ищут в индексе подходящие страницы, а также определяют, как часто ключевые слова встречаются на странице и в каких ее разделах (например, в заголовке или основном тексте).

Алгоритм -Подбор подходящих страниц

Суть не в том, чтобы употребить максимальное количество раз ключевое слово, а постараться дать полную информацию по запросу. Страница должна содержать сведения по запросу, а не просто дублировать его.

Ранжирование релевантных страниц

Тут само название говорит за себя, алгоритм отвечает за оценку релевантности страниц. Задача показать первыми, наиболее подходящие страницы. Данный алгоритм содержит в себе сотни других, на основе которых и формируется вся выдача. Сюда входит оценка новизны контента и количества повторов запроса до удобства просмотра страницы. Если на страницу ссылаются авторитетные в своей области сайты, это означает, что на ней вероятно представлен качественный контент.

Алгоритм - Ранжирование релевантных страниц

Также на этапе ранжирования релевантных страниц, отсеиваются страницы, содержащие спам, а именно страницы с перегруженными ключевыми словами, и с множествами ссылающихся сомнительных ресурсов (некачественные или необдуманные в количествах ссылки).  Все это учитывается системой PageRank, и вытесняется с поисковой выдачи вовсе.

Учет сведений о пользователях

Еще один алгоритм, основанный на учете сведений пользователей. А именно учитываются сведения о местоположении пользователя, его история предыдущих запросов, настройка Google Поиска и другое.

Например, если житель Нью-Йорка вводит запрос «футбол«, ему в первую очередь будут показаны сведения об американском футболе и клубе Нью-Йорк Сити.

Алгоритм - Учет сведений о пользователях

Интернет непрерывно меняется. Каждое мгновение издатели публикуют сотни новых веб-страниц, и все эти изменения учитываются в результатах поиска Google.

 

(Посещений 71, 1 посещений сегодня)

Оставить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *