
Здравствуйте! В этом видео мы расскажем, как работают поисковые системы. Вы узнаете, как они ищут веб-страницы, что делают с найденными и как выбирают результаты для показа. Когда вы ищете в поисковой системе ближайшую кофейню, вы вряд ли думаете о технологиях поиска. Но как же это работает? Как система так быстро обыскала весь Интернет и выбрала, какие результаты вам показать?
Все поисковые системы похожи, хотя и используют собственные программы. Каждая система выполняет три задачи. Во-первых, исследует контент, о котором узнаёт и который ей доступен. Этот процесс называется сканирование. Во-вторых, сортирует весь контент, то есть индексирует его. Наконец, система определяет, какой контент будет релевантен для запроса. Это называется ранжирование.
Рассмотрим подробнее весь процесс. Поисковые системы сканируют Интернет в поисках контента – веб-страниц, изображений и видео. Каждая система просматривает страницы при помощи программ под названием робот, поисковый робот или паук.
Роботы сканируют сотни страниц, переходя на новые по ссылкам. Они не останавливаются, и их единственная цель – постоянно посещать страницы в поисках новых ссылок и контента, которые можно проиндексировать. Второй этап процесса – индексация. Индекс – это огромный список всех веб-страниц и контента, найденных роботами. Система использует индекс как источник той информации, которая отображается на странице результатов поиска.
Но в индекс попадает не всё, что находят роботы.
Например, поисковая система может найти несколько копий одного и того же контента на разных сайтах.
Как это возможно? Представьте, что вы ищете не кофейню, а кофемашину. Вы увидите, что для новейшего аппарата "ЦарьКофе-200" на сайтах магазинов представлено одинаковое описание. Возможно, его предоставил производитель. Важно то, что поисковой системе нужно определить, какую именно версию сохранить в индексе. В сотнях дубликатов нет нужды, поэтому вряд ли все страницы попадут в индекс.
Поэтому, если ваш сайт продает кофемашины, лучше написать собственное описание к аппарату.
Логично, верно?
Мы разобрали сканирование и индексацию, теперь переходим к ранжированию. Когда вы вводите запрос, поисковая система сравнивает ваши слова и фразы с собственным индексом, затем ищет совпадения. Допустим, что система нашла двести тридцать миллионов совпадений. Теперь она будет их ранжировать.
Алгоритм, стоящий за ранжированием – тайна за семью печатями. На место страницы в результатах поиска влияет множество факторов: слова на странице, количество ссылающихся на нее сайтов, свежесть контента и многое другое.
Однако вне зависимости от конкретного алгоритма цель у всех систем одна: предложить человеку то, что он ищет.
Например, вы прочли об австралийском капучино под названием "флэт уайт" и хотите его попробовать. Если ввести фразу "флэт уайт кофе поблизости", поисковая система определит ваше местоположение и покажет, где рядом с вами продают такой напиток. Она может даже показать вам маршрут на карте.
Итак, что же мы узнали? Поисковые системы постоянно ищут в Интернете контент, сортируют его и подбирают наиболее релевантные результаты по запросу. Понимание этого процесса поможет сделать ваш сайт максимально эффективным.
Основная информация
Когда вы вводите запрос, поисковые системы исследуют и сортируют контент всех веб-страниц в Сети, а затем показывают их вам в определенном порядке на странице результатов поиска. Разобравшись, как это работает, вы сможете эффективнее развивать свой бизнес. Из этого видео вы узнаете:
- как поисковые системы ищут веб-страницы;
- что они делают с найденными страницами;
- каким образом поисковые системы выбирают результаты для показа.