Книга: Интернет для ваших родителей

Поисковики

Поисковики

Если вас интересует конкретный вопрос, то лучше обратиться к услугам поисковой машины (ПМ), или поисковой системы (ПС), или, попросту, к поисковику. Поисковик — это довольно сложная компьютерная программа, снабженная зачатками искусственного интеллекта и умеющая самостоятельно обучаться. Система круглосуточно, без выходных и перерывов на обед, сканирует Интернет. Она переходит по ссылке на страницу, находит там новые ссылки, переходит по ним далее и за какое-то время обходит всю сеть. Это время, несмотря на большую скорость работы программы, превышает месяц. Столь большой период обхода объясняется огромным количеством страниц и тем, что постоянно возникают новые страницы и сайты, а какие-то закрываются. Эта часть поисковика называется пауком.

Загрузив страницу, система анализирует ее. Она ищет так называемые ключевые слова, то есть слова, которые могут использовать пользователи при поиске информации. Информация о странице сохраняется в базе данных поисковика.

По запросу пользователя поисковик анализирует свою базу данных и выдает результат обработки запроса в виде списка ссылок на те страницы, где, возможно, существует ответ на вопрос, интересующий пользователя.

Например, мы хотим найти каталоги сайтов. Используем для этого поисковик. Один из популярнейших русскоязычных поисковиков — yandex.ru. Загрузите главную страницу этого сайта.


В центральной части страницы находится поле, предназначенное для ввода поисковых запросов. Как только мы начнем набирать каталог сайтов, программа станет предлагать нам готовые варианты запросов. С первой же буквы второго слова появится нужный вариант (рис. 2.4). Если по нему щелкнуть, то загрузится страница с результатом обработки нашего запроса (рис. 2.5).


Прежде всего, обратите внимание, что по нашему запросу нашлось 270 млн страниц, на которых присутствуют какие-либо каталоги сайтов.

На текущей странице приведен список из десяти сайтов с их кратким описанием. Следующие страницы продолжают этот список. Внизу страницы находится строка навигации с номерами страниц. Сайты в этом списке располагаются в соответствии с неким рейтингом, который определяет сам поисковик.

Попасть «на первую страницу Яндекса», да еще и по интересному запросу — мечта любого хозяина сайта.

При поиске существуют две крайности: в одном случае поисковик сообщает, что по нашему запросу ничего не найдено, в другом — предлагает многомиллионный список, который не просмотреть и за всю жизнь. Если я в строке запроса попрошу работу недалеко от дома, с хорошей зарплатой и необременительными обязанностями, то поисковик, скорее всего, сообщит, что по моему запросу ничего не найдено. Если же я введу в поле поиска слово работа, то мне будет предложен список из более полумиллиарда страниц. Задача в идеале сводится к тому, чтобы, сужая поиск, получить список из нескольких страниц, на которых наверняка присутствует ответ на наш запрос. Если после запроса работа поставить флажок в Санкт-Петербурге, то из 505 млн страниц останется только 14 миллионов. Конечно, это тоже очень много. Далее можно конкретизировать область деятельности и поискать в найденном.

Если вопрос простой, то ответ будет найден на первой же странице из списка. В этом случае нас мало интересует его длина. Например, на запрос курса валют на сегодня вы очень легко найдете ответ на странице поиска, даже не заходя на следующие страницы, — попробуйте.

Оглавление книги


Генерация: 0.932. Запросов К БД/Cache: 2 / 0
поделиться
Вверх Вниз