Книга: Блог. Создать и раскрутить

На чем основан поиск

На чем основан поиск

Все поисковые машины базируются лишь на трех основных операторах, лежащих в основе булевой алгебры (еще ее называют булевой логикой, или Boolean). Это логические операторы «И», «ИЛИ» и НЕ». Работают они следующим образом.

1. Логическое «И». Если между двумя словами в запросе стоит оператор «И», то в результатах запроса будут только те документы, в которых содержатся оба слова. Так, например, по запросу собака И кошка будет найден документ, в котором есть предложение «Собака гналась за кошкой», но не будет документа, состоящего из текста «кошка отдыхала» или «корм для собак».

2. Логическое «ИЛИ». Если между словами стоит оператор «ИЛИ», то вы получите документы, в которых содержится хотя бы одно из этих слов. Если нет специальных ограничительных оговорок, то документы, где оба эти слова присутствуют, также будут найдены.

Например, по запросу собака ИЛИ кошка будут найдены документы, исключенные в прошлом запросе и содержащие тексты «кошка отдыхала» или «корм для собак», а также документ, в котором есть предложение «Собака гналась за кошкой».

3. Логическое «НЕ». Если два предыдущих оператора описывали те слова, которые вы хотите включить в запрос, то оператор «НЕ», наоборот, слова из запроса исключает. Те, кто впервые сталкивается с операторами запросов, нередко высказывают удивление и говорят: «Так не проще ли не включать ненужное слово в запрос? Зачем вводить дополнительный оператор?» Увы, не проще.

На самом деле, чтобы понять значение логического оператора «НЕ», имеет смысл вспомнить, что наш запрос не создает в Интернете ничего нового. Мы лишь выуживаем то, что нам надо, из имеющегося огромного, но все же конечного массива. При этом мы должны отсечь информационный мусор. Вот и отсекаем его с помощью оператора «НЕ». К сожалению, не мы решаем, будет мусор в выдаче или нет. Так, например, по запросу информации о коньке крыши неизбежно будет появляться информационный мусор в виде документов о Коньке-Горбунке, фигурном катании, хоккее, лошадях и т. п. Без логического «НЕ» тут не обойтись никак.

Давайте рассмотрим примеры работы логического оператора «НЕ».

По запросу собака НЕ кошка будет найден документ, содержащий текст «корм для собак», а вот документы, содержащие текст «кошка отдыхала» или «собака гналась за кошкой» и даже «корма для собак и кошек», из выдачи будут исключены.

Часто встречается чуть более сложный вариант написания запроса, который содержит все или почти все операторы, показанные выше. В этом случае лучше пользоваться еще одним элементом поискового запроса – круглыми скобками, которые позволяют отделять однотипные слова запроса от остальных. Кроме того, они дают возможность самому составителю визуально лучше различать разные фрагменты запроса. Покажем на конкретных примерах, как и для чего скобки используются.

Например, запрос пушистые И (собаки ИЛИ кошки) позволит получить документы, относящиеся как к пушистым собакам, так и к пушистым кошкам – по отдельности или вместе. Скобки при этом «раскрываются» по обычным арифметическим правилам вынесения за скобку общего множителя (для тех, кто не любит математику, поспешим сказать, что глубоких знаний этой дисциплины вам не потребуется).

А вот запрос пушистые И (собаки ИЛИ кошки) НЕ (собаки И кошки) выдаст документы, в которых написано про пушистых собак или пушистых кошек, но не содержится документов, в которых кошки и собаки будут упоминаться вместе.

Еще раз уточним – все поисковые машины сегодня работают на основе этих трех операторов, хотя нюансы их написания в разных поисковых машинах могут быть различны.

Оглавление книги


Генерация: 0.650. Запросов К БД/Cache: 3 / 0
поделиться
Вверх Вниз