Книга: Яндекс для всех

1.3.2. Расширенные возможности поиска

1.3.2. Расширенные возможности поиска

Для того чтобы использовать расширенные возможности, перейдите по ссылке расширенный поиск, находящейся под строкой ввода запроса. Вы попадете на новую страницу, где, помимо поля ввода запроса, размещены поля для формирования сложных поисковых условий.

Все выбранные вами условия являются обязательными при обработке запроса. Например, если вы в дополнительных условиях установите требование, чтобы слова запроса находились на одной странице документа, а документ был в формате DOC (Microsoft Word), то в результате получите список документов, в которых искомые слова находятся на одной странице. Ни HTML-страницы, ни другие документы, содержащие искомые слова, в результат поиска включены не будут.

Группа условий Искомые слова

Дополнительные условия разбиты на две группы. Первая группа условий Искомые слова относится к словам и их размещению в документе.

Расположение слов друг относительно друга

С помощью первого блока условий (табл. 1.1) назначается требование по взаимному расположению искомых слов (иначе — расстояние между словами).


Возможность определять в запросе взаимное расположение слов на странице или в документе связана с тем, что в Яндексе используются специальные алгоритмы, учитывающие не только морфологию слов, но и их связь между собой (если в запросе указано несколько слов).

Яндекс — весьма самостоятельная система, и если вы ей не укажете строгие правила поиска, он будет искать по правилам, применяемым по умолчанию:

Если слова, идущие в запросе одно за другим, тесно связаны между собой, поиск будет происходить в пределах одного предложения. Если связь менее тесная — поиск будет вестись на расстоянии в несколько предложений. В том случае, если Яндекс определит, что слова между собой не связаны, они будут разыскиваться в пределах одного документа.

Пример, приводимый Яндексом

…запрос продажа автомобилей Украина отличается от запроса продажа автомобили Украины. В первом запросе "точно найденным документом" будет считаться документ, в котором слова "продажа" и "автомобиль" находятся "рядом" (скажем, в одном предложении), а слово "Украина" — "далеко" (скажем, где угодно в документе). Во втором запросе точно найденным документом будет считаться только такой, в котором слова "автомобиль" и "Украина" находятся достаточно близко. Яндекс решает так, потому что фраза "автомобили Украины" синтаксически согласована. То есть, с точки зрения Яндекса, первый запрос нацелен на поиск украинских автомобильных дилеров, а второй — на поиск любых продавцов "Таврий".

Используя настройки расширенного поиска, вы тем самым ужесточаете требования к его результатам и ограничиваете "своеволие" поисковой машины. Незначительный, вроде бы, нюанс, но может существенно сказаться на полученных результатах.

Расположение слов на странице

При обычном поиске заданные в запросе слова разыскиваются по всем элементам страницы (табл. 1.2). В данном контексте под элементами понимаются тело страницы, ее заголовок (тот текст, который виден в заголовке браузера), либо ссылки, ведущие со страницы. Вы можете ограничить ареал поиска, выбрав один из перечисленных элементов. И более того, вы можете ужесточить поиск среди ссылок, если в качестве дополнительного параметра укажете, на какой конкретно сайт должна вести ссылка. Это может пригодиться в том случае, если вы знаете сайт, информации на котором вы доверяете. И если в процессе поиска в тексте документа будут ссылки на информацию с этого сайта, вы заранее предполагаете, что сможете доверять и найденной информации.


Форма представления слова

Еще один элемент настройки — выбор формы представления слова в документе (табл. 1.3). С его помощью можно либо искать слово во всех его морфологических формах, либо в строгом соответствии с написанием в запросе. Использование этого элемента идентично использованию восклицательного знака перед словом в тексте запроса.


Группа условий Страницы

А вот эта группа настроек предназначена для отбора соответствующих запросу страниц, но по параметрам, не имеющим отношения к словам. Отбор выполняется по иным требованиям и позволяет сократить количество подобранных ссылок до минимума.

Первое, что предлагается в качестве дополнительного ограничения, — язык документа (страницы). Хотя Яндекс проводит индексирование сайтов только русскоязычной части Интернета, здесь также могут встречаться сайты и документы на разных языках. По умолчанию для поиска язык сайта или документа не важен (например, слово computer может встречаться как в текстах на русском, так и в текстах на английском языке). Если же вас интересуют тексты (страницы сайта, документы) только на определенном языке или группе языков, используйте опцию выбора языка. Можно выбрать определенный язык, а можно, используя клавиши <Shift> или <Ctrl>, выбрать несколько.

Во многих случаях важно не только наличие страницы или документа, но и дата их создания. К примеру, вы ищете новую информацию об Испании, куда хотели бы поехать в отпуск. Вам нужны публикации за последний месяц. Используя второй элемент настройки — дата, установите необходимый период. Это могут быть последние две недели, месяц, три месяца или год. Впрочем, совершенно не обязательно использовать эти предварительные настройки — вы можете установить и собственный период для отбора.

К сожалению, необходимо отметить, что отбор документов по времени работает плохо. И связано это не с особенностями поисковой машины. Отнюдь. Яндекс прекрасно понимает дату создания документа, получая ее из его свойств, и дату публикации или изменения страницы на сайте. Беда в другом. Далеко не все серверы выдают правильную дату документа или страницы. Это первое. А второе заключается в том, что на обновленной странице, где размещаются тексты, новости, объявления, дата самого текста может быть очень давней, а дата публикации страницы из-за публикации новостей, новой. Поэтому я бы не очень доверял использованию данной настройки.

Впрочем, этой настройке в большей степени можно доверять в том случае, когда вы ищете только документы, исключая поиск страниц. Яндекс понимает документы, созданные в нескольких форматах: HTML, PDF (Adobe Acrobat Reader), RTF, DOC (Microsoft Word), PPT (PowerPoint), SWF (Macromedia Flash). Если вас интересует несколько определенных форматов, удерживая клавишу <Shift> или <Ctrl>, выберите нужные.

Неплохая возможность есть для тех, кто разместил в Интернете свой сайт или публикацию. С помощью поля содержат ссылку можно указать сетевой адрес сайта или статьи. Результатом будет список страниц и документов, в которых, помимо ключевых слов, будет и указанная ссылка. Результаты поиска помогут увидеть заинтересованность в материалах вашего сайта или публикации. Но не надо думать, что все заинтересованные посетители будут ставить на вас ссылки. Поэтому к итогам надо относиться очень аккуратно и доверять им только как к определенному показателю, не более того.

Вы можете еще более ограничить область поиска, если укажете перечень сайтов, на которых нужно будет искать информацию. Заполните поле находятся на сайте перечнем сайтов (через запятую), и Яндекс будет проводить поиск только по их материалам. Эту особенность можно использовать и в том случае, если вам известен интересный сайт с полезной информацией, но не имеющий функции поиска. Введите в поле находятся на сайте его адрес, и Яндекс выдаст результаты по одному сайту. Не следует забывать, что владельцы сайта могли поставить запрет на индексирование определенных страниц или разделов сайта, поэтому в результатах могут быть приведены далеко не все страницы, содержащие разыскиваемую информацию.

Примечание

В документации к разделу расширенный поиск говорится о том, что должно быть еще одно поле — не находятся на сайте. Служит оно для противоположной цели — исключить из результатов поиска один или несколько сайтов. Но на странице расширенного поиска это поле отсутствует.

Поиск "по образцу" заключается в том, что вы вносите в поле похожи на страницу адрес документа, для которого хотели бы найти подобные материалы. В результате вы получите список страниц и документов, содержащих искомые слова и подобные предложенному вами образцу. По своему действию эта настройка подобна ссылке Похожие документы в результатах поиска.

И еще одно ограничение, которое вы можете наложить на выдачу результатов поиска. Заключается оно в том — на сайтах какого региона требуется искать результаты. Для этого введите в поле регион название города, области, государства. В результатах вашего запроса будут ссылки на документы и сайты, находящиеся в этом регионе. Но не все так однозначно. Будут пропущены сайты, владельцами которых являются организации или жители данного региона, но реально размещенные на хостингах, находящихся далеко за его пределами. Примеров таких множество. И наоборот. В результаты попадут сайты, совершенно не связанные с нужным регионом, но находящиеся на площадках компаний, предоставляющих услуги хостинга в нужном вам регионе.

По мере формирования условий поиска, выбранные назначения отображаются в нижней части страницы в поле после слова Итого. Те параметры, которые не изменялись, в итоговое выражение не включаются.

Итак, подведем небольшие итоги. С помощью расширенного поиска вы можете наложить ограничение на взаимное расположение слов в документе, их нахождение в отдельных его элементах, ограничить используемый язык документа, время создания или изменения, тип, регион и диапазон просматриваемых сайтов. Чем точнее вы сможете наложить ограничения, тем меньше и точнее будет сформированный результат поиска. Да, времени на подготовку запроса уйдет заведомо больше, чем при обычном запросе. Зато время на просмотр результатов существенно сократится.

И последнее, поскольку речь зашла о результатах. На странице настроек расширенного поиска вы можете назначить количество ссылок в результатах, которые будут выводиться на одной странице. Кому-то может быть достаточно того количества, которое предлагается по основным настройкам, а кому-то необходимо, чтобы это количество было больше или меньше.

Оглавление книги


Генерация: 1.178. Запросов К БД/Cache: 3 / 1
поделиться
Вверх Вниз