Книга: Профессиональный поиск в Интернете

Google

Google

Поисковик Google заслуженно считается мировым лидером современного интернет-поиска. Основанная в 1998 году компания Google по сей день остается среди ведущих законодателей мод в сфере интернет-поиска и веб-сервисов.


Разработчики Google всегда отличались повышенным вниманием к совершенствованию алгоритмов своего поисковика, а также разумным консерватизмом в области пользовательского интерфейса. Возможности составления запроса на Google можно назвать классическими, да и способы отображения результатов поиска также стали своеобразным стандартом. В последнее время разработчики Google предприняли серьезные изменения в этих областях – слишком уж старомодно стал смотреться крупнейший поисковик на фоне молодых конкурентов.

Google обладает одной из крупнейших в мире индексных баз, что обеспечивает широкий охват источников информации. Индексная информация Google сведена в несколько вертикальных баз. Кроме наиболее известной базы «Веб», это несколько мультимедиа-баз («Картинки», «Видео»), работающих с источниками актуальной информации и сообщениями на RSS-лентах база «Новости», а также индексирующая сетевые дневники база «Блоги». Кроме того, Google предлагает широкий выбор дополнительных ресурсов, среди которых стоит отметить картографический сервис, каталог сайтов, службу вопросов и ответов. Эти ресурсы также можно рассматривать как инструменты поиска.

В базе «Веб» для составления запроса Google предлагает режимы простого и расширенного поиска. В режиме простого поиска из дополнительных инструментов доступна только виртуальная клавиатура. Расширенный поиск предлагает больше возможностей. Поскольку форма расширенного поиска доступна практически во всех поисковых продуктах Google, остановимся на ней подробнее (рис. 1.1).


Рис. 1.1. Форма расширенного поиска Google

Данная форма разделена на четыре зоны. Первая выделенная цветом зона содержит инструменты составления запроса с использованием логических операторов. Поддерживается поиск по точной фразе. Между словами, внесенными в поле. Со всеми словами, будет автоматически поставлено логическое «И». Поле С любым из слов добавляет между словами запроса логическое «ИЛИ», а Без слов – оператор «НЕ». В этой же зоне находится выпадающее меню, позволяющее выбрать количество результатов на странице выдачи в диапазоне от десяти до ста ссылок.

Следующая зона формы расширенного поиска содержит перечень основных фильтров. С их помощью можно ограничить поиск ресурсами на определенном языке или ресурсами, относящимися к какой-либо одной доменной зоне. Полезным часто становится фильтр. Дата, с помощью которого можно отбирать веб-страницы, проиндексированные в определенный промежуток времени. Поддерживается и поиск по конкретному, указанному пользователем сайту. Фильтр Расположение слов дает возможность указать, в каком элементе веб-страницы должны находиться указанные ключевые слова. Фильтр Права использования предназначен для отбора контента, распространяемого под определенными условиями. Данный фильтр особенно актуален при поиске файлов. Предлагается и семейный фильтр под названием. Безопасный поиск; он предназначен для автоматического исключения из результатов поиска потенциально оскорбительного или неприличного контента. Данный фильтр имеет три уровня действия. Строгий уровень отбрасывает все сомнительные сайты, умеренный действует только при поиске изображений, не сказываясь на результатах веб-поиска. Кроме того, фильтрацию можно полностью отключить. Как известно, Google индексирует не только веб-страницы, но и файлы различных типов: документы в форматах Microsoft Office, Google Earth, PDF, PostScript, RTF и SWF. Включить поиск по какому-либо из этих типов файлов можно, используя фильтр. Формат файлов.

Зона поиска по странице позволяет искать сайты, ссылающиеся на указанную веб-страницу (поле Ссылки), а также сайты, содержащие ключевые слова, тематически близкие указанной в поле Похожие веб-странице.

Расположенная в нижней части формы расширенного поиска зона Поиск по темам в настоящее время предлагает доступ только к поиску по исходному коду программ, распространяющихся с открытыми исходными кодами (Open Source).

При обработке запроса на русском языке Google достаточно осторожно использует изменение морфологических форм слова. Это сознательная позиция разработчиков. Взамен предлагаются поисковые уточнения, демонстрируемые над списком выдачи, в который и предлагаются другие словоформы наравне с предложениями по исправлению орфографии, опечаток, а также слов, ошибочно набранных при неправильной раскладке.

Страница выдачи Google по умолчанию предлагает список из десяти наиболее релевантных результатов поиска. Особенность Google заключается в том, что на своей странице выдачи этот поисковик демонстрирует концепцию так называемого «универсального поиска» (Universal Search). Выполнен он по рецепту Джеймса Бонда: «смешать, но не взбалтывать». Его суть заключается в том, что набранный в Google запрос по умолчанию отправляется на все основные специализированные ресурсы поисковика, а результаты такого поиска показываются единым списком. Конечно, показывать результаты поиска картинок или видео на одной странице с результатами веб-поиска умеют большинство современных поисковиков, располагающих такими базами, однако результаты из различных баз Google показываются не отдельными блоками на странице, а выводятся единым списком, при этом позиции разнородных результатов на странице выдачи распределяются по степени общей релевантности.

Соответствующие алгоритмы пытаются определить, что важней для темы поиска: обычная веб-страница, видеоролик, новость или сообщение в блоге, что и определяет порядок следования результатов в форме выдачи.

Для каждого результата приводится заголовок найденной страницы, текстовая выдержка, адрес веб-страницы, а также ссылки на сохраненную при индексировании в кэше поисковика копию веб-страницы и тематически подобные странички. Необходимо отметить, что поиск подобных веб-страниц пока не является сильной стороной Google и здесь, как правило, можно наблюдать небольшое количество результатов, а также информационный шум.

Для изображений, включенных в «универсальный» список выдачи, приводятся только их графические миниатюры. Видеоролики сопровождаются информацией об их длительности, а также дате добавления в базу.

В нижней части страницы находится поле для поиска в найденном. Его роль – возможность уточнения запроса пользователем за счет добавления новых ключевых слов (рис. 1.2).


Рис. 1.2. Инструменты уточнения запроса Google собраны на боковой панели списка выдачи

Дополнительные инструменты уточнения запроса вынесены на боковую панель, которая содержит несколько блоков фильтров. Первый сверху блок позволяет быстро перейти к поиску в основных вертикальных базах Google. Второй блок во многом повторяет перечни фильтров формы расширенного поиска. С помощью его инструментов можно отобрать результаты, представленные на языке, установленном в браузере пользователя по умолчанию, отфильтровать ссылки по дате добавления в индекс. Если пользователь является обладателем аккаунта Google, система может разделить в списке выдачи просмотренные и еще не просмотренные им результаты.

Отдельно отметим возможность настройки внешнего вида страницы выдачи Режим Колесо обозрения делит область просмотра результатов на две части. Первая предлагает визуальную карту результатов поиска: в центре демонстрируется поступивший запрос, а вокруг располагаются дополнительные, автоматически найденные ключевые слова, способные содержательно уточнить запрос. Режим Хронология упорядочивает результаты по хронологическому признаку, при этом учитывается не дата добавления страницы в индекс, а даты событий, о которых идет речь в тексте найденных веб-страниц. Данный режим позволяет наглядно увидеть историю развития той или иной темы. Для этого служит выводимая над результатами поиска «линия времени», разделенная на отрезки по 5 лет. Щелкнув на определенном делении, можно открыть результаты, текст которых относится только к этому отрезку времени.

Дополнительные варианты настройки есть и у стандартного режима просмотра. В режиме. Сайты с картинками под заголовком каждого результата поиска демонстрируются изображения, найденные на этом же сайте. В режиме. Предпросмотр страниц рядом с каждой позицией поиска выводится миниатюрный скриншот веб-страницы, что позволяет вспомнить нужный сайт по его внешнему виду.

Последней на сегодняшний день новинкой Google в области пользовательских интерфейсов стал режим «Живой поиск». Он включается автоматически при достаточной скорости интернет-соединения. В этом режиме список результатов поиска загружается немедленно после ввода или изменения поискового запроса пользователем. Кроме того, рядом со ссылками появились кнопки с изображением лупы. Они открывают всплывающие панели со скриншотами выбранных страниц.

Более подробного рассказа заслуживает режим. Поиск с переводом, который работает с помощью сервиса Google Переводчик. При его активации на странице поиска появляется меню выбора языковых пар. Результаты поиска выводятся в двух колонках: на оригинальном языке и переведенные на указанный пользователем язык. Данная функция очень полезна при поиске по национальным сегментам интернета. После перехода по переведенным ссылкам переводятся и целевые веб-страницы. Система перевода Google отличается хорошей скоростью работы, поэтому серфинг в таком режиме проблем не вызывает.

Главный плюс переводческой службы Google – большое количество поддерживаемых языков. Качество перевода с основных европейских языков вполне сносное, правда, это относится только к текстам так называемой «общей» лексики. Как только происходит переход на тематические ресурсы, качество перевода заметно падает. Как бы то ни было, в большинстве случаев понять смысл текста можно (рис. 1.3).


Рис. 1.3. Режим поиска с переводом полезен при работе с национальными сегментами интернета

Система поиска новостей в Google работает с новостными сайтами и другими ресурсами, предлагающими соответствующий контент. В отличие от веб-поиска допускается сортировка результатов не только по релевантности, но и по дате публикации.

Для поиска в блогах Google не предлагает каких-либо необычных инструментов или возможностей, просто ограничивая поиск ресурсами популярных блог-платформ. А вот база «Микроблоги» интересна тем, что индексирует сообщения популярного сервиса Twitter. Сортировка результатов поиска идет по дате их публикации. Для удобства работы со списком выдачи предлагается визуальная «линия времени», демонстрирующая количество «твитов» за последний день и позволяющая быстро находить сообщения за определенный промежуток времени.

Локальный поиск Google тесно связан с картографическими сервисами, поэтому его эффективность напрямую связана с качеством покрытия картами Google той или иной территории. Наилучшее качество обеспечивается для Северной Америки. При локальном поиске в русских ресурсах достойный охват обеспечивается только для крупных городов. Нельзя не отметить, что данное направление развивается, и результаты постепенно становятся лучше. Для запуска поиска по картам достаточно добавить слово «карта» к своему поисковому запросу.

Обладатели аккаунтов Google при настройке поиска могут включить режим записи своих поисковых запросов. Полученные сведения о переходах по ссылкам используются для улучшения списка выдачи Google. При желании историю своего поиска можно очистить в любой момент.

Google может похвастаться хорошим выбором вспомогательных справочных инструментов. Набор в строке поиска математического выражения позволит быстро вычислить его значения. Поддерживаются основные арифметические операции. В строке поиска также работает механизм перевода значений между различными единицами измерения и конвертации валют.

Некоторое время тому назад системой Google предлагался также достаточно широкий выбор поисковых операторов, которые можно было указывать в строке поиска для уточнения запроса. Сейчас большинство таких операторов доступно в форме расширенного поиска в виде фильтров. Активными и официально поддерживаемыми остались только оператор обязательного включения слова (+) и оператор автоматической подстановки слов в запрос. В последнем случае поисковик анализирует подобные по смыслу запросы, поступавшие в систему, и постарается дополнить поступивший запрос. Оператор define: позволит найти определения заданного в строке поиска слова в крупных справочных ресурсах. В то же время многие доступные ранее операторы продолжают работать. Их перечень, характеристика и примеры использования приведены в приложении А.

Активным пользователям Google стоит обратить внимание на проект Google Experimental Search, являющийся одним из разделов Google Labs (www.google.com/experimental/). Этот проект предлагает протестировать новейшие разработки Google в области поиска. Одновременно можно принять участие только в одном из предлагаемых экспериментов. В настоящее время там представлены два проекта, касающиеся работы с Google с помощью клавиатурных комбинаций.

Среди дополнительных программ для работы с Google отметим поисковые плагины для браузеров, а также официальную панель инструментов Google. Она предлагает быстрый доступ к поиску в вертикальных базах Google и возможность работы с историей поиска своего аккаунта Google. Кроме того, предлагается быстрый доступ к другим веб-сервисам Google.

Оглавление книги


Генерация: 0.095. Запросов К БД/Cache: 0 / 0
поделиться
Вверх Вниз