Книга: Профессиональный поиск в Интернете

Яндекс.Картинки

Яндекс.Картинки

Развитие системы поиска изображений одного из крупнейших российских интернет-поисковиков также не стоит на месте. В настоящее время система использует собственную индексную базу, а также задействует базу системы Picsearch.


В системе Яндекс.Картинки предусмотрены режимы простого и расширенного поиска. В ходе простого поиска работает механизм автодополнения вводимых в поле поиска ключевых слов. Поскольку этот механизм оптимизирован с учетом особенностей русского языка, его работа весьма полезна.

Форма расширенного поиска предлагает четыре блока фильтров, работающих с различными признаками изображения, как формальными, так и визуальными. Фильтр Искать слова учитывает косвенные признаки и позволяет искать изображения по окружающему их на веб-странице тексту, а также описанию изображения в HTML-разметке. Поддерживаются поиск по фразе и поиск с учетом различных словоформ. С помощью фильтра. Формат можно указать желаемый графический формат изображений. Поддерживается ограничение поиска указанным сайтом или доменом.

Фильтры Размер и Ориентация позволяют указать формальные характеристики нужного изображения. Предлагается список из пяти вариантов размера: от «иконок» до «очень больших» изображений. Поддерживается выбор в перечне стандартных разрешений мониторов с целью поиска «обоев» для рабочего стола, а также ручное указание нужного размера изображения в пикселях.

Фильтр Цвет позволяет указать желаемую цветовую гамму изображения. Работает этот фильтр достойно, но в то же время не стоит забывать, что он анализирует общую гамму изображения, иногда не делая различий между тем, что, собственно, изображено на картинке, и фоном.

Фильтр Тип дает возможность не только разделить фотографии, клипарт и графику, но и находить изображения людей, для чего служит переключатель Портреты.

Очень удобной особенностью расширенного поиска в системе Яндекс.Картинки является блок в нижней части формы, где все условия поиска приводятся в виде осмысленного текстового запроса. Такой инструмент позволяет увидеть недочеты запроса, да и просто оценить его возможный результат.

Результаты поиска выводятся постранично. По умолчанию на одной странице выдачи располагаются двадцать миниатюр. Миниатюры сопровождаются краткой текстовой характеристикой, которая содержит фрагмент текста исходной веб-страницы, размер изображения и адрес сайта, на котором картинка была найдена.

Инструменты уточнения запроса собраны под строкой запроса. Они немногочисленны, но полезны. С их помощью можно фильтровать картинки определенного размера. Поддерживается отбор только по заранее заданным группам: большие, средние, маленькие и обои. На эту панель также вынесены инструменты контентного анализа изображений. Это уже знакомый нам по форме расширенного поиска переключатель. Портреты, который включает режим распознания лиц на изображениях, а также палитра, с помощью которой можно быстро отбирать в списке выдачи картинки определенной цветовой гаммы (рис. 7.2).


Рис. 7.2. Страница выдачи системы Яндекс.Картинки с включенным фильтром Портреты

Щелчок на миниатюре открывает страницу просмотра. Яндекс.Картинки, в отличие от многих других поисковиков, не открывает сразу страницу, на которой было найдено изображение. Страница просмотра, кроме собственно выбранного изображения, предлагает список копий картинки, найденных на разных сайтах. Список отсортирован по размерам изображений, что позволяет быстро найти наиболее качественный вариант. Следует заметить, что это весьма удобный инструмент, действительно облегчающий поиск. На странице просмотра появляется также ссылка на веб-страницу, на которой была размещена найденная картинка. В нижней части экрана в виде ленты выводятся остальные результаты поиска изображений по заданному пользователем запросу. Это решение также стоит признать удачным, поскольку можно быстро вернуться к результатам поиска и просмотреть другие изображения, не уходя со страницы просмотра.

Яндекс предлагает также отдельный экспериментальный проект. Визуальный поиск. Строго говоря, это не поиск изображений по запросу, а своеобразная рекомендательная система. Пользователю предлагается выбирать среди демонстрируемых фотоснимков ландшафтов и достопримечательностей наиболее понравившиеся картинки. Собрав статистику (может потребоваться от десяти до пятидесяти выборов), система рекомендует посетить определенную страну, а также предлагает варианты поиска дополнительных изображений понравившихся достопримечательностей.

Нельзя не отметить наличие сервиса поиска изображений, оптимизированного для смартфонов и телефонов. Этот сервис доступен в общем пакете сервисов Яндекса для мобильных устройств.

Рассказ о вертикальных базах универсальных поисковиков мы завершим анонсированным во вступлении к этой главе тестом качества их поиска. Сначала попробуем оценить охват поисковых сервисов Google Картинки и Яндекс.Картинки. Для этого достаточно будет посмотреть на общее количество результатов каждого поисковика по одинаковым запросам. В качестве тестового задания выступит фраза «космонавт Юрий Гагарин». Этот запрос, на момент написания данных строк, принес на Google 2510 результатов, на Яндексе – 780. Налицо более чем трехкратное преимущество Google.

Поскольку поиск картинок идет по косвенным признакам, посмотрим, насколько высок уровень информационного шума. На. Яндексе первое изображение, не относящееся напрямую к первому космонавту. Земли и названному в его честь кораблю (это был портрет космонавта № 4, Павла. Поповича), появилось на шестой странице выдачи В Google это событие произошло гораздо раньше, уже на шестнадцатой позиции списка выдачи появилось фото неизвестного спортсмена-воднолыжника. Значительный информационный шум, при котором количество релевантных результатов практически сравнялось с мусором, у Google возник уже на седьмой странице. Яндекс продержался до девятой страницы.

После включения режима распознавания лиц выяснилось, что на обоих поисковиках он работает отменно, сбоев не было. Яндекс нашел 102 портрета, Google – 282. Что же касается точности, то оба поисковика опростоволосились уже на первых страницах выдачи Яндекс показал Павла Поповича на 18-й позиции, а Google – неизвестную даму на 11-й. Информационно-мусорный «полураспад» наступил в Яндексе на четвертой странице (6 из 20 изображений не относились к теме). Заметим, что численное превосходство релевантных результатов на сервисе Яндекс.Картинки сохранилось до последней страницы выдачи Google в аналогичных условиях сдался уже на четвертой странице. Перелом был достаточно резкий: начиная с шестой-седьмой страницы в результатах можно было найти практически кого угодно, но только не космонавта Гагарина.

В случае использования цветовых фильтров при отборе портретов количество результатов предсказуемо и резко сокращается. Максимум результатов на Яндексе дала белая гамма. Правда, там было немало ложных срабатываний на картинки с белым фоном и обводками. Что касается остальных цветов, то Яндекс оказался достаточно требовательным: искомый цвет для прохождения фильтра должен быть преобладающим в изображении. Как и прежде, Google превосходил Яндекс в количестве результатов каждого цвета – у Google список выдачи после применения фильтра измерялся сотнями картинок. Однако нельзя не заметить, что Google демонстрирует другой, гораздо более либеральный подход к фильтрации: для прохождения фильтра на изображении достаточно простого присутствия объекта искомого цвета.

Оглавление книги


Генерация: 1.197. Запросов К БД/Cache: 3 / 0
поделиться
Вверх Вниз