Книга: Профессиональный поиск в Интернете
iMetaSearch
iMetaSearch
Программа-поисковик iMetaSearch предназначена для глубокой обработки и сортировка найденных ссылок с помощью оригинальных алгоритмов. К стилю работы с этим поисковиком понадобится привыкнуть, однако он действительно повышает качество поиска.
Интерфейс iMetaSearch разделен на четыре панели: список найденных ссылок, панель просмотра информации о выделенной ссылке и две боковые панели, с помощью которых можно проводить дополнительный анализ результатов. Первая из них – Search Topics – предлагает список предположительных тем, в которые можно объединить найденные ссылки. Второй раздел – Search Words – наоборот, позволяет максимально детализировать поиск за счет работы не с крупными темами, а со списком всех автоматически выделенных программой ключевых слов. Каждый раздел снабжен ползунком, с помощью которого можно быстро определить демонстрируемое программой количество групп и ключевых слов iMetaSearch позволяет добавлять в список используемых поисковиков свои машины. Для этого служит мастер настройки Build Engine.
Автоматический поиск ключевых слов предполагает наличие достаточно серьезных технологий обработки результатов. Для выделения групп и ключевых слов в iMetaSearch используется технология латентного семантического анализа (Latent Semantic Analysis, LSA). В двух словах ее смысл заключается в следующем. Как правило, пользователи составляют короткие запросы, содержащие одно-два ключевых слова, что ведет к размыванию результатов поиска и появлению информационного шума. LSA-система пытается в автоматизированном режиме расширить полученный запрос на основе обратной связи с пользователем. Проще говоря, отработав оригинальный, полученный от пользователя запрос, LSA-система предлагает пользователю указать лучший с его точки зрения результат, проводит его анализ и перестраивает список выдачи с учетом автоматически выделенных дополнительных условий.
Задача сортировки результатов поиска решена в полном соответствии с идеями технологии LSA. Выделив наиболее полезный результат в списке, пользователь тем самым присваивает ему значение релевантности равное ста процентам. Список выдачи немедленно перестраивается с учетом новых данных, полученных в результате такой обратной связи. Программа выводит на первые позиции за выделенной нами ссылкой наиболее похожие на нее по содержанию веб-страницы, указывая степень смыслового подобия как в цифрах, в процентном значении степени совпадения, так и визуально – цветной полоской. Кроме этого семантического стиля доступны и более привычные режимы сортировки – по заголовкам веб-страниц, задействованным поисковикам, и по рейтингу веб-страниц на использованных поисковиках. Результаты поиска можно выгрузить в HTML– или CSV-файл.
Главный недостаток iMetaSearch – очень плохая работа с поисковыми запросами, набранными кириллицей. Это значительно снижает количество пользователей в наших краях, которым данная программа могла бы приносить практическую пользу.
- Chapter 5. Kernel Initialization
- Кто такая Елена Ивашенцева?
- 11.2. Цели процесса
- Рис. 214. Имена почтовых серверов.
- Document
- ГЛАВА 3 Внутренняя структура .NET Compact Framework
- Джордж Буль Отец булевой алгебры
- Removable Storage Media
- Работа пользователей с виртуальной машиной
- 6.5. Общие команды меню Windows-программ. Буфер обмена Windows