Профессиональный поиск в Интернете
Шрифт:
Рис. 4.3. Страница системы AllPlus в режиме визуального просмотра кластеров Topics Graf
Система AllPlus весьма удобна в работе, а ее визуальный интерфейс хоть и не отличается функциональностью, может реально поспособствовать скорейшему нахождению нужной информации. Заметим, что система способна нормально работать с русскоязычными запросами, однако качество кластеризации уступает ведущим российским проектам.
TouchGraph Google Browser
Крупные современные интернет-поисковики не торопятся внедрять на своих страницах визуальные технологии. Причин этому много – от здорового консерватизма до возможных проблем с
Упомянутые приложения состоят из трех инструментов, визуализирующих результаты поиска на Google, Amazon и Facebook. Возможности этих инструментов, равно как и их интерфейсы, очень похожи – по большому счету, отличаются только источники данных для анализа. Построены эти приложения на технологии Java и соответственно требуют наличия на компьютере Java-машины.
Поскольку возможности предлагаемых приложений близки, мы остановимся только на одном из них – TouchGraph Google Browser. Рабочее пространство этого апплета разделено на несколько зон и содержит любопытный набор инструментов. Большая часть окна приложения отведена зоне просмотра результатов поиска. Боковая панель содержит фильтры и окно информации о найденных сайтах.
Отправив поисковый запрос, пользователь может просмотреть его результаты в виде цветной графической схемы (рис. 4.4). С помощью панели инструментов TouchGraph пользователь может редактировать и перестраивать карту, выводя на нее значки или URL-адреса сайтов, выбирая количество отображаемых кластеров, задавая их цвета и расстояние между узлами. Перестраивать карту можно и вручную, перетаскивая мышью нужные узлы. Дополнительные инструменты сортировки доступны в контекстном меню, которое можно вызвать для любого элемента карты. С их помощью можно развернуть кластер для просмотра вложенных элементов, оставить на карте только выделенный кластер или же просто открыть связанный с выделенным узлом карты веб-сайт. При выборе конкретного сайта на соответствующей панели выводится краткая информация о нем.
Рис. 4.4. Поисковая визуальная система TouchGraph Google Browser
Боковая панель фильтров содержит полный список всех найденных сайтов – как отображенных на карте, так и скрытых, например, из-за выбранного пользователем масштабе изображения. Этот список можно сортировать по различным признакам: названию сайта, адресу. Кроме того, ссылки можно сгруппировать по кластерам. Такой фильтр запускается с помощью кнопок в крайней левой колонке списка – щелкая на них можно вывести отмеченную ссылку ближе к центру карты или же, наоборот, удалить ее из результатов поиска.
WikiMindMap
Проект WikiMindMap предназначен для визуального поиска в рамках сервиса Wikipedia. Изюминка проекта состоит в том, что при визуализации используются технологии так называемых «карт разума». Логичное решение, если учесть, что карты разума как раз и были в свое время придуманы для облегчения восприятия человеком больших объемов текстовой информации.
Интерфейс данного сервиса построен на технологии Flash. Поиск ведется в простом режиме и начинается указанием ключевого слова в поле поиска. Из дополнительных возможностей доступна только возможность выбора одного из одиннадцати поддерживаемых WikiMindMap локализованных версий Wikipedia. Русскоязычной версии (Википедии) в этом списке, к сожалению, пока нет. После нахождения подходящих энциклопедических статей в дело вступает алгоритм сортировки найденного. Найденные записи представляются в виде карты разума со всеми присущими этим картам особенностями, в том числе центральной темой (указанного в поисковом запросе ключевого слова) и иерархической структурой связанных терминов, которые выделяются
пусть и не всегда безгрешно, но вполне достойно (рис. 4.5).Рис. 4.5. Система визуализации WikiMindMap
На первом уровне иерархии WikiMindMap обычно находятся не отдельные термины, а их тематические группы, которые можно раскрывать, щелкая на значке +. Кнопки с зелеными стрелками перестраивают карту, помещая в ее центр соответствующее ключевое слово. Щелчок на конкретном термине открывает соответствующую страницу Wikipedia. Кроме страниц Wikipedia, на карте могут присутствовать и ссылки на внешние ресурсы. Они также берутся со страниц энциклопедии и помечаются особым значком. В результате привычная энциклопедия приобретает новые черты, информация автоматически структурируется, что действительно совершенствует процесс поиска справочной информации. Заметим, что работает система весьма и весьма быстро.
Полученную онлайновую карту можно сохранить на своем компьютере как файл в формате популярного свободного редактора карт разума FreeMind. Можно скачать и саму программу WikiMindMap. На сайте проекта представлено несколько различных скомпилированных версий, а также выложен архив с исходным кодом WikiMindMap.
Universe
Сервис Universe – это проект, находящийся на грани собственно интернет-поиска и изобразительного искусства. Для поиска применяются стандартные инструменты новостного сервиса Daylife, на серверах которого и работает Universe. Визуальный интерфейс проекта выполнен с помощью другой готовой технологии – инструментов проекта Processing.
Возможности составления запроса в Universe скромные – предусмотрен только режим простого поиска. После запуска поискового механизма система сама генерирует визуальную «вселенную», которая выглядит именно как карта звездного неба. Просмотр предлагается начать со щелчка на карте, после чего в ее центр выводится основной термин поиска. Дополнительные результаты демонстрируются в виде своеобразного кольца вокруг центральной темы (рис. 4.6).
Рис. 4.6. Система Universe предлагает оригинальный визуальный интерфейс поиска
При поиске и группировке новостей данный ресурс пытается автоматически устанавливать связи между событиями, персоналиями и сообщениями различного типа (текстовыми, видео, фото), проходящими в общем потоке новостей.
С технической точки зрения Universe – это Java-апплет, поэтому для его работы на компьютере должна быть установлена последняя версия Java-машины. Кроме того, апплет достаточно требователен к компьютеру пользователя. Кроме естественного для веб-приложения требования быстрого интернет-канала, для использования Universe рекомендуется наличие на компьютере пользователя не менее 2. Гбайт оперативной памяти. Для относительно маломощных устройств предлагается более демократичная версия Universe Mini. Она загружает меньшее количество результатов за сеанс поиска, а также выводит визуальную карту не в полноэкранном режиме, а в небольшом окне, что благоприятно сказывается на быстродействии.
Выводы и рекомендации
В этой главе рассмотрены два интересных направления совершенствования интернет-поиска. Современные семантические поисковики являются в большей степени экспериментальными машинами, находящимися в стадии развития. Для того чтобы получить реальную пользу от использования таких поисковиков, приходится, как обычно, учить «матчасть» и держать в уме особенности современной реализации алгоритмов таких машин при составлении собственных поисковых запросов. Поэтому чтобы получить практическую выгоду от их применения, все равно придется конструировать запросы с оглядкой на ограниченные возможности их машинного разбора. Наилучшим образом такие машины обрабатывают прямые вопросы, содержащие более-менее точные указания на область поиска, то есть слова «Где?», «Когда?», «Сколько?» и им подобные. В таких случаях результаты выдачи семантических машин действительно могут оказаться более качественными, чем у обычных универсальных поисковиков, в чем нетрудно убедиться самостоятельно.