Чтение онлайн

ЖАНРЫ

Профессиональный поиск в Интернете

Кутовенко Алексей

Шрифт:

Следующая важная особенность семантических поисковиков – результаты поиска. Если обычные поисковики в основном предоставляют пользователю ссылки на веб-сайты, где предположительно находится необходимая информация, то семантические поисковики пытаются давать прямые ответы, самостоятельно выделяя в проиндексированных документах нужные фрагменты. В результате страница выдачи подобного поисковика выглядит несколько необычно. Вместо списка релевантных запросу ссылок пользователю предлагается список прямых ответов на заданный пользователем вопрос. Другими словами, главным режимом работы семантического поисковика является режим фактографического поиска.

Практически все современные семантические поисковики в настоящее время находятся в стадии бета-тестирования. В их работе еще встречается немало ограничений. Для эффективного использования таких машин в повседневной работе необходимо не только обладать сведениями об их возможностях, но и представлять себе сферу их применения, то есть ту область, в которой

они обладают преимуществами по сравнению с обычными поисковиками.

Dialogus

Система Dialogus реализует только режим простого поиска, не предусматривая каких-либо дополнительных фильтров или инструментов составления запроса. Пользовательские запросы принимаются только в виде прямых вопросов. После отправки запроса Dialogus демонстрирует интересную особенность своего интерфейса: поисковая машина с помощью флэш-ролика иллюстрирует процесс обработки запроса в режиме реального времени. Пусть эта опция и не несет практической нагрузки, однако любопытно видеть, как запрос проходит фазы разбора и формализации, нормализации терминов, синтаксического и морфологического анализа, предварительного поиска в собственной базе Dialogus и Сети в целом, поиска стоп-слов и собственно выдачи текстового ответа. Страница выдачи Dialogus разделена на две главные зоны: рабочую область, содержащую основной список результатов, и боковую вспомогательную панель (рис. 4.1). В ней выводится список запросов, поступивших в систему от других пользователей и тематически похожих на заданный вами, а также, что особенно интересно, проводится поиск изображений, подходящих, по мнению поисковика, под тематику вашего запроса. Правда, эффективность поиска изображений пока невысока, равно как и релевантность предлагаемых картинок.

Рис. 4.1. Семантическая поисковая система Dialogus

Ответы Dialogus представляют собой краткие текстовые выдержки, в которых, по мнению системы, находится ответ на заданный вопрос. Каждый фрагмент сопровождается несколькими вспомогательными кнопками. С их помощью можно просмотреть более крупный фрагмент текста ответа или перейти на содержащую его веб-страницу. Для повышения точности работы системы применена обратная связь. Пользователям предлагается оценить ответ по пятибалльной шкале. Кроме того, предусмотрена кнопка, позволяющая пометить ответ как спам.

Заметим, что семантическая подсистема данного проекта действительно работает. Если при разборе вопросов могут происходить сбои в ходе формализации запроса, то выдаваемые прямые ответы, как правило, действительно полезны и сокращают время поиска конкретной информации.

AskNet

Система AskNet Global Search предлагает режим простого поиска по заданному пользователем вопросу. Отличие данной системы от конкурентов проявляется в возможности вести поиск в нескольких вертикальных базах, доступ к которым можно получить с помощью вкладок над полем запроса. Предлагается шесть таких баз, а также режим поиска во всех доступных источниках. При переходе к поиску в вертикальной базе под полем поиска предлагается выбрать источники, на которые будет отправлен запрос. Для поиска новостей предлагаются ресурсы Lenta.ru, Газета. ру, CNews и РБК. Выбор из трех-четырех источников возможен и в других вертикальных базах: «Энциклопедии», «Словари», «Магазины», «Медицина» и «Адреса».

AskNet лучше всего понимает только определенные типы вопросов. Перечень поддерживаемых в настоящее время конструкций на русском и английском языках подробно разобран в справочной системе проекта. Корректная работа алгоритма разбора запроса в форме свободно сформулированного вопросительного предложения гарантируется, если в нем содержится не более двух сказуемых или трех других однородных членов. Вопрос также должен быть грамматически верным и синтаксически согласованным. В принципе, AskNet может обработать и предложение с ошибками, однако ждать в таком случае достойного результата сложно. Если система не сможет обработать ваш запрос с учетом семантики, поиск будет проведен в обычном режиме, то есть только по ключевым словам.

При поступлении запроса система самостоятельно определяет наиболее вероятный объект поиска. При поиске учитываются синонимы, обрабатываются аббревиатуры и словесная запись цифр и дат. Семантические технологии в AskNet также работают на этапе выдачи результатов – связи между словами в поисковой фразе учитываются при сортировке результатов. Скорость работы данной системы не отличается быстротой, от принятия запроса до выдачи ответа может пройти около десяти секунд.

Страница выдачи AskNet Global Search предлагает традиционный список ссылок, сопровождаемый краткими выдержками из текста

найденных веб-страниц, в которых красным цветом выделяются ключевые слова, содержавшиеся в вашем поисковом запросе, а зеленым – сформулированные системой на основе семантической обработки запроса. Оригинальный документ можно просмотреть, не покидая страницы поиска, для чего предусмотрена ссылка. Подробно, расположенная возле каждой позиции выдачи Она открывает на странице результатов фрейм, в который и загружается исходная страница. Если системе удалось найти прямые и точные ответы на заданный вопрос, например, дату, имя, численное значение какого-либо параметра, то эти данные приводятся отдельным коротким списком над основным списком выдачи.

Кроме стандартной версии семантического интернет-поиска, предлагается сервис AskNet Global Search Mobile. В настоящее время это единственное на рынке предложение русского семантического поиска, оптимизированное для мобильных устройств. В отличие от обычного режима, здесь нельзя выбирать вертикальные базы для поиска. К сожалению, данный сервис часто страдает от сбоев доступа.

Экспериментальные интерфейсы интернет-поисковиков

Одним из направлений улучшения качества работы пользователей с системами интернет-поиска стали эксперименты в области пользовательского интерфейса – визитной карточки любого поисковика. Отметим, что интерфейс не просто выполняет сугубо эстетическую функцию, но является средством построения удобной рабочей среды, необходимой для эффективного поиска. Кроме того, именно от его устройства во многом зависит перечень предлагаемых пользователю инструментов составления запроса и уточнения результатов поиска. В последние годы появилось достаточное количество поисковых проектов с нестандартными, экспериментальными интерфейсами. Попробуем разобраться, что они предлагают пользователям и готовы ли они отправить на свалку истории старый добрый интерфейс с выдачей результатов в виде текстового списка из десяти ссылок на страницу.

Прежде чем начинать рассказ об экспериментальных интерфейсах, попробуем вкратце разобраться с недостатками традиционного интерфейса. Привычная страница выдачи интернет-поисковика, как правило, представляет собой список из десяти текстовых ссылок, сопровождаемых краткой характеристикой. Как показывает практика, редкий пользователь просматривает больше двух-трех таких страниц, на которых обычно располагаются наиболее популярные ресурсы. Это порождает серьезную проблему «длинного хвоста» результатов, которые без дополнительного уточнения запроса пользователем, как правило, не просматриваются. Одним из способов решения данной проблемы является уже описанная нами ранее технология кластеризации, однако решать ее можно и с помощью экспериментальных интерфейсов.

Характерной чертой современных интернет-поисковиков является возможность поиска в вертикальных базах данных. Как правило, каждому виду поиска выделяют отдельную страницу, иногда со своими специфическими инструментами составления запроса и демонстрации результатов. Такая раздельная организация интерфейса удобна для глубокого поиска в конкретной базе данных, однако порождает ряд проблем в случаях, когда требуется собрать разнородный материал по определенной теме или же сравнить результаты выдачи по тематическому запросу на нескольких интернет-поисковиках. Проведя поиск в веб-документах, а затем переходя к поиску изображений, мы теряем результаты первого поиска и не можем одновременно просматривать оба списка выдачи Это не всегда удобно. Приходится одновременно открывать и просматривать несколько страниц, а затем думать о том, как бы удобнее сохранить результаты поиска. Данные операции требуют затрат времени и лишних усилий. Решение проблемы также может лежать в области разработки нестандартных пользовательских интерфейсов. Не случайно некоторые крупные универсальные поисковики стали «подмешивать» в результаты веб-поиска позиции, найденные в вертикальных базах.

Поисковики с традиционным интерфейсом для уточнения запроса предлагают весьма ограниченный набор инструментов. Как правило, это подсказки при вводе запроса и разные варианты запроса, которые помогают поправить орфографию или просмотреть близкие по написанию варианты слов из запроса. Некоторые экспериментальные поисковики предлагают интерфейсы с большим количеством оригинальных инструментов уточнения запроса.

Экспериментальные пользовательские интерфейсы поиска, опирающиеся на различные визуальные приемы повышения эффективности поиска, в отношении применяемых средств и решаемых задач можно условно разделить на группы.

К первой отнесем поисковики, интерфейсы которых построены с применением вкладок или же настраиваемого перечня колонок. Такой подход призван помочь пользователю при одновременном просмотре результатов поиска из нескольких источников: вертикальных баз одного поисковика или нескольких поисковиков в случае системы интернет-метапоиска.

Интерфейсы второй группы экспериментальных поисковиков можно назвать «облаками», или «картами». В них применяются различные способы визуализации результатов поиска, позволяющие, с одной стороны, увеличить количество отображаемых на одной странице результатов, с другой – предоставляющие пользователям дополнительные инструменты уточнения запроса и просмотра его результатов.

Поделиться с друзьями: