Чтение онлайн

ЖАНРЫ

Яндекс для всех
Шрифт:

Списки имен создаются отдельно для каждой рубрики, региона, сюжета и результатов поиска. Таким образом, пользователь может наблюдать, как меняется состав лиц, о которых пишут журналисты, от Нижнего Новгорода к Иркутску, кто сегодня является наиболее заметной фигурой спортивной сферы, а кто — культурной.

Рейтинги обновляются каждые 10 минут — одновременно с появлением новых сообщений на Яндекс. Новостях, — что позволяет быстро находить упоминания ньюсмейкеров в актуальных сюжетах. Списки имен представлены на всех страницах службы, когда данные позволяют набрать достаточную статистику.

Отзывы об этом сервисе превзошли все ожидания, захотелось двигаться дальше, и тогда появились пресс-портреты.

3.1.6.

Пресс-портреты в Новостях

Читая новость о каком-либо событии, зачастую, если в тексте упоминается какой-либо человек, хочется узнать о нем побольше. Кто он такой, чем и когда занимался, какого его отношение к различным событиям. Самостоятельно собрать подобные сведения об интересующем вас человеке довольно сложно, для этого придется проводить обширный поиск нужной информации.

Яндекс. Новости решил выполнить эту работу за нас. Теперь в составе Новостей появился дополнительный сервис — пресс-портреты. Вот как было написано в пресс-релизе по поводу открытия этого сервиса:

В пресс-портрете на сегодняшний день представлено три типа сведений о человеке: свободные определения человека, послужной список и цитаты. Свободные определения — это звания (полковник, доцент), ученые степени (доктор экономических наук), профессии (литературный критик, известный адвокат) и любые другие описания (хороший семьянин, старый знакомый Маши Ивановой, самый богатый человек в мире). В послужной список входят факты, состоящие из названия организации (Юкос, Министерство экономического развития) и должности (президент, генеральный директор, секретарь), которую человек в ней занимал, занимает (или займет в будущем). В третьем блоке содержатся цитаты человека и цитаты о нем других людей. Каждый факт снабжен текстовой иллюстрацией фрагментом новостного сообщения, из которого была извлечена информация. Кроме того, для каждого факта можно получить все его упоминания в Яндекс. Новостях.

Справочная часть службы Яндекс. Новости состоит более чем из 1 млн пресс-портретов, 30 тыс. из которых обновляется ежедневно. Новостная служба Яндекса была открыта семь лет назад, поэтому большая часть пресс-портретов создана на основе анализа сообщений СМИ с 2000 года, в настоящее время к службе подключаются архивы новостных источников за предыдущие годы, что повышает полноту и точность сервиса.

Как и все остальные работы в Новостях, формирование пресс-портретов выполняется полностью автоматически. Поэтому одной из проблем является создание пресс-портретов для однофамильцев, когда совпадают еще и их имена и фамилии. Поэтому идеальный результат, когда одному человеку соответствует один пресс-портрет, получается не во всех случаях.

Примером может служить поиск человека Иван Иванов. На странице результатов поиска, помимо сюжетов и новостей, приведены ссылки на упоминающихся в этих новостях лиц. Но в списке наиболее известных лиц Ивана Иванова нет. Впрочем, под списком ведущей пятерки есть ссылка на все пресс-портреты, относящиеся к этому поиску, а их 93. Перейдя по этой ссылке, увидим список, в котором "Иван Иванов" встречается на первой странице, затем еще несколько раз в продолжении этого списка.

Искать людей можно не только по фамилии (например, Черномырдин или Михаил Булгаков), но и по названию организации (например, Антей, ibm или Палата лордов) — в этом случае будут найдены все, кто, по сведениям СМИ, имеет или имел к ней отношение.

Миллион пресс-портретов — величина весьма впечатляющая. Но вместе с тем нельзя ожидать, что каждый пресс-портрет содержит все информационные блоки, о которых говорилось выше. Встречаются люди, о которых известно лишь место работы либо упоминание в прессе, без привязки к месту работы, поэтому такая информация входит в блок общих сведений.

Жаль, что отсутствует возможность поиска среди этих подборок, поэтому приходится для поиска пресс-портретов выполнять поиск по фамилии

человека, а затем через блок Упомянутые лицанаходить нужную информацию.

Возвращаюсь заново к тексту этого раздела через месяц с тем, чтобы дополнить уже написанное. Опять подтверждается, что о Яндексе писать очень сложно, здесь постоянно появляется что-то новое и написанное вчера сегодня становится уже неточным. Так произошло и с разделом пресс-портретов.

Найдите на новостной странице ссылку Пресс-портреты. Она расположена под строкой поиска. Перейдя по ссылке, вы откроете страницу (рис. 3.8), на которой представлена информация о назначениях и отставках, состоявшихся на текущую дату, список наиболее упоминаемых в новостях личностей и список людей, отмечающих сегодня свой день рождения. И уже дальше, перейдя по ссылке с фамилии упомянутого человека, вы попадете на страницу его пресс-портрета.

3.1.7. Цитаты в Новостях

Как отделить слухи от фактов? Если новость, о которой вы хотите узнать, является ли она официальной или это действительно слух, подтверждается высказыванием чиновника или лица, заслуживающего доверия, вы будете считать ее фактом. А как можно быстро найти официальное подтверждение той или иной новости? Только поиском, который поможет отыскать официальные высказывания, если они существуют.

Служба Яндекса Цитаты в новостях выполняет это за вас. Эта служба позволяет искать высказывания людей в сообщениях СМИ. Самые популярные и наиболее цитируемые высказывания за последние сутки представлены на главной странице сервиса. Фактически, цитаты отражают картину наиболее значимых событий дня, дают ее с точки зрения главных действующих лиц.

В основе технологии выделения цитат лежит синтаксический анализатор и модуль обработки предикативных конструкций с коммуникативными глаголами и оборотами. Выделяется как прямая речь в кавычках, так и косвенная речь, выраженная придаточными предложениями ("Иванов отметил, что…") и вводными оборотами ("по словам Иванова…"). Использование результатов извлечения всех фактов о человеке и полный анализ всего новостного сообщения позволяют с высокой точностью различать однофамильцев при определении автора высказывания, даже если в предложении с цитатой никакой дополнительной информации, кроме имени и фамилии, указано не было.

Поиск (рис. 3.9) можно вести по нескольким направлениям. Для этого строка поиска разделена на две части. В первую вписывается фамилия человека, чьи высказывания вы хотите найти, во вторую то, на какую тему вы ищете высказывания. Если заполнить только первое поле, будут показаны все выбранные из СМИ цитаты конкретного человека. Если только второе — будут подобраны высказывания всех людей по данной теме. Впрочем, просматривать цитаты отдельного человека можно и со страницы его пресс-портрета, где на первой странице публикуются его последние высказывания, а по ссылке можно перейти ко всем цитатам, имеющимся в распоряжении Яндекса.

Поиск цитат (рис. 3.10) может послужить основой для сбора всевозможных несуразиц, которые допускали в своих выступлениях или интервью известные личности. База для этого обширная — если пресс-портретов насчитывается свыше миллиона, то количество цитат достигает уже четырех миллионов от более чем 630 тыс. авторов.

Обратите внимание еще на один блок, расположенный на главной странице сервиса. В правой колонке приводятся фамилии наиболее цитируемых за текущий день людей. В этой колонке их только 10, но можно увидеть и весь список людей, привлекших внимание к своим выступлениям.

Поделиться с друзьями: