Интернет-разведка. Руководство к действию
Шрифт:
Эксперимент расставил акценты иначе. Стоп-слова, независимо от того, закавычены они или нет, одинаково попадают в выдачу.
А вот остальным словам (не входящим в список стоп-слов), которые необходимо в обязательном порядке включить в выдачу, кавычки действительно обеспечивают обязательное включение в результат. Это эквивалентно оператору «плюс» в Яндексе и Гугле.
Вы искали: «с» пингвином, найдено сайтов: 15468, документов: 166651
Вы искали: с пингвином, найдено сайтов: 15468, документов: 166651.
Вы искали: «the» apple please, найдено сайтов: 2700, документов: 16047
Вы искали: the apple please,
Пример работы кавычек в иных случаях, а не только со стоп-словами, приведен в следующем разделе – Логическое «И».
Кроме того, как мы уже говорили, кавычки могут выступать аналогично оператору «восклицательный знак» в Яндексе. Слово, указанное в запросе в кавычках, будет присутствовать в результатах поиска лишь в той форме, в которой вы его зададите.
7. Логическое «И».
Как и в Яндексе с Гуглом, роль логического «И» в Рамблере выполняет пробел. В принципе, можно ввести вместо пробела слово AND, но на практике, по вполне понятным причинам, так обычно не делается.
Подобно Яндексу, Рамблер достаточно вольно обращается со словами, которые соединены пробелом – он может легко выдать не только те документы, где присутствуют ВСЕ слова запроса, но и те, где на одно-два слова меньше.
В этом можно убедиться, сравнив два запроса:
[кошки собаки верблюды зебры носороги]
Вы искали: кошки собаки верблюды зебры носороги, найдено сайтов: 42, документов: 296
http://ci-razvedka.narod.ru/Rambler_Cash_Examples_Folder/Rambler_bez_Nosorogov.html
и
[ «кошки» «собаки» «верблюды» «зебры» «носороги»]
Вы искали: «кошки» «собаки» «верблюды»…, найдено сайтов: 9, документов: 53
http://ci-razvedka.narod.ru/Rambler_Cash_Examples_Folder/Rambler_s_Nosorogami.html.
Во втором случае все без исключения элементы запроса принудительно включены в выдачу – за счет кавычек, поэтому документов в выдаче значительно меньше.
8. Логическое «ИЛИ».
Написание этого оператора приспособлено как для любителей Яндекса, так и для тех, кто предпочитает работать с Гуглом.
Как и в Яндексе, в Рамблере логическое «ИЛИ» может быть представлено вертикальной чертой |.
Для тех, кто привык к логическому «ИЛИ» Гугла, данная система предоставляет возможность пользоваться также оператором OR.
Приоритета нет ни у одного из этих двух указанных вариантов.
Наример:
Вы искали:
дуоденогастрэктомия OR циклопентанпергидрофенантрен,
найдено сайтов: 266, документов: 813.
Вы искали:
дуоденогастрэктомия | циклопентанпергидрофенантрен,
найдено сайтов: 266, документов: 813
9. Логическое «НЕ».
Логическое «НЕ» в Рамблере похоже на таковое в Гугле и распространяется на весь документ. Сузить запрос, подобно Яндексу, до предложения, эта система не позволяет. Записывается логическое «НЕ» как NOT.
Запрос: [журавль]
Вы искали: журавль, найдено сайтов: 43085, документов: 554542
Запрос: [журавль NOT колодец]
Вы искали: журавль NOT колодец, найдено сайтов: 41447, документов: 528644
Запрос: [журавль NOT (колодец | птица)]
Вы искали: журавль NOT (колодец | птица), найдено сайтов: 33059, документов: 390789
Запрос: [журавль NOT (колодец | птица | «журавль»)]
Вы искали: журавль NOT (колодец | птица | «журавль»), найдено сайтов: 23824, документов: 225549
Запрос: [журавль NOT (колодец | птица | «журавль» | «журавлей»)]
Вы искали: журавль NOT (колодец | птица |
«журавль» | «журавлей»), найдено сайтов: 21197, документов: 19238710. Стемминг (а также wildcard).
Рамблер НЕ поддерживает ни стемминг, ни вилдкард.
11. Поиск с заданным расстоянием.
Рамблер не очень качественно поддерживает поиск с расстоянием, несмотря на то, что его «Помощь» утверждает обратное.
Рамблер говорит о том, что когда он ищет слова «в документе», то он реально ищет их на расстоянии не более 40 слов друг от друга. Это, конечно, не поиск с расстоянием, а скорее ограничение расстояния, но, по крайней мере, это прямо заявленное ограничение.
Однако при этом Рамблер утверждает, что уменьшить расстояние в 40 слов можно. Запрос, при котором слова должны находиться рядом, в «Помощи» выглядит так:
[2, красная армия]
Интересно, что при проверке этого утверждения мы обнаружили, что поисковик, похоже, – рекордсмен по числу сайтов, которые можно реально открыть в результатах запроса. Так, в случае с запросом про «красную армию» Рамблер показал более двух с половиной тысяч сайтов и был готов демонстрировать их и дальше, если бы мы не прекратили свой эксперимент.
Результат можно увидеть по адресу:
http://ci-razvedka.narod.ru/Rambler_Cash_Examples_Folder/Three_Thousands_Sites.html.
Еще нам показался необычным (и неудобным) способ перехода к следующей группе сайтов в результатах выдачи. Так, если в Яндексе можно уйти, например, на 20-ю страницу выдачи, после чего внизу страницы с результатами последней доступной для просмотра в группе страниц станет 30-я, то в Рамблере для того, чтобы эта 30-я страница стала видна, требуется сначала выбрать переход к следующей группе сайтов вверху страницы, под строкой с запросом, и только после этого можно выбрать последнюю страницу следующей группы сайтов и перейти на нее. Подобная организация перехода в два приема совершенно непонятна. Однако вернемся к непосредственным результатам запроса
[2, красная армия], —
который, согласно хэлпу Рамблера, должен рассматривать цифру «2» как служебную информацию о расстоянии между словами, и выдавать результаты, где слова «красная» и «армия» находятся рядом.
Наше внимание привлекло то, что цифра «2», которая в поиске должна была играть роль элемента оператора запросов, в выдаче обозначалась как слово, релевантное искомому.
Чтобы не пролистывать результаты по «красной армии» до 47-тысячного сайта, мы попробовали испытать поиск с расстоянием, как он описан в разделе «Помощь», на другом запросе и не полчили положительного результата. Для того чтобы провести такую работу, мы взяли за основу фразу из песни: «Майскими короткими ночами, отгремев, закончились бои».
Запрос: [2, «майскими» «ночами» +отгремев]
Вы искали: 2, «майскими» «ночами» +отгремев, найдено сайтов: 48, документов: 293.
В выдачу попали документы, не содержащие слова запроса непосредственно рядом друг с другом, более того, цифра «2» опять оказалась рассмотрена в качестве части введенного в поисковую строку выражения:
Фотографии, рекомендованные автором Roman Mezenin:: Галерея:: Клуб Foto.ru
… Портрет Комм. 6 / Рек. 2 Майскими короткими ночами / отгремев, закончились бои
05.06.2005 – 26 Kb –– Восстановить текст – Найти похожие – Рубрика: Фото
Морской интернет-клуб
Майскими короткими ночами, Отгремев, закончились бои. Где же вы теперь, друзья – однополчане, Боевые спутники мои? Страницы: 1 2 3 4 5 6 7
18.10.2005 – 10 Kb –– Восстановить текст – Найти похожие.