Яндекс для всех
Шрифт:
Однако не всегда использование морфологического анализа желательно. В ряде ситуаций необходимо найти слово в определенном его написании. Такая возможность также существует. Для отключения использования морфологического анализа перед требуемым словом в запросе достаточно поставить восклицательный знак.
Исключить морфологический анализ можно и другим путем — взять искомое слово в кавычки. Кавычки используются и в тех случаях, когда требуется найти определенное слововыражение, цитату. Например, если в строке поиска вы введете "мороз и солнце, день чудесный", то в результатах поиска будут приведены ссылки на страницы, содержащее искомое выражение.
В поисковой системе слова, начинающиеся с букв в разном регистре, считаются разными формами одного слова. Поэтому как бы вы ни написали слово пряжа,
Те, кто искали информацию с помощью Яндекса, знают, что среди найденных документов будут встречаться и такие, в которых содержится только часть слов, входящих в запрос. Что сделать, чтобы важное для вас слово присутствовало в документе в обязательном порядке? Для решения этой проблемы вам надо перед требуемым словом без пробела поставить знак +.
В русском языке, как и в любом другом, есть группа слов, которые встречаются в тексте значительно чаще других. К таким словам относятся предлоги, местоимения, частицы (еще их называют Стоп-слова).Они появляются в текстах так часто, что начинают мешать поиску. Поэтому большинство поисковых машин их игнорирует даже в том случае, когда они встречаются в тексте запроса. Но что делать, если для вашей фразы слово из такого стоп-списка требуется в обязательном порядке? Как и в предыдущем случае, использовать признак обязательности — знак +. Но это не единственный вариант — чуть ранее мы говорили о том, что можно исключить использование морфологического анализа, заключая искомое выражение в кавычки. И тогда поиск выражения "и маятник может шагать в ногу со временем" однозначно приведет вас на страницу замечательного польского писателя С. Е. Леца.
Вы уже догадываетесь, какой ответ будет на вопрос, — а как исключить слово из поиска? Ну не хочу я, чтобы на странице результатов по запросу о компаниях-производителях горных лыж присутствовали предложения горных курортов. В этом случае в строке запроса перед словом, которое вы хотите исключить, необходимо поставить знак —. И тогда запрос может выглядеть так: горные лыжи — курорт — тур — агентство.
Вот те минимальные сведения, знания которых вполне достаточно для выполнения большинства поисковых запросов. Но иногда требования к результатам поиска предъявляются более высокие, и в этом случае нужно использовать расширенный поиск.
1.3.2. Расширенные возможности поиска
Для того чтобы использовать расширенные возможности, перейдите по ссылке расширенный поиск, находящейся под строкой ввода запроса. Вы попадете на новую страницу, где, помимо поля ввода запроса, размещены поля для формирования сложных поисковых условий.
Все выбранные вами условия являются обязательными при обработке запроса. Например, если вы в дополнительных условиях установите требование, чтобы слова запроса находились на одной странице документа, а документ был в формате DOC (Microsoft Word), то в результате получите список документов, в которых искомые слова находятся на одной странице. Ни HTML-страницы, ни другие документы, содержащие искомые слова, в результат поиска включены не будут.
Дополнительные условия разбиты на две группы. Первая группа условий Искомые слова относится к словам и их размещению в документе.
С помощью первого блока условий (табл. 1.1) назначается требование по взаимному расположению искомых слов (иначе — расстояние между словами).
Возможность
определять в запросе взаимное расположение слов на странице или в документе связана с тем, что в Яндексе используются специальные алгоритмы, учитывающие не только морфологию слов, но и их связь между собой (если в запросе указано несколько слов).Яндекс — весьма самостоятельная система, и если вы ей не укажете строгие правила поиска, он будет искать по правилам, применяемым по умолчанию:
Если слова, идущие в запросе одно за другим, тесно связаны между собой, поиск будет происходить в пределах одного предложения. Если связь менее тесная — поиск будет вестись на расстоянии в несколько предложений. В том случае, если Яндекс определит, что слова между собой не связаны, они будут разыскиваться в пределах одного документа.
…запрос продажа автомобилей Украина отличается от запроса продажа автомобили Украины. В первом запросе "точно найденным документом" будет считаться документ, в котором слова "продажа" и "автомобиль" находятся "рядом" (скажем, в одном предложении), а слово "Украина" — "далеко" (скажем, где угодно в документе). Во втором запросе точно найденным документом будет считаться только такой, в котором слова "автомобиль" и "Украина" находятся достаточно близко. Яндекс решает так, потому что фраза "автомобили Украины" синтаксически согласована. То есть, с точки зрения Яндекса, первый запрос нацелен на поиск украинских автомобильных дилеров, а второй — на поиск любых продавцов "Таврий".
Используя настройки расширенного поиска, вы тем самым ужесточаете требования к его результатам и ограничиваете "своеволие" поисковой машины. Незначительный, вроде бы, нюанс, но может существенно сказаться на полученных результатах.
При обычном поиске заданные в запросе слова разыскиваются по всем элементам страницы (табл. 1.2). В данном контексте под элементами понимаются тело страницы, ее заголовок (тот текст, который виден в заголовке браузера), либо ссылки, ведущие со страницы. Вы можете ограничить ареал поиска, выбрав один из перечисленных элементов. И более того, вы можете ужесточить поиск среди ссылок, если в качестве дополнительного параметра укажете, на какой конкретно сайт должна вести ссылка. Это может пригодиться в том случае, если вы знаете сайт, информации на котором вы доверяете. И если в процессе поиска в тексте документа будут ссылки на информацию с этого сайта, вы заранее предполагаете, что сможете доверять и найденной информации.
Еще один элемент настройки — выбор формы представления слова в документе (табл. 1.3). С его помощью можно либо искать слово во всех его морфологических формах, либо в строгом соответствии с написанием в запросе. Использование этого элемента идентично использованию восклицательного знака перед словом в тексте запроса.
А вот эта группа настроек предназначена для отбора соответствующих запросу страниц, но по параметрам, не имеющим отношения к словам. Отбор выполняется по иным требованиям и позволяет сократить количество подобранных ссылок до минимума.
Первое, что предлагается в качестве дополнительного ограничения, — язык документа (страницы). Хотя Яндекс проводит индексирование сайтов только русскоязычной части Интернета, здесь также могут встречаться сайты и документы на разных языках. По умолчанию для поиска язык сайта или документа не важен (например, слово computer может встречаться как в текстах на русском, так и в текстах на английском языке). Если же вас интересуют тексты (страницы сайта, документы) только на определенном языке или группе языков, используйте опцию выбора языка. Можно выбрать определенный язык, а можно, используя клавиши <Shift> или <Ctrl>, выбрать несколько.