Чтение онлайн

ЖАНРЫ

Поиск в интернете

Гультяев Алексей Константинович

Шрифт:
 

Итак, еще раз подчеркнем, что загружаемая браузером страница может содержать не только текстовую информацию, но и другие элементы, способные привлечь внимание посетителя сами по себе. Скажем, если страница посвящена отчету о футбольном матче, то некий посетитель может заинтересоваться только фотографиями и полностью проигнорировать текст с комментариями. Можно предположить, что при поиске в Интернете такой посетитель будет пытаться найти в первую очередь страницы с «футбольными» иллюстрациями либо непосредственно файлы снимков.

ПРИМЕЧАНИЕ: Учитывая повышенный интерес посетителей Интернета к мультимедийным материалам, владельцы многих веб-сайтов превратили свои владения в подлинные «склады» таких ресурсов. Большой популярностью пользуются, в частности,

специализированные хранилища музыкальных файлов в формате MP3. Подробнее об особенностях поиска на таких сайтах рассказано в третьей главе.

Читателю, вероятно, знакомо выражение «ресурсы Интернета», упомянутое выше. Оно обычно используется для обозначения всей информации, представленной в Интернете, независимо от ее типа и формата. То есть к ресурсам относятся и HTML-файлы, и графические файлы, и файлы других типов, к которым разрешен доступ посетителям Сети. Очевидно, что технология поиска зависит от вида искомого ресурса. Однако наличие в Интернете единой системы адресации в значительной степени сглаживает эти различия.

Адресация в Интернете

Если вы хотите с кем-то пообщаться в «обычной», некомпьютерной, жизни, то вам потребуется адрес. Как правило, адреса организованы в виде иерархической системы:

• страна город улица дом квартира или

• телефонный код страны – код города – телефонный номер абонента.

В Интернете тоже принята иерархическая система адресов, она имеет пять уровней. Уровни называют доменами (областями). Самый верхний, корневой домен нулевого уровня – это WWW в целом. Самый нижний (четвертый) уровень соответствует конкретному компьютеру, подключенному к Сети.

Доменные имена

Правила адресации определены так называемым сетевым протоколом, или IP-протоколом (IP – Internet Protocol).

ПРИМЕЧАНИЕ Сетевой протокол – это набор правил и требований, определяющих порядок обмена данными в Сети. Он учитывается при разработке компьютерных программ и технических устройств, обеспечивающих передачу и прием данных в Сети. Если программа или устройство отвечает требованиям сетевого протокола, говорят, что она поддерживает этот протокол.

 

По названию протокола используемые в Интернете адреса стали называть IP-адресами. Каждый IP-адрес является уникальным и состоит из четырех чисел (от о до 255 включительно), разделенных точками. Например, наугад выбранная комбинация 195.19.23.167 вполне может оказаться IP-адресом какого-нибудь реального компьютера.

Крайнее слева число соответствует самому высокому уровню, а крайнее справа – конкретному компьютеру, то есть самому нижнему уровню иерархии (рис. 1.4).

Недостатком IP-адреса является то, что цифровой код сложен для запоминания и восприятия посетителями Сети. Этот недостаток исправили очень просто: заменили цифровой код символьными обозначениями (то есть более или менее осмысленными словами или аббревиатурами). Скажем, комбинация my.group.spb.ru – пример символьного эквивалента цифрового IP-адреса. IP-адрес, представленный в символьной форме, называют доменным именем.

Рис. 1.4. Структура IP-адреса.


В отличие от IP-адреса, уровни иерархии в доменном имени расположены в обратном порядке: самому верхнему уровню (домену нулевого уровня) соответствует крайняя справа точка. Стоящая слева от нее последовательность символов (в приведенном выше примере – ru) – это имя домена первого уровня, и так далее. Крайняя левая часть доменного имени соответствует имени компьютера, подключенного к Сети.

ПРИМЕЧАНИЕ: Как правило, корневой домен (который обозначается самой правой точкой) при написании доменного имени не указывается.

Еще одно существенное отличие доменного имени от IP-адреса состоит в том, что оно не обязательно должно состоять из четырех частей. Вы можете встретить доменное имя компьютера, которое содержит три, пять или даже шесть частей. Например, доменное имя веб-узла издательства «Питер» – www.piter.com.

Состав частей доменного имени зависит от логической структуры того домена, к которому относится компьютер (рис. 1.5).

Контроль

за использованием доменных имен осуществляет специальная служба Сети – Служба доменных имен (Domain Name Service, DNS). Основная задача DNS – корректно сопоставить доменному имени компьютера его IP-адрес. Процедуру сопоставления IP-адреса доменного имени обычно называют разрешением (resolving).

Поиск IP-адреса по доменному имени выполняют так называемые серверы имен (nameserver), чаще их называют DNS-серверами. Каждый DNS-сервер хранит информацию о нескольких доменах. Так называемые корневые серверы хранят информацию о серверах имен для всех доменов первого уровня (top-level domains, TLD). В настоящее время насчитывается 13 корневых серверов, и все они расположены в США. Если DNS-сервер какого-либо уровня не может самостоятельно разрешить доменное имя, он обращается за информацией к вышестоящему DNS-серверу. Это повторяется до тех пор, пока ответ не будет найден или пока не выяснится, что указанного адреса не существует.

Рис. 1.5. Доменное имя может иметь различную длину.


Давайте рассмотрим работу DNS на примере. Предположим, работая за компьютером с именем comp.set.spb.ru, вы хотите зайти на сайт по адресу www.piter.com.

Прежде всего ваш компьютер отправит запрос на определение IP-адреса сайта www.piter.com DNS-серверу организации, которая поддерживает домен set. Допустим, на этом DNS-сервере требуемый IP-адрес отсутствует. В таком случае DNS-сервер перешлет запрос вышестоящему серверу, поддерживающему домен spb. Если и здесь ничего не удастся найти, запрос отправляется DNS-серверу домена. ru. Этот сервер тоже может «не знать», где искать нужный сайт, но он прекрасно «знает», где находится DNS-сервер домена. com, ему он и переадресует ваш запрос. Сервер домена. com содержит информацию обо всех субдоменах, в том числе о домене piter.com. Но о том, где в домене piter находится веб-сервер www.piter.com, он знать не обязан. Поэтому он посылает запрос DNS-серверу издательства «Питер» и уже от него получает IP-адрес искомого веб-сервера. Этот адрес передается назад по цепочке запросов и в конце концов поступает на ваш компьютер. И только после этого браузер обращается напрямую по указанному IP-адресу за получением нужной веб-страницы (рис. 1.6).

В настоящее время практически каждая цивилизованная страна имеет свой домен первого уровня (на сегодняшний день насчитывается около 300 таких доменов). Имя домена соответствует международному двухбуквенному коду страны по стандарту ISO. Например, имя домена России – ru, Украины – ua, США – us. Единственное исключение – Великобритания. Ее код ISO – gb, однако в качестве доменного имени используются буквы uk.

Рис. 1.6. Упрощенная схема поиска IP-адреса.


Внутри доменов первого уровня обычно используется дополнительное деление. Например, географические домены обычно подразделяются в соответствии с административным устройством данного сообщества. В России достаточно распространено создание доменов второго уровня для крупных городов. Так, домен Санкт-Петербурга называется spb.ru, домен Москвы – msk.ru.

Наряду с географическим принципом образования доменов широко используются домены первого уровня, оставшиеся с тех времен, когда границы Интернета «совпадали» с границами США. Наиболее известными из них являются:.com – коммерческие организации, net – сетевые организации, edu – образовательные учреждения, org – общественные (некоммерческие) организации, mil – учреждения министерства обороны США.

ПРИМЕЧАНИЕ: В 2001 году было введено еще несколько имен для доменов первого уровня:.name – для физических лиц, museum – для музеев и других «сокровищниц мировой культуры», aero – для организаций и фирм, связанных с авиационными перевозками, biz – для коммерческих организаций. А в 2002 список пополнился именем. pro. Предполагается, что в соответствующем домене будут регистрироваться организации и учреждения, занимающиеся профессиональной деятельностью в различных областях науки и техники. Пока ни один из перечисленных доменов не стал так популярен, как их предшественники.

Поделиться с друзьями: