Чтение онлайн

ЖАНРЫ

Технология XSLT

Валиков Алексей Н.

Шрифт:

...

 </имя>

Пример

<myelement myattribute="myvalue">

 <mysubnode>

sometext

 </mysubnode>

</myelement>

И в том, и в другом случае, имя задает имя элемента, а конструкции вида

атрибутX="значениеХ"
— определяют значения его атрибутов. Имена в XML являются регистро-зависимыми,
то есть имена
MyElement
,
myelement
и
MYELEMENT
различаются. Кроме того, имена в XML могут принадлежать различным пространствам имен, о которых мы поговорим чуть позже.

Элементы являются основной конструкцией языка XML. Организуя содержимое в элементах, можно явно выделить иерархическую структуру документа. Легко заметить, что документ, состоящий из вложенных друг в друга элементов, устроен подобно дереву: родительский элемент является корнем, в то время как дочерние элементы, которые включаются в него, являются ветками, а если они не содержат ничего более, то и листьями. Следующий пример (рис. 1.1) иллюстрирует эту концепцию.

Рис. 1.1. Документ и соответствующее ему дерево элементов

Очень важно понять, что XML-документ логически организован в виде дерева. Дерево является довольно простой структурой для обработки, но при этом выразительная сложность его весьма велика. Древовидная структура является одной из наиболее подходящих абстракций для описания объектов и отношений в реальном мире — возможно именно древовидное устройство наряду с простотой использования обеспечили XML такой потрясающий успех.

Обратимся теперь к синтаксису элементов. EBNF-правило, определяющее элемент, выглядит следующим образом:

[39] element ::= EmptyElemTag

| STag content ETag

Пустому элементу соответствует нетерминал

EmptyElemTag
. Непустой элемент начинается открывающим тегом (нетерминал
STag
), включает некоторое содержимое (
content
) и заканчивается закрывающим тегом (
ETag
).

Открывающий тег состоит из имени (

Name
) и последовательности определений атрибутов (
Attribute
), которые разделены пробельными символами:

[40] STag ::= '<' Name (S Attribute)* S? '>'

В ряде случаев атрибуты тега могут отсутствовать.

Перед закрывающей угловой скобкой тега могут также стоять пробельные символы, поэтому вполне корректной будет следующая запись:

 href="#"

>

В закрывающем теге имени предшествует косая черта ("

/
") и перед закрывающей угловой скобкой тоже могут стоять пробелы:

[42] ETag ::= '</' Name S? '>'

Имена в открывающем и закрывающем тегах должны совпадать.

Содержимое элемента может состоять из элементов (нетерминал

element
), сущностей (
Reference
), секций символьных данных (
CDSect
), инструкций по обработке (
PI
) и комментариев (
Comment
), перемешанных с символьными данными (
CharData
):

[43] content ::= CharData?

((element

| Reference

| CDSect

| PI

| Comment) CharData?)*

Пустой

элемент не имеет содержимого и задается продукцией
EmptyElemTag
в следующем виде:

[44] EmptyElemTag ::= '<' Name (S Attribute)* S? '/>'

Тег пустого элемента выглядит точно так же, как и тег непустого элемента с той лишь разницей, что перед закрывающей угловой скобкой стоит символ косой черты ("

/
"). В этом, кстати, одно из главных отличий синтаксиса языка XML от HTML. Например, вместо
<HR>
в XML следует писать
<HR/>
.

Замечание

Для того чтобы привести синтаксис HTML в соответствие со стандартом XML, был создан язык XHTML. Этот язык полностью соответствует синтаксису XML, что делает возможным обработку XHTML-документов XML-средствами, но при этом набор тегов XHTML идентичен набору тегов языка HTML. К сожалению, далеко не все браузеры поддерживают XHTML. Чаще всего проблемы возникают именно с пустыми элементами (или одиночными тегами в терминах HTML): например, браузеры могут некорректно воспринимать запись вида

<br/>
. В большинстве случаев проблема решается использованием перед косой чертой пробела: запись вида
<br />
, скорее всего, будет обработана корректно.

Атрибут

В элементах можно использовать атрибуты с присвоенными им значениями. Атрибут задается в следующем виде:

атрибут="значение"

Например, в записи гипертекстовой ссылки

<а href="#">Заходите к нам!</а>

элемент

а
имеет атрибут
href
, которому присвоено значение
"http://www.xsltdev.ru"
.

В языке XML атрибуты всегда должны иметь значения. Например, атрибут

selected
в записи элемента

<option selected>

 выбранный элемент

</option>

будет задан с точки зрения XML некорректно, поскольку ему не присвоено значение. Заметим, что в HTML такое определение является вполне нормальным. Такую ошибку легко исправить следующим образом:

<option selected="selected">

 выбранный элемент

</option>

Значения атрибутов заключаются в кавычки — одинарные или двойные, например, в предыдущем случае можно написать:

<option selected='selected'>

 выбранный элемент

</option>

На практике часто бывает необходимым использовать в значениях атрибутов кавычки (например, для записи литералов). Следующий пример иллюстрирует, как это можно делать:

<auth login='"scott"' password="'tiger'"/>

Атрибуту

login
присвоено значение
"scott"
(включая двойные кавычки), атрибуту
password
— значение
'tiger'
(включая одинарные кавычки).

Поделиться с друзьями: