Чтение онлайн

ЖАНРЫ

Технология XSLT

Валиков Алексей Н.

Шрифт:

□ Windows-1251;

□ KOI8-R;

□ Cp866;

□ ISO-8859-5.

Техническая рекомендация XML оговаривает, что. в тех случаях, когда имя использованной кодировки не является стандартным, оно должно указываться с префиксом "

x-
", например:

<?xml version="1.0" encoding="x-BK-CYR"?>

Псевдоатрибуту

standalone
соответствует EBNF-правило
SDDecl
:

[32] SDDecl ::= S 'standalone' Eq

(("'" ('yes' | 'no') "'")

| ( '"' ('yes' | 'no') '"' ) )

Расшифровывается

это правило очень просто: псевдоатрибут
standalone
может иметь значение
yes
или
no
, заключенное в одинарные или двойные кавычки.

Секции СDATA

Секции CDATA выделяют части документа, внутри которых текст не должен восприниматься как разметка. CDATA означает буквально "character data" — символьные данные. Секции CDATA задаются следующим образом:

<![CDATA[содержимое]]>

Поскольку синтаксис разметки документов в XML имеет текстовую форму, часто бывает, что само содержимое документа может быть воспринято как разметка. В том случае, когда этого желательно избежать, самым простым выходом будет поместить такие данные внутрь секции CDATA.

Пример

Следующий текст в документе

<slogan>Покупайте наших слонов!</slogan>

будет воспринят как разметка. Для того чтобы избежать этого, достаточно написать

<![СDАТА[<slogan>Покупайте наших слонов!</slogan>]]>

Такая конструкция уже будет воспринята как символьные данные. Другим примером может быть использование символов "

<
" и "
&
":

<![CDATA[ if ( а < b && b < с ) {...} ]]>

Секции символьных данных задаются четырьмя довольно простыми правилами:

[18] CDSect ::= CDStart CData CDEnd

[19] CDStart ::= '<![CDATA['

[20] CData ::= Char* - (Char* ']]>' Char*))

[21] CDEnd ::= ']]>'

Содержимое секции символьных данных, отвечающее продукции CData, может состоять из любых символов, в том числе "

<
" и "
&
", которые не будут восприниматься как разметка. Единственное, чего секции CDATA не могут включать — это последовательность "
]]>
", которая завершает символьную секцию.

Комментарии (comments)

XML-документ может содержать комментарии, которые записываются следующим образом:

<!-- текст комментария– ->

Текст комментария может состоять из любых символов, кроме двух минусов

подряд ("

– -
"). Кроме этого, комментарий не должен заканчиваться символом "
" .

Пример комментария:

...

<!-- product title="Слон">

 Покупайте
наших слонов!

</product-->

...

Продукция комментария называется в XML

Comment
и имеет следующий вид:

[15] Comment ::= '<!--' ((Char - '-') | ('-' (Char- '-')))* '-->'

Выражение

((Char - '-') | ('-' (Char - '-')))*
означает, что содержимое комментария не должно оканчиваться на знак "
" или содержать два таких знака последовательно.

Пространства имён

XML позволяет создавать наборы элементов с любыми синтаксически допустимыми именами и определять с их помощью логическую структуру документов практически произвольной сложности.

За время существования XML была создана разметка для большого числа задач. На таких Web-сайтах, как http://www.xml.org, http://www.schema.net и http://www.ebxml.org можно с большой вероятностью найти определения структуры документов для огромного количества предметных областей. Во многих случаях уже созданные схемы помогут сократить этап концептуального моделирования документов.

Часто случается, что различные логические схемы документов используют одни и те же имена элементов в различных смыслах. Это не является проблемой, если в документе используется только одна схема. Но представьте себе ситуацию, когда в одном и том же документе необходимо использовать элементы нескольких различных схем — будет попросту невозможно определить, какой элемент относится к какой схеме, и, вообще, какие схемы были использованы в документе. Для решения этих проблем в XML используются пространства имен (англ. namespaces).

Чтобы различать схемы документов, каждой из них ставится в соответствие уникальный идентификатор ресурса (URI). Две схемы будут считаться тождественными тогда и только тогда, когда их уникальные идентификаторы будут совпадать, поэтому нужно осторожно выбирать URI для создаваемой схемы документа. Очень часто в качестве URI используются URL различных Web-сайтов. Это совсем не означает, что по указанному адресу должно что-либо находиться, просто такой способ практически гарантирует уникальность — вряд ли кому придет в голову использовать адрес чужого сервера в качестве идентификатора своей схемы.

Пример

Уникальный идентификатор языка XSLT, которому посвящена эта книга, имеет вид:

http://www.w3.org/1999/XSL/Transform

Для того чтобы определить, какой схеме принадлежит тот или иной элемент в документе, можно использовать механизм префиксов. Префиксы пространств имен задаются как атрибуты с именами, начинающимися последовательностью

xmlns
, и имеют следующий вид:

<префикс:элемент xmlns:префикс="URI">

Поделиться с друзьями: