История XML

По мере того, как компания расширяет ассортимент своей продукции или хранилище данных, поддержание своего присутствия в Интернете может стать более обременительным. Поскольку различные предприятия используют различные типы магистральных сетей для своих баз данных, не всегда просто обрабатывать данные или перемещать их в новую систему. Чтобы усовершенствовать информационную архитектуру Всемирной паутины, Джеймс Кларк возглавил команду из одиннадцати человек для создания XML (eXtensible Markup Language), нового языка разметки. Стоит отметить, что язык разметки был полностью разработан посредством еженедельных телеконференций и электронной почты.

Что такое XML?

Данные часто описываются с помощью XML (Extensible Markup Language). Информация может быть отформатирована различными способами, а структурированные данные могут быть переданы в электронном виде через Интернет и интранет благодаря стандарту XML.

Стандартный обобщенный язык разметки (SGML) — это язык, используемый для определения языков разметки, а XML — одно из его ответвлений.

Документация, записи баз данных и финансовые транзакции — это лишь некоторые из многочисленных применений возможностей кодирования XML. XML-данные можно использовать в качестве основы для разработки широкого спектра контента, включая онлайн, печатные и мобильные материалы.

XML-документы, как и их HTML-аналоги, сохраняются в виде файлов американского стандартного кода для обмена информацией (ASCII) и могут редактироваться в любом текстовом редакторе, поддерживающем стандарт Unicode.

Для чего используется XML?

Основная функция XML — предоставить простой текстовый формат для представления структурированной информации, согласно Консорциуму Всемирной паутины (W3C), органу стандартов для Интернета, включая следующее:

  • базовые форматы данных для приложений, таких как в Microsoft Office;
  • техническая документация;
  • параметры конфигурации прикладного программного обеспечения;
  • книги;
  • сделки; и
  • счета-фактуры.

XML позволяет обмениваться структурированной информацией между:

  • программы и программы;
  • программы и люди; и
  • локально и через сети.

W3C определяет стандарт XML и рекомендует его использование для веб-контента. Хотя XML и HTML основаны на платформе SGML, W3C также определил форматы документов XHTML и XHTLM5, которые отражают, соответственно, стандарты HTML и HTML5 для веб-контента.

Как работает XML?

Успех XML заключается в согласованности, которую он обеспечивает для форматов данных. Поскольку формат XML зависит от формата, любое отклонение от ожидаемого формата может привести к тому, что программное обеспечение, предназначенное для чтения или отображения закодированных данных, сообщит об ошибке.

Синтаксический анализатор XML может читать и интерпретировать правильно сформированный XML-документ, который представляет собой допустимый код XML, соответствующий синтаксису XML. Элементы являются строительными блоками всех XML-документов. Они используются для организации и хранения информации. Открывающий и закрывающий теги обозначают начало и конец элемента соответственно, и внутри могут быть размещены дополнительные элементы или простые данные.

Программы, созданные для обработки входных данных XML, могут надежно обрабатывать правильно отформатированные данные, предоставляемые XML. Например, техническая документация может включать элемент «предупреждение», подобный показанному в следующем фрагменте кода XML:

<warning>
     <para>
          <emphasis type="bold">May cause serious injury</emphasis>
          Exercise extreme caution as this procedure could result in serious injury or death if precautions are not taken.
     </para>
</warning

В данном примере эти данные интерпретируются и отображаются по-разному, в зависимости от форм-фактора технической документации. На веб-странице этот элемент может отображаться следующими способами:

WARNING: Exercise extreme caution as this procedure could result in serious injury or death if precautions are not taken.

Один и тот же XML-код может выглядеть совершенно по-разному при отображении в пользовательском интерфейсе бытового устройства по сравнению с распечаткой. Возможно, этот элемент может привести к тому, что выделенный или выделенный текст изменит цвет и/или начнет мигать. При печати текст может быть представлен другим шрифтом и макетом.

Представление не определено в XML-документах, и нет предопределенных тегов. Большинство XML-приложений используют библиотеки тегов, специфичные для определенного формата XML. Хотя большинство пользователей будут придерживаться одного из установленных форматов XML при создании документов, при необходимости могут быть разработаны пользовательские элементы XML.

Синтаксис XML:

Для написания XML-документа существуют простые, но строгие правила [10]:

1. Элементы — это основные строительные блоки документа.

2. XML-элементы не определены заранее. Это дает пользователям больший контроль над ними.

3. Они чувствительны к регистру. Например. : Тег элемента ‹Возраст› не совпадает с ‹возрастом›.

4. Все элементы XML могут иметь атрибуты в парах имя/значение, как и в HTML. Но значения атрибутов всегда следует заключать в кавычки.

например: ‹цвет пера="красный"›Шеффер‹/ручка›

6. Они должны быть правильно вложены

7. У них должны быть открывающие и закрывающие теги

8. Документы должны иметь корневой элемент.

9. Комментарии могут быть обозначены как ‹! — Вставить комментарий здесь →

XML-пример

<?xml version="1.0" encoding="UTF-8"?>
<library>
     <book>
          <title>Harry Potter and the Goblet of Fire</title>
          <author>J. K. Rowling</author>
     </book>
     <book>
          <title>The Lord of the Rings</title>
          <author>J. R. R. Tolkien</author>
     </book>
     <book>
          <title>Fantastic Beasts and Where to Find Them</title>
          <author>J. K. Rowling</author>
     </book>
</library>

В чем преимущество использования XML для документации?

XML широко используется для технической документации, поскольку он может указывать структурную информацию. Затем другие программы могут анализировать эту структуру документа для вывода.

Например, в HTML пользователь может создавать различные типы списков, включая нумерованные списки, но нет возможности явно пометить содержимое как часть пошаговой процедуры. В XML тег процедуры может быть определен для представления списка элементов как шагов процедуры, включая идентификацию различных элементов для обязательных шагов, необязательных шагов и альтернативных шагов.

Рекомендации

Подпишитесь на меня на GitHub: MadhushaPrasad