Documento XML
XML Un documento es un documento de texto plano (sin formato).
Procesador XML (XML processor) y aplicación (application)
Cuando una aplicación necesita leer un documento XML, la aplicación reproduce un procesador XML. El procesador XML (o Parser XML Analyzer, analizador XML en inglés) es un documento que analiza el contenido y pasa la información a una aplicación de formato estructurado. La recomendación de XML especifica qué debe hacer el procesador, pero la aplicación no será responsable de lo que hará esta información.
Caracteres (characters)
Los documentos XML se pueden codificar con diferentes caracteres de juego (iso-8859-1, utf-8 etc...).
Marcas (mark-up) y contenidos (content)
El texto del documento XML se divide en marcas y contenido. Las marcas pueden ser de dos tipos: etiquetas o referencias y entidades. Todo lo que no es marca es el contenido.
Etiquetas (tags)
Una etiqueta es "<" del carácter y termina con el carácter ">". Hay dos tipos:
Existen varias entidades predefinidas:
Algunos caracteres significan que son únicos en XML.
El error le dará:
<message>if salary < 1000 then</message>
Para evitar esto, tenemos estas entidades únicas("<",....)
Referenciai a entidades :
<message>if salary < 1000 then</message>
Nota: "<" y "&" son estrictamente ilegales sólo en XML.
Comentarios o explicaciones
Notas (comentarios)
A veces, los comentarios deben incluirse en documentos XML, que no incluyen procesadores de información ni reproducciones de documentos. Se escriben como HTML, terminando en "<!- -" y "->".
<! -- comentario o descripción -->
Instrucciones de procesamiento (PI, instrucción de procesamiento)
"<?" Comienzan con el conjunto de caracteres y terminan con el conjunto "?>". Documento
instalaciones de procesamientovTiene instrucciones dirigidas a aplicaciones que leen. Pueden aparecer en cualquier parte del documento. Por ejemplo:
<?xml-stylesheet type="text/xsl" href="estilo.xsl" ?>
XML declaración(XML declaration)
Debe aparecer en la primera línea del documento. Aunque la sintaxis en sí no es una instrucción
<?xml version="1.0" encoding="iso-8859-1"?>
<?xml version="1.0" encoding="utf-8"?>
Es importante que el personaje del juego que aparece en la declaración sea en realidad un conjunto de caracteres en el documento que se almacena, si no, el procesador XML puede tener problemas para leer el documento.
Definición de Tipo de Documento (DTD, Document Type Definition)
El DTD es un documento que define la estructura del documento XML, es decir, sus elementos, atributos, entidades, notas, etc. Independientemente del orden en el que van a aparecer y quiénes son sus hijos. El examinador de XML utilizará la verificación de validez del documento.
Declaración de tipo de documento (DOCTYPE, Document type declaration)
"Comenzando con el conjunto de caracteres <? DOCTYPE" y terminando con "?>". Indica los DTD (s) del documento de validación para el documento XML. El DTD puede estar dentro del documento o puede ser un documento externo. Por ejemplo, en el ejemplo siguiente, indicará un documento externo:
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Strict//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-strict.dtd">
Secciones CDATA (CDATA section)
"<! [CDATA [" comience con el conjunto de caracteres y complete el "]]>" grupo. El procesador no lo interpreta como una marca, sino como un texto. Por ejemplo, si incluye caracteres especiales en la sección CDATA (<& ""), el procesador XML no toma la marca como un carácter en lugar de un carácter común
Sintaxis correcta: un documento XML bien formado
XML Especifica la sintaxis a seguir en el idioma:
Se dice que un documento XML está bien formado, si el documento cumple las reglas del W3C para las especificaciones XML. Hay muchas, ya menudo difíciles de entender; Así, vamos a mencionar los más importantes:
<?xml version = "1.0"?>
Esta también es correcta, pero mas larga:
<?xml version = "1.0" encoding="UTF-8" standalone="yes"?>
Algunas notas sobre juegos de carácteres y códecs:
. Un conjunto de caracteres es una colección de caracteres y cada carácter de la colección está vinculado a un número llamado punto de código, por ejemplo ASCIIn, el punto de código de la A es 65.
Unicode (ahora en su versión 6) es un ejemplo de un conjunto de caracteres que tiene todos los caracteres utilizados en todos los alfabetos del mundo.
. Otro ejemplo de juegos de personajes es ISO Latin1, e ISO-8859-1 es una codificación de este juego de carácteres. Son 256 caracteres que coinciden con los primeros 256 caracteres de Unicode.
. Determina cómo se representa el código de codificación de caracteres (codificación) en bytes, por ejemplo el código de código 56, por ejemplo: un byte con un signo de 2 bytes sin formato de pequeño endian, 4 bytes. ..
.UTF-8 (formato de transformación Unicode de 8 bits de longitud variable) es un ejemplo del carácter de codificación de carácter de carácter Unicode.
. El punto de código de letra "A" en latín es U + 0041.
. Es un juego de caracteres ASCII y un codificador de caracteres, es un SuperScript de ASCII que es Unicode (incluido).
Sólo puede haber un elemento raíz que esté "colgando" del nodo raíz (/). Los elementos anteriores serán los descendientes de ese elemento. El único documento XML bien documentado tendría sólo un elemento sin un subconjunto.
Hay elementos que no necesitan ser elementos abiertos y tener un elemento para cerrar.
Los elementos vacíos deben estar cerrados con.> Ejemplo: <br />
Los elementos deben aparecer correctamente anidados, en términos de apertura y cierre; No deben superponerse, es decir, abrir los ítems está en el orden del orden ordenado.