XML, que significa "eXtensible Markup Language", es un formato de archivo utilizado para almacenar y transportar datos. Fue diseñado para ser tanto humano como máquina legible.
Es uno de los lenguajes más utilizado para llevar a cabo la transferencia de información entre sistemas.
Algunas características clave de XML son las siguientes:
Estructura jerárquica: XML utiliza etiquetas (similares a HTML) para definir los datos. Estas etiquetas pueden anidar para crear una estructura jerárquica, lo que facilita la organización y el agrupamiento de datos relacionados.
Autodescriptivo: Las etiquetas en XML son descriptivas, lo que significa que el nombre de la etiqueta suele indicar el tipo de datos que contiene. Por ejemplo, <nombre>Juan</nombre> indica claramente que el contenido es un nombre.
Extensible: Los usuarios pueden definir sus propias etiquetas y estructuras de documentos, lo que hace que XML sea extremadamente adaptable y útil para una variedad de aplicaciones y industrias.
Transporte de datos: XML es ampliamente utilizado para el intercambio de datos a través de Internet debido a su capacidad para ser leído tanto por humanos como por máquinas, y su compatibilidad con diferentes sistemas y tecnologías.
Independencia de la plataforma: XML es un formato independiente del sistema, lo que significa que los datos escritos en XML pueden ser utilizados en cualquier sistema operativo y aplicación que soporte XML.
Soporte para espacios de nombres: XML admite espacios de nombres, lo que ayuda a evitar conflictos de nombres en los elementos y proporciona una forma de calificar elementos y atributos.
Validación: Los documentos XML pueden ser validados contra esquemas o DTDs (Document Type Definitions) para asegurarse de que la estructura y el contenido del documento cumplan con las definiciones específicas.
Los documentos XML consisten en texto sin formato y contienen etiquetas personalizadas definidas por el programador. Se aconseja que estas etiquetas sean lo más explicativas posible. Para su creación, se emplean los signos de menor que "<", mayor que ">" y la barra oblicua "/".
Las etiquetas son utilizadas para darle sentido a la información.
<?xml version="1.0" encoding="UTF-8"?>
<libreria>
<libro>
<titulo>El Principito</titulo>
<autor>Antoine de Saint-Exupéry</autor>
<anioPublicacion>1943</anioPublicacion>
</libro>
<libro>
<titulo>1984</titulo>
<autor>George Orwell</autor>
<anioPublicacion>1949</anioPublicacion>
</libro>
</libreria>
Este XML representa una lista de libros en una librería. Cada libro tiene su propio conjunto de etiquetas que describen el título, el autor y el año de publicación. Aquí se pueden observar las características clave de XML, como las etiquetas de apertura y cierre, la estructura jerárquica y la facilidad para ser leído tanto por humanos como por máquinas.
En XML, un elemento vacío es aquel que no tiene contenido, es decir, no tiene texto ni elementos anidados dentro de él. A menudo, los elementos vacíos se utilizan para representar datos que solo necesitan una etiqueta sin contenido adicional. Estos elementos pueden escribirse de dos formas:
Usando una etiqueta de apertura y una de cierre: Por ejemplo, <elemento></elemento>.
Usando una etiqueta auto-cerrada: Por ejemplo, <elemento/>.
Para escribir el elemento "nombre" vacío, se puede escribir:
<nombre></nombre>
<nombre/>
En XML, la relación entre padres e hijos describe la estructura jerárquica de los elementos dentro del documento.
Elemento Padre: Es aquel que contiene otros elementos. En una estructura jerárquica, es el elemento de nivel superior que engloba a uno o más elementos.
Elemento Hijo: Son los elementos contenidos dentro de un elemento padre. Pueden tener sus propios elementos hijos, creando así múltiples niveles de jerarquía.
Aquí, <padre> es el elemento padre que contiene dos elementos hijos: <hijo1> y <hijo2>. Cada uno de estos elementos hijos puede tener a su vez sus propios hijos, ampliando la jerarquía.
<padre>
<hijo1>Valor 1</hijo1>
<hijo2>Valor 2</hijo2>
</padre>
El elemento raíz en un documento XML es el único elemento que se encuentra en el nivel superior de la estructura del documento. Actúa como un contenedor principal para todos los demás elementos y establece el alcance del documento XML.
Este elemento raíz es esencial porque:
Define el tipo de documento XML: El elemento raíz da una idea del contenido y la estructura del documento.
Es único: Un documento XML debe tener exactamente un elemento raíz, que envuelve todos los demás elementos.
Establece el contexto y el espacio de nombres: Todos los otros elementos en el documento XML son descendientes de este elemento raíz y heredan su contexto.
Todo documento XML tiene que tener un único elemento raíz (padre) del que desciendan todos los demás.
Los elementos con contenido mixto en XML son aquellos que pueden contener tanto elementos (etiquetas) como texto. Esta característica permite mayor flexibilidad en la estructura del documento XML, ya que no se limita a tener solo texto o solo elementos anidados dentro de una etiqueta.
<libro>
El autor de <titulo>El Principito</titulo> es Antoine de Saint-Exupéry.
</libro>
En este ejemplo, el elemento <libro> contiene tanto texto ("El autor de") como otro elemento XML (<titulo>). Esto es útil en situaciones donde se necesita intercalar texto y elementos, como en documentos que contienen marcado dentro de párrafos de texto.