# Introducción a XML

Este notebook está diseñado para enseñar a los estudiantes los conceptos básicos de XML (eXtensible Markup Language), su estructura y usos comunes en el desarrollo de aplicaciones web y intercambio de datos.

## ¿Qué es XML?

XML es un lenguaje de marcado que se utiliza para almacenar y transportar datos de manera estructurada. A diferencia de otros lenguajes de marcado como HTML, XML no tiene un conjunto fijo de etiquetas; en su lugar, permite a los usuarios definir sus propias etiquetas.

## Elementos de XML

Un documento XML se compone de varios elementos, que pueden tener atributos y valores. La estructura básica de un documento XML es la siguiente:

```xml
<elemento>
    <subelemento atributo="valor">Contenido</subelemento>
</elemento>
```

### Ejemplo de un Documento XML
A continuación se muestra un ejemplo simple de un documento XML que representa información sobre libros:

```xml
<biblioteca>
    <libro id="1">
        <titulo>El Quijote</titulo>
        <autor>Miguel de Cervantes</autor>
        <anio>1605</anio>
    </libro>
    <libro id="2">
        <titulo>Cien años de soledad</titulo>
        <autor>Gabriel García Márquez</autor>
        <anio>1967</anio>
    </libro>
</biblioteca>
```

## Características de XML
- **Legibilidad**: XML es legible tanto para humanos como para máquinas.
- **Auto-descriptivo**: La estructura de los datos es explícita en la definición de etiquetas.
- **Independiente de la plataforma**: Puede ser utilizado en diversos sistemas operativos y lenguajes de programación.
- **Extensibilidad**: Se pueden crear nuevas etiquetas para representar diferentes tipos de datos.


## Ventajas y Desventajas de XML

| **Ventajas**                           | **Desventajas**                       |
|----------------------------------------|--------------------------------------|
| Estructura clara y jerárquica        | Puede ser verboso y ocupar más espacio |
| Facilita el intercambio de datos      | Más difícil de procesar que JSON     |
| Extensible                            | No soporta tipos de datos complejos  |


## Aplicaciones Comunes de XML
- **Servicios Web**: Muchos servicios utilizan XML para el intercambio de datos entre cliente y servidor.
- **Configuraciones**: Archivos de configuración son a menudo almacenados en XML.
- **Documentación**: Se utiliza para formatos de documentos como SVG (gráficos vectoriales) y XHTML.


<h1>Estructura de Árbol XML</h1>

<p>Los documentos XML se estructuran como árboles de elementos, comenzando desde un elemento raíz que se ramifica hacia sus elementos secundarios.</p>

<p>Un árbol XML típica se organizan de la siguiente manera:</p>

<pre><code>&lt;raiz&gt;
  &lt;hijo&gt;
    &lt;subhijo&gt;.....&lt;/subhijo&gt;
  &lt;/hijo&gt;
&lt;/raiz&gt;</code></pre>

<p>En esta jerarquía, se utilizan los términos padre, hijo y hermano para describir las relaciones entre los distintos elementos:</p>
<ul>
    <li>Los elementos padres tienen hijos.</li>
    <li>Los elementos hijos poseen un padre.</li>
    <li>Los elementos hermanos son aquellos que están al mismo nivel, es decir, comparten el mismo padre.</li>
</ul>

<p>Cada elemento puede contener texto (por ejemplo, <strong>Harry Potter</strong>) y atributos (como <code>categoría="Personaje"</code>).</p>

<h2>Sintaxis Autodescriptiva</h2>

<p>XML se caracteriza por una sintaxis autodescriptiva que facilita su comprensión y uso.</p>

<p>El documento XML comienza con una declaración que indica la versión de XML y la codificación de caracteres:</p>

<pre><code>&lt;?xml version="1.0" encoding="UTF-8"?&gt;</code></pre>

<p>Se le denomina prologo, es opcional, pero muy recomendable</p>

<p>Las "etiquetas de apertura y cierre" suelen denominarse "etiquetas de inicio y de fin". Utilice la que prefiera. Es exactamente lo mismo.</p>

<h2>Comentarios en XML</h2>
<p>La sintaxis para escribir comentarios en XML es similar a la de HTML:</p>


<pre><code>&lt;!-- Esto es un comentario --&gt;</code></pre>

<p>No se permiten dos guiones en medio de un comentario:</p>

<pre><code>&lt;-- This is an invalid -- comment --&gt;</code></pre>

<p>A continuación, se define el elemento raíz del documento. Por ejemplo:</p>
<pre><code>&lt;libros&gt;</code></pre>

<p>Dentro de este elemento, se puede iniciar un elemento <code>&lt;libro&gt;</code>:</p>

<pre><code>&lt;libro categoria="cocina"&gt;</code></pre>

<p>El elemento <code>&lt;libro&gt;</code> puede contener cuatro elementos secundarios: <code>&lt;titulo&gt;</code>, <code>&lt;autor&gt;</code>, <code>&lt;año&gt;</code>, <code>&lt;precio&gt;</code>.</p>

<pre><code>&lt;titulo lang="es"&gt;Cocinando Todos los Días&lt;/titulo&gt;
&lt;autor&gt;Giada De Laurentiis&lt;/autor&gt;
&lt;año&gt;2005&lt;/año&gt;
&lt;precio&gt;30.00&lt;/precio&gt;</code></pre>

<p>Finalmente, cerramos el elemento del libro con:</p>

<pre><code>&lt;/libro&gt;</code></pre>


### Ejemplo de Estructura
```xml
<estudiantes>
    <estudiante id="1">
        <nombre>Ana</nombre>
        <calificacion>8.5</calificacion>
    </estudiante>
    <estudiante id="2">
        <nombre>Juan</nombre>
        <calificacion>9.0</calificacion>
    </estudiante>
</estudiantes>
```

<body>
    <h1>Referencias de Entidades en XML</h1>
    <p>Algunos caracteres tienen un significado especial en XML.</p>
    <p>
        Si coloca un carácter como <code>&lt;</code> dentro de un elemento XML, generará un error porque el analizador lo interpreta como el inicio de un nuevo elemento.
    </p>
    <p>Esto generará un error XML:</p>
    <pre>
&lt;mensaje&gt; salario <b><font color="red">&lt;</font></b> 1000 &lt;/mensaje&gt;
    </pre>
    <p>Para evitar este error, reemplace el carácter <code>&lt;</code> con una referencia de entidad:</p>
    <pre>
&lt;mensaje&gt; salario &amp;lt; 1000 &lt;/mensaje&gt;
    </pre>
    <p>Dando como resultado:</p>
    <pre>
&lt;mensaje&gt; salario < 1000 &lt;/mensaje&gt;
    </pre>    
    <h2>Referencias de Entidad Predefinidas en XML</h2>
    <table border="1" cellpadding="5">
        <thead>
            <tr>
                <th>Referencia</th>
                <th>Carácter</th>
                <th>Descripción</th>
            </tr>
        </thead>
        <tbody>
            <tr>
                <td><code>&amp;lt;</code></td>
                <td>&lt;</td>
                <td>Menor que</td>
            </tr>
            <tr>
                <td><code>&amp;gt;</code></td>
                <td>&gt;</td>
                <td>Mayor que</td>
            </tr>
            <tr>
                <td><code>&amp;amp;</code></td>
                <td>&amp;</td>
                <td>Ampersand</td>
            </tr>
            <tr>
                <td><code>&amp;apos;</code></td>
                <td>'</td>
                <td>Apostrofe</td>
            </tr>
            <tr>
                <td><code>&amp;quot;</code></td>
                <td>"</td>
                <td>Doble comillas</td>
            </tr>
        </tbody>
    </table>
</body>


<body>
    <h1>¿Qué es un elemento XML?</h1>
    <p>
        Un elemento XML es todo, desde (incluida) la etiqueta de inicio del elemento hasta (incluida) la etiqueta de finalización del elemento.
    </p>
    <pre> &lt;precio&gt;29.99&lt;/precio&gt; </pre>
    <p>Un elemento puede contener:</p>
    <ul>
        <li>Texto</li>
        <li>Atributos</li>
        <li>Otros elementos</li>
        <li>O una mezcla de los anteriores</li>
    </ul>
    <pre><code>
&lt;librería&gt;
  &lt;libro Tema="infantil"&gt;
    &lt;título&gt;Harry Potter&lt;/título&gt;
    &lt;autor&gt;J K. Rowling&lt;/autor&gt;
    &lt;año&gt;2005&lt;/año&gt;
    &lt;precio&gt;29.99&lt;/precio&gt;
  &lt;/libro&gt;
  &lt;libro Tema="web"&gt;
    &lt;título&gt;Aprendiendo XML&lt;/título&gt;
    &lt;autor&gt;Erik T. Ray&lt;/autor&gt;
    &lt;año&gt;2003&lt;/año&gt;
    &lt;precio&gt;39.95&lt;/precio&gt;
  &lt;/libro&gt;
&lt;/librería&gt;
    </code></pre>
    <p>En el ejemplo anterior:</p>
    <ul>
        <li><code>&lt;título&gt;</code>, <code>&lt;autor&gt;</code>, <code>&lt;año&gt;</code> y <code>&lt;precio&gt;</code> tienen contenido de texto incluso valores numericos como <code>29.99 o 39.95</code>.</li>
        <li><code>&lt;librería&gt;</code> y <code>&lt;libro&gt;</code> tienen contenido de elementos porque contienen otros elementos.</li>
        <li><code>&lt;libro&gt;</code> tiene un atributo (<code>categoría="infantil"</code>).</li>
    </ul>
    <h2>Elementos XML Vacíos</h2>
    <p>Un elemento sin contenido se dice que está vacío.</p>
    <p>En XML, puedes indicar un elemento vacío de la siguiente manera:</p>
    <code><pre> &lt;elemento&gt;&lt;/elemento&gt; </pre></code>
    <p>También puedes utilizar una etiqueta de cierre automático:</p>
    <code><pre> &lt;elemento /&gt; </pre></code>
</body>
</html>


<body>
    <h1>Reglas de Denominación de XML</h1>
    <p>Los elementos XML deben seguir estas reglas de nomenclatura:</p>
    <ul>
        <li><p>Los nombres de los elementos distinguen entre mayúsculas y minúsculas.</p>
        <p>No es lo mismo:</p>
        <p><code>&lt;persona&gt;</code>, <code>&lt;nombre&gt;</code>, <code>&lt;apellido&gt;</code>.</p>que:</p>
        <p><code>&lt;Persona&gt;</code>, <code>&lt;Nombre&gt;</code>, <code>&lt;Apellido&gt;</code>.</p>
        </li>
        <li>Los nombres de los elementos deben comenzar con una letra o un guion bajo.</li>
        <li>Los nombres de elementos no pueden comenzar con las letras <code>xml</code> (o <code>XML</code>, <code>Xml</code>, etc.).</li>
        <li>Los nombres de los elementos pueden contener letras, dígitos, guiones, guiones bajos y puntos.</li>
        <li>Los nombres de los elementos no pueden contener espacios.</li>
        <li>Se puede utilizar cualquier nombre, no se reservan palabras (excepto <code>xml</code>).</li>
    </ul>
    <h2>Mejores Prácticas de Nomenclatura</h2>
    <ul>
        <li>Crea nombres descriptivos, como este: <code>&lt;persona&gt;</code>, <code>&lt;nombre&gt;</code>, <code>&lt;apellido&gt;</code>.</li>
        <li>Crea nombres cortos y simples, como este: <code>&lt;título_del_libro&gt;</code>, no así: <code>&lt;el_título_del_libro&gt;</code>.</li>
        <li>Evite el "<code>-</code>". Si nombras algo como <code>nombre-apellido</code>, es posible que algunos programas piensen que deseas restar <code>apellido</code> de <code>nombre</code>.</li>
        <li>Evite el "<code>.</code>". Si nombras algo como <code>nombre.apellido</code>, algún software puede pensar que <code>apellido</code> es una propiedad del objeto <code>nombre</code>.</li>
        <li>Evite <code>:</code>. Los dos puntos están reservados para espacios de nombres.</li>
        <li>Las letras no inglesas como é, ò, á son perfectamente legales en XML, pero tenemos que tener cuidado con los problemas que podemos tener, si el software no las admite.</li>
    </ul>
    <h2>Convenciones de Nombres</h2>
    <p>Algunas convenciones de nomenclatura comúnmente utilizadas para elementos XML:</p>
    <table border="1" cellpadding="5">
        <thead>
            <tr>
                <th>Estilo</th>
                <th>Ejemplo</th>
                <th>Descripción</th>
            </tr>
        </thead>
        <tbody>
            <tr>
                <td>Minúscula</td>
                <td><code>&lt;nombre&gt;</code></td>
                <td>Todas las letras en minúscula.</td>
            </tr>
            <tr>
                <td>Mayúsculas</td>
                <td><code>&lt;NOMBRE&gt;</code></td>
                <td>Todas las letras en mayúsculas.</td>
            </tr>
            <tr>
                <td><p>Estilo de la serpiente</p><p>Snake case</p></td>
                <td><code>&lt;nombre_apellido&gt;</code></td>
                <td>El guion bajo separa palabras.</td>
            </tr>
            <tr>
                <td><p>Estilo Pascal</p><p>Pascal case</p></td>
                <td><code>&lt;Nombre&gt;</code></td>
                <td>Primera letra mayúscula de cada palabra.</td>
            </tr>
            <tr>
                <td><p>Estilo de camello</p><p>Camel case</p></td>
                <td><code>&lt;nombreApellido&gt;</code></td>
                <td>Primera letra mayúscula en cada palabra excepto la primera.</td>
            </tr>
        </tbody>
    </table>
    <p>
        <span style="background-color: #007BFF; color: white; font-weight: bold; padding: 2px 5px; border-radius: 3px;">Consejo</span>: 
        Elige tu estilo de nombre y sé coherente con él.
    </p>
    <p>Los documentos XML suelen tener una base de datos correspondiente. Una práctica habitual es utilizar las reglas de denominación de la base de datos para los elementos XML.</p>
</body>
</html>


## Elementos XML frente a Atributos

XML (Extensible Markup Language) es un lenguaje de marcado que permite almacenar y transportar datos de manera estructurada.  
Uno de los debates en XML es si se deben usar **elementos** o **atributos** para representar la información.  

### 1. Uso de atributos en XML

Los atributos se utilizan dentro de la etiqueta de apertura de un elemento. Sirven para agregar información adicional sobre el contenido.

#### **Ejemplo con atributo**
```xml
<persona genero="femenino">
  <firstname>Anna</firstname>
  <lastname>Smith</lastname>
</persona>

En este caso, genero="female" es un atributo del elemento <person>, mientras que <firstname> y <lastname> son elementos.

2. Uso de elementos en XML
Los elementos representan la información dentro de etiquetas anidadas en lugar de atributos.

Ejemplo con elementos

<persona>
  <genero>femenino</genero>
  <firstname>Anna</firstname>
  <lastname>Smith</lastname>
</persona>

Aquí, "genero" es un elemento en lugar de un atributo.


In [None]:
!pip install xmltodict

In [None]:
import xmltodict

xml_data = """<persona genero="femenino">
  <firstname>Anna</firstname>
  <lastname>Smith</lastname>
</persona>"""

# Convertir XML a diccionario
data_dict = xmltodict.parse(xml_data)
print(data_dict)

# Extraer valores
genero = data_dict["persona"]["@genero"]  # Atributo "genero"
firstname = data_dict["persona"]["firstname"]
lastname = data_dict["persona"]["lastname"]

# Mostrar resultados
print(f"Género: {genero}")
print(f"Nombre: {firstname}")
print(f"Apellido: {lastname}")


https://feeds.bbci.co.uk/news/rss.xml

In [None]:
import requests
import xmltodict

# URL del feed RSS de la BBC
url = "https://feeds.bbci.co.uk/news/rss.xml"

# Hacer una solicitud HTTP para obtener el contenido del XML
response = requests.get(url)

# Verificar si la solicitud fue exitosa
if response.status_code == 200:
    # Convertir el XML a un diccionario de Python
    xml_content = response.content
    data_dict = xmltodict.parse(xml_content)

    # Acceder a los datos del diccionario
    channel = data_dict['rss']['channel']
    print("Título del feed:", channel['title'])
    print("Descripción:", channel['description'])
    print("Enlace:", channel['link'])

    # Mostrar las noticias (items)
    print("\nÚltimas noticias:")
    for item in channel['item']:
        print(f"\nTítulo: {item['title']}")
        print(f"Descripción: {item['description']}")
        print(f"Enlace: {item['link']}")
        print(f"Fecha de publicación: {item['pubDate']}")
else:
    print("Error al obtener el feed RSS. Código de estado:", response.status_code)


<h3>3. ¿Cuándo usar atributos y cuándo elementos?</h3>

<table border="1">
  <thead>
    <tr>
      <th><strong>Criterio</strong></th>
      <th><strong>Usar Elementos</strong></th>
      <th><strong>Usar Atributos</strong></th>
    </tr>
  </thead>
  <tbody>
    <tr>
      <td><strong>Estructura de datos</strong></td>
      <td>Para datos que contienen información clave</td>
      <td>Para metadatos o propiedades secundarias</td>
    </tr>
    <tr>
      <td><strong>Cantidad de datos</strong></td>
      <td>Cuando el contenido es extenso</td>
      <td>Cuando la información es breve</td>
    </tr>
    <tr>
      <td><strong>Consulta de datos</strong></td>
      <td>Más fácil de buscar y filtrar</td>
      <td>Más difícil de consultar en XPath o XQuery</td>
    </tr>
    <tr>
      <td><strong>Extensibilidad</strong></td>
      <td>Más flexible y fácil de modificar</td>
      <td>Menos flexible para futuras modificaciones</td>
    </tr>
  </tbody>
</table>


<h3>4.- Los espacios de nombres</h3>
Los espacios de nombres (namespaces) en XML son una forma de evitar conflictos de nombres en documentos XML. Esto es especialmente útil cuando se combinan documentos XML de diferentes fuentes o cuando se utilizan vocabularios de diferentes esquemas que pueden tener nombres de elementos y atributos similares.

## Concepto

Un espacio de nombres es un conjunto de nombres, en este caso, un conjunto de nombres de elementos y atributos. Un espacio de nombres se define mediante una URI (Identificador Uniforme de Recursos), lo que proporciona un contexto único a los nombres.

### Ejemplo

Supongamos que tenemos dos elementos que tienen el mismo nombre (`elemento`) pero pertenecen a diferentes espacios de nombres:

```xml
<root>
    <ns1:elemento>Contenido del espacio de nombres 1</ns1:elemento>
    <ns2:elemento>Contenido del espacio de nombres 2</ns2:elemento>
</root>


En este ejemplo:

ns1
y
ns2
son prefijos que representan los espacios de nombres definidos por las URIs proporcionadas.
ns1:elemento
y
ns2:elemento
se refieren a elementos diferentes, aunque su nombre base sea el mismo.
<p>Importancia</p>
<p>Prevención de Conflictos: Permiten combinar documentos XML de diferentes esquemas sin que haya conflictos entre nombres de elementos y atributos.</p>

<p>Claridad Semántica: Facilitan la comprensión del significado de los elementos, ya que el espacio de nombres indica su origen y su propósito.</p>

<p>Facilidad de Integración: Son esenciales para la integración de diferentes estándares y vocabularios en una única estructura XML.</p>

<p>Espacios de Nombres XML:</p>
El Atributo <code>xmlns</code>
<p>En XML, los espacios de nombres (namespaces) son una herramienta fundamental para evitar colisiones de nombres cuando se combinan elementos de diferentes vocabularios o esquemas. Imagina que estás trabajando con datos de libros y de automóviles. Ambos podrían tener un elemento <code>&lt;nombre&gt;</code>, pero con significados distintos. Los espacios de nombres nos permiten distinguir entre el título de un libro y el título de un automóvil.</p>

El Atributo <code>xmlns</code>
El atributo <code>xmlns</code> se utiliza para declarar un espacio de nombres. Se coloca en la etiqueta de inicio de un elemento y tiene la siguiente sintaxis:

In [None]:
xmlns:prefijo="URI"

prefijo: Un nombre corto que se utilizará para referirse a los elementos y atributos de este espacio de nombres.
URI: Un Identificador Uniforme de Recursos (URI) que identifica de manera única el espacio de nombres. Suele ser una URL, pero no tiene por qué ser accesible.


<?xml version="1.0" encoding="UTF-8"?>
<catalogo xmlns:libros="http://example.com/libros"
          xmlns:coches="http://example.com/coches">
  <libros:libro>
    <libros:nombre>El Señor de los Anillos</libros:nombre>
    <libros:autor>J.R.R. Tolkien</libros:autor>
  </libros:libro>
  <coches:coche>
    <coches:nombre>Ford Mustang</coches:nombre>
    <coches:marca>Ford</coches:marca>
  </coches:coche>
</catalogo>

En este ejemplo:

Se declaran dos espacios de nombres:
libros, con el URI http://example.com/libros
coches, con el URI http://example.com/coches
Los elementos <libro>, <titulo> y <autor> pertenecen al espacio de nombres libros.
Los elementos <coche>, <modelo> y <marca> pertenecen al espacio de nombres coches.
De esta manera, aunque tengamos elementos con el mismo nombre (por ejemplo, si tuviéramos un elemento <editorial> tanto para libros como para coches), XML puede distinguirlos gracias a los prefijos y los espacios de nombres.

Puedes incluir este código XML directamente en una celda de Jupyter, utilizando la "magia" de la celda para que se interprete como XML. Por ejemplo:

En Resumen
Los espacios de nombres XML y el atributo xmlns son esenciales para trabajar con documentos XML complejos que combinan elementos de diferentes fuentes. Permiten evitar ambigüedades y garantizar la correcta interpretación de los datos.

El atributo xmlns en el primer elemento <code>&lt;table&gt;</code> le da al prefijo h: un espacio de nombres calificado.

El atributo xmlns en el segundo elemento <code>&lt;table&gt;</code> le da al prefijo f: un espacio de nombres calificado.

Cuando se define un espacio de nombres para un elemento, todos los elementos secundarios con el mismo prefijo se asocian con el mismo espacio de nombres.

Los espacios de nombres también se pueden declarar en el elemento raíz XML:

<root xmlns:h="http://www.ejemplo.org/TR/html4/"
xmlns:f="https://www.ejemplo.com/furniture">

<h:table>
  <h:tr>
    <h:td>Apples</h:td>
    <h:td>Bananas</h:td>
  </h:tr>
</h:table>

<f:table>
  <f:name>African Coffee Table</f:name>
  <f:width>80</f:width>
  <f:length>120</f:length>
</f:table>

</root>

El propósito de usar un URI es darle al espacio de nombres un nombre único.

Sin embargo, las empresas a menudo utilizan el espacio de nombres como un puntero a una página web que contiene información del espacio de nombres.

Identificador uniforme de recursos (URI)
Un identificador uniforme de recursos (URI) es una cadena de caracteres que identifica un recurso de Internet.

El URI más común es el localizador uniforme de recursos (URL), que identifica una dirección de dominio de Internet. Otro tipo de URI no tan común es el nombre uniforme de recursos (URN).

Un URI (Uniform Resource Identifier) es una cadena de caracteres que identifica un recurso en una red, como internet. Los URI se utilizan para localizar y acceder a recursos, como páginas web, imágenes, archivos, etc.

Hay dos tipos principales de URI:

URL (Uniform Resource Locator): Es el tipo más común de URI. Una URL no solo identifica un recurso, sino que también proporciona la ubicación del recurso en la red. Por ejemplo, https://www.ejemplo.com/imagen.jpg es una URL que identifica y localiza una imagen en un servidor web.

URN (Uniform Resource Name): Un URN identifica un recurso por su nombre en un espacio de nombres específico, pero no necesariamente proporciona la ubicación del recurso. Por ejemplo, urn:isbn:0451450523 es un URN que identifica un libro por su número ISBN.


Espacios de nombres predeterminados
Definir un espacio de nombres predeterminado para un elemento nos ahorra el uso de prefijos en todos los elementos secundarios. Tiene la siguiente sintaxis:

xmlns="namespaceURI"
Este XML contiene información de la tabla HTML:
<table xmlns="http://www.ejemplo.org/TR/html4/">
  <tr>
    <td>Apples</td>
    <td>Bananas</td>
  </tr>
</table>


Uso de Espacios de Nombres en Documentos Complejos
Cuando trabajas con documentos XML que combinan múltiples espacios de nombres, es importante asegurarte de que cada elemento y atributo esté correctamente asociado con su espacio de nombres correspondiente.

Ejemplo de documento complejo:

In [None]:
<?xml version="1.0" encoding="UTF-8"?>
<root xmlns:libros="http://example.com/libros"
      xmlns:coches="http://example.com/coches"
      xmlns:musica="http://example.com/musica">
    
    <libros:libro>
        <libros:nombre>1984</libros:nombre>
        <libros:autor>George Orwell</libros:autor>
    </libros:libro>
    
    <coches:coche>
        <coches:nombre>Tesla Model S</coches:nombre>
        <coches:marca>Tesla</coches:marca>
    </coches:coche>
    
    <musica:album>
        <musica:nombre>The Dark Side of the Moon</musica:nombre>
        <musica:artista>Pink Floyd</musica:artista>
    </musica:album>
</root>

En este ejemplo:

Se utilizan tres espacios de nombres diferentes: libros, coches, y musica.

Cada espacio de nombres tiene su propio prefijo y URI, lo que permite evitar conflictos entre elementos con el mismo nombre (por ejemplo, <code>&lt;nombre&gt;</code> en libros y coches).

### `<![CDATA"`

In [None]:
<title>
<![CDATA[ BBC News ]]>
</title>


Esto es un fragmento de código XML, específicamente una etiqueta `<title>` que contiene un título envuelto en `<![CDATA[ ... ]]>`. Vamos a desglosarlo:

### `<title>`  
Es una etiqueta XML que indica el título de algo, posiblemente un feed RSS o un documento XML estructurado.

### `<![CDATA[ ... ]]>`  
CDATA (Character Data) es una sección en XML que permite incluir texto sin que los caracteres especiales (como `<`, `>`, `&`) se interpreten como parte de la estructura XML.

En este caso, el texto `"BBC News"` está dentro de una sección CDATA, lo que significa que se trata de un dato textual y no de una etiqueta XML.

### ¿Por qué se usa CDATA?  
Se usa cuando se quiere incluir contenido que podría contener caracteres especiales sin que el parser XML lo confunda con etiquetas o entidades. Aunque en este caso `"BBC News"` no tiene caracteres problemáticos, CDATA es útil cuando se manejan fragmentos de código HTML, scripts o texto con símbolos especiales.

### Resumen  
Esta línea indica que el título del documento o del elemento XML es **"BBC News"**, y el uso de CDATA simplemente protege el contenido ante posibles caracteres especiales.


<!DOCTYPE html>
<html lang="es">
<head>
    <meta charset="UTF-8">
    <meta name="viewport" content="width=device-width, initial-scale=1.0">
    <title>Definición de DTD en XML</title>
</head>
<body>
    <h1>Definición de DTD en XML</h1>
    <p>Un DTD (Document Type Definition) define la estructura y reglas que debe seguir un documento XML. Especifica los elementos permitidos, su jerarquía, atributos y tipos de datos, asegurando la validez del documento.</p>    
    <h2>Tipos de DTD</h2>
    <ul>
        <li><strong>DTD Interno:</strong> Se define dentro del propio documento XML.</li>
        <li><strong>DTD Externo:</strong> Se almacena en un archivo separado y se referencia desde el XML.</li>
    </ul>
</body>
</html>

<h1>Ejemplo de DTD Interno</h1>
<p>El siguiente XML contiene un DTD interno que define la estructura del documento:</p>
<pre><code>
    &lt;?xml version="1.0" encoding="UTF-8"?&gt;
    &lt;!DOCTYPE biblioteca [
        &lt;!ELEMENT biblioteca (libro+)&gt;
        &lt;!ELEMENT libro (titulo, autor, año)&gt;
        &lt;!ELEMENT titulo (#PCDATA)&gt;
        &lt;!ELEMENT autor (#PCDATA)&gt;
        &lt;!ELEMENT año (#PCDATA)&gt;
    ]&gt;
    &lt;biblioteca&gt;
        &lt;libro&gt;
            &lt;titulo&gt;Aprendiendo XML&lt;/titulo&gt;
            &lt;autor&gt;Juan Pérez&lt;/autor&gt;
            &lt;año&gt;2023&lt;/año&gt;
        &lt;/libro&gt;
    &lt;/biblioteca&gt;
</pre></code>
<div class="explicacion">
    <p><strong>Explicación:</strong></p>
    <ul>
        <li><code>&lt;!ELEMENT biblioteca (libro+)&gt;</code> → La raíz <code>&lt;biblioteca&gt;</code> contiene uno o más <code>&lt;libro&gt;</code>.</li>
        <li><code>&lt;!ELEMENT libro (titulo, autor, año)&gt;</code> → Un <code>&lt;libro&gt;</code> debe contener <code>titulo</code>, <code>autor</code> y <code>año</code>.</li>
        <li><code>&lt;!ELEMENT titulo (#PCDATA)&gt;</code> → El contenido de <code>&lt;titulo&gt;</code> es texto (PCDATA = Parsed Character Data).</li>
    </ul>
</div>
<h1>Ejemplo de DTD Externo</h1>
<p>Se define en un archivo separado (<strong>biblioteca.dtd</strong>):</p>
<code><pre>
    &lt;!ELEMENT biblioteca (libro+)&gt;
    &lt;!ELEMENT libro (titulo, autor, año)&gt;
    &lt;!ELEMENT titulo (#PCDATA)&gt;
    &lt;!ELEMENT autor (#PCDATA)&gt;
    &lt;!ELEMENT año (#PCDATA)&gt;
</pre></code>
<p>Y en el XML se referencia así:</p>
<code><pre>
    &lt;?xml version="1.0" encoding="UTF-8"?&gt;
    &lt;!DOCTYPE biblioteca SYSTEM "biblioteca.dtd"&gt;
    &lt;biblioteca&gt;
        &lt;libro&gt;
            &lt;titulo&gt;XML Avanzado&lt;/titulo&gt;
            &lt;autor&gt;María López&lt;/autor&gt;
            &lt;año&gt;2024&lt;/año&gt;
        &lt;/libro&gt;
    &lt;/biblioteca&gt;
</pre></code>
<div class="explicacion">
    <p><strong>Ventajas del DTD externo:</strong></p>
    <ul>
        <li>Permite reutilizar la definición en varios XML.</li>
        <li>Facilita el mantenimiento.</li>
    </ul>
</div>

