# Básicos de XML para Python usando ElementTree

**Aprende cómo analizar, explorar, modificar y rellenar archivos XML con el paquete ElementTree de Python, bucles for y expresiones XPath.**


## Qué es XML?

XML significa `"Lenguaje de Marcado Extensible"`. Se utiliza principalmente en páginas web, donde los datos tienen una estructura específica y son interpretados dinámicamente por el framework XML.

XML crea una estructura en forma de árbol que es fácil de interpretar y admite jerarquías. Siempre que una página siga la estructura XML, se puede llamar documento XML.

- Los documentos XML tienen secciones, llamadas elementos, definidos por una etiqueta de inicio y una etiqueta de cierre. Una etiqueta es una construcción de marcado que comienza con < y termina con >. Los caracteres entre la etiqueta de inicio y la etiqueta de cierre, si los hay, son el contenido del elemento. Los elementos pueden contener marcado, incluidos otros elementos, que se denominan "elementos secundarios".
- El elemento más grande de nivel superior se llama `raíz`, que contiene todos los demás elementos.
- Los atributos son pares` nombre-valor` que existen dentro de una etiqueta de inicio o una etiqueta de elemento vacío. Un atributo XML solo puede tener un valor único y cada atributo puede aparecer como máximo una vez en cada elemento.

```
<?xml version="1.0"?>
<collection>
	<genre category="Action">
		<decade years="1980s">
			<movie favorite="True" title="Indiana Jones: The raiders of the lost Ark">
				<format multiple="No">DVD</format>
				<year>1981</year>
				<rating>PG</rating>
				<description>
				'Archaeologist and adventurer Indiana Jones 
				is hired by the U.S. government to find the Ark of the 
				Covenant before the Nazis.'
				</description>
			</movie>
		   	<movie favorite="True" title="THE KARATE KID">
			   <format multiple="Yes">DVD,Online</format>
			   <year>1984</year>
			   <rating>PG</rating>
			   <description>None provided.</description>
			</movie>
			<movie favorite="False" title="Back 2 the Future">
			   <format multiple="False">Blu-ray</format>
			   <year>1985</year>
			   <rating>PG</rating>
			   <description>Marty McFly</description>
			</movie>
		</decade>
		<decade years="1990s">
			<movie favorite="False" title="X-Men">
			   <format multiple="Yes">dvd, digital</format>
			   <year>2000</year>
			   <rating>PG-13</rating>
			   <description>Two mutants come to a private academy for their kind whose resident superhero team must 
			   oppose a terrorist organization with similar powers.</description>
			</movie>
			<movie favorite="True" title="Batman Returns">
			   <format multiple="No">VHS</format>
			   <year>1992</year>
			   <rating>PG13</rating>
			   <description>NA.</description>
			</movie>
		   	<movie favorite="False" title="Reservoir Dogs">
			   <format multiple="No">Online</format>
			   <year>1992</year>
			   <rating>R</rating>
			   <description>WhAtEvER I Want!!!?!</description>
			</movie>
		</decade>	
	</genre>
	
	<genre category="Thriller">
		<decade years="1970s">
			<movie favorite="False" title="ALIEN">
				<format multiple="Yes">DVD</format>
				<year>1979</year>
				<rating>R</rating>
				<description>"""""""""</description>
			</movie>
		</decade>
		<decade years="1980s">
			<movie favorite="True" title="Ferris Bueller's Day Off">
				<format multiple="No">DVD</format>
				<year>1986</year>
				<rating>PG13</rating>
				<description>Funny movie about a funny guy</description>
			</movie>
			<movie favorite="FALSE" title="American Psycho">
				<format multiple="No">blue-ray</format>
				<year>2000</year>
				<rating>Unrated</rating>
				<description>psychopathic Bateman</description>
			</movie>
		</decade>
	</genre>
```

## Introducción a ElementTree

La estructura en árbol de XML hace que la navegación, modificación y eliminación sea relativamente simple a nivel de programación. Python tiene una biblioteca incorporada, ElementTree, que contiene funciones para leer y manipular archivos XML (y otros archivos con estructuras similares).

In [2]:
import xml.etree.ElementTree as ET

## Analizando Datos XML

El archivo XML proporcionado describe una colección básica de películas. ¡El único problema es que los datos están desordenados! Ha habido muchos conservadores diferentes de esta colección y cada uno tiene su propia forma de ingresar datos al archivo. El objetivo principal de este tutorial será leer y comprender el archivo con Python, para luego solucionar los problemas.

Primero necesitas leer el archivo con `ElementTree`.

In [3]:
tree = ET.parse('data/movies.xml')
root = tree.getroot()

Ahora que has inicializado el árbol, deberías observar el XML e imprimir los valores para comprender cómo está estructurado el árbol.

Cada parte de un árbol (incluida la raíz) tiene una etiqueta que describe el elemento. Además, como has visto en la introducción, los elementos pueden tener atributos, que son descriptores adicionales, utilizados especialmente para el uso repetido de etiquetas. Los atributos también ayudan a validar los valores ingresados para esa etiqueta, lo que contribuye una vez más al formato estructurado de un XML.

¡Más adelante en este tutorial verás que los atributos pueden ser bastante poderosos cuando se incluyen en un XML!

In [4]:
root.tag

'collection'

En el nivel superior, puedes observar que este XML tiene como raíz la etiqueta colección (o `collection` en inglés).

In [5]:
root.attrib

{}

Root no tiene atributos

### Bucles for
Puedes iterar fácilmente sobre los subelementos (comúnmente llamados "hijos") de la raíz usando un simple bucle "for"

In [6]:
for child in root:
    print(child.tag, child.attrib)

genre {'category': 'Action'}
genre {'category': 'Thriller'}
genre {'category': 'Comedy'}


Ahora sabes que los hijos de la raíz colección son todos género (o genre en inglés). Para designar el género, el XML usa el atributo categoría (o category en inglés). Hay películas de acción, suspenso y comedia según el elemento género.

Típicamente, es útil conocer todos los elementos del árbol completo. Una función útil para hacer eso es `root.iter()`. Puedes poner esta función dentro de un bucle `"for"` y iterará sobre todo el árbol.

In [7]:
[elem.tag for elem in root.iter()]

['collection',
 'genre',
 'decade',
 'movie',
 'format',
 'year',
 'rating',
 'description',
 'movie',
 'format',
 'year',
 'rating',
 'description',
 'movie',
 'format',
 'year',
 'rating',
 'description',
 'decade',
 'movie',
 'format',
 'year',
 'rating',
 'description',
 'movie',
 'format',
 'year',
 'rating',
 'description',
 'movie',
 'format',
 'year',
 'rating',
 'description',
 'genre',
 'decade',
 'movie',
 'format',
 'year',
 'rating',
 'description',
 'decade',
 'movie',
 'format',
 'year',
 'rating',
 'description',
 'movie',
 'format',
 'year',
 'rating',
 'description',
 'genre',
 'decade',
 'movie',
 'format',
 'year',
 'rating',
 'description',
 'decade',
 'movie',
 'format',
 'year',
 'rating',
 'description',
 'movie',
 'format',
 'year',
 'rating',
 'description',
 'decade',
 'movie',
 'format',
 'year',
 'rating',
 'description',
 'decade',
 'movie',
 'format',
 'year',
 'rating',
 'description']

Esto te da una idea general de cuántos elementos tienes, pero no muestra los atributos o niveles en el árbol.

Existe una forma útil de ver todo el documento. Cualquier elemento tiene un método `.tostring()`. Si pasas la raíz al método .tostring(), puedes devolver todo el documento. Dentro de ElementTree (recuerda que su alias es ET), .tostring() tiene una forma un poco extraña.

Como ElementTree es una biblioteca potente que puede interpretar más que solo XML, debes especificar tanto la codificación como la decodificación del documento que estás mostrando como cadena. Para XML, usa 'utf8': este es el tipo de formato de documento típico para un XML.

In [8]:
print(ET.tostring(root, encoding='utf8').decode('utf8'))

<?xml version='1.0' encoding='utf8'?>
<collection>
	<genre category="Action">
		<decade years="1980s">
			<movie favorite="True" title="Indiana Jones: The raiders of the lost Ark">
				<format multiple="No">DVD</format>
				<year>1981</year>
				<rating>PG</rating>
				<description>
				'Archaeologist and adventurer Indiana Jones 
				is hired by the U.S. government to find the Ark of the 
				Covenant before the Nazis.'
				</description>
			</movie>
		   	<movie favorite="True" title="THE KARATE KID">
			   <format multiple="Yes">DVD,Online</format>
			   <year>1984</year>
			   <rating>PG</rating>
			   <description>None provided.</description>
			</movie>
			<movie favorite="False" title="Back 2 the Future">
			   <format multiple="False">Blu-ray</format>
			   <year>1985</year>
			   <rating>PG</rating>
			   <description>Marty McFly</description>
			</movie>
		</decade>
		<decade years="1990s">
			<movie favorite="False" title="X-Men">
			   <format multiple="Yes">dvd, digital</f

La función `iter()` se puede utilizar de manera más amplia para ayudar a encontrar elementos particulares de interés. `root.iter()` enumerará todos los subelementos bajo la raíz que coincidan con el elemento especificado. Aquí, enumerarás todos los atributos del elemento película (o movie en inglés) en el árbol:

In [9]:
for movie in root.iter('movie'):
    print(movie.attrib)

{'favorite': 'True', 'title': 'Indiana Jones: The raiders of the lost Ark'}
{'favorite': 'True', 'title': 'THE KARATE KID'}
{'favorite': 'False', 'title': 'Back 2 the Future'}
{'favorite': 'False', 'title': 'X-Men'}
{'favorite': 'True', 'title': 'Batman Returns'}
{'favorite': 'False', 'title': 'Reservoir Dogs'}
{'favorite': 'False', 'title': 'ALIEN'}
{'favorite': 'True', 'title': "Ferris Bueller's Day Off"}
{'favorite': 'FALSE', 'title': 'American Psycho'}
{'favorite': 'False', 'title': 'Batman: The Movie'}
{'favorite': 'True', 'title': 'Easy A'}
{'favorite': 'True', 'title': 'Dinner for SCHMUCKS'}
{'favorite': 'False', 'title': 'Ghostbusters'}
{'favorite': 'True', 'title': 'Robin Hood: Prince of Thieves'}


¡Ya puedes ver cómo se han introducido las películas (o movies en inglés) de diferentes formas. No te preocupes por eso ahora, tendrás la oportunidad de corregir uno de los errores más adelante en este tutorial.

### Expresiones XPath

Muchas veces los elementos no tendrán atributos, solo tendrán contenido de texto. Usando el atributo `.text`, puedes imprimir este contenido.

Ahora, imprime todas las descripciones de las películas.

In [10]:
for description in root.iter('description'):
    print(description.text)


				'Archaeologist and adventurer Indiana Jones 
				is hired by the U.S. government to find the Ark of the 
				Covenant before the Nazis.'
				
None provided.
Marty McFly
Two mutants come to a private academy for their kind whose resident superhero team must 
			   oppose a terrorist organization with similar powers.
NA.
WhAtEvER I Want!!!?!
"""""""""
Funny movie about a funny guy
psychopathic Bateman
What a joke!
Emma Stone = Hester Prynne
Tim (Rudd) is a rising executive
				 who “succeeds” in finding the perfect guest, 
				 IRS employee Barry (Carell), for his boss’ monthly event, 
				 a so-called “dinner for idiots,” which offers certain 
				 advantages to the exec who shows up with the biggest buffoon.
				 
Who ya gonna call?
Robin Hood slaying


Imprimir el XML es útil, pero XPath es un lenguaje de consulta que se utiliza para buscar dentro de un XML de forma rápida y sencilla. XPath significa Lenguaje de consulta de ruta XML y utiliza, como su nombre lo indica, una sintaxis similar a una "ruta" para identificar y navegar por los nodos en un documento XML.

Comprender XPath es crucial para escanear y rellenar archivos XML. ElementTree tiene una función `.findall()` que recorre los hijos inmediatos del elemento referenciado. Puedes usar expresiones XPath para especificar búsquedas más precisas.

Aquí, buscarás en el árbol películas estrenadas en 1992:

In [11]:
for movie in root.findall("./genre/decade/movie/[year='1992']"):
    print(movie.attrib)

{'favorite': 'True', 'title': 'Batman Returns'}
{'favorite': 'False', 'title': 'Reservoir Dogs'}


La función `.findall()` siempre comienza en el elemento especificado.  Este tipo de función es extremadamente útil para realizar operaciones de "buscar y reemplazar". ¡Incluso puedes buscar por atributos!

Ahora, imprime solo las películas que están disponibles en múltiples formatos (busca por el atributo).

In [12]:
for movie in root.findall("./genre/decade/movie/format/[@multiple='Yes']"):
    print(movie.attrib)

{'multiple': 'Yes'}
{'multiple': 'Yes'}
{'multiple': 'Yes'}
{'multiple': 'Yes'}
{'multiple': 'Yes'}


Piensa por qué, en este caso, la instrucción print devuelve los valores "Sí" de multiple. Piensa en cómo está definido el bucle for. ¿Podrías reescribir este bucle para imprimir los títulos de las películas en su lugar? Inténtalo a continuación:

Sugerencia: usa '...' dentro de XPath para devolver el elemento padre del elemento actual.

In [13]:
for movie in root.findall("./genre/decade/movie/format[@multiple='Yes']..."):
    print(movie.attrib)

{'favorite': 'True', 'title': 'THE KARATE KID'}
{'favorite': 'False', 'title': 'X-Men'}
{'favorite': 'False', 'title': 'ALIEN'}
{'favorite': 'False', 'title': 'Batman: The Movie'}
{'favorite': 'True', 'title': 'Dinner for SCHMUCKS'}


## Modificando un XML

Anteriormente, los títulos de las películas eran un desastre absoluto. Ahora, imprímelos de nuevo:

In [14]:
for movie in root.iter('movie'):
    print(movie.attrib)

{'favorite': 'True', 'title': 'Indiana Jones: The raiders of the lost Ark'}
{'favorite': 'True', 'title': 'THE KARATE KID'}
{'favorite': 'False', 'title': 'Back 2 the Future'}
{'favorite': 'False', 'title': 'X-Men'}
{'favorite': 'True', 'title': 'Batman Returns'}
{'favorite': 'False', 'title': 'Reservoir Dogs'}
{'favorite': 'False', 'title': 'ALIEN'}
{'favorite': 'True', 'title': "Ferris Bueller's Day Off"}
{'favorite': 'FALSE', 'title': 'American Psycho'}
{'favorite': 'False', 'title': 'Batman: The Movie'}
{'favorite': 'True', 'title': 'Easy A'}
{'favorite': 'True', 'title': 'Dinner for SCHMUCKS'}
{'favorite': 'False', 'title': 'Ghostbusters'}
{'favorite': 'True', 'title': 'Robin Hood: Prince of Thieves'}


Anteriormente, se mencionó que los títulos de las películas estaban desordenados. Un ejemplo de esto es "2 Back 2 the Future". Para solucionar este problema, podemos realizar una operación de "buscar y reemplazar". 

In [15]:
b2tf = root.find("./genre/decade/movie[@title='Back 2 the Future']")
print(b2tf)

<Element 'movie' at 0x000001C219976C00>


Tenga en cuenta que usar el método `.find()` devuelve un elemento del árbol. La mayor parte del tiempo, es más útil editar el contenido dentro de un elemento.

Modifique el atributo title de la variable del elemento Volver al futuro para que diga "Volver al futuro". Luego, imprima los atributos de su variable para ver su cambio. Puede hacer esto fácilmente accediendo al atributo de un elemento y luego asignándole un nuevo valor:

In [16]:
b2tf.attrib["title"] = "Back to the Future"
print(b2tf.attrib)

{'favorite': 'False', 'title': 'Back to the Future'}


Escriba sus cambios nuevamente en el XML para que queden fijados permanentemente en el documento. Vuelva a imprimir los atributos de su película para asegurarse de que funcionaron los cambios. Use el método .write() para hacer esto:

In [17]:
tree.write("movies.xml")

tree = ET.parse('movies.xml')
root = tree.getroot()

for movie in root.iter('movie'):
    print(movie.attrib)

{'favorite': 'True', 'title': 'Indiana Jones: The raiders of the lost Ark'}
{'favorite': 'True', 'title': 'THE KARATE KID'}
{'favorite': 'False', 'title': 'Back to the Future'}
{'favorite': 'False', 'title': 'X-Men'}
{'favorite': 'True', 'title': 'Batman Returns'}
{'favorite': 'False', 'title': 'Reservoir Dogs'}
{'favorite': 'False', 'title': 'ALIEN'}
{'favorite': 'True', 'title': "Ferris Bueller's Day Off"}
{'favorite': 'FALSE', 'title': 'American Psycho'}
{'favorite': 'False', 'title': 'Batman: The Movie'}
{'favorite': 'True', 'title': 'Easy A'}
{'favorite': 'True', 'title': 'Dinner for SCHMUCKS'}
{'favorite': 'False', 'title': 'Ghostbusters'}
{'favorite': 'True', 'title': 'Robin Hood: Prince of Thieves'}


## Corrigiendo Atributos

El atributo multiple está incorrecto en algunos lugares. Use `ElementTree` para corregir el designador según la cantidad de formatos en los que se presente la película. Primero, imprima el atributo y el texto de format para ver qué partes necesitan corregirse.

In [18]:
for form in root.findall("./genre/decade/movie/format"):
    print(form.attrib, form.text)

{'multiple': 'No'} DVD
{'multiple': 'Yes'} DVD,Online
{'multiple': 'False'} Blu-ray
{'multiple': 'Yes'} dvd, digital
{'multiple': 'No'} VHS
{'multiple': 'No'} Online
{'multiple': 'Yes'} DVD
{'multiple': 'No'} DVD
{'multiple': 'No'} blue-ray
{'multiple': 'Yes'} DVD,VHS
{'multiple': 'No'} DVD
{'multiple': 'Yes'} DVD,digital,Netflix
{'multiple': 'No'} Online,VHS
{'multiple': 'No'} Blu_Ray


In [19]:
import re

for form in root.findall("./genre/decade/movie/format"):
   
    match = re.search(',',form.text)
    if match:
        form.set('multiple','Yes')
    else:
        form.set('multiple','No')


tree.write("movies.xml")

tree = ET.parse('movies.xml')
root = tree.getroot()

for form in root.findall("./genre/decade/movie/format"):
    print(form.attrib, form.text)

{'multiple': 'No'} DVD
{'multiple': 'Yes'} DVD,Online
{'multiple': 'No'} Blu-ray
{'multiple': 'Yes'} dvd, digital
{'multiple': 'No'} VHS
{'multiple': 'No'} Online
{'multiple': 'No'} DVD
{'multiple': 'No'} DVD
{'multiple': 'No'} blue-ray
{'multiple': 'Yes'} DVD,VHS
{'multiple': 'No'} DVD
{'multiple': 'Yes'} DVD,digital,Netflix
{'multiple': 'Yes'} Online,VHS
{'multiple': 'No'} Blu_Ray


## Moviendo Elementos

Algunos datos se han colocado en la década incorrecta. Use lo que ha aprendido sobre XML y ElementTree para encontrar y corregir los errores en los datos de la década.

Será útil imprimir tanto las etiquetas decade como las etiquetas year en todo el documento.

In [20]:
for decade in root.findall("./genre/decade"):
    print(decade.attrib)
    for year in decade.findall("./movie/year"):
        print(year.text, '\n')

{'years': '1980s'}
1981 

1984 

1985 

{'years': '1990s'}
2000 

1992 

1992 

{'years': '1970s'}
1979 

{'years': '1980s'}
1986 

2000 

{'years': '1960s'}
1966 

{'years': '2010s'}
2010 

2011 

{'years': '1980s'}
1984 

{'years': '1990s'}
1991 



Hay películas de la década de 2000 ubicadas incorrectamente en el archivo XML. Para identificarlas, podemos utilizar una expresión XPath

In [21]:
for movie in root.findall("./genre/decade/movie/[year='2000']"):
    print(movie.attrib)

{'favorite': 'False', 'title': 'X-Men'}
{'favorite': 'FALSE', 'title': 'American Psycho'}


Agregando una Etiqueta para la Década de 2000: 
Para mover los datos de X-Men a la década correcta, necesita agregar una nueva etiqueta decade para la década de 2000 dentro del género Acción. El método SubElement() de ElementTree se puede utilizar para agregar esta etiqueta al final del elemento correspondiente en el XML.

In [22]:
action = root.find("./genre[@category='Action']")
new_dec = ET.SubElement(action, 'decade')
new_dec.attrib["years"] = '2000s'

print(ET.tostring(action, encoding='utf8').decode('utf8'))

<?xml version='1.0' encoding='utf8'?>
<genre category="Action">
		<decade years="1980s">
			<movie favorite="True" title="Indiana Jones: The raiders of the lost Ark">
				<format multiple="No">DVD</format>
				<year>1981</year>
				<rating>PG</rating>
				<description>
				'Archaeologist and adventurer Indiana Jones 
				is hired by the U.S. government to find the Ark of the 
				Covenant before the Nazis.'
				</description>
			</movie>
		   	<movie favorite="True" title="THE KARATE KID">
			   <format multiple="Yes">DVD,Online</format>
			   <year>1984</year>
			   <rating>PG</rating>
			   <description>None provided.</description>
			</movie>
			<movie favorite="False" title="Back to the Future">
			   <format multiple="No">Blu-ray</format>
			   <year>1985</year>
			   <rating>PG</rating>
			   <description>Marty McFly</description>
			</movie>
		</decade>
		<decade years="1990s">
			<movie favorite="False" title="X-Men">
			   <format multiple="Yes">dvd, digital</format>
			   <ye

Moviendo X-Men a la Década de 2000: 
Ahora que tiene la etiqueta decade para la década de 2000 dentro del género Acción, puede mover la película X-Men a su lugar correcto. Utilizaremos los métodos de ElementTree: `.append()` and `.remove()`, respectively.

In [23]:
xmen = root.find("./genre/decade/movie[@title='X-Men']")
dec2000s = root.find("./genre[@category='Action']/decade[@years='2000s']")
dec2000s.append(xmen)
dec1990s = root.find("./genre[@category='Action']/decade[@years='1990s']")
dec1990s.remove(xmen)

print(ET.tostring(action, encoding='utf8').decode('utf8'))

<?xml version='1.0' encoding='utf8'?>
<genre category="Action">
		<decade years="1980s">
			<movie favorite="True" title="Indiana Jones: The raiders of the lost Ark">
				<format multiple="No">DVD</format>
				<year>1981</year>
				<rating>PG</rating>
				<description>
				'Archaeologist and adventurer Indiana Jones 
				is hired by the U.S. government to find the Ark of the 
				Covenant before the Nazis.'
				</description>
			</movie>
		   	<movie favorite="True" title="THE KARATE KID">
			   <format multiple="Yes">DVD,Online</format>
			   <year>1984</year>
			   <rating>PG</rating>
			   <description>None provided.</description>
			</movie>
			<movie favorite="False" title="Back to the Future">
			   <format multiple="No">Blu-ray</format>
			   <year>1985</year>
			   <rating>PG</rating>
			   <description>Marty McFly</description>
			</movie>
		</decade>
		<decade years="1990s">
			<movie favorite="True" title="Batman Returns">
			   <format multiple="No">VHS</format>
			   <year

## Construyendo Documentos XML

In [24]:
tree.write("movies.xml")

tree = ET.parse('movies.xml')
root = tree.getroot()

print(ET.tostring(root, encoding='utf8').decode('utf8'))

<?xml version='1.0' encoding='utf8'?>
<collection>
	<genre category="Action">
		<decade years="1980s">
			<movie favorite="True" title="Indiana Jones: The raiders of the lost Ark">
				<format multiple="No">DVD</format>
				<year>1981</year>
				<rating>PG</rating>
				<description>
				'Archaeologist and adventurer Indiana Jones 
				is hired by the U.S. government to find the Ark of the 
				Covenant before the Nazis.'
				</description>
			</movie>
		   	<movie favorite="True" title="THE KARATE KID">
			   <format multiple="Yes">DVD,Online</format>
			   <year>1984</year>
			   <rating>PG</rating>
			   <description>None provided.</description>
			</movie>
			<movie favorite="False" title="Back to the Future">
			   <format multiple="No">Blu-ray</format>
			   <year>1985</year>
			   <rating>PG</rating>
			   <description>Marty McFly</description>
			</movie>
		</decade>
		<decade years="1990s">
			<movie favorite="True" title="Batman Returns">
			   <format multiple="No">VHS</forma

## Conclusion

Puntos Clave sobre XML y ElementTree

¡Genial! Ahora tiene las bases para comprender y comenzar a procesar XML. Aquí hay algunos puntos clave para recordar:

Estructura de Etiquetas (Tags):

Las etiquetas construyen la estructura en forma de árbol y designan qué valores se deben delimitar en ese lugar.
Un uso inteligente de la estructura facilita la lectura y escritura en un XML.
Las etiquetas siempre necesitan corchetes de apertura y cierre para mostrar las relaciones entre padre e hijo (elementos anidados).
Atributos:

Los atributos describen con más detalle cómo validar una etiqueta o permiten designaciones booleanas (verdadero/falso).
Los atributos suelen tomar valores muy específicos para que el analizador XML (y el usuario) puedan utilizarlos para verificar los valores de las etiquetas.

Librería ElementTree:

ElementTree es una importante biblioteca de Python que le permite analizar y navegar por un documento XML.
Al utilizar ElementTree, el documento XML se divide en una estructura de árbol fácil de manejar.

*References:*

https://docs.python.org/3/library/xml.etree.elementtree.html

https://en.wikipedia.org/wiki/XML