Définition de XML
==

Terminologie
--

**XML** est le sigle de **eXtensible Markup Language**, soit le langage de balisage générique extensible.

Il a été conçu pour permettre le stockage d’informations de toute nature dans des fichiers *structurés en arborescence* via l’utilisation de **balises** qui forment les nœuds de l'arbre (</balise></balise>, <balise />).

`<a><b></b></a>` est valide, mais pas `<a><b></a></b>`.

Exemple : `<a><b></b><c></c></a>`

* les nœuds b et c sont **frères**
* les nœuds b et c sont **fils** de a
* le nœuds est le **père** de b et de c
* les nœuds b et c sont des **feuilles**, car il s’agit de nœuds ne contenant pas d’autres nœuds
* le nœuds a est la **racine** de l'arbre (il ne peut y en avoir qu'une)

*XML est un langage déclaratif de balisage générique et extensible dont le vocabulaire et la grammaire ne sont pas définis a priori.*

Chargement d'un document XML
--

In [None]:
# You should execute this line to install pydantic and factory_boy
import subprocess
print(subprocess.getstatusoutput("pip install lxml"))

In [None]:
with open('document.xml') as f:
    print(f.read())

In [None]:
from lxml import etree

In [None]:
with open('document.xml') as f:
    tree = etree.parse(f)

In [None]:
root = tree.getroot()

In [None]:
print(root)

In [None]:
root.items()

In [None]:
root.getchildren()

In [None]:
p1, p2, p3 = root.getchildren()

In [None]:
print(p1)

In [None]:
p1.getchildren()

In [None]:
p1.keys()

In [None]:
p1.values()

In [None]:
p1.items()

In [None]:
p3.keys()

In [None]:
p3.values()

In [None]:
p3.items()

In [None]:
p2.text

In [None]:
{node.get('id'): node.get('nom') for node in root.getchildren()}

Mini-DOM
--

In [None]:
from xml.dom.minidom import parse, Node

In [None]:
document = parse('document.xml')

In [None]:
print(document)

In [None]:
[dict(n.attributes.items()) for n in document.documentElement.childNodes if n.nodeType == Node.ELEMENT_NODE]

Modification d'un document XML
--

In [None]:
p3.attrib.update({"nom": "Slash"})

In [None]:
p3.items()

In [None]:
{node.get('id'): node.get('nom') for node in root.getchildren()}

In [None]:
help(root.makeelement)

In [None]:
p4 = root.makeelement("personne", {"id": "4", "nom": "Brian May"})

In [None]:
p4

In [None]:
p4.items()

In [None]:
root.append(p4)

In [None]:
root.getchildren()

In [None]:
{node.get('id'): node.get('nom') for node in root.getchildren()}

In [None]:
etree.indent(root, space="    ")
print(etree.tostring(root, pretty_print=True).decode())

In [None]:
with open("document_2.xml", "w") as f:
    f.write(etree.tostring(root, pretty_print=True).decode())

In [None]:
with open("document_2.xml") as f:
    print(f.read())

Création d'un document avec mini-DOM
--

In [None]:
from xml.dom.minidom import Document

In [None]:
document = Document()

In [None]:
root = document.createElement("liste")

In [None]:
child = document.createElement('personne')

In [None]:
child.setAttribute('id', '5')

In [None]:
child.setAttribute('nom', 'Frank Zappa')

In [None]:
root.appendChild(child)

In [None]:
document.appendChild(root)

In [None]:
print(document.toprettyxml())

In [None]:
with open("document_2.xml", "w") as f:
    f.write(document.toprettyxml())

In [None]:
with open("document_2.xml") as f:
    print(f.read())

---