# Des requêtes XPath dans le module *elementTree*

Le module *elementTree* offre un support limité de la syntaxe XPath pour interagir avec des scripts en Python. Pour une utilisation stricte du langage XPath, le module *libxml2* devra être privilégié.

## Expressions prises en charge

|Syntaxe|Description|
|:-:|:-|
|`nœud`|Sélectionne tous les enfants de l’élément `nœud`.|
|`*`|Joker d’éléments pour sélectionner tous les enfants, incluant les commentaires et les instructions de traitement.|
|`.`|Sélectionne le nœud courant. Surtout utile au début d’une expression pour exprimer le fait que l’on trace un chemin relatif.|
|`//`|Sélectionne tous les éléments enfants de l’élément courant.|
|`..`|Sélectionne le parent d’un élément. Renvoie `None` si la recherche porte sur les ancêtres du nœud racine.|
|`[@attrib]`|Sélectionne tous les éléments qui comportent l’attribut renseigné dans le prédicat.|
|`[@attrib="valeur"]`|Sélectionne tous les éléments dont l’attribut renseigné dans le prédicat porte la valeur indiquée.|
|`[@attrib!="valeur"]`|Sélectionne tous les éléments dont l’attribut renseigné dans le prédicat ne porte pas la valeur indiquée.|
|`[nœud]`|Sélectionne les éléments dont l’un des enfants directs a une balise conforme à celle indiquée.|
|`[.="texte"]`|Sélectionne tous les éléments dont le contenu textuel complet, y compris les descendants, est égal au texte donné.|
|`[.!="texte"]`|Sélectionne tous les éléments dont le contenu textuel complet, y compris les descendants, n’est pas égal au texte donné.|
|`[nœud="texte"`]|Sélectionne tous les éléments qui ont un enfant nommé `nœud` dont le contenu textuel complet, y compris les descendants, est égal au texte donné.|
|`[nœud!="texte"]`|Sélectionne tous les éléments qui ont un enfant nommé `nœud` dont le contenu textuel complet, y compris les descendants, n’est pas égal au texte donné.|
|`[position]`|Sélectionne les éléments situés à la position donnée.|

## Exemples

Les exemples reposent sur un document XML qui fournit des informations sur quelques constellations du ciel observable.

Tout d’abord, il est nécessaire de charger le fichier et de le modéliser avec *elementTree*. Ensuite, la méthode `findall()` acceptant une requête au format XPath, elle permet de réaliser toutes les opérations souhaitées.

In [None]:
import xml.etree.ElementTree as ET

tree = ET.parse('./data/constellations.xml')
root = tree.getroot()

Pour sélectionner le nœud courant :

In [None]:
for el in root.findall("."):
    print(el.tag)

Pour sélectionner les petits-enfants d’une certaine étiquette :

In [None]:
for el in root.findall('./constellation/name'):
    print(el.text)

Pour sélectionner les nœuds dont l’attribut `origin` vaut `Ptolémée` et qui ont un enfant `areas` :

In [None]:
for el in root.findall('.//areas/..[@origin="Ptolémée"]'):
    print(el.find('name').text)

Pour sélectionner tous les nœuds `area` qui sont enfants d’un nœud dont l’attribut `origin` vaut `Lacaille` :

In [None]:
for el in root.findall('.//*[@origin="Lacaille"]//area'):
    print(f"{el.text} {el.attrib['unit']}")

Tous les nœuds `area` qui sont les deuxièmes enfants de leur parent :

In [None]:
for el in root.findall('.//area[2]'):
    print(f"{el.text} {el.attrib['unit']}")

## Requête sur un espace de nommage

En considérant le fragment de code XML suivant, dont le préfixe `xml` est défini dans l’espace de nommage par défaut `http://www.w3.org/XML/1998/namespace` :

In [None]:
import xml.etree.ElementTree as ET

xml = '''<?xml version="1.0"?>
<library>
    <title xml:lang="fr">Salammbô</title>
    <title xml:lang="es">El Aleph</title>
</library>
'''

root = ET.fromstring(xml)

Pour récupérer les titres dont l’attribut `lang` préfixé `xml` vaut `es`, la requête XPath donne :

In [None]:
for el in root.findall('./title[@{http://www.w3.org/XML/1998/namespace}lang = "es"]'):
    print(el.text)

Dans le cas où plusieurs espaces de nommages sont définis dans un document, il est préférable de les consigner dans un dictionnaire transmis ensuite à la méthode `findall()` :

In [None]:
ns = {
    'xml': 'http://www.w3.org/XML/1998/namespace'
}

for el in root.findall('./title[@xml:lang = "es"]', ns):
    print(el.text)