# Implémentation du DOM

## 1. Problématique
- Modifier le contenu d'une page web grâce au DOM.
- Mis en place en 1997 pour Netscape Navigator (ancêtre de Firefox).

<div align="middle"><img src="ressources/dom.png" width=300px></div>

<div align="middle"><h3>Comment implémenter la structure du DOM en Python?</h3></div>

## 2. Structure arborescente
### 2.1 Élément HTML

In [None]:
<a href="https://cviroulaud.github.io">Un super site</a>

- balises
- contenu
- attribut(s)

<div align="middle"><img src="ressources/a.png" width=500px></div>

### 2.2 Une page web

In [None]:
<html>
    <head>
        <meta charset="utf-8">
        <title>Présentation NSI seconde</title>
    </head>
    <body>
        <p>La NSI est trop cool!! Le programme est très riche:</p>
        <ul>
            <li>Programmation</li>
            <li>Algorithmie</li>
            <li>Architecture machine</li>
            <li>Langages du web</li>
        </ul>
        <a href="https://cviroulaud.github.io">Les cours de NSI</a>
        <img src="images/nsi.png">
    </body>
</html>

<div align="middle"><img src="ressources/page.png" width=800px></div>

## 3. Implémentation en Python
### 3.1 Un nœud

In [20]:
class Noeud:
    def __init__(self, v: str, f: list)->None:
        self.valeur = v
        self.fils = f
    
    # affiche la balise et les éléments fils
    def __str__(self):
        res = self.valeur + "\n\t"
        for f in self.fils:
            res += f.valeur + "\n\t"
        return res

- *valeur* contient le nom de la balise, de l'attribut ou le contenu
- *fils* contient la liste des nœuds fils

In [9]:
dom = Noeud("html", 
            [Noeud("head", 
                [Noeud("meta", 
                    [Noeud("charset", 
                    [Noeud("utf-8", [])])]),
                Noeud("title", 
                  [Noeud("text", [Noeud("Présentation NSI seconde", [])])])]),
            Noeud("body", 
                  [Noeud("p", 
                    [Noeud("text", [Noeud("La NSI est trop cool!!", [])])]),
                   Noeud("ul", 
                    [Noeud("li", 
                     [Noeud("text", [Noeud("Programmation", [])])]),
                     Noeud("li", 
                     [Noeud("text", [Noeud("Algorithmie", [])])]),
                     Noeud("li", 
                     [Noeud("text", [Noeud("Architecture machine", [])])]),
                     Noeud("li", 
                     [Noeud("text", [Noeud("Langages du web", [])])])]),
                   Noeud("a", 
                     [Noeud("href", [Noeud("https://cviroulaud.github.io", [])]),
                      Noeud("text", [Noeud("Les cours de NSI", [])])]),
                   Noeud("img", [Noeud("src", [Noeud("images/nsi.png", [])])])])])

### 3.2 Manipulation du DOM
Imiter les méthodes de JavaScript comme *Element.getElementsByTagName()*

#### Activité 1
- Télécharger et décompresser *dom-annexe.zip* .
- Écrire la fonction récursive **taille(dom: Noeud)$\;\rightarrow\;$int** qui renvoie le nombre d'éléments du DOM.
- Écrire la fonction récursive **get_elements_by_tagname(arbre: Noeud, tag: str, res: list)$\;\rightarrow\;$list** qui renvoie la liste *res* des nœuds fils de *tag*.

In [3]:
def taille(dom: Noeud)->int:
    """
    renvoie le nombre d'éléments de dom
    """
    t = 1
    for f in dom.fils:
        t += taille(f)
    return t

In [4]:
taille(dom)

33

In [10]:
def get_elements_by_tagname(tag: str, arbre: Noeud, res: list)->list:
    """
    récupère la liste des noeuds de 'e' dans 'arbre'
    """
    if arbre.valeur == tag:
        res.append(arbre)
    for f in arbre.fils:
        get_elements_by_tagname(tag, f, res)
    return res

In [11]:
# utilisation de la méthode __str__
for n in get_elements_by_tagname("head", dom, []):
    print(n)

head
	meta
	title
	


In [8]:
# comportement similaire à javascript
for n in get_elements_by_tagname("text", dom, []):
    print(n.fils[0].valeur)

Présentation NSI seconde
La NSI est trop cool!!
Programmation
Algorithmie
Architecture machine
Langages du web
Les cours de NSI


#### Attention aux effets de bord

In [17]:
def get_elements_by_tagname_effet_bord(tag: str, arbre: Noeud, res: list = [])->list:
    if arbre.valeur == tag:
        res.append(arbre)
    for f in arbre.fils:
        get_elements_by_tagname(tag, f, res)
    return res

au premier appel de la fonction, Python crée une liste **persistante**

In [18]:
for n in get_elements_by_tagname_effet_bord("head", dom):
    print(n)

head
	meta
	title
	


In [19]:
for n in get_elements_by_tagname_effet_bord("text", dom):
    print(n.fils[0].valeur)

meta
Présentation NSI seconde
La NSI est trop cool!!
Programmation
Algorithmie
Architecture machine
Langages du web
Les cours de NSI


In [None]:
# Première solution: un objet 'défaut' qu'on réinitialise
def get_elements_by_tagname2(tag: str, arbre: Noeud, res: list = None)->list:
    # gestion de l'effet de bord potentiel
    if res is None:
        res = []

    if arbre.valeur == tag:
        res.append(arbre)
    for f in arbre.fils:
        get_elements_by_tagname(tag, f, res)
    return res

In [None]:
# Seconde solution: englober la fonction récursive
def get_elements_by_tagname3(tag: str, arbre: Noeud):
    
    # fonction interne
    def get_elements_interne(tag: str, arbre: Noeud, res: list)->list:
        if arbre.valeur == tag:
            res.append(arbre)
        for f in arbre.fils:
            get_elements_by_tagname(tag, f, res)
        return res

    # appel principal
    return get_elements_interne(tag, arbre, [])