In [1]:
# dé-commenter cette ligne si nbtutor n'est pas installé
%load_ext nbtutor

In [2]:
from callstats import CallRecorder

In [3]:
from IPython.core.display import HTML

def _set_css_style(css_file_path):
   """
   Read the custom CSS file and load it into Jupyter.
   Pass the file path to the CSS file.
   """

   styles = open(css_file_path, "r").read()
   s = '<style>%s</style>' % styles     
   return HTML(s)

_set_css_style('custom/custom.css')

<div style='width:20em'><img src='img/logo-igm.png'></div>
<div style='font-size:larger'><strong>Algorithmique et programmation 2</strong><br>
L1 Mathématiques - L1 Informatique<br>
Semestre 2
</div>

# Récursivité et listes

1. Un type de données récursif : les listes chaînées
2. Fonctions récursives sur les listes chaînées
3. Récursivité et listes Python

## Un type de données récursif : les listes chaînées

### Rappel : définition récursive d'une fonction

On distingue un ou plusieurs cas "de base" et un cas "général"

Factorielle :

$$
n! = \begin{cases}
      1 \text{ si $n = 0$}\\
      n \times (n-1)! \text{ sinon}
    \end{cases}
$$

### Nouveauté : définir un type récursivement

**Idée :** une **liste** est
- Soit vide (elle ne contient aucun élément)
- Soit constituéé d'un premier élément et de la **liste** des éléments suivants

On définit l'ensemble des listes en faisant référence... à l'ensemble des listes

On appelle ces listes des **listes (simplement) chaînées** :

![liste chaînée](img/Singly-linked-list.png)

### En Python

On peut choisir de représenter :

- La liste vide par `None`
- La liste constituée du premier élément `tete` suivi de la liste d'éléments `suite` par le tuple `(tete, suite)`

**Remarque importante :** on représente ici des listes **immutables** !

#### Exemples :

In [4]:
vide = None  # liste à 0 éléments

In [6]:
%%nbtutor -r -f

nombres = (12, (99, (37, None)))

In [7]:
%%nbtutor -r -f

saisons = ('printemps', 
              ('été', 
                  ('automne', 
                      ('hiver', None))))

**Attention :** ce ne sont pas du tout les listes habituelles de Python ! 

Pour éviter la confusion on distinguera
- **"listes chaînées"** ou **"listes récursives"**
- **"listes Python"** ou **"listes classiques"**

### Fonctions utilitaires

In [8]:
def liste_vide():
    return None

def est_vide(r_liste):
    return r_liste == None

In [9]:
r_liste = liste_vide()
est_vide(r_liste)

True

In [10]:
def tete(r_liste):
    # ATTENTION : plante si liste vide !
    return r_liste[0]

def suite(r_liste):
    return r_liste[1]

In [11]:
nombres = (12, (99, (37, None)))
tete(nombres)

12

In [12]:
suite(nombres)

(99, (37, None))

In [13]:
def cons(v, r_liste):
    return (v, r_liste)

In [14]:
r_liste = liste_vide()
r_liste = cons('a', r_liste)
r_liste = cons('b', r_liste)
r_liste = cons('c', r_liste)
r_liste

('c', ('b', ('a', None)))

## Parcours (récursif) de listes (récursives)

-   **Idée :** traiter un élément, puis appel récursif sur le reste
-   **Cas d'arrêt :** liste vide, ou liste réduite à un élément

<img src="img/reclistes.png" width=70%></img>

Nombreuses variantes possibles *(dans l'autre sens, deux éléments à la fois...)*  

### Calculer la longueur d'une liste récursive


**Algorithme :**
La longueur d'une liste `r_liste` est :
- 0 si `r_liste` est vide
- la longueur de la liste `suite` plus 1 si `r_liste` est de la forme `(tete, suite)`

**Implémentation :**

In [15]:
def longueur(r_liste):
    if est_vide(r_liste):
        return 0
    else:
        return 1 + longueur(suite(r_liste))

In [16]:
vide = None
longueur(vide)

0

In [17]:
nombres = (12, (99, (37, None)))
longueur(nombres)

3

In [18]:
saisons = ('printemps', ('été', ('automne', ('hiver', None))))
longueur(saisons)

4

### Rechercher un élément dans une liste récursive

Soit `r_liste` une liste récursive et `v` une valeur quelconque, on veut savoir si `v` apparaît dans `r_liste`.

**Algorithme :**
- si `r_liste` est vide : c'est **faux**
- si `r_liste` est de la forme `(tete, suite)` avec `tete == v` : c'est **vrai**
- si `r_liste` est de la forme `(tete, suite)` avec `tete != v` : on recherche `v` dans `suite`

**Implémentation :**

In [19]:
def est_dans(v, r_liste):
    if est_vide(r_liste):
        return False
    elif tete(r_liste) == v:
        return True
    else:
        return est_dans(v, suite(r_liste))

In [20]:
est_dans("automne", saisons)

True

In [21]:
est_dans("juillet", saisons)

False

### Chercher la position d'un élément dans une liste récursive

Soit `r_liste` une liste récursive et `v` une valeur quelconque, on veut savoir à quelle position `v` apparaît pour la première fois dans `r_liste` (en comptant à partir de 0). 

On fixera par convention le résultat à `None` si la liste ne contient pas `v`, en particulier si la liste est vide.

**Algorithme :**
- si `r_liste` est de la forme `(tete, suite)` avec `tete == v` : le résultat est `0`
- si `r_liste` est de la forme `(tete, suite)` avec `tete != v` : le résultat est 1 + la poisition de `v` dans `suite`

**Implémentation :**

In [22]:
def premier_indice(v, r_liste):
    if est_vide(r_liste):
        return None
    elif tete(r_liste) == v:
        return 0
    else:
        return 1 + premier_indice(v, suite(r_liste))

In [23]:
r_liste = (0, (1, (0, (1, 0))))
premier_indice(1, r_liste)

1

In [24]:
premier_indice("automne", saisons)

2

#### Variantes

Recherche du dernier indice où apparaît un élément

In [34]:
def dernier_indice(v, r_liste):
    if est_vide(r_liste):
        return None
    else:
        res = dernier_indice(v, suite(r_liste))
        if tete(r_liste) != v and res == None:
            return None
        elif res == None:
            return 0
        else:
            return 1 + res

In [35]:
r_liste = (0, (1, (0, (1, (0, None)))))
dernier_indice(1, r_liste)

3

In [36]:
dernier_indice(2, r_liste)

Liste des indices où apparaît un élément

In [37]:
def liste_indices(v, r_liste):
    if est_vide(r_liste):
        return liste_vide()
    else:
        res = liste_indices(v, suite(r_liste))
        if tete(r_liste) == v:
            return cons(0, res)
        else:
            return res

In [38]:
liste_indices(0, r_liste)

(0, (0, (0, None)))

Nouvelle tentative :

In [45]:
def ajouter_un_partout(r_liste):
    if est_vide(r_liste):
        return liste_vide()
    else:
        res = ajouter_un_partout(suite(r_liste))
        return cons(tete(r_liste) + 1, res)

def liste_indices(v, r_liste):
    if est_vide(r_liste):
        return liste_vide()
    else:
        res = liste_indices(v, suite(r_liste))
        res = ajouter_un_partout(res)
        if tete(r_liste) == v:
            return cons(0, res)
        else:
            return res

In [47]:
r_liste = (0, (1, (0, (1, (0, None)))))
liste_indices(0, r_liste)

(0, (2, (4, None)))

Dernière tentative :

In [48]:
def liste_indices(v, r_liste, decalage=0):
    if est_vide(r_liste):
        return liste_vide()
    else:
        res = liste_indices(v, suite(r_liste), decalage+1)
        if tete(r_liste) == v:
            return cons(decalage, res)
        else:
            return res

In [49]:
r_liste = (0, (1, (0, (1, (0, None)))))
liste_indices(0, r_liste)

(0, (2, (4, None)))

### Convertir une liste récursive en chaîne de caractères

... par exemple pour pouvoir l'afficher joliment.

**Algorithme :**
- si la liste est vide, on renvoie la chaîne vide `""`
- sinon, on convertit la tête et la suite de la liste en chaîne et on renvoie leur concaténation

**Implémentation :**

In [60]:
def liste_vers_chaine(r_liste):
    if est_vide(r_liste):
        return ""
    else:
        return str(tete(r_liste)) + " -> " + liste_vers_chaine(suite(r_liste))

In [61]:
liste_vers_chaine(nombres)

'12 -> 99 -> 37 -> '

**Implémentation (deuxième essai) :**

In [62]:
def liste_vers_chaine(r_liste):
    if est_vide(r_liste):
        return "()"
    else:
        res = str(tete(r_liste))
        s = suite(r_liste)
        if not est_vide(s):
            res += " -> " + liste_vers_chaine(s)
        return res

In [64]:
liste_vers_chaine(liste_vide())

'()'

In [63]:
liste_vers_chaine(nombres)

'12 -> 99 -> 37'

## Récursivité sur les listes Python

**Question :** peut-on aussi écrire des fonctions récursives pour parcourir des listes Python ?

La réponse est bien sûr **oui**, mais avec quelques points de vigilance...

Reprenons un exemple traité plus haut :

**Recherche** : Écrivez une fonction Python prenant en argument une liste et un objet quelconque, et renvoyant `True` si l'objet est dans la liste, `False` sinon... *sans utiliser de boucle ni le mot-clé `in`*.

#### Premier essai : avec une *slice*

In [89]:
def est_dans_1(elem, lst):
    if lst[0] == elem:
        return True
    else:
        return est_dans_1(elem, lst[1:len(lst)])
    
est_dans_1(0, [1, 2, 3])

IndexError: list index out of range

*Problème :* oubli d'un cas d'arrêt

#### Second essai : *slice* et arrêt sur liste vide

In [87]:
def est_dans_2(elem, lst):
    if len(lst) == 0:
        return False
    elif lst[0] == elem:
        return True
    else:
        return est_dans_2(elem, lst[1:])
        
est_dans_2(0, [1, 2, 3])

False

*Problème :* calculer `lst[1:]` à chaque appel est **trop coûteux**

In [90]:
def est_dans_3(elem, lst, debut):
    if debut >= len(lst):
        return False
    elif lst[debut] == elem:
        return True
    else:
        return est_dans_3(elem, lst, debut+1)  
    
lst = ['a', 'b', 'c']
est_dans_3('b', lst, 0)

True

- Avantage : travaille toujours sur la même liste
- Défaut : change la signature de la fonction (3 paramètres)

#### Variante : paramètre par défaut

In [91]:
def est_dans_4(elem, lst, debut=0):
    if debut >= len(lst):
        return False
    elif lst[debut] == elem:
        return True
    else:
        return est_dans_4(elem, lst, debut+1)  
    
lst = ['a', 'b', 'c']
est_dans_4('b', lst)

True

-   Avantage : travaille toujours sur la même liste
-   Valeur par défaut de `debut` si absent (`debut=0`)
-   Appel sans le troisième argument : cherche sur toute la liste

## Conclusion

### Pourquoi programmer des fonctions récursives ?

-   On peut tout calculer de cette façon (sans boucles !)
-   Certains problèmes plus simples à résoudre
    
    -   Bien adapté à des structures de données récursives
    -   Solutions souvent plus concises et compréhensibles
    -   Algorithmes parfois plus faciles à analyser
    

-   Certains le sont beaucoup moins...
    
    -   Complexité parfois plus difficile à évaluer
    -   Opérations parfois inadaptées (ex : listes Python)
    
-   Peut entraîner un surcoût
    
    -   Temps de gestion de la pile
    -   Espace mémoire pour chaque appel imbriqué
    -   Recopies si on n'est pas prudent

### Bilan de la récursivité

-   Avantages:
    
    - $\checkmark$ simplifie la vie quand on a compris le ``truc''
    - $\checkmark$ code souvent plus court et donc plus lisible
    
-   Inconvénients:

    - $\times$ il faut comprendre le truc...
    - $\times$ tous les langages ne s'y prêtent pas aussi bien
    - $\times$ souvent moins performant *($\rightarrow$ dérécursification, récursion terminale...)*

## <img src='img/non-exigible.png' style='display:inline; width:1.5em'> Raffinement du parcours de listes *(non exigible)*

**Problème :** 
- Le parcours récursif de listes Python vu précédemment recopie une portion de la liste à chaque appel (tous les éléments sauf 1) !
- C'est très coûteux en temps d'exécution et en mémoire.

In [1]:
#%%nbtutor -r -f -d 11 -i

def est_dans_2(lst, elem):
    if len(lst) == 0:
        return False
    elif lst[0] == elem:
        return True
    else:
        return est_dans_2(lst[1:], elem)

est_dans_2(list(range(10)), 14)

False

Cela revient (en plus rapide) à écrire une fonction `queue(lst)` qui renvoie une copie de `lst` privée de son premier élément :

In [2]:
def queue(lst):
    res = []
    for i in range(1, len(lst)):
        res.append(lst[i])
    return res

def est_dans_2_bis(lst, elem):
    if len(lst) == 0:
        return False
    elif lst[0] == elem:
        return True
    else:
        return est_dans_2_bis(queue(lst), elem)
    
est_dans_2_bis(list(range(10)), 9)

True

In [3]:
est_dans_2_bis([0, 0, 0, 0, 0], 1)

False

In [4]:
est_dans_2_bis([0, 0, 0, 0, 1], 1)

True

**Exercice :** compter le nombre d'appels à la fonction `append`
-   au cours de l'appel `est_dans_2_bis([0, 0, 0, 0, 0], 1)`
-   au cours de l'appel `est_dans_2_bis([0] * n, 1)` pour `n` un naturel quelconque

In [5]:
def queue(lst):
    res = []
    cpt = 0
    for i in range(1, len(lst)):
        res.append(lst[i])
        cpt += 1
    return res, cpt

def est_dans_2_ter(lst, elem):
    if len(lst) == 0:
        return False, 0
    elif lst[0] == elem:
        return True, 0
    else:
        tmp, cpt = queue(lst)
        res, cpt2 = est_dans_2_ter(tmp, elem)
        return res, cpt + cpt2        

In [6]:
est_dans_2_ter([0, 0, 0, 0, 0], 1)

(False, 10)

In [7]:
est_dans_2_ter([0, 0, 0, 0, 1], 1)

(True, 10)

In [8]:
est_dans_2_ter([0]*1000, 1)

(False, 499500)

#### Troisième essai : avec `pop(0)`

In [9]:
def est_dans_3(lst, elem):
    if len(lst) == 0:
        return False 
    premier = lst.pop(0)
    if premier == elem:
        return True
    else:
        return est_dans_3(lst, elem)

lst = [1, 2, 3]
print(est_dans_3(lst, 3))
print(lst)
print(est_dans_3(lst, 3))

True
[]
False


*Avantage :* une seule copie, mais... 
- détruit la liste !
- toujours inefficace ! (`pop(0)` décale toute la liste)

#### Quatrième essai : avec `pop()`

In [10]:
def est_dans_4(lst, elem):
    if len(lst) == 0:
        return False 
    dernier = lst.pop()
    if dernier == elem:
        return True
    else:
        return est_dans_4(lst, elem)
    

In [11]:
lst = ['a', 'b', 'c']
est_dans_4(lst, 'b')

True

In [12]:
est_dans_4(lst, 'b')

False

-   Parcourt la liste depuis la fin 
-   Plus efficace, mais... détruit toujours la liste !  

#### Cinquième essai : avec un indice

<img src="img/reclistes2.png" width=70%></img>

In [13]:
def est_dans_5(lst, elem, indice):
    if indice >= len(lst):
        return False
    elif lst[indice] == elem:
        return True
    else:
        return est_dans_5(lst, elem, indice+1)  
    
lst = ['a', 'b', 'c']
est_dans_5(lst, 'b', 0)

True

- Avantage : travaille toujours sur la même liste
- Défaut : change la signature de la fonction (3 paramètres)

#### Sixième essai : avec un paramètre par défaut

In [14]:
def est_dans_6(lst, elem, indice=0):
    if indice >= len(lst):
        return False
    elif lst[indice] == elem:
        return True
    else:
        return est_dans_6(lst, elem, indice+1)
       

In [15]:
lst = ['a', 'b', 'c']
est_dans_6(lst, 'd')

False

-   Avantage : travaille toujours sur la même liste
-   Valeur par défaut de `indice` si absent (`indice=0`)
-   Appel sans le troisième argument : cherche sur toute la liste

#### Une dernière forme : avec une fonction interne

In [16]:
def est_dans_7(lst, elem):

    # fonction auxiliaire récursive!
    def aux(indice):  
        if indice >= len(lst):
            return False
        elif lst[indice] == elem:
            return True
        else:
            return aux(indice + 1)

    return aux(0)

lst = ['a', 'b', 'c']
est_dans_7(lst, 'c')

True

**On compare !**

Pour voir un peu comment ces fonctions se comportent en pratique, on va les chronométrer avec `timeit` sur des entrées de la forme `[0] * n`.

In [17]:
n = 20000

In [18]:
from sys import setrecursionlimit
setrecursionlimit(2*n)

In [20]:
%timeit est_dans_2([0] * n, 1)
%timeit est_dans_3([0] * n, 1)
%timeit est_dans_6([0] * n, 1)

1.84 s ± 7.16 ms per loop (mean ± std. dev. of 7 runs, 1 loop each)
57.9 ms ± 340 µs per loop (mean ± std. dev. of 7 runs, 10 loops each)
4.87 ms ± 72.1 µs per loop (mean ± std. dev. of 7 runs, 100 loops each)


Test de doublement :

In [21]:
n = 10000
%timeit est_dans_3([0] * n, 1)
%timeit est_dans_3([0] * (n*2), 1)

14.5 ms ± 90.1 µs per loop (mean ± std. dev. of 7 runs, 100 loops each)
57 ms ± 280 µs per loop (mean ± std. dev. of 7 runs, 10 loops each)


Le temps n'est pas *du tout* proportionnel à la taille de l'entrée !

Logique : si $n (n-1) / 2 = x$, combien vaut $(2n) (2n-1) / 2$ ?

In [23]:
n = 10000
%timeit est_dans_6([0] * n, 1)
%timeit est_dans_6([0] * (n*2), 1)

2.29 ms ± 38.4 µs per loop (mean ± std. dev. of 7 runs, 100 loops each)
4.83 ms ± 25.1 µs per loop (mean ± std. dev. of 7 runs, 100 loops each)


Le temps est *à peu près* proportionnel à la taille de l'entrée !