<br>
<div align="right">Enseignant : Aric Wizenberg</div>
<div align="right">E-mail : icarwiz@yahoo.fr</div>
<div align="right">Année : 2018/2019</div><br><br><br>
<div align="center"><span style="font-family:Lucida Caligraphy;font-size:32px;color:darkgreen">Master 2 MASERATI - Cours de Python</span></div><br><br>
<div align="center"><span style="font-family:Lucida Caligraphy;font-size:24px;color:#e60000">Fonctions récursives</span></div><br><br>
<hr>

# Définition

Pour l'instant, toutes les fonctions que nous avons créés sont sur le mode **itératif**, on exécute des instructions les unes après les autres en suivant une progression linéaire, commençant à la première ligne de la fonction et finissant à la dernière. 

Le fonctionnement d'une fonction itérative est le assimilable à celui des **fonctions** en mathématiques : on va faire varier x linéairement sur un intervalle, et on calcule le résultat de f(x). 

En termes de données, c'est typiquement le mode adapté pour parcourir ligne à ligne une **table de données** (comme sur SAS...).

---

Mais il existe un autre type de fonctionnement qu'on appelle le mode **récursif**, on définie une fonction en utilisant cette même fonction dans sa propre définition.

Le fonctionnement est le même que celui des **suites** en mathématiques : on va supposer une valeur initiale et, à partir de cette valeur, on va calculer successivement les différents termes de la suite.

En termes de données, c'est typiquement le mode adapté pour parcourir noeud par noeud un **arbre** ou un **réseau**.

# Méthode

Pour écrire une fonction récursive il faut préalablement déterminer :
- Que se passe-t-il dans le cas où la fonction traite le cas **feuille**?
- Que se passe-t-il lorsqu'elle traite le cas **noeud**?
- Comment est-elle **initialisée** ?
- Nécessite-t-on des données **persistentes** ?

# Exemple d'application

## Suite de Fibonacci

Un homme met un couple de lapins dans un lieu complètement isolé de tous les côtés par un mur. Combien de couples obtient-on en un an si chaque couple engendre tous les mois un nouveau couple à compter du troisième mois de son existence ?

<div align="center"><img src="attachment:FibonacciRabbit.svg.png" style="height:300px"></div>

Autrement dit :

$ U_n = U_{n - 1} + U_{n - 2} $ 

Avec $ U_1 = 1 $ et $ U_2 = 1 $

Il est possible d'écrire cette fonction en mode **itératif**, mais elle se prête intuitivement au mode **récursif**

In [1]:
def fib_rec(n):
    if n == 1 or n == 2: # cas feuille
        return 1 
    else: # cas noeud
        return fib_rec(n - 1) + fib_rec(n - 2)

In [2]:
fib_rec(15)

610

Il est important de comprendre que **ce n'est pas parce qu'un sujet semble intuitivement** destiné à être traité par une fonction récursive que c'est la **solution optimale**.

Par exemple la fonction précédente serait en réalité mieux traitée en utilisant une fonction itérative. Pourquoi?

Le problème est qu'il y a énormément de redondances : à chaque rang, on va recalculer l'ensemble de la chaine 2 fois...

Il est parfois utile d'avoir une fonction englobante (un **wrapper**), permettant de disposer d'un environnement pour notre fonction récursive.

In [3]:
def fibo_wrapper(start):
    memo = {
        0: 0, 
        1: 1,
    }

    def fibm(n):
        if not n in memo: # cas noeud
            memo[n] = fibm(n-1) + fibm(n-2)
        
        # cas feuille : rien de spécial à faire
        return memo[n]

    return fibm(start)    

In [5]:
fibo_wrapper(15)

610

La différence de temps de calcul entre les deux fonctions est énorme...

In [4]:
%%timeit
fib_rec(15)

143 µs ± 1.56 µs per loop (mean ± std. dev. of 7 runs, 10000 loops each)


In [6]:
%%timeit
fibo_wrapper(15)

5.24 µs ± 128 ns per loop (mean ± std. dev. of 7 runs, 100000 loops each)


## Parcours d'un JSON

Chargeons d'abord les données

In [7]:
import json

with open('../data/voyagessncf.json', encoding='utf-8') as fichier:
    json_dict = json.load(fichier)

In [8]:
json_dict.keys()



Ecrivons maintenant une fonction récursive pour parcourir un JSON et récupérer toutes les valeurs de type float qu'il contient, ainsi que leur localisation

In [11]:
def get_data_from_json(element, location=''):
    # cas noeud (ensemble)
    if type(element) in (list, dict):
        liste = []
        
        if type(element) == list:            
            for i, v in enumerate(element):            
                liste += get_data_from_json(v, f'{location}/__L_{i}__')
        else:
            for k, v in element.items():
                liste += get_data_from_json(v, f'{location}/{k}')
                
        return liste
    
    # cas feuille (valeur)
    else:
        if type(element) == float and element: #agrega element par se debarraser de los valores = 0 ?
            return [(location, element)]
        else:
            return []    

In [12]:
get_data_from_json(json_dict)

[('/results/__L_0__/priceProposals/FLEX/amount', 102.0),
 ('/results/__L_0__/priceProposals/FLEX/amountWithMandatorySpaceComfort',
  102.0),
 ('/results/__L_0__/priceProposals/FLEX/passengerDetails/__L_0__/price',
  102.0),
 ('/results/__L_0__/priceProposals/UPSELL/amount', 115.6),
 ('/results/__L_0__/priceProposals/UPSELL/amountWithMandatorySpaceComfort',
  115.6),
 ('/results/__L_0__/priceProposals/UPSELL/passengerDetails/__L_0__/price',
  115.6),
 ('/results/__L_1__/priceProposals/SEMIFLEX/amount', 70.0),
 ('/results/__L_1__/priceProposals/SEMIFLEX/amountWithMandatorySpaceComfort',
  70.0),
 ('/results/__L_1__/priceProposals/SEMIFLEX/passengerDetails/__L_0__/price',
  70.0),
 ('/results/__L_1__/priceProposals/UPSELL/amount', 81.9),
 ('/results/__L_1__/priceProposals/UPSELL/amountWithMandatorySpaceComfort',
  81.9),
 ('/results/__L_1__/priceProposals/UPSELL/passengerDetails/__L_0__/price',
  81.9),
 ('/results/__L_1__/segments/__L_0__/transporterRating', 3.730769230769231),
 ('/resul

## Parcours du disque dur

Maintenant essayons de calculer la taille d'un dossier en accumulant la taille de l'ensemble des éléments qu'il contient...

In [None]:
import os

TAILLE_MEGA = 1024*1024

def getfoldersize(folder):
    fullsize = 0

    try:
        listels = os.listdir(folder)
    except OSError:
        print('recursion problem')
    else:
        for elem in listels:
            fullpath = f'{folder}/{elem}'
            # cas feuille
            if os.path.isfile(fullpath):
                fullsize += os.path.getsize(fullpath)/TAILLE_MEGA
                
            # cas noeud
            else:
                fullsize += getfoldersize(f'{folder}/{elem}') 
    
    return fullsize

In [None]:
getfoldersize('..')

Une autre bonne raison de faire un wrapper peut être que le résultat de notre fonction récursive et le résultat final que l'on souhaite obtenir ne sont pas exactement concordants.

Si dans cet exemple nous souhaitons faire une fonction donnant la taille des différents sous-dossiers d'un dossier parent, il va falloir faire un wrapper adapté.

In [None]:
import os

def folder_size(basefolder):
    TAILLE_MEGA = 1024*1024
    result = []

    def getfoldersize(folder):
        fullsize = 0

        try:
            listels = os.listdir(folder)
        except OSError:
            print('recursion problem')
        else:
            for elem in listels:
                fullpath = f'{folder}/{elem}'
                if os.path.isfile(fullpath):
                    fullsize += os.path.getsize(fullpath)/TAILLE_MEGA # cas feuille
                else:
                    fullsize += getfoldersize(f'{folder}/{elem}') # cas noeud
        return fullsize
    
    for elem in os.listdir(basefolder):
        if not os.path.isfile(f'{basefolder}/{elem}'):
            result.append((elem, getfoldersize(f'{basefolder}/{elem}')))

    return result

In [None]:
folder_size('..')