<p style="color:#FFF; background:#06D; padding:12px; font-size:20px; font-style:italic; text-align:center">
<span style="width:49%; display:inline-block; text-align:left">Version 2025-06</span>
<span style="width:49%; display:inline-block; text-align:right">Licence CC‚ÄìBY‚ÄìNC‚ÄìND</span>
<span style="font-size:40px; font-style:normal"><b>INTERPR√âTEUR : IPYTHON</b></span><br>
<span style="width:49%; display:inline-block; text-align:left">Christophe Schlick</span>
<span style="width:49%; display:inline-block; text-align:right">schlick ‡≤Ñ u<b>-</b>bordeaux ‚Ä¢ fr</p>

Le chapitre 3 a permis de faire un tour d'horizon de la syntaxe du langage Python, ainsi que des fonctionnalit√©s de base fournies par le noyau de ce langage. Les √©l√©ments vus dans le chapitre 3 sont donc valables quelque soit l'environnement de d√©veloppement utilis√© pour √©crire du code Python :
  [**IDLE**](https://docs.python.org/3/library/idle.html) &#9679;
  [**Spyder**](https://www.spyder-ide.org) &#9679;
  [**PyCharm**](https://www.jetbrains.com/pycharm) &#9679;
  [**VS Code**](https://code.visualstudio.com) &#9679; et autres...

Dans ce chapitre, nous allons aborder quelques fonctionnalit√©s plus avanc√©es qui sont sp√©cifiques √† l'environnement Jupyter et √† l'interpr√©teur [**IPython**](https://ipython.org) qui s'ex√©cute en arri√®re-plan sur le serveur, pour interpr√©ter le code Python dans les cellules de code d'un notebook. Le noyau d'ex√©cution de l'interpr√©teur IPython s'appelle **ipykernel** (c'est ce nom qui apparait en haut √† droite dans l'interface JupyterLab pour indiquer le noyau en cours d'ex√©cution dans le notebook actif). Comme on l'a vu au chapitre 1, c'est le seul noyau disponible par d√©faut √† l'installation de la distribution Anaconda. Le noyau **ipykernel** a √©t√© sp√©cifiquement con√ßu pour l'√©cosyst√®me ***Scientific Python***, et offre ainsi des outils particuli√®rement int√©ressants pour toute personne devant d√©velopper des applications scientifiques, et notamment des applications en Sciences des Donn√©es. Ce chapitre se propose donc de faire un tour d'horizon rapide des fonctionnalit√©s les plus utiles. Pour avoir des informations compl√©mentaires, on peut se r√©f√©rer √† la documentation compl√®te du package qui se trouve sur le site [**readthedocs**](https://ipython.readthedocs.io/en/stable/), sachant qu'une copie locale est directement disponible dans le menu **`Help`** de JupyterLab, sous le titre ***IPython Reference***.

In [1]:
import warnings; warnings.filterwarnings('ignore') # suppression des 'warning' de l'interpr√©teur
from SRC.tools import show, inspect, cutcut # import des fonctions utilitaires du module 'tools'

<h2 style="padding:16px; color:#FFF; background:#06D">A - Debugging, benchmarking, robustesse et fiabilit√©</h2>

Dans le domaine du d√©veloppement logiciel, ind√©pendamment du langage utilis√© et du domaine d'application concern√©, il existe un consensus assez large sur les cinq crit√®res principaux permettant d'√©valuer la **qualit√© d'un code source** :

* La **lisibilit√©** du code
* La **robustesse** du code
* La **fiabilit√©** du code
* La **vitesse d'ex√©cution** du code
* La **sobri√©t√© m√©moire** du code

La lisibilit√© du code est √©videmment un crit√®re relativement subjectif, m√™me s'il existe des r√®gles assez pr√©cises sur les bonnes pratiques qui permettent d'am√©liorer cette lisibilit√©. Par contre, les quatre autres crit√®res peuvent √™tre mesur√©s de mani√®re objective. L'environnement Jupyter fournit un certain nombre d'outils pour am√©liorer la productivit√© durant l'√©criture du code puis, lorsque le code est op√©rationnel, de mesurer facilement les √©l√©ments li√©s √† la vitesse d'ex√©cution, la sobri√©t√© m√©moire, la robustesse et la fiabilit√© du code.

Pour illustrer la mise en oeuvre de ce processus, on va utiliser l'exemple tr√®s classique de la **[suite de Fibonacci](https://fr.wikipedia.org/wiki/Suite_de_Fibonacci)**, d√©finie par la math√©maticien italien [**Leonardo Fibonacci**](https://fr.wikipedia.org/wiki/Leonardo_Fibonacci) en 1202 par la relation de r√©currence suivante :

$$
F_0 = 0\qquad F_1 = 1\qquad F_p = F_{p-1} + F_{p-2}\quad \forall\, p > 1
$$

En 1834, le math√©maticien fran√ßais [**Jacques Binet**](https://fr.wikipedia.org/wiki/Jacques_Philippe_Marie_Binet) a calcul√© l'expression fonctionnelle de la suite, c'est-√†-dire la formule permettant d'exprimer directement le $n$-i√®me terme de la suite, sans avoir besoin de conna√Ætre les termes pr√©c√©dents :

$$
F_n = \frac{\varphi^n-\psi^n}{\varphi-\psi}\qquad \text{avec}\qquad \varphi = \frac{1+\sqrt5}2\qquad \text{et}\qquad \psi = \frac{1-\sqrt5}2
$$

A partir de ces √©l√©ments, on peut impl√©menter trois versions diff√©rentes pour effectuer le calcul des termes de cette suite :

- une **version r√©cursive** **`fiboR(n)`** dans laquelle les termes sont calcul√©s par des appels r√©cursifs
- une **version it√©rative** **`fiboI(n)`** dans laquelle les termes sont calcul√©s √† l'aide d'une boucle
- une **version fonctionnelle** **`fiboF(n)`** dans laquelle les termes sont obtenus via la formule de Binet

---
### 1 - Debugging

Comme la plupart des environnements modernes utilis√©s pour le d√©veloppement logiciel, JupyterLab int√®gre un [**d√©bogueur**](https://fr.wikipedia.org/wiki/D%C3%A9bogueur), terme fran√ßais officiel m√™me si la plupart des d√©veloppeurs francophones continuent d'employer le terme anglais : ***debugger***. Concr√®tement il s'agit d'un outil informatique permettant √† un d√©veloppeur d'identifier et corriger un dysfonctionnement de son code, traditionnellement appel√© ***bug***, en mettant en oeuvre un **processus de recherche de panne** (***troubleshooting***) similaire √† ce qui existe dans le domaine du g√©nie industriel. Quelque soit l'environnement d'ex√©cution utilis√©, un debugger permet toujours de rajouter au mininum les quatre fonctionnalit√©s suivantes :

- La cr√©ation de **points d'arr√™t** √† des endroits sp√©cifiques durant l'ex√©cution du code
- Une ex√©cution **pas √† pas** (plus exactement, instruction par instruction) √† partir d'un point d'arr√™t
- L'affichage du **contenu des variables** locales et globales durant l'ex√©cution pas √† pas
- L'affichage du **contenu de la pile d'appel** des fonctions durant l'ex√©cution pas √† pas

Evidemment, l'utilisation d'un debugger est un processus fonci√®rement interactif, il n'est donc pas facile d'illustrer son fonctionnement dans un notebook statique comme ce chapitre de cours, mais en mettant des indications sur les actions √† r√©aliser au clavier et √† la souris, cela vous permet de reproduire les op√©rations d√©crites, sur votre session JupyterLab

La fonction **`fiboF(n)`** ci-dessous impl√©mente la version fonctionnelle de Fibonacci en utilisant la formule de Binet. Le code ne pr√©sente aucune difficult√© puisqu'il consiste simplement √† d√©finir les deux variables **`phi`** et **`psi`**, puis √† effectuer le calcul indiqu√© par la formule. Pour √©viter les approximations in√©vitables lors des calculs en nombres r√©els, il ne faut pas oublier d'arrondir le r√©sultat vers l'entier le plus proche, puisque les termes de la suite sont n√©cessairement des entiers.

Pour activer le debugger dans le notebook courant, il faut commencer par ***cliquer sur l'ic√¥ne ressemblant √† un insecte*** noir (comme **bug** en anglais) sur la partie droite de la barre d'outils qui se trouve au-dessus de ce notebook. Normalement, apr√®s un l√©ger temps de mise en place, l'ic√¥ne doit devenir rouge pour indiquer que le debugger est actif. Le deuxi√®me effet visuel est que toutes les cellules de code se voient rajouter une num√©roration des lignes, et que la barre de contr√¥le √† gauche de la fen√™tre bascule automatiquement sur l'onglet **`Debugger`**.

La seconde √©tape consiste √† placer un point d'arr√™t √† l'int√©rieur de la fonction, ici on va choisir de mettre cet arr√™t sur la ligne 5 de la cellule de code. Pour cela, il faut cliquer sur la zone gris√©e, juste √† gauche du num√©ro 5 pour faire appara√Ætre un disque rouge indiquant la position du point d'arr√™t. Ensuite, en ex√©cutant la cellule par **<kbd>CTRL</kbd>**+**<kbd>ENTER</kbd>**, l'interpr√©teur commence ex√©cuter la boucle **`for`**, mais lorsqu'il effectue le premier appel **`fibo(0)`**, l'ex√©cution va s'arr√™ter √† l'endroit du point d'arr√™t qui vient d'√™tre plac√© : dans la cellule de code, la ligne 5 est mise sur fond gris, et dans la barre de contr√¥le √† gauche, s'affichent les valeurs stock√©es dans les trois variables locales **`n`**, **`phi`** et **`psi`** au moment du point d'arr√™t.

In [2]:
def fiboF(n):
  """return the n-th term of the Fibonacci sequence (functional version, based on Binet's formula)
     fibo(n) = (phi**n-psi**n)/(phi-psi) where phi = (1+sqrt(5))/2 and psi = (1-sqrt(5))/2"""
  phi, psi = (1 + 5**0.5) / 2, (1 - 5**0.5) / 2
  return round((phi**n - psi**n) / (phi - psi)) # round result to nearest integer

for n in range(10): print(f"F{n} = {fiboF(n)}", end=' / ') # display the 10 first Fibonacci terms

F0 = 0 / F1 = 1 / F2 = 1 / F3 = 2 / F4 = 3 / F5 = 5 / F6 = 8 / F7 = 13 / F8 = 21 / F9 = 34 / 

Lorsqu'on se trouve sur un point d'arr√™t, plusieurs options sont possibles pour l'utilisateur, en utilisant les diff√©rents boutons de la barre d'ex√©cution se trouvant en-dessous de la zone d'affichage des variables. Les r√¥les des 6 boutons sont r√©capitul√©s sur la figure ci-dessous, mais pour cette premi√®re fonction, on va simplement cliquer sur le bouton <tt>‚ñ∂</tt> (= **continue**) ce qui va continuer l'ex√©cution jusqu'au prochain point d'arr√™t. Ce nouvel arr√™t correspond au deuxi√®me appel de la fonction **`fiboF`**, avec cette fois-ci **`n=1`**. En cliquant sur le boutton <tt>‚ñ∂</tt> √† chaque point d'arr√™t, cela permet d'ex√©cuter le code √©tape par √©tape, en s'arr√™tant √† chaque nouvel appel de fonction, et on constate que l'affichage des termes de la suite s'effectue un par un, en dessous de la cellule de code. A l'inverse, appuyer sur le bouton <tt>‚ñ†</tt> (= **terminate**) de la barre d'ex√©cution, ne provoque pas un arr√™t de l'ex√©cution (comme on pourrait s'y attendre) mais un arr√™t du debugger, et par cons√©quent toutes les it√©rations restantes de la boucle **`for`** vont s'ex√©cuter jusqu'au bout, sans interruption.

<center><img src="IMG/debugger.png" width=256></center>

---
On voit que la fonction **`fiboF(n)`** implique le calcul de trois constantes **`phi`**, **`psi`** et **`1/(phi-psi)`** dont l'√©valuation fait intervenir des racines carr√©es et des divisions, deux op√©rations assez co√ªteuses pour le CPU. Une optimisation classique, tr√®s facile √† mettre en place, consiste √† pr√©calculer l'ensemble des constantes utilis√©es par une fonction. Dans notre cas, lorsqu'on √©value un seul terme de la suite, cela ne va pas engendrer une diff√©rence notable pour le temps d'ex√©cution, mais si l'on doit calculer plusieurs milliers de termes, la diff√©rence est loin d'√™tre n√©gligeable, comme on le verra dans la section suivante. On va donc √©crire une seconde version de la fonction, appel√©e **`fiboP(n)`**, en pr√©calculant les trois constantes :
$$
\varphi = 1.618033988749895\qquad \psi = -0.6180339887498949\qquad \tau = \frac{1}{\varphi - \psi} = 0.4472135954999579
$$

In [3]:
def fiboP(n):
  """return the n-th term of the Fibonacci sequence (precomputed functional version)
     fibo(n) = (phi**n-psi**n)/(phi-psi) where phi = (1+sqrt(5))/2 and psi = (1-sqrt(5))/2"""
  return round((1.618033988749895**n - (-0.6180339887498949)**n) * 0.4472135954999579)

for n in range(10): print(f"F{n} = {fiboP(n)}", end=' / ') # display the 10 first Fibonacci terms

F0 = 0 / F1 = 1 / F2 = 1 / F3 = 2 / F4 = 3 / F5 = 5 / F6 = 8 / F7 = 13 / F8 = 21 / F9 = 34 / 

---
La troisi√®me version **`fiboR(n)`** va utiliser la d√©finition par r√©currence et produire une fonction r√©cursive pour le calcul des termes de la suite. L√† encore, la fonction est d'une simplicit√© extr√™me puisqu'elle consiste uniquement √† traduire en Python, la d√©finition math√©matique, en utilisant l'op√©rateur d'√©valuation conditionnelle. On peut m√™me simplifier encore l'expression en fusionnant les deux cas $F_0$ et $F_1$, comme le montre le code ci-dessous.

La d√©finition de la suite de Fibonacci est une r√©currence √† deux termes (il faut conna√Ætre $F_{n-2}$ et $F_{n-1}$ pour calculer $F_n$), ce qui se traduit en Python par deux appels r√©cursifs dans le code de la fonction **`fiboR`**. Autrement dit, chaque appel de fonction va g√©n√©rer deux appels de fonction, qui vont g√©n√©rer quatre appels et ainsi de suite. Pour mieux comprendre le fonctionnement de la r√©cursion, 

In [4]:
def fiboR(n):
  """return the n-th term of the Fibonacci sequence (recursive version)"""
  return fiboR(n-1) + fiboR(n-2) if n > 1 else n # merge n=0 and n=1 in a single test

for n in range(10): print(f"F{n} = {fiboR(n)}", end=' / ') # display the 10 first Fibonacci terms

F0 = 0 / F1 = 1 / F2 = 1 / F3 = 2 / F4 = 3 / F5 = 5 / F6 = 8 / F7 = 13 / F8 = 21 / F9 = 34 / 

In [5]:
def fiboM(n, memo={0:0,1:1}):
  """return the n-th term of the Fibonacci sequence (recursive version with memoization)"""
  if n in memo: return memo[n] # return value already stored in 'memo' dictionary
  else: memo[n] = fiboM(n-1, memo) + fiboM(n-2, memo); return memo[n] # add new value in dictionary

for n in range(10): print(f"F{n} = {fiboM(n)}", end=' / ') # display the 10 first Fibonacci terms

F0 = 0 / F1 = 1 / F2 = 1 / F3 = 2 / F4 = 3 / F5 = 5 / F6 = 8 / F7 = 13 / F8 = 21 / F9 = 34 / 

In [6]:
def fiboT(n, a=0, b=1):
  """return the n-th term of the Fibonacci sequence (terminal recursive version)"""
  return fiboT(n-1, b, a+b) if n > 1 else b if n > 0 else a

for n in range(10): print(f"F{n} = {fiboT(n)}", end=' / ') # display the 10 first Fibonacci terms

F0 = 0 / F1 = 1 / F2 = 1 / F3 = 2 / F4 = 3 / F5 = 5 / F6 = 8 / F7 = 13 / F8 = 21 / F9 = 34 / 

In [7]:
def fiboI(n):
  """return the n-th term of the Fibonacci sequence (iterative version)"""
  a, b = 0, 1 # initialisation des variables stockant les termes de la suite : a = F_0, b = F_1
  for _ in range(n): # utilisation de la variable anonyme '_' comme compteur de boucle
    a, b = b, a + b # mise √† jour des termes de la suite : 'a' = terme pr√©c√©dent, 'b' = terme courant
  return a

for n in range(10): print(f"F{n} = {fiboI(n)}", end=' / ') # display the 10 first Fibonacci terms

F0 = 0 / F1 = 1 / F2 = 1 / F3 = 2 / F4 = 3 / F5 = 5 / F6 = 8 / F7 = 13 / F8 = 21 / F9 = 34 / 

In [8]:
def fiboG(n):
  """return the n-th term of the Fibonacci sequence (generator version)"""
  a, b = 0, 1 # initialisation des variables stockant les termes de la suite : a = F_0, b = F_1
  for _ in range(n-1): # utilisation de la variable anonyme '_' comme compteur de boucle
    yield a; a, b = b, a + b # mise √† jour des termes de la suite : 'a' = terme pr√©c√©dent, 'b' = terme courant
  yield a

for n,f in enumerate(fiboG(10)): print(f"F{n} = {f}", end=' / ') # display the 10 first Fibonacci terms

F0 = 0 / F1 = 1 / F2 = 1 / F3 = 2 / F4 = 3 / F5 = 5 / F6 = 8 / F7 = 13 / F8 = 21 / F9 = 34 / 

In [9]:
for c in 'FPMTI': # loop over fibo versions
  name = 'fibo' + c; f = eval(name) # get name and code for current fibo version
  a, b = f(100), str(f(1000)) # compute the 100th and the 1000th term for current fibo version
  print(f"‚óè {name}(100) = {a} ‚óè {name}(1000) = {b[:20]}...{b[-20:]}") # cut middle of fibo(1000)

‚óè fiboF(100) = 354224848179263111168 ‚óè fiboF(1000) = 43466557686938914862...34523370463746326528
‚óè fiboP(100) = 354224848179263111168 ‚óè fiboP(1000) = 43466557686938914862...34523370463746326528
‚óè fiboM(100) = 354224848179261915075 ‚óè fiboM(1000) = 43466557686937456435...76137795166849228875
‚óè fiboT(100) = 354224848179261915075 ‚óè fiboT(1000) = 43466557686937456435...76137795166849228875
‚óè fiboI(100) = 354224848179261915075 ‚óè fiboI(1000) = 43466557686937456435...76137795166849228875


---
### 2 - Benchmarking

Lorsqu'on travaille en traitements des donn√©es, il arrive tr√®s fr√©quemment que l'on se retrouve dans une situation similaire √† celle de notre exemple, c'est-√†-dire avoir plusieurs impl√©mentations alternatives pour une m√™me fonctionnalit√©. Mis √† part certains cas triviaux, s√©lectionner la meilleure version est rarement une t√¢che facile, car il n'y a pas forc√©ment une relation d'ordre total, selon les crit√®res de comparaison choisis. L'op√©ration de comparaison des performances de ces diff√©rentes impl√©mentations s'appelle un **benchmark**, qui √† l'origine √©tait un terme utilis√© par les g√©om√®tres et les cartographes pour identifier une altitude de r√©f√©rence sur le terrain (la traduction litt√©rale signifie ***marque sur un banc de mesure***)

Un crit√®re de comparaison important pour ces diff√©rentes impl√©mentations consiste √† mesurer leur vitesse d'ex√©cution sur un m√™me exemple (on choisira g√©n√©ralement un exemple plut√¥t complexe, pour lequel les temps de calcul risquent d'√™tre assez √©lev√©s). Le noyau **`ipykernel`** permet d'effectuer de telles comparaisons tr√®s facilement gr√¢ce √† la commande magique **`%timeit`** qui va cr√©er un ***environnement de benchmarking*** pour la mesure de performance entre plusieurs algorithmes.

Dans notre exemple de la suite de Fibonacci, comme on dispose de cinq versions diff√©rentes pour effectuer le m√™me calcul, il est tout √† fait judicieux de lancer un benchmarking pour obtenir en faisant plusieurs tests comparatifs sur les vitesses de calcul. Dans un premier test, on compare le temps d'ex√©cution pour le calcul des 25 premiers termes de la suite de Fibonacci :

In [10]:
a = %timeit fiboI(25)

966 ns ¬± 10.2 ns per loop (mean ¬± std. dev. of 7 runs, 1,000,000 loops each)


In [11]:
for c in 'FPRMTI':
  name = 'fibo' + c; f = eval(name); print('‚óè ' + name)
  %timeit [f(n) for n in range(25)]
%timeit list(fiboG(25))

‚óè fiboF
10.5 Œºs ¬± 147 ns per loop (mean ¬± std. dev. of 7 runs, 100,000 loops each)
‚óè fiboP
11.2 Œºs ¬± 704 ns per loop (mean ¬± std. dev. of 7 runs, 100,000 loops each)
‚óè fiboR
22.8 ms ¬± 912 Œºs per loop (mean ¬± std. dev. of 7 runs, 10 loops each)
‚óè fiboM
2.31 Œºs ¬± 203 ns per loop (mean ¬± std. dev. of 7 runs, 100,000 loops each)
‚óè fiboT
20.8 Œºs ¬± 1.58 Œºs per loop (mean ¬± std. dev. of 7 runs, 10,000 loops each)
‚óè fiboI
10.8 Œºs ¬± 1.06 Œºs per loop (mean ¬± std. dev. of 7 runs, 100,000 loops each)
1.62 Œºs ¬± 33.3 ns per loop (mean ¬± std. dev. of 7 runs, 1,000,000 loops each)


On constate que pour de petites valeurs de **$n$** :
  - **`fiboF`**, **`fiboP`** et **`fiboI`** ont des temps d'ex√©cution tr√®s similaires
  - **`fiboR`** est environ 2000x plus lente que **`fiboI`**
  - **`fiboT`** est environ 2x plus lente que **`fiboI`**
  - **`fiboL`** est environ 5x plus rapide que  **`fiboI`**

Lorsqu'on augmente la valeur de **$n$**, les temps de calcul avec **`fiboR`** deviennent tr√®s vite r√©dhibitoires (plusieurs minutes pour **$n = 50$** ), √† cause des calculs inutiles engendr√©s par la double r√©currence. Par cons√©quent, on ne va conserver que les quatre autres versions pour le second test qui consiste √† calculer les 1000 premiers termes de la suite de Fibonacci :

In [12]:
for c in 'MTI':
  name = 'fibo' + c; f = eval(name); print('‚óè ' + name)
  %timeit [f(n) for n in range(1000)]

‚óè fiboM
99.2 Œºs ¬± 2.6 Œºs per loop (mean ¬± std. dev. of 7 runs, 10,000 loops each)
‚óè fiboT
76.7 ms ¬± 4.59 ms per loop (mean ¬± std. dev. of 7 runs, 10 loops each)
‚óè fiboI
20.2 ms ¬± 210 Œºs per loop (mean ¬± std. dev. of 7 runs, 100 loops each)


In [13]:
for c in 'MTI':
  name = 'fibo' + c; f = eval(name); print('‚óè ' + name)
  %timeit [f(n) for n in range(1000)]

‚óè fiboM
96.2 Œºs ¬± 1.79 Œºs per loop (mean ¬± std. dev. of 7 runs, 10,000 loops each)
‚óè fiboT
77.6 ms ¬± 4.48 ms per loop (mean ¬± std. dev. of 7 runs, 10 loops each)
‚óè fiboI
20.3 ms ¬± 1.25 ms per loop (mean ¬± std. dev. of 7 runs, 100 loops each)


On peut constater que, pour des valeurs de *n* plus grandes, la version it√©rative **`fibo`** est pr√®s de 50x plus lente que la version fonctionnelle **`fiboF`** . Donc, avec ce seul crit√®re de la **vitesse d'ex√©cution**, on pourrait conclure que **`fiboF`** est une impl√©mentation largement meilleure que **`fibo`**.

Mais la vitesse d'ex√©cution n'est pas le seul crit√®re qualitatif pour juger de l'impl√©mentation d'un algorithme. Un autre crit√®re fondamental est le **domaine de validit√©** qui d√©finit l'ensemble des donn√©es pour lesquelles l'algorithme donne un r√©sultat correct. Et sur ce crit√®re, la diff√©rence entre les deux versions est sans appel :

La version it√©rative effectue ses calculs en utilisant le type **`int`** pour lequel (comme on l'a rappel√© dans le chapitre pr√©c√©dent) la pr√©cision n'est limit√©e que la quantit√© de m√©moire disponible sur l'interpr√©teur Python. Dans notre cas, on obtient sans aucune difficult√©, les 2090 chiffres composant la valeur exacte du 10000$^e$ terme de la suite de Fibonacci :

In [14]:
fiboI(9999)

2079360823713349807211264898864283682508703609401590311968294586652850142345568664892745603430522651559175734329719015801062479426725097317613381017990273803823178974834623555648319143159192453239442002806781032040872441469346284906266838708330804825092065449334087873322637758084744632487379760373479464825811385863155040408101726038120291994389237094285260164739821355447908182359371542956694514931299366484677909043779928477367537928427066017513466483326637769864201210689135579114187277693408080350495679409464829288056605636471818766266897075853738335267742083557415594565854200363476532454100612101244678568917149480326240860269309121160197393822944663604990153196328615969907788042772028923553932967187718291564341907918652511867885682160089752017107049943765706734240087108390881180097625972743182053955425686946081535591845825339823438236043576275982317989611674842426954592463320461413799285081435201873848092358155398899089715146940613169561449778372074346137375621868510685682609069633981

A l'inverse, la version fonctionnelle effectue ses calculs en utilisant le type **`float`** pour lequel (comme on l'a √©galement rappel√© dans le chapitre pr√©c√©dent) le stockage est d√©fini avec une pr√©cision limit√©e (*norme IEEE 754*). Dans notre cas, la valeur du 10000$^e$ terme d√©passe tr√®s largement le plus grand nombre repr√©sentable par le type **`float`** et donc l'ex√©cution de la fonction aboutit √† un erreur de d√©bordement **`OverflowError`**

In [15]:
# Note : enlever le caract√®re '#' en pr√©fixe de la ligne suivante pour provoquer l'erreur
#fiboM(9999)

M√™me s'il est simplifi√© √† l'extr√™me, cet exemple est assez caract√©ristique d'une situation qu'on retrouve souvent en Analyse Num√©rique, et plus g√©n√©ralement dans les Sciences des Donn√©es : pour un m√™me traitement, il existe des algorithmes rapides mais avec un domaine de validit√© restreint et des algorithmes plus lents avec des domaines plus vastes. Pour un probl√®me donn√©, il faut donc avoir une connaissance en amont assez pr√©cise sur la variabilit√© des donn√©es √† traiter, afin de choisir l'algorithme optimal pour chaque cas de figure.

In [None]:
from numba import jit # import de la fonction 'jit' (just-in-time compilation)

@jit
def fiboNF(n):
  """return the n-th term of the Fibonacci sequence (numba optimized functional version)
     fibo(n) = (phi**n-psi**n)/(phi-psi) where phi = (1+sqrt(5))/2 and psi = (1-sqrt(5))/2"""
  phi, psi = (1 + 5**0.5) / 2, (1 - 5**0.5) / 2
  return round((phi**n - psi**n) / (phi - psi))

@jit
def fiboNP(n):
  """return the n-th term of the Fibonacci sequence (numba optimized precomputed functional version)
     fibo(n) = (phi**n-psi**n)/(phi-psi) where phi = (1+sqrt(5))/2 and psi = (1-sqrt(5))/2"""
  return round((1.618033988749895**n - (-0.6180339887498949)**n) * 0.4472135954999579)

@jit
def fiboNR(n):
  """return the n-th term of the Fibonacci sequence (numba optimized recursive version)"""
  return fiboNR(n-1) + fiboNR(n-2) if n > 1 else n

@jit
def fiboNT(n, a=0, b=1):
  """return the n-th term of the Fibonacci sequence (terminal recursive version)"""
  return fiboNT(n-1, b, a+b) if n > 1 else b if n > 0 else a

@jit
def fiboNI(n):
  """return the n-th term of the Fibonacci sequence (numba optimized iterative version)"""
  a, b = 0, 1
  for _ in range(n): a, b = b, a + b
  return a

In [None]:
n = 100
for f in (fiboF, fiboP, fiboM, fiboT, fiboNT, fiboI, fiboNI): print(f(n) % 1000000)

---
Mais on peut faire encore bien mieux que cela en termes de performance. En effet, le noyau d'ex√©cution **ipykernel** inclut par d√©faut les fonctionnalit√©s du package [**numba**](https://numba.pydata.org) qui propose un m√©canisme de [**compilation √† la vol√©e**](https://fr.wikipedia.org/wiki/Compilation_%C3%A0_la_vol%C3%A9e) (***Just-In-Time*** ou **JIT**) qui permet de convertir une fonction Python en langage machine une 

In [None]:
%timeit -r 20 [fiboNF(n) for n in range(1000)]
%timeit -r 20 [fiboNP(n) for n in range(1000)]
%timeit -r 20 [fiboNT(n) for n in range(1000)]
%timeit -r 20 [fiboNI(n) for n in range(1000)]

In [None]:
%timeit fiboNI(30000)
#%timeit fiboNT(20000)
#%timeit fiboI(20000)

In [None]:
%timeit fiboNP(30000)

In [None]:
fiboI(3000) % 1000000, fiboNI(3000) % 1000000, fiboNP(3000) % 1000000

---
### 2 - Robustesse et contr√¥le des donn√©es entrantes

La robustesse d'un programme se d√©finit comme sa capacit√© √† d√©tecter en amont les donn√©es probl√©matiques, avant qu'elles ne provoquent des erreurs sur les traitements √† mettre en oeuvre.

La mani√®re la plus simple pour augmenter la robustesse d'un programme consiste √† mettre ***un contr√¥le de donn√©es entrantes*** au d√©but du bloc de chacune des fonctions du programme qui manipule des donn√©es provenant d'une source ext√©rieure (par exemple, des donn√©es qui ont √©t√© soit saisies au clavier par un utilisateur, soit lues dans un fichier local ou distant, soit r√©cup√©r√©s via un flux r√©seau). Ce type de contr√¥le est tellement fr√©quent (et tellement important) que la plupart des langages de programmation fournissent une instruction sp√©cifique pour cette t√¢che.

Ainsi le langage Python poss√®de une instruction **`assert <test>, <message>`** qui va interrompre le programme en affichant le message **`<message>`** √† chaque fois que **`<test>`** fournit une valeur bool√©enne fausse. Il suffit donc pour une donn√©e particuli√®re d'identifier toutes les conditions que doit respecter cette donn√©e, et de les combiner avec l'op√©rateur **`and`** pour construire l'expression **`<test>`**.

> **Note :** Dans l'instruction **`assert`**, la virgule de s√©paration entre le test et le message d'erreur est obligatoire. De plus, il arrive assez fr√©quemment (notamment si le test combine plusieurs conditions qui doivent √™tre v√©rifi√©es simultan√©ment) que le nombre de caract√®res n√©cessaire pour l'ensemble de la commande **`assert`** d√©passe largement les 80 caract√®res qui repr√©sente la taille maximale conseill√©e pour une ligne de code en Python. La solution habituelle dans ces cas-l√† est d'ins√©rer un caract√®re de continuation **`'\'`** juste apr√®s la virgule, et de placer le message d'erreur sur la ligne suivante. Pour les m√™mes raisons, si le test comporte un grand nombre de conditions √† v√©rifier, il est g√©n√©ralement pr√©f√©rable d'utiliser plusieurs instructions **`assert`** avec des tests et des messages d'erreurs sp√©cifiques.

Voici ce que cela donne pour la fonction **`fibo(n)`** :

In [None]:
# on rajoute un contr√¥le de type et de valeur sur la donn√©e entrante 'n' de la fonction
def fibo(n):
  """return the n-th term of the Fibonacci sequence (iterative version)"""
  assert isinstance(n, int) and n >= 0, f"{n} must be a positive integer"
  a, b = 0, 1
  for loop in range(n):
    a, b = b, a + b
  return a

In [None]:
# Note : enlever un par un le caract√®re '#' en pr√©fixe des lignes suivantes pour tester
#fibo(-1)
#fibo(1.5)
#fibo('toto')

---
### 3 - Fiabilit√© et tests unitaires

La fiabilit√© d'un programme se d√©finit comme sa capacit√© √† fournir syst√©matiquement un r√©sultat correct, lorsque le jeu de donn√©es fourni en entr√©e se trouve dans le domaine de validit√© pour le traitement souhait√©. Comme pour la robustesse, la fiabilit√© d'un programme se v√©rifie syst√©matiquement au niveau de chacune des fonctions qui le composent. Le principe g√©n√©ral mis en oeuvre pour le contr√¥le de la fiabilit√©, consiste √† √©crire, quasiment en m√™me temps que le code de chacune des fonctions, un ensemble de cas d'utilisation, appel√©e ***tests unitaires*** (*unit test*, en anglais) qui sont destin√©s √† v√©rifier sur un jeu de donn√©es suffisament repr√©sentatif, que la fonction fournit bien les r√©sultats attendus.

Le langage Python poss√®de un package **`pytest`** qui fournit un moteur de tests unitaires similaires √† ceux qui existent dans d'autres langages de programmation. Son principe consiste √† √©crire un ensemble de fonctions (toutes pr√©fix√©es par **`test_...`**) qui contiennent un ensemble de clauses **`assert`** fournissant des conditions sur les valeurs de retours pour diff√©rents appels de fonctions. Le moteur va ainsi identifier et ex√©cuter automatiquement toutes les fonctions de tests (gr√¢ce au pr√©fixe) est v√©rifier que toutes les conditions sont valid√©es. Le package **`pytest`** est assez simple √† mettre en oeuvre, mais il est con√ßu pour du d√©veloppement logiciel bas√© sur un IDE classique, o√π le code est compos√© d'un ensemble de modules. Ainsi pour chaque module **`xxx`** qui compose son code, le d√©veloppeur va √©crire un autre module **`test_xxx`** qui sera d√©di√© aux tests des fonctions du module **`xxx`**.

Lorsqu'on d√©veloppe en Python √† l'int√©rieur d'un notebook, le code n'est pas d√©compos√© en modules ind√©pendants, mais en une s√©rie de cellules de code. Par cons√©quent, le package **`pytest`** n'est pas tr√®s facile √† mettre en oeuvre, et il s'av√®re que le package **`doctest`** est infiniment mieux adapt√©. Avec ce package, au lieu de cr√©er des fonctions de tests sp√©cifiques, le d√©veloppeur va simplement inclure dans la docstring de chaque fonction, les diff√©rents cas d'utilisation de la fonction et le r√©sultat attendu pour chaque cas. Avec une syntaxe tr√®s l√©g√®re (cf. ci-dessous), cette id√©e permet non seulement d'inclure facilement des tests unitaires, mais √©galement de profiter de la pr√©sence de ces tests pour enrichir la documentation de chacune des fonctions du notebook, et fournir ainsi √† l'utilisateur des informations tr√®s pr√©cises sur l'utilisation de ces fonctions.

La r√©f√©rence compl√®te pour l'utilisation du package **`doctest`** se trouve dans le **[manuel de r√©f√©rence](https://docs.python.org/fr/3/library/doctest.html#)** de la biblioth√®que standard de Python, mais comme son principe est simplissime, il suffit d'un exemple illustrant les trois cas de figures usuels pour comprendre la syntaxe √† respecter pour sa mise en oeuvre :

In [None]:
from doctest import testmod # import de la fonction 'testmod' du package 'doctest'

In [None]:
def fibo(n: int) -> int:
  """return the n-th term of the Fibonacci sequence (iterative version)
  >>> fibo(0), fibo(1), fibo(2), fibo(3), fibo(4), fibo(5)
  (0, 1, 1, 2, 3, 5)
  >>> [fibo(n) for n in range(50)] # doctest: +ELLIPSIS
  [0, 1, ... 7778742049]
  >>> fibo(-1), fibo(2.5), fibo('z')
  Traceback (most recent call last):
  ...
  AssertionError: -1 must be a positive integer
  """
  assert isinstance(n, int) and n >= 0, f"{n} must be a positive integer"
  a, b = 0, 1
  for loop in range(n):
    a, b = b, a + b
  return a

Comme on peut le voir dans le code ci-dessus, on rajoute une s√©rie de lignes simulant des appels √† la fonction avec diff√©rents jeux de param√®tres, dans la cha√Æne de caract√®res multi-lignes correspondant √† la docstring de la fonction **`fibo`**. Chaque ligne commen√ßant par un pr√©fixe **`>>>`** indique les appels √† effectuer, et la ou les lignes suivantes (jusqu'au prochain pr√©fixe **`>>>`**) repr√©sentent le r√©sultat attendu. Pour compacter l'affichage, on peut tout √† fait combiner plusieurs appels en une seule ligne, en les s√©parant par des virgules. Par exemple:
```
>>> fibo(0), fibo(1), fibo(2), fibo(3), fibo(4), fibo(5)
(0, 1, 1, 2, 3, 5)
```

Si l'on sait que le r√©sultat renvoy√© par un appel particulier est tr√®s long (en nombre de caract√®res ou en nombre de lignes), on peut utiliser la notation **`...`** (en activant le mode *ELLIPSIS* par un commentaire sp√©cifique) et se contenter de ne mettre que le d√©but et la fin du r√©sultat attendu :
```
>>> [fibo(n) for n in range(50)] # doctest: +ELLIPSIS
[0, 1, ... 7778742049]
```

Enfin, si l'on sait que le r√©sultat va renvoyer une erreur (**`AssertionError`**, **`TypeError`**, **`ValueError`** ou autres), il suffit l√† encore de ne mettre que le d√©but et la fin du message affich√©, pour que **`doctest`** puisse v√©rifier que le r√©sultat obtenu est bien conforme au r√©sultat attendu. M√™me si concr√®tement seul le premier appel de fonction provoquant une erreur est ex√©cut√©, il est assez fr√©quent de combiner tous les cas d'utilisation provoquant la m√™me erreur sur la m√™me ligne, pour gagner de la place dans la docstring :
```
>>> fibo(-1), fibo(2.5), fibo('z')
Traceback (most recent call last):
...
AssertionError: -1 must be a positive integer
```



L'appel de la fonction **`testmod`** va analyser toutes les docstrings de toutes les fonctions d'un notebook, identifier les tests qui y figurent et ex√©cuter l'un apr√®s l'autre chacun des tests pour contr√¥ler le r√©sultat obtenu. Si tout se passe bien, l'affichage sera minimaliste, en indiquant simplement le nombre de test effectu√©s et le nombre d'√©checs (cf. ci-dessous). Si un ou plusieurs tests √©chouent, l'affichage sera plus d√©taill√©, permettant au d√©veloppeur d'identifier toutes les erreurs rencontr√©es. On peut √©galement activer l'option **`verbose=True`** pour forcer la fonction **`testmod`** √† d√©tailler l'ensemble des tests effectu√©s :

In [None]:
testmod()
#testmod(verbose=True) # enlever le '#' pour obtenir la version d√©taill√©e

<h2 style="padding:16px; color:#FFF; background:#06D">B - Affichage de donn√©es multimedia</h2>

Comme on l'a vu dans le chapitre pr√©c√©dent, le noyau du langage Python (et c'est le cas pour la quasi-totalit√© des noyaux des langages de programmation g√©n√©ralistes) n'inclut que les outils de base pour ***manipuler des donn√©es num√©riques et des donn√©es textuelles***. Lorsqu'on souhaite manipuler des donn√©es plus complexes (graphiques, photos, audios, vid√©os, bases de donn√©es structur√©es, ...) il faudra imp√©rativement utiliser des biblioth√®ques d'extension, ne serait-ce que pour lire et afficher les donn√©es correspondantes.

Dans ce contexte, l'avantage de l'environnement JupyterLab est ind√©niable : comme il s'ex√©cute dans un navigateur web, les notebooks ont directement acc√®s √† toutes les fonctionnalit√©s permettant l'affichage des donn√©es multim√©dia qu'on trouve habituellement dans les pages HTML. Le noyau [**ipykernel**](https://ipython.org) fournit ainsi un package **`IPython`** contenant un module **`display`** qui permet aux programmes Python de lire et d'afficher tr√®s facilement des images, des vid√©os, des sons, qu'ils soient stock√©s dans des fichiers locaux, ou sur des serveurs distants.

---

Pour importer le module **`IPython.display`** on va utiliser la technique appel√©e **short alias import** qui est devenue tr√®s classique au sein de l'√©cosyst√®me *Scientific Python* dans lequel les programmes sont g√©n√©ralement grands consommateurs de modules ou de packages import√©s. Comme son nom l'indique, la technique consiste √† ***importer un module ou package en lui donnant un alias court*** afin de raccourcir le pr√©fixe qu'il faudra utiliser pour acc√©der aux ressources qu'il contient : 

> **`import IPython.display as dp`**

Apr√®s cette commande d'import, toutes les fonctions disponibles dans le module **`IPython.display`** seront accessibles dans le notebook, simplement en pr√©fixant le nom de la fonction par l'alias du module. Dans notre cas, une fonction **`xxx(...)`** appartenant au module pourra √™tre appel√©e avec **`dp.xxx(...)`** alors qu'avec un import classique, il faudrait utiliser la pr√©fixe complet **`IPython.display.xxx(...)`** ce qui sera moins efficace mais √©galement moins lisible.

In [None]:
import IPython.display as dp # import du package 'Ipython.display' avec alias 'dp'

Les cellules de code ci-dessous vont illustrer l'utilisation de quelques unes des fonctions fournies par ce module, pour visualiser des donn√©es multim√©dia complexes directement en Python, sans √™tre oblig√© de passer par les commandes magiques comme on l'avait fait au chapitre 1 :

---
### 1 - Donn√©es au format Markdown

In [None]:
# On cr√©e une cha√Æne de caract√®res multi-lignes contenant un bloc de code Markdown
# Attention : il est recommand√© d'utiliser syst√©matiquement une cha√Æne brute
# (pr√©fixe 'r' avant les guillemets) pour √©viter que le noyau n'interpr√®te les
# caract√®res qui ont un r√¥le en Python, notamment les backslashes '\'
code = r"""
Voici une liste regroupant diff√©rents √©l√©ments pouvant √™tre visualis√©s en Markdown :
* El√©ment contenant des caract√®res Unicode par copier/coller : üôÇüëçüåû‚õî
* El√©ment contenant des caract√®res Unicode par code num√©rique : &#9824; &#9827; &#9829; &#9830;
* El√©ment contenant une √©quation math√©matique : $e^{\,i\pi} + 1 = 0$
* El√©ment contenant un extrait de code source : `x, y = minmax(x, y)`
* El√©ment contenant un lien hypertexte local : [**Jupyter Logo**](IMG/jupyter.png)
* El√©ment contenant un lien hypertexte distant : [**Jupyter Website**](https://www.jupyter.org)
"""
dp.Markdown(code) # on affiche le code interpr√©t√© via la fonction 'dp.Markdown'

In [None]:
# Cela fonctionne √©galement si le code se trouve dans un fichier local ou distant
dp.Markdown(filename='TEST/display.md') # mettre url=... pour visualiser un fichier distant

---
### 2 - Donn√©es au format LaTeX

In [None]:
# On cr√©e une cha√Æne de caract√®res multi-lignes (toujours une cha√Æne brute) contenant du code LaTeX
code = r"""
$$\left\{\begin{align}
e^{\,i\pi} + 1 &= 0 &&
{\sf (identit√© d'Euler)}\\
F(\omega) &= \int_{-\infty}^{+\infty} f(t)\,e^{-2\pi i\, \omega t}\, dt &&
{\sf (transform√©e de Fourier continue)}\\
S_m &= \sum_{n\,=\,0}^{N-1} s_n\, e^{-2\pi i\frac{m\,n}{N}} &&
{\sf (transform√©e de Fourier discr√®te)}
\end{align}\right.$$
"""
dp.Latex(code) # on affiche le code interpr√©t√© via la fonction 'dp.Latex'

In [None]:
# Cela fonctionne √©galement si le code se trouve dans un fichier local ou distant
dp.Latex(filename='TEST/display.tex') # mettre url=... pour visualiser un fichier distant

---
### 3 - Donn√©es au format HTML + CSS

In [None]:
# On cr√©e une cha√Æne de caract√®res multi-lignes contenant du code HTML et CSS
text = r"""
<style>
  .row {display:flex; font-size:16px; font-weight:700}
  .colA {flex:66%; background:#7FA; padding:8px}
  .colB {flex:33%; background:#FA7; padding:8px}
  .colC {flex:99%; text-align:center; font-style:italic}
</style>
<div class=row>
  <div class=colA>ABCDEFGHIJKLMNOPQRSTUVWXYZ</div>
  <div class=colB>ABCDEFGHIJKLMNOPQRSTUVWXYZ</div>
</div> <div class=row>
  <div class=colC>ABCDEFGHIJKLMNOPQRSTUVWXYZ</div>
</div> <div class=row>
  <div class=colC>ABCDEFGHIJKLMNOPQRSTUVWXYZ</div>
  <div class=colC>ABCDEFGHIJKLMNOPQRSTUVWXYZ</div>
</div> <div class=row>
  <div class=colB>ABCDEFGHIJKLMNOPQRSTUVWXYZ</div>
  <div class=colA>ABCDEFGHIJKLMNOPQRSTUVWXYZ</div>
</div>
"""
dp.HTML(text) # on affiche le code interpr√©t√© via la fonction 'dp.HTML'

In [None]:
# Cela fonctionne √©galement si le code se trouve dans un fichier local ou distant
dp.HTML(filename='TEST/display.html') # mettre url=... pour visualiser un fichier distant

---
### 4 - Donn√©es au format SVG

In [None]:
# On cr√©e une cha√Æne de caract√®res multi-lignes contenant du code SVG
code = r"""
<svg viewBox='0 0 750 250'>
  <g fill='#EEE' stroke='#000' stroke-width='2'>
    <rect x='25' y='25' width='700' height='200' rx='25' stroke-width='4'/>
    <ellipse cx='100' cy='125' rx='50' ry='75' fill='#F00'/>
    <ellipse cx='210' cy='125' rx='50' ry='75' fill='#0F0'/>
    <ellipse cx='320' cy='125' rx='50' ry='75' fill='#00F'/>
    <ellipse cx='430' cy='125' rx='50' ry='75' fill='#0FF'/>
    <ellipse cx='540' cy='125' rx='50' ry='75' fill='#F0F'/>
    <ellipse cx='650' cy='125' rx='50' ry='75' fill='#FF0'/>
  </g>
</svg>
"""
dp.SVG(code) # on affiche le code interpr√©t√© via la fonction 'dp.SVG'

In [None]:
# Cela fonctionne √©galement si le code se trouve dans un fichier local ou distant
dp.SVG(filename='TEST/display.svg') # mettre url=... pour visualiser un fichier distant

---
### 5 - Donn√©es de types Image / Audio / Video

Les donn√©es de types Image, Audio ou Video sont g√©n√©ralement stock√©es dans des fichiers de donn√©es, en utilisant des formats standardis√©s :
- **BMP** (non compress√©), **JPG**, **PNG** ou **GIF** pour les ***images***
- **WAV** (non compress√©), **MP3**, **AAC** ou **OGG** pour les ***sons***
- **MP4** pour les ***vid√©os***

Le package **`display`** fournit trois fonctions **`Image`**, **`Audio`** et **`Video`** permettant de visualiser les contenus de ces fichiers. N√©anmoins, le comportement de ces fonctions diff√®rent selon qu'on utilise un fichier local (appel avec l'argument **`filename=...`**) ou distant (appel avec l'argument **`url=...`**). Dans le premier cas, les donn√©es du fichier visualis√© sont directement incluses dans le fichier **`.ipynb`** du notebook (ce qui permet de conserver l'info, m√™me si le fichier initial est effac√© ou d√©plac√©, mais cr√©e le risque d'un notebook devenant ***tr√®s volumineux*** si de nombreux fichiers multim√©dia sont ins√©r√©s de cette mani√®re. Dans le second cas, seul le lien URL est stock√© dans le notebook (ce qui n'augmente donc pas la taille du fichier  **`.ipynb`** mais impose √† l'utilisateur d'√™tre connect√© √† Internet lors de l'utilisation du notebook). Selon les cas de figures, l'un ou l'autre de ces deux comportements peut s'av√©rer pr√©f√©rable.

In [None]:
dp.Image('IMG/smiley.png') # mettre url=... pour visualiser un fichier distant

In [None]:
dp.Audio('IMG/beep.mp3') # mettre url=... pour visualiser un fichier distant

In [None]:
dp.Video('IMG/noise.mp4') # mettre url=... pour visualiser un fichier distant

Pour les vid√©os en streaming, le module **`display`** propose deux fonctions **`YouTubeVideo`** et **`VimeoVideo`** permettant d'afficher une vid√©o dont on connait l'identificateur alphanum√©rique sur les deux sites classiques [**YouTube**](https://www.youtube.com) et [**Vimeo**](https://vimeo.com/fr/) :

In [None]:
dp.YouTubeVideo('A5YyoCKxEOU', width='100%', height=360) # affichage vid√©o YouTube via son identificateur

In [None]:
dp.VimeoVideo('455065259', width='100%', height=360) # affichage vid√©o Vimeo via son identificateur

---
### 6 - Affichage de sites web

Enfin, le module **`display`** propose une fonction **`IFrame`** qui a le m√™me r√¥le que la balise **`<iframe>`** en HTML, et qui sera g√©n√©ralement utilis√©e pour afficher un site web complet au sein d'un notebook :

In [None]:
dp.IFrame('https://www.wikipedia.org', width='100%', height=360)

---
### 7 - Utilisation de 'display' dans une fonction

Lorsque la derni√®re expression d'une cellule de code, consiste √† appeler une des fonctions du module **`display`** (comme on l'a fait dans les exemples pr√©c√©dents), le r√©sultat renvoy√© par cette fonction est directement interpr√©t√© par le noyau d'ex√©cution, ce qui provoque l'affichage de la donn√©e correspondante (Markdown, HTML, LaTeX, Image, etc). Par contre, lorsqu'une fonction de ce module est appel√© √† l'int√©rieur d'une autre fonction Python, l'affichage n'est pas automatique. Dans ce cas de figure, il faut ***explicitement appeler la fonction **`dp.display`** pour provoquer l'affichage***.

Voici un exemple de mise en oeuvre, avec le code d'une fonction **`fold_seq`** permettant d'afficher le contenu d'une s√©quence arbitraire en Python √† l'aide d'une table HTML. Le param√®tre **`fold`** d√©finit le nombre d'√©l√©ments √† mettre sur une m√™me ligne, avant d'effectuer un changement de ligne (*line folding*, en anglais) :

In [None]:
def fold_seq(seq, fold=10): # version sans les balises fermantes
  """display a Python sequence as an HTML table, where 'fold' controls line folding"""
  seq = [str(item) for item in seq] # convert all items to string
  seq = [seq[n:n+fold] for n in range(0, len(seq), fold)] # extract slices of 'fold' items
  head, tail = '<center><table>', '</table></center>' # set head and tail of HTML code
  rowsep, colsep = '\n<tr>', '\n  <td>' # set row and col separators as HTML tags with indentation
  html = rowsep + rowsep.join(colsep + colsep.join(row) for row in seq) # set body of HTML code
  html = '\n'.join([head, html, tail]) # insert body between head and tail
  #print(html) # print whole generated HTML code (TL;DR)
  #print(cutcut(html)) # print only head and tail lines of HTML code (use 'cutcut' from 'tools' module)
  dp.display(dp.HTML(html)) # display generated HTML table

fold_seq(range(1, 121), fold=20) # valeurs de 1 √† 120, r√©parties par lignes de 20 colonnes

**Note :** La fonction pr√©c√©dente ne d√©finit que les balises ouvrantes (**`<tr>`** et **`<td>`**) des lignes et des colonnes de la table, alors que la norme HTML impose de rajouter les balises fermantes associ√©es (**`</tr>`** et **`</td>`**). En pratique, il s'av√®re que la totalit√© des navigateurs web savent interpr√©ter correctement le formatage d'une table HTML, m√™me si les balises fermantes des lignes et des colonnes sont manquantes (c'est un h√©ritage de l'√©poque o√π la norme √©tait moins stricte) donc la fonction **`fold_seq`** donne un r√©sultat correct quelque soit le navigateur utilis√© pour ex√©cuter l'environnement Jupyter. Ceci dit, si on est puriste et qu'on cherche √† produire du code HTML respectant la norme, on peut r√©√©crire la fonction pr√©c√©dente, pour obtenir une version l√©g√®rement plus compliqu√©e :

In [None]:
def fold_seq(seq, fold=10): # version avec les balises fermantes
  """display a Python sequence as an HTML table, where 'fold' controls line folding"""
  seq = [str(item) for item in seq] # convert all items to string
  seq = [seq[n:n+fold] for n in range(0, len(seq), fold)] # extract slices of 'fold' items
  head, tail = '<center><table>', '</table></center>' # set head and tail of HTML code
  # define 6 separators as HTML tags : (head, tail, sep = head+tail) both for row and col
  rowhead, rowtail, colhead, coltail = '<tr>\n', '</tr> ', '  <td>', '</td>\n'
  rowsep, colsep = rowtail + rowhead, coltail + colhead
  html = rowhead + rowsep.join(colhead + colsep.join(row) + coltail for row in seq) + rowtail
  html = '\n'.join([head, html, tail]) # insert HTML body between head and tail
  #print(cutcut(html)) # print head and tail lines of HTML code
  dp.display(dp.HTML(html)) # display generated HTML table

fold_seq(range(1, 121), fold=20) # valeurs de 1 √† 120, r√©parties par lignes de 20 colonnes

G√©n√©rer du code HTML par programme avant d'utiliser la fonction **`display`** pour l'afficher, est une pratique tr√®s courante √† l'int√©rieur des notebooks Jupyter, en particulier lorsque l'on souhaite afficher des donn√©es avec une mise en page pr√©cise. Une autre pratique courante assez similaire consiste √† g√©n√©rer du code SVG par programme, afin de pouvoir construire une image de mani√®re algorithmique. Voici un exemple permettant de g√©n√©rer un √©chiquier dont la taille et les couleurs peuvent √™tre modifi√©es par l'utilisateur :

In [None]:
def chessboard(size=8, scale=32, colors='#EEE #777'):
  """display a chessboard as an SVG image, using provided size, scale factor and colors"""
  head, tail = f"<svg width='{scale*size}' viewBox='0 0 {size} {size}'>", '</svg>' # set <svg> tag
  colors = colors.split() # convert colors string to a couple of colors
  svg = [f"<rect x='{c}' y='{r}' width='1' height='1' fill='{colors[(r+c)%2]}'/>"
    for r in range(size) for c in range(size)] # create list of <rect> tags for all cells
  svg = '\n'.join([head, *svg, tail]) # merge SVG body between head and tail
  #print(cutcut(svg)) # print head and tail lines of HTML code
  #dp.display(dp.SVG(svg)) # display SVG image
  dp.display(dp.HTML(f"<center>{dp.SVG(svg).data}</center>")) # display centered SVG image

chessboard() # √©chiquier d√©fini avec les arguments par d√©faut
#chessboard(40, 12, '#0F0 #00F') # modification de la taille et des couleurs

<h2 style="padding:16px; color:#FFF; background:#06D">C - Interaction</h2>

Le noyau [**ipykernel**](https://ipython.org) fournit un autre package appel√© **`ipywidgets`** qui permet d'int√©grer dans les notebooks Jupyter, un ***ensemble de widgets d'interaction*** (on parle √©galement d'**interacteurs**) pour modifier les arguments des fonctions contenues dans un notebook, sans √™tre oblig√© de modifier les cellules de code correspondantes. Cela permet donc √† un utilisateur qui ne ma√Ætrise pas la programmation, de pouvoir modifier facilement les jeux de donn√©es √† exp√©rimenter.

Le package **`ipywidgets`** rec√®le de nombreuses fonctionnalit√©s permettant de cr√©er des notebooks interactifs tr√®s complexes. Pour une utilsation avanc√©e, il faut se r√©f√©rer √† la documentation compl√®te du package qui se trouve sur le site [**ReadTheDocs**](https://ipywidgets.readthedocs.io). Dans cette section, nous allons simplement illustrer l'apport le plus important que fournit le package, √† savoir la d√©finition d'une fonction **`interact`** extr√™mement flexible, qui permet de cr√©er automatiquement des widgets graphiques pour la saisie interactive de donn√©es par l'utilisateur.

---
Lorsqu'on souhaite utiliser l'int√©gralit√© des fonctionnalit√©s fournies, on importe habituellement le package **`ipywidgets`** par le biais d'un alias court, avec la commande suivante :

> **`import ipywidgets as ws`**

Lorsqu'on souhaite simplement b√©n√©ficier de la fonction **`interact`** (ce qui est notre cas), on peut directement importer cette fonction, sans avoir √† utiliser le reste du package :

> **`from ipywidgets import interact`**


In [None]:
from ipywidgets import interact # import de la fonction 'interact' du package 'ipywidgets'

In [None]:
def test(a, b): return a, b # simple fonction de test pour les diff√©rents int√©racteurs

In [None]:
test(10, 15)

---
### 1 - Interacteurs √† valeurs num√©riques

Les interacteurs √† valeurs num√©riques permettent √† l'utilisateur de saisir soit une valeur enti√®re, soit une valeur r√©elle par le biais d'un **curseur graphique**. L'intervalle de variation de ce curseur est fournie sous la forme d'un couple d'entiers ou de r√©els. Une troisi√®me valeur (optionnelle) permet de sp√©cifier le pas d'incr√©ment du curseur. Si ce pas n'est pas sp√©cifi√©, il est initialis√© √† 1 pour les entiers, et √† 0.1 pour les r√©els

In [None]:
interact(test, a=(0,10), b=(0,50,5)); # interacteur √† valeurs enti√®res

In [None]:
interact(test, a=(0.0,1.0), b=(-5,5,0.5)); # interacteur √† valeurs r√©elles

---
### 2 - Interacteurs √† choix

Les interacteurs √† choix permettent √† l'utilisateur de saisir soit une valeur bool√©enne (sous la forme d'une **case √† cocher**), soit une cha√Æne de caract√®res (sous la forme d'une **zone de saisie** alphanum√©rique), soit de choisir parmi une liste de valeurs pr√©d√©finies (sous la forme d'une **liste d√©roulante**). Comme pour
les interacteurs √† valeurs num√©riques, c'est toujours par le biais de la fonction `interact` que ces interacteurs sont cr√©√©s. Pour chaque argument fourni √† la fonction `interact`, c'est la nature de la valeur d'initialisation de cet argument qui permet √† **ipywidgets** de choisir l'interacteur ad√©quat

In [None]:
interact(test, a=True, b=False); # interacteur √† valeurs bool√©ennes

In [None]:
interact(test, a='', b=['AAA','BBB','CCC','DDD','EEE','FFF']); # interacteurs de saisie et de choix

---
### 3 - D√©corateur d'interaction et fonction d'affichage

Les fonctions de calcul utilis√©es dans un notebook fournissent rarement des r√©sultats sous une forme qui permet de les connecter directement avec un interacteur. Il est donc souvent pr√©f√©rable de cr√©er une **fonction d'affichage** qui va appeler la fonction de calcul et reformater les r√©sultats obtenus pour les rendre plus lisibles. De plus, comme la fonction **`interact`** peut √™tre utilis√©e sous la forme d'un **d√©corateur**, cela permet d'avoir une mise en oeuvre et une r√©partition des r√¥les tr√®s lisible :

- la **fonction de calcul** **`xxx(...)`** va effectuer les calculs num√©riques, sans prendre en compte la notion d'interaction
- le **d√©corateur** **`@interact(...)`** permet de cr√©er la widget d'interaction et de d√©finir les domaines de variation de chacun des arguments
- la **fonction d'affichage** **`show_xxx(...)`** permet de formater les r√©sultats obtenus et de d√©finir les valeurs par d√©faut pour les diff√©rents arguments de la fonction de calcul

In [None]:
from math import factorial # mise en oeuvre avec une fonction de calcul externe

@interact(n=(0,60)) # le d√©corateur d'interaction d√©finit les intervalles de variation des arguments
def show_factorial(n=0): # la fonction d'affichage d√©finit les valeurs par d√©faut et formate le r√©sultat
  print(f"{n}! = {factorial(n)}")

In [None]:
def facto(n): # mise en oeuvre avec une fonction de calcul interne
  """return n! (factorial of integer n)"""
  out = 1
  for loop in range(1, n+1): out *= loop
  return out

@interact(n=(0,60)) # le d√©corateur d'interaction d√©finit les intervalles de variation des arguments
def show_facto(n=0): # la fonction d'affichage d√©finit les valeurs par d√©faut et formate le r√©sultat
  print(f"{n}! = {facto(n)}")

---
### 4 - Interaction avec validation manuelle

Lorsque la complexit√© de la fonction de calcul est telle que l'affichage ne s'effectue pas de mani√®re instantan√©e, ou lorsqu'il est judicieux de modifier plusieurs param√®tres √† la fois avant de relancer le calcul, il est possible d'utiliser le d√©corateur **`interact_manual`** au lieu de **`interact`** . Dans ce cas, l'affichage graphique n'est pas actualis√© √† chaque modification de l'un des param√®tres, mais est diff√©r√© jusqu'au moment o√π l'utilisateur clique sur le bouton intitul√© ***`Run Interact`*** :

In [None]:
from ipywidgets import interact_manual # import de la fonction 'interact_manual'

In [None]:
@interact_manual(n=(0,1000)) # on choisit une interaction avec validation manuelle
def show_facto(n=0): # le reste ne change pas
  print(f"{n}! = {facto(n)}")

---
### 5 - Combinaison avec la fonction 'display'

Contrairement √† ce que pourraient laisser penser les exemples ci-dessus, la fonction d'affichage utilis√©e par les interacteurs du module **`ipywidgets`** n'est pas limit√©e √† l'utilisation de la seule fonction **`print`**. En effet, toute fonction permettant de g√©n√©rer un affichage au sein du notebook Jupyter est susceptible d'√™tre employ√©e, ce qui signifie que ces interacteurs se combinent particuli√®rement bien avec la fonction **`display`** √©tudi√©e dans la section B. Par exemple, la fonction **`fold_seq`** (qui g√©n√®re et affiche du code HTML) ou la fonction **`chessboard`** (qui g√©n√®re et affiche du code SVG) peuvent √™tre directement pilot√©e par des interacteurs, avec exactement le m√™me formalisme que les exemples pr√©c√©dents :

In [None]:
print('Enter any valid Python sequence in the cell below :')
@interact_manual(fold=(1,20))
def show_fold_seq(seq='range(50)', fold=10):
  if not seq: return # si la s√©quence est vide, on interrompt l'ex√©cution
  fold_seq(eval(seq), fold) # sinon, on appelle la fonction 'fold_seq' avec les param√®tres interactifs

In [None]:
@interact(size=(2,24))
def show_chessboard(size=8):
  chessboard(size) # on ne modifie qu'un seul argument de la fonction

In [None]:
print('Enter two valid HTML colors in the cell below :')
@interact_manual(size=(2,24), scale=(1,64))
def show_chessboard(colors='#0F0 #00F', size=12, scale=24):
  if not colors: return # si les couleurs sont vide, on interrompt l'ex√©cution
  chessboard(size, scale, colors) # sinon, on appelle la fonction 'chessboard'

<div style="padding:8px; margin:0px -20px; color:#FFF; background:#06D; text-align:right">‚óè ‚óè ‚óè </div>