# Notebook: Interface utilisateur
### Comment lancer Jupyter

- Sous Mac ou GNU/Linux, dans un terminal : `$ jupyter-notebook`,
- Sous Windows, avec Anaconda, il y a un lanceur graphique installé.

  
Lorsque vous créez un nouveau document notebook, le nom du notebook, une barre de menu, une barre d'outils, une cellule de code vide et le kernel s'affichent.
<center><img src="img/JN.png" width="700" ></center>

## Jupyter pour écrire des documents

On peut *utiliser* le langage à balise [Markdown](https://jupyter-notebook.readthedocs.io/en/stable/examples/Notebook/Working%20With%20Markdown%20Cells.html) ! Et $\LaTeX^2$

Pour lancer une cellule Markdown, sélectionnez le type dans la barre d'outils.

<center><img src="img/codeM.png" width="700" ></center> 

### **Cellules de texte**

Créez une nouvelle cellule, changez son type en `Markdown`, tapez quelques mots et appuyez sur `Ctrl-Enter`. Jupyter Notebook "rendra" le texte et l'affichera sur la page. Vous pouvez appuyer sur `Enter` ou cliquer dans la cellule pour modifier à nouveau son contenu. 

**Markdown basics**

**LaTeX equations**

vous pouvez inclure des expressions mathématiques à la fois en ligne et affichées.  
- Inline expressions can be added by surrounding the latex code with `$`
- Les expressions affichées sont entourées de `\begin{equation}` et `\end{equation}`

**Blocs de code**

Notebook supporte le markdown Github, vous pouvez utiliser des triples crochets pour les blocs de code :

### **Cellules Raw**  
Vous pouvez intégrer du code destiné à l'illustration plutôt qu'à l'exécution

### **Cellules de Code**

Vous pouvez également appuyer sur `Alt-Entrée` pour rendre la cellule actuelle et créer une nouvelle cellule. Les nouvelles cellules seront par défaut des cellules de code.

### ***Kernels***  

Lorsque vous exécutez une cellule de code, ce code est exécuté dans le *kernel*.  
Toute sortie est renvoyée à la cellule pour être affichée. L'état du *kernel* persiste dans le temps et entre les cellules - il concerne le document dans son ensemble et non les cellules individuelles.  

La plupart du temps, le flux dans un Notebook se fait de haut en bas. Mais il est fréquent de revenir en arrière pour apporter des modifications.  
Nous pouvons voir l'ordre d'exécution à gauche de chaque cellule (`[6]`).  
Si jamais est nécessaire réinitialiser, il existe plusieurs options dans le menu Kernel :  
- `Restart`: redémarre le noyau, effaçant ainsi toutes les variables, etc. qui ont été définies.
- `Restart & Clear Output`: idem que ci-dessus mais effacera également la sortie affichée sous les cellules de code.
- `Restart & Run All`: idem que ci-dessus mais exécutera toutes les cellules dans l'ordre, de la première à la dernière.
- `Interrupt`: Si le *kernel* est bloqué sur un calcul ous pouvons l'arrêter.

### **Raccourcis clavier**  

`Ctrl-Enter` exécute la cellule en cours  
`Alt-Enter` exécute la cellule en cours et crée ensuite une nouvelle cellule.  
`Enter` lance l'édition de la cellule sélectionnée.   
Pour quitter l'édition d'une cellule, appuyez sur `Esc`.   

*Si le curseur n'est pas actif dans une cellule*  
`m` convertit la cellule sélectionnée en cellule Markdown  
`b` insère une nouvelle cellule sous la cellule sélectionnée  
`x` "coupe" la cellule sélectionnée  
`v` colle une cellule précédemment coupée sous la cellule   sélectionnée  
`Cmd-S`Sauvegarde
`h` fait apparaître un écran d'aide contenant de nombreux autres raccourcis.  

Vous pouvez "télécharger" votre notebook dans différents formats via `File > Save And Export Notebook As`. Vous pouvez télécharger votre notebook sous forme de fichier HTML statique, fichier .ipynb, PDF, etc.


### **Les lignes magiques dans Jupyter**

Lorsque nous utilisons `%matplotlib inline`, les graphiques Matplotlib s'affichent directement dans le Notebook. 

In [None]:
import numpy as np
import matplotlib.pyplot as plt
%matplotlib inline 

plt.ion()

data = np.random.randn(2, 100)
fig, ax = plt.subplots()
ax.scatter(*data, c=data[1], s=100*np.abs(data[0]));

tapez `%lsmagic` dans une cellule code, et exécutez la cellule. Vous obtiendrez une liste des lignes et cellules magiques disponibles.  

- Les *lignes magiques* opèrent sur une seule ligne d'une cellule de code
- Les *cellules magiques* agissent sur l'ensemble de la cellule de code dans laquelle elles sont appelées.

### Lancement d'une commande Unix  

Il est possible de lancer une commande Unix depuis un notebook Jupyter. Il faut pour cela précéder la commande du symbole `!`  
e.g. `!ls`

In [None]:
!ls

### **Exemple: Bref usage de python et de données Iris**

**Configuration** 
Il est courant de commencer par une cellule de code spécifique pour les importations et la configuration.

In [None]:
%matplotlib inline
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns 
from sklearn.datasets import load_iris
from sklearn.cluster import KMeans
sns.set(style="darkgrid")

Nous allons importer:  
`pandas` pour travailler avec les données  
`Matplotlib` pour tracer des graphiques  
`Seaborn` pour rendre les graphiques plus jolis
`sns.set(style="darkgrid")` c'est une ligne magique pour demander à `Jupyter` de capturer les tracés *Matplotlib* et de les rendre dans la sortie de la cellule. 

In [None]:
# Chargement du jeu de données Iris
iris = sns.load_dataset('iris')

In [None]:
# Affichage des cinq premières lignes du jeu de données
print("Aperçu des données Iris :")
iris.head()

In [None]:
# Informations sur les données
iris.info()

In [None]:
# Statistiques descriptives
print("\nStatistiques descriptives des données Iris :")
iris.describe()

In [None]:
# Visualisation des données avec Matplotlib
# Pairplot pour visualiser les relations entre les variables
print("\nVisualisation des relations entre les variables avec Pairplot :")
sns.pairplot(iris, hue='species')
plt.show()

In [None]:
# Boxplot pour visualiser la répartition des données pour chaque espèce
print("\nBoxplot pour visualiser la répartition des données pour chaque espèce :")
plt.figure(figsize=(10, 6))
sns.boxplot(data=iris, x='species', y='sepal_length')
plt.title('Répartition de la longueur des sépales par espèce')
plt.show()

In [None]:
# Exclure la colonne "species"
iris_numeric = iris.drop('species', axis=1)

# Heatmap pour visualiser les corrélations entre les variables numériques
print("\nHeatmap pour visualiser les corrélations entre les variables :")
plt.figure(figsize=(8, 6))
sns.heatmap(iris_numeric.corr(), annot=True, cmap='coolwarm', linewidths=0.5)
plt.title('Corrélations entre les variables')
plt.show()


In [None]:
# Clustering avec K-Means
# Sélection des caractéristiques à utiliser pour le clustering
X = iris.drop(['species'], axis=1)

In [None]:
# Clustering avec K-Means en utilisant 3 clusters (car nous savons qu'il y a 3 espèces)
kmeans = KMeans(n_clusters=3, random_state=42)
kmeans.fit(X)

In [None]:
# Ajout des étiquettes de clusters au jeu de données
iris['cluster'] = kmeans.labels_

In [None]:
# Visualisation des clusters avec Matplotlib
plt.figure(figsize=(10, 6))
sns.scatterplot(data=iris, x='sepal_length', y='sepal_width', hue='cluster', palette='viridis', s=100)
plt.title('Clustering des iris selon les caractéristiques des sépales')
plt.xlabel('Longueur du sépale')
plt.ylabel('Largeur du sépale')
plt.legend(title='Cluster')
plt.show()