# Python Intermédiaire

---

## 1. Fonction

### 1.1 Déclarer une fonction avec `def`

En Python, **vous déclarez des fonctions en utilisant le mot-clé** `def`, suivi du nom de la fonction, de parenthèses `()`, et de deux-points `:`. Le corps de la fonction est indenté sous la déclaration.

In [None]:
def simple_greet(name, greeting):
  greeting = f"{greeting}, {name}!"
  print(greeting)

simple_greet("Alice", "Bonjour") # Sortie : Bonjour, Alice!

**Retourner des valeurs avec** `return`

L'instruction `return` est utilisée dans une fonction pour renvoyer une valeur à l'appelant.

*   **Comment l'utiliser :** Lorsqu'une instruction `return` est rencontrée, la fonction s'arrête immédiatement et la valeur spécifiée est renvoyée.
*   **Comment utiliser la valeur retournée :** La valeur retournée par une fonction peut être assignée à une variable, utilisée dans une expression, ou passée comme argument à une autre fonction.

Si une fonction n'a pas d'instruction `return`, ou si elle a une instruction `return` sans valeur, elle retourne implicitement `None`.

In [None]:
def return_greet(name, greeting):
  greeting = f"{greeting}, {name}!"
  print(greeting)
  return greeting

greeting = return_greet("Bob", "Salut")
print(greeting) # Sortie : Salut, Bob!

greeting = simple_greet("Alice", "Bonjour") # Sortie : Bonjour, Alice!
print(greeting) # Sortie : None

print(f"Ce matin, j'ai rencontré Bob et lui ai dit : {return_greet('Bob', 'Salut')}")
print(f"Cet après-midi, j'ai rencontré Alice et lui ai dit : {simple_greet('Alice', 'Bonjour')}")

**Valeurs d'arguments par défaut**

Vous pouvez fournir des valeurs par défaut pour les arguments de fonction. Cela rend l'argument optionnel lors de l'appel de la fonction.

*   **Syntaxe :** Assignez une valeur par défaut à un argument en utilisant l'opérateur d'assignation (`=`) dans la définition de la fonction : `def ma_fonction(arg1, arg2=valeur_par_defaut):`
*   **Comportement :**
    *   Si vous appelez la fonction sans fournir de valeur pour l'argument avec une valeur par défaut, la valeur par défaut sera utilisée.
    *   Si vous fournissez une valeur pour l'argument, cette valeur remplacera la valeur par défaut.

In [None]:
def greet(name, greeting="Bonjour"):
  print(f"{greeting}, {name}!")

greet("Bob") # Sortie : Bonjour, Bob!
greet("Charlie", "Salut") # Sortie : Salut, Charlie!

### 1.2 Portée des variables

**Portée des variables dans les fonctions**

La portée des variables détermine où une variable peut être accédée dans votre code. Dans les fonctions Python :

*   **Variables locales :** Les variables définies à l'intérieur d'une fonction sont locales à cette fonction et ne peuvent pas être accédées depuis l'extérieur.
*   **Variables globales :** Les variables définies en dehors de toute fonction peuvent être accédées depuis les fonctions, mais leur modification nécessite le mot-clé `global`.
*   **Paramètres de fonction :** Agissent comme des variables locales dans la fonction.

**Implications importantes lors de l'appel de fonctions :**
*   **Isolation :** Les variables locales n'interfèrent pas avec les variables extérieures à la fonction, même si elles ont le même nom.
*   **Sécurité des données :** Les fonctions ne peuvent pas modifier accidentellement les variables dans le code appelant sauf si elles sont explicitement conçues pour le faire.
*   **Efficacité mémoire :** Les variables locales sont automatiquement nettoyées lorsque la fonction se termine.
*   **Comportement prévisible :** Chaque appel de fonction crée son propre ensemble indépendant de variables locales.


Jouez avec les exemples suivants pour maîtriser la portée des variables dans les fonctions

In [None]:
# 1. Variables locales vs globales

# Variable globale (définie en dehors de toute fonction)
global_var = "Je suis globale"

def show_scope():
    # Variable locale (n'existe que dans cette fonction)
    local_var = "Je suis locale"
    
    print("Dans la fonction :")
    print(f"  local_var: {local_var}")      # Peut accéder à la variable locale
    print(f"  global_var: {global_var}")    # Peut lire la variable globale
    
    return local_var

# Essayer d'accéder à local_var en dehors de la fonction
print("En dehors de la fonction :")
print(f"  global_var: {global_var}")       # Peut accéder à la variable globale
# print(f"  local_var: {local_var}")       # Cela causerait une erreur !

# Appeler la fonction
result = show_scope()
print(f"  result: {result}")               # Peut accéder à la valeur retournée

In [None]:
# 2. Paramètres de fonction comme variables locales

def process_data(param1, param2):
    print("Dans la fonction :")
    print(f"  param1: {param1}")
    print(f"  param2: {param2}")
    
    # Les paramètres agissent comme des variables locales - on peut les modifier
    param2 = param1  # Assigner la valeur de param1 à param2
    print(f"  Après param2 = param1 :")
    print(f"    param1: {param1}")
    print(f"    param2: {param2}")
    
    return param1, param2

# Variables en dehors de la fonction
param1 = "Valeur originale"
param2 = "Autre valeur"

print("Avant l'appel de la fonction :")
print(f"  param1: {param1}")
print(f"  param2: {param2}")

print("\n" + "="*40)

# Appeler la fonction
result1, result2 = process_data(param1, param2)

print("\nAprès l'appel de la fonction :")
print(f"  param1: {param1}")        # Inchangé - les paramètres sont des copies locales
print(f"  param2: {param2}")        # Inchangé - la valeur originale est préservée
print(f"  result1: {result1}")      # Valeurs retournées
print(f"  result2: {result2}")      # Montre que l'assignation a fonctionné dans la fonction

In [None]:
# 3. Isolation des variables - Mêmes noms, portées différentes

# Variable en dehors des fonctions
my_var = "Je suis en dehors"

def function1():
    my_var = "Je suis dans function1"  # Même nom, portée différente
    print(f"Dans function1 : {my_var}")

def function2():
    my_var = "Je suis dans function2"  # Même nom, portée différente
    print(f"Dans function2 : {my_var}")

print(f"En dehors des fonctions : {my_var}")

function1()
print(f"Après function1 : {my_var}")  # Original inchangé

function2()
print(f"Après function2 : {my_var}")  # Original inchangé

# Chaque fonction a sa propre copie indépendante de my_var

In [None]:
# 4. Modifier les variables globales depuis une fonction

# Variable globale
global_counter = 0

def increment_global():
    global global_counter  # Doit déclarer 'global' pour la modifier
    global_counter += 1
    print(f"Dans la fonction : global_counter = {global_counter}")

def increment_local():
    # Cela crée une variable LOCALE, ne modifie pas la globale
    global_counter = 100  # C'est une variable locale !
    print(f"Dans la fonction : global_counter locale = {global_counter}")

print("Avant tout appel de fonction :")
print(f"global_counter = {global_counter}")

print("\n" + "="*40)

# Essayer de modifier la variable globale sans le mot-clé 'global'
increment_local()
print(f"Après increment_local() : global_counter = {global_counter}")  # Inchangé !

print("\n" + "="*40)

# Modifier correctement la variable globale
increment_global()
print(f"Après increment_global() : global_counter = {global_counter}")  # Changé !

increment_global()
print(f"Après le deuxième increment_global() : global_counter = {global_counter}")  # Changé à nouveau !

# Point clé : Vous avez besoin du mot-clé 'global' pour modifier les variables globales depuis les fonctions

### 1.3 Mutabilité des arguments de fonction

**Objets mutables vs immuables comme arguments de fonction**

Lorsque des objets sont passés à des fonctions, leur comportement dépend du fait qu'ils soient **mutables** (peuvent être modifiés) ou **immuables** (ne peuvent pas être modifiés) :

*   **Objets immuables** (chaînes, nombres, tuples) : Lorsqu'ils sont passés à une fonction, vous obtenez une **copie** de la référence. Modifier le paramètre crée une nouvelle variable locale et n'affecte pas l'objet original.
*   **Objets mutables** (listes, dictionnaires, ensembles) : Lorsqu'ils sont passés à une fonction, vous obtenez une **référence** au même objet. Modifier le contenu de l'objet affecte l'objet original en dehors de la fonction.

**Important :** Il s'agit de la **mutabilité des objets**, pas de la **portée des variables**. Les règles de portée des variables s'appliquent toujours - le nom du paramètre est local à la fonction, mais pour les objets mutables, ce nom local pointe vers le même objet en mémoire.


Voici quelques exemples pour illustrer ces concepts.

In [None]:
# 1. Objets mutables vs immuables comme arguments de fonction

def modify_immutable(x):
    print(f"Dans la fonction - avant : x = {x}")
    x = x + 10  # Crée une nouvelle variable locale, ne modifie pas l'original
    print(f"Dans la fonction - après : x = {x}")

def modify_mutable(lst):
    print(f"Dans la fonction - avant : lst = {lst}")
    lst.append(99)  # Modifie l'objet original
    print(f"Dans la fonction - après : lst = {lst}")

# Test avec un objet immuable (entier)
num = 5
print(f"Avant l'appel de modify_immutable : num = {num}")
modify_immutable(num)
print(f"Après l'appel de modify_immutable : num = {num}")  # Inchangé !

print("\n" + "="*50)

# Test avec un objet mutable (liste)
my_list = [1, 2, 3]
print(f"Avant l'appel de modify_mutable : my_list = {my_list}")
modify_mutable(my_list)
print(f"Après l'appel de modify_mutable : my_list = {my_list}")  # Changé !

print("\n" + "="*50)

In [None]:
# 2. Portée des variables vs mutabilité des objets

def function_with_2lists(list1, list2):
    print(f"Dans la fonction - avant : list1 = {list1}, list2 = {list2}")
    list1 = [100, 200, 300]  # Réassigne le nom du paramètre local
    list2.append(99)
    print(f"Dans la fonction - après : list1 = {list1}, list2 = {list2}")

global_list1 = [1, 2, 3]
global_list2 = [4, 5, 6]

print(f"Avant l'appel de function_with_2lists : global_list1 = {global_list1}, global_list2 = {global_list2}")
print('-'*50)
function_with_2lists(global_list1, global_list2)
print('-'*50)
print(f"Après l'appel de function_with_2lists : global_list1 = {global_list1}, global_list2 = {global_list2}")  # Inchangé !

# Le nom du paramètre est local, mais le réassigner n'affecte pas l'objet original


### 1.4 Lambda

**Qu'est-ce que Lambda ?**

Une **fonction lambda** est une petite fonction anonyme qui peut être définie en une seule ligne. Elle est utile pour des opérations simples dont vous n'avez besoin qu'une seule fois, surtout lors de l'utilisation de fonctions comme `map()`, `filter()`, ou `sorted()`.

**Syntaxe :** `lambda arguments: expression`

**Caractéristiques clés :**
*   **Anonyme :** Aucun nom de fonction requis
*   **Expression unique :** Ne peut contenir qu'une seule expression (pas d'instructions)
*   **En ligne :** Souvent utilisée directement là où une fonction est attendue
*   **Temporaire :** Idéale pour des opérations simples et ponctuelles


In [None]:
# Exemples de fonctions Lambda

# 1. Fonction lambda de base
square = lambda x: x ** 2
print(f"Carré de 5 : {square(5)}")

# 2. Lambda avec plusieurs arguments
add = lambda x, y: x + y
print(f"Additionner 3 et 4 : {add(3, 4)}")

# 3. Lambda avec map() - appliquer une fonction à chaque élément
numbers = [1, 2, 3, 4, 5]
squared_numbers = list(map(lambda x: x ** 2, numbers))
print(f"Original : {numbers}")
print(f"Carrés : {squared_numbers}")

# 4. Lambda avec filter() - garder uniquement les éléments qui satisfont la condition
even_numbers = list(filter(lambda x: x % 2 == 0, numbers))
print(f"Nombres pairs : {even_numbers}")

# 5. Lambda avec sorted() - tri personnalisé
students = [("Alice", 85), ("Bob", 92), ("Charlie", 78)]
# Trier par note (deuxième élément du tuple)
sorted_by_grade = sorted(students, key=lambda student: student[1])
print(f"Trié par note : {sorted_by_grade}")

# 6. Lambda vs fonction régulière (même résultat)
def square_function(x):
    return x ** 2

print(f"Lambda : {square(3)}")
print(f"Fonction : {square_function(3)}")

# Lambda est plus concis pour les opérations simples !


### **Exercice 1.1 : Fonction**

**Instructions :** Complétez l'exercice suivant pour tester votre compréhension de :
- La syntaxe des fonctions avec `def`
- Les valeurs d'arguments par défaut
- Les arguments mutables vs immuables

**Tâche :** Créez une fonction appelée `process_data` qui :
1. Prend une **liste** (mutable) comme premier argument
2. Prend une **chaîne de charactère** (immuable) comme deuxième argument avec la valeur par défaut `"default"`
3. Prend un **nombre** (immuable) comme troisième argument avec la valeur par défaut `2`
4. Ajoute la chaîne à la liste
5. Ajoute le nombre à chaque élément de la liste, lorsque l'élément est de type `int`.
6. **Retourne la liste originale** (la liste passée en argument doit être modifiée sur place)

**Testez votre fonction avec ces appels :**
```python
# Test 1 : Tous les arguments fournis
l1 = [1, 2, 3]
result1 = process_data([1, 2, 3], "hello", 10)

# Test 2 : Utilisation des valeurs par défaut
l2 = [4, 5.5, 'Mike']
result2 = process_data(l2)

# Test 3 : Vérifier si la liste originale est modifiée
original_list = [10, 20.7, 30]
result3 = process_data(original_list, "test", 5)
print(f"Liste originale après l'appel de fonction : {original_list}")
```

**Comportement attendu :**
- La fonction doit modifier la liste originale **sur place** (comportement mutable)
- Les paramètres chaîne et nombre doivent utiliser les valeurs par défaut lorsqu'ils ne sont pas fournis
- La fonction doit retourner la liste originale (qui est maintenant modifiée)
- La liste originale en dehors de la fonction doit être modifiée

Le squelette de la solution est donné dans le code suivant. Remplissez les parties manquantes.

In [None]:
def process_data(data_list, text="default", number=2):
    pass
    
    # créer une copie de la data_list
    #old_list = 
    
    # modifier la data_list sur place
    
    # retourner la liste originale
    #return old_list

# Test 1 : Tous les arguments fournis
l1 = [1, 2, 3]
print(f"Avant l'appel de process_data : l1 = {l1}")

result1 = process_data(l1, "hello", 10)
print(f"Après l'appel de process_data : l1 = {l1}")
print(f"result1 : {result1}")

print('\n' + '-'*50)

# Test 2 : Utilisation des valeurs par défaut
l2 = [4, 5.5, 'Mike']
print(f"Avant l'appel de process_data : l2 = {l2}")

result2 = process_data(l2)
print(f"Après l'appel de process_data : l2 = {l2}")
print(f"result2 : {result2}")

print('\n' + '-'*50)

# Test 3 : Vérifier si la liste originale est modifiée
l3 = [10, 20.7, 30]
print(f"Avant l'appel de process_data : l3 = {l3}")

result3 = process_data(l3, "test", 5)
print(f"Après l'appel de process_data : l3 = {l3}")
print(f"result3 : {result3}")


## 2. Éléments de NumPy

**Pourquoi NumPy pour le ML ?**

*   NumPy est la fondation de l'écosystème Python pour la science des données. Scikit-learn, pandas et la plupart des bibliothèques ML attendent des tableaux NumPy en entrée. Comprendre ces concepts fondamentaux de NumPy, à savoir

    *   **Les tableaux NumPy** et **leurs opérations**

    est essentiel pour l'apprentissage automatique.

*   Les boîtes à outils puissantes de NumPy. Au-delà des opérations de base sur les tableaux, NumPy fournit des boîtes à outils spécialisées :

    *   **Statistiques** - Fonctions statistiques intégrées (moyenne, écart-type, corrélation, etc.)
    *   **Algèbre linéaire** - Opérations matricielles, valeurs propres, SVD et autres fonctions d'algèbre linéaire  
    *   **Échantillonnage aléatoire** - Générer des données aléatoires pour les tests et l'initialisation
    *   **Fonctions mathématiques** - Trigonométriques, logarithmiques et autres opérations mathématiques, telles que la transformée de Fourier rapide.

    Ces boîtes à outils font de NumPy une fondation computationnelle complète pour les algorithmes ML et plus généralement pour la science et l'ingénierie.

### 2.1 Tableau NumPy

Un **tableau NumPy** est un objet tableau multidimensionnel qui représente une grille de valeurs, toutes du même type. C'est comme une liste Python, mais beaucoup plus puissant et efficace.

* **Créer des tableaux à partir d'une liste (de listes de listes ...)**. 

In [None]:
import numpy as np

print('\n' + '-'*50)
# Créer un tableau NumPy à partir d'une liste
list_1d = [1, 2, 3, 4, 5]
array_1d = np.array(list_1d)
print("array_1d: \n", array_1d)
print("la dimension de array_1d : ", np.ndim(array_1d))
print("la forme de array_1d : ", np.shape(array_1d))
print("la taille de array_1d : ", np.size(array_1d))
print("le type de données des éléments de array_1d : ", array_1d.dtype)

print('\n' + '-'*50)
# Créer un tableau 2D à partir d'une liste de listes
list_2d = [[1.0, 2.0, 3.0], [4.0, 5.0, 6.0]]
array_2d = np.array(list_2d)
print("array_2d: \n", array_2d)
print("la dimension de array_2d : ", np.ndim(array_2d))
print("la forme de array_2d : ", np.shape(array_2d))
print("la taille de array_2d : ", np.size(array_2d))
print("le type de données des éléments de array_2d : ", array_2d.dtype)

print('\n' + '-'*50)
# Créer un tableau 3D à partir d'une liste de listes de listes
list_3d = [[[1, 2, 3], [4, 5, 6]], [[7, 8, 9], [10, 11, 12]]]
array_3d = np.array(list_3d)
print("array_3d: \n", array_3d)
print("la dimension de array_3d : ", np.ndim(array_3d))
print("la forme de array_3d : ", np.shape(array_3d))
print("la taille de array_3d : ", np.size(array_3d))
print("le type de données des éléments de array_3d : ", array_3d.dtype)

*   **Dimensions des tableaux :** Dans l'exemple précédent, les données (qui sont des scalaires) sont organisées en une structure hiérarchique en couches.
    *   `array_1d` n'a qu'une seule couche (dimension), et sa (unique) première couche contient des entrées qui sont des scalaires dans notre exemple.
    *   `array_2d` ajoute une nouvelle couche : sa première couche est une liste de listes, aussi appelées "lignes", et chaque ligne (la deuxième couche) est elle-même une liste de scalaires, c'est-à-dire un tableau 1D. Ce tableau 2D est comme une matrice (tableau).
    *   `array_3d` va plus loin : sa première couche consiste en des "matrices" qui sont des tableaux 2D (deuxième couche). 
    Les dimensions des tableaux font également référence au nombre d'axes (directions) le long desquels le tableau peut être indexé. Les éléments d'un tableau à $N$ dimensions sont accédés en spécifiant $N$ indices, un pour chaque dimension. Par exemple, dans un tableau 2D, les éléments sont accédés en spécifiant un indice de ligne et un indice de colonne. 

    Cela peut être résumé :

    *   Tableau 1D (vecteur) - Une séquence de nombres (1 axe)
    *   Tableau 2D (matrice) - Un tableau de nombres avec des lignes et des colonnes (2 axes)
    *   Tableau 3D (tenseur) - Un cube de nombres (3 axes)
    *   Tableau nD (tenseur) - Tableaux avec n axes

*   **Accéder aux éléments du tableau via les indices** Les éléments du tableau sont accédés via l'opérateur `[]` entourant une série d'indices séparés par `,`, par exemple `array_3d[0, 2, 1]`. En termes de couches, les indices apparaissant plus à gauche correspondent à une couche supérieure que les indices apparaissant plus à droite. Voici des exemples :

In [None]:
print('-'*50)
# Accéder aux éléments dans un tableau 1D
print('array_1d: \n', array_1d)
print("Le 1er élément de array_1d :", array_1d[0])
print("Le 2e élément de array_1d :", array_1d[1])

print('-'*50)
# Accéder aux éléments dans un tableau 2D
print('array_2d: \n', array_2d)
idx0, idx1 = 0, 1
print(f"Élément array_2d[{idx0}, {idx1}] :", array_2d[idx0, idx1])
idx0, idx1 = 1, 2   
print(f"Élément array_2d[{idx0}, {idx1}] :", array_2d[idx0, idx1])

print('-'*50)
# Accéder aux éléments dans un tableau 3D
print('array_3d: \n', array_3d)
idx0, idx1, idx2 = 0, 1, 2
print(f"Élément array_3d[{idx0}, {idx1}, {idx2}] :", array_3d[idx0, idx1, idx2])
idx0, idx1, idx2 = 1, 0, 0
print(f"Élément array_3d[{idx0}, {idx1}, {idx2}] :", array_3d[idx0, idx1, idx2]) 

* **Créer des tableaux spéciaux** : NumPy fournit plusieurs fonctions pour créer des tableaux avec des motifs ou valeurs spécifiques. Ceux-ci sont particulièrement utiles pour l'initialisation, le masquage et la préparation des données. Ces tableaux spéciaux peuvent généralement être définis en utilisant un tuple, par exemple `(5,5,2)`, qui spécifie la forme du tableau. Les tableaux spéciaux couramment utilisés sont

    * **Zeros** - Tableaux remplis de zéros (utile pour l'initialisation)
    * **Ones** - Tableaux remplis de uns (utile pour les termes de biais)
    * **Full** - Tableaux remplis d'une valeur spécifique
    * **Identity** - Matrices carrées avec des 1 sur la diagonale, 0 ailleurs
    * **Arange** - Tableaux avec des valeurs espacées régulièrement
    * **Linspace** - Tableaux avec un nombre spécifié de valeurs espacées régulièrement

Voici des exemples :

In [None]:
# 1. Zeros - Tableaux remplis de zéros
print("1. Tableaux de zéros :")
zeros_1d = np.zeros(5)
shape = (3, 4)
zeros_2d = np.zeros(shape)
print(f"Zéros 1D : {zeros_1d}")
print(f"Zéros 2D :\n{zeros_2d}")

In [None]:
# 2. Ones - Tableaux remplis de uns
print("\n2. Tableaux de uns :")
ones_1d = np.ones(5)
ones_2d = np.ones((2, 3))
print(f"Uns 1D : {ones_1d}")
print(f"Uns 2D :\n{ones_2d}")

In [None]:
# 3. Matrice identité - Matrice carrée avec des 1 sur la diagonale
print("\n3. Matrice identité :")
identity_3x3 = np.eye(3)
print(f"Identité 3x3 :\n{identity_3x3}")

# 4. Full - Tableaux remplis d'une valeur spécifique
print("\n4. Tableaux complets :")
full_array = np.full((2, 3), 7)
print(f"Tableau rempli de 7 :\n{full_array}")

In [None]:
# 5. Arange - Valeurs espacées régulièrement
print("\n6. Arange (espacé régulièrement) :")
arange_1 = np.arange(0, 10, 2)  # Début, fin, pas
arange_2 = np.arange(5)         # 0 à 4
print(f"0 à 10, pas 2 : {arange_1}")
print(f"0 à 4 : {arange_2}")

# 6. Linspace - Nombre spécifié de valeurs espacées régulièrement
print("\n7. Linspace (nombre spécifié de points) :")
linspace_array = np.linspace(0, 10, 5)  # Début, fin, nombre de points
print(f"5 points de 0 à 10 : {linspace_array}")

* **Tranche (slicing)** : sélectionner un sous-ensemble d'éléments d'un tableau en utilisant une plage d'indices. On peut utiliser à la place d'un indice (par exemple `1`) une plage d'indices (par exemple `n:N` pour le n-ième, (n+1)-ième, ..., (N-1)-ième éléments) pour sélectionner plusieurs éléments dans l'axe (ou couche) associé. Voici des exemples :

In [None]:
# Tableau 1D
arr_1d = np.arange(10)  # [0, 1, ..., 9]
print("\nTableau 1D :", arr_1d)
print("arr_1d[2:5] :", arr_1d[2:5])    # Éléments aux indices 2,3,4
print("arr_1d[4:] :", arr_1d[4:])      # De l'indice 4 à la fin
print("arr_1d[:5] :", arr_1d[:5])      # Du début à l'indice 4

# Tableau 2D
arr_2d = np.arange(12).reshape(3, 4)
print("\nTableau 2D :\n", arr_2d)
print("arr_2d[1:3, 1:3] :\n", arr_2d[1:3, 1:3])   # Lignes 1-2, colonnes 1-2
print("arr_2d[1:, 2] :\n", arr_2d[1:, 2])       # Lignes 1 à la fin, colonnes 0-1
print("arr_2d[:2, 2:] :\n", arr_2d[:2, 2:])       # Lignes 0-1, colonnes 2 à la fin

# Tableau 3D
arr_3d = np.arange(24).reshape(2, 3, 4)
print("\nTableau 3D :\n", arr_3d)
print("arr_3d[1:, 1:3, 2:] :\n", arr_3d[1:, 1:3, 2:])  # Du 1er bloc en avant, lignes 1-2, colonnes 2-3
print("arr_3d[:, 1, :3] :\n", arr_3d[:, 1, 3])      # Tous les blocs, 2 premières lignes, 3 premières colonnes
print("arr_3d[:1, :, 1:3] :\n", arr_3d[:1, :, 1:3])    # Premier bloc, toutes les lignes, colonnes 1-2

* **Combinaison de tableaux** : Joindre plusieurs tableaux en un seul en utilisant des opérations comme la concaténation (le long des lignes/colonnes), l'empilement (le long de nouvelles dimensions), ou la fusion (basée sur des indices communs). Essentiel pour préparer les ensembles de données d'entraînement et combiner des caractéristiques de différentes sources.

In [None]:
# Exemple 1 : Concaténer des tableaux 1D
a = np.array([1, 2, 3])
b = np.array([4, 5, 6])
concat_1d = np.concatenate((a, b))
print("Tableaux 1D concaténés :", concat_1d)

# Exemple 2 : Concaténer des tableaux 2D le long des lignes (axis=0) et des colonnes (axis=1)
c = np.array([[1, 2], [3, 4]])
d = np.array([[5, 6], [7, 8]])
concat_2d_axis0 = np.concatenate((c, d), axis=0)  # Empiler verticalement
concat_2d_axis1 = np.concatenate((c, d), axis=1)  # Empiler horizontalement
print("Tableaux 2D concaténés (axis=0) :\n", concat_2d_axis0)
print("Tableaux 2D concaténés (axis=1) :\n", concat_2d_axis1)

# Exemple 3 : Empiler des tableaux (ajoute une nouvelle dimension)
x = np.array([1, 2, 3])
y = np.array([4, 5, 6])
stacked_vert = np.stack((x, y), axis=0)  # forme (2, 3)
stacked_horiz = np.stack((x, y), axis=1)  # forme (3, 2)
print("Empilé verticalement (axis=0) :\n", stacked_vert)
print("Empilé horizontalement (axis=1) :\n", stacked_horiz)

### 2.2 Opérations vectorisées

Les opérations vectorisées dans NumPy permettent d'effectuer des opérations sur des tableaux entiers sans utiliser de boucles explicites. Cela conduit à un code concis et une exécution beaucoup plus rapide en exploitant des optimisations de bas niveau. Voici des exemples

In [None]:
# Exemple 1 : Arithmétique sur les tableaux
import numpy as np

a = np.array([1, 2, 3, 4])
b = np.array([10, 20, 30, 40])

print("a :", a)
print("b :", b)

# Additionner deux tableaux
sum_ab = a + b     
# Multiplier un tableau par un scalaire
double_a = 2 * a   
# Élever un tableau à une puissance (scalaire)
power_a = a**2     
# Élever un tableau à la puissance d'un autre tableau
power_ab = b**a    

print("Somme de a et b :", sum_ab)
print("Double de a :", double_a)
print("Puissance de a :", power_a)
print("Puissance de a par b :", power_ab)

# Exemple 2 : Fonctions élément par élément
c = np.array([0, np.pi / 2, np.pi])
sin_c = np.sin(c)   # [0.0, 1.0, 0.0]

print("c :", c)
print("Sinus de c :", sin_c)

# Exemple 3 : Opérations booléennes
d = np.array([5, -1, 7, 3])
positive_mask = d > 0      
print("d :", d)
print("Est-ce que d > 0 ? :", positive_mask)

# Exemple 4 : Appliquer une fonction à tous les éléments
squared = np.sqrt(a)
print("Racine carrée de a :", squared)


### 2.3 Opérations mathématiques

NumPy implémente une large gamme d'opérations mathématiques regroupées en plusieurs catégories. Voici quelques-unes couramment utilisées dans chaque catégorie :

1. Opérations arithmétiques :
   - Addition, soustraction, multiplication, division
   - Exemples : `np.add`, `np.subtract`, `np.multiply`, `np.divide`, `np.power`

2. Fonctions trigonométriques :
   - Sinus, cosinus, tangente et leurs inverses
   - Exemples : `np.sin`, `np.cos`, `np.tan`, `np.arcsin`, `np.arccos`, `np.arctan`

3. Exponentielles et logarithmes :
   - Exponentielle, logarithme, log10, log2
   - Exemples : `np.exp`, `np.log`, `np.log10`, `np.log2`

4. **Fonctions statistiques** :
   - Moyenne, médiane, écart-type, somme, min, max
   - Exemples : `np.mean`, `np.median`, `np.std`, `np.sum`, `np.min`, `np.max`

5. **Opérations d'algèbre linéaire** :
   - Produit scalaire, multiplication matricielle, valeurs propres, inverse
   - Exemples : `np.dot`, `np.matmul`, `np.linalg.eig`, `np.linalg.inv`

6. **Agrégations et réductions** :
   - Calculer des résultats sur des axes (comme sum, prod, any, all)
   - Exemples : `np.sum`, `np.prod`, `np.any`, `np.all` (avec l'argument axis)

7. Autres fonctions spéciales :
   - Racine carrée, valeur absolue, arrondi, plancher, plafond
   - Exemples : `np.sqrt`, `np.abs`, `np.round`, `np.floor`, `np.ceil`

Ces fonctions permettent une analyse de données efficace et des calculs scientifiques en utilisant des tableaux NumPy.

Voici quelques exemples de cas d'utilisation courants

In [None]:
import numpy as np

arr = np.array([[1, 2, 3],
                [4, 5, 6]])

print('arr: \n', arr)

# Somme de tous les éléments
print("np.sum(arr) :", np.sum(arr))  

# Somme le long des colonnes (axis=0)
print("np.sum(arr, axis=0) :", np.sum(arr, axis=0))

# Somme le long des lignes (axis=1)
print("np.sum(arr, axis=1) :", np.sum(arr, axis=1))

# Vérifier si tous les éléments sont supérieurs à 0
print("np.all(arr > 0) :", np.all(arr > 0)) 

# Vérifier si un élément est supérieur à 5
print("np.any(arr > 5) :", np.any(arr > 5))

# Moyenne de tous les éléments
print("np.mean(arr) :", np.mean(arr))  

# Max et min de tous les éléments
print("np.max(arr) :", np.max(arr)) 
print("np.min(arr) :", np.min(arr)) 

# Max le long des colonnes
print("np.max(arr, axis=0) :", np.max(arr, axis=0)) 

# Min le long des lignes
print("np.min(arr, axis=1) :", np.min(arr, axis=1)) 


### **Exercice 2.1 : Découvrir l'efficacité de l'implémentation NumPy**

`Numpy` est optimisé pour l'efficacité grâce à son implémentation sous-jacente en C. Ici, nous examinerons particulièrement son efficacité dans l'exécution de la sommation.

Écrivez du code pour comparer le temps pris pour additionner tous les éléments d'une longue liste en utilisant une boucle Python standard et le temps pris en utilisant la fonction `np.sum` de NumPy. Cela vous aidera à observer l'efficacité de l'implémentation vectorisée de NumPy !

1. Créez une liste de 10 000 000 nombres aléatoires (vous pouvez utiliser `numpy.random.rand` pour générer un tableau et le convertir en liste).
2. Additionnez tous les éléments en utilisant une boucle Python (`for` ou `sum()`).
3. Additionnez tous les éléments en utilisant `np.sum`.
4. Mesurez le temps d'exécution pour les deux méthodes (vous pouvez utiliser le module `time`).
5. Affichez les résultats et comparez le temps pris.

Ci-dessous se trouve le squelette du code, vous pouvez l'utiliser pour commencer

In [None]:
import numpy as np
import time

# Créer une grande liste et un tableau numpy
N = 10_000_000
data_list = np.random.rand(N).tolist()
data_array = np.array(data_list)

print('Sommation via boucle Python ...')
# Mesurer la somme en utilisant la fonction sum intégrée de Python ou une boucle for


# afficher le résultat de la sommation et le temps pris


print('Sommation via NumPy ...')
# Mesurer la somme en utilisant np.sum de numpy


# afficher le résultat de la sommation et le temps pris


## 3. Éléments de Matplotlib

Matplotlib est une bibliothèque Python populaire pour créer des graphiques et visualisations de haute qualité. Elle est largement utilisée en analyse de données, recherche scientifique et apprentissage automatique pour présenter les données visuellement et obtenir des insights. Dans cette section, nous introduirons trois sujets fondamentaux dans Matplotlib :

1. Créer des graphiques avec des lignes et des points (nuages de points)
2. Afficher des "champs" (par exemple images, matrices, etc.) en utilisant `imshow`
3. Visualiser les distributions de données avec des histogrammes

Ces sujets vous aideront à commencer avec les moyens les plus courants de visualiser des données en utilisant Matplotlib. 

Plus d'informations et une galerie sur https://matplotlib.org/stable/ pour vos cas d'utilisation.

### * **Graphiques**

On peut tracer une variable (implémentée avec np.array ou list) en fonction d'une autre variable par des lignes ou des nuages de points. Le premier est plus adapté pour afficher la dépendance de variation entre les deux variables, tandis que le second est plus adapté pour l'analyse de corrélation statistique. Voici deux exemples.

In [None]:
import matplotlib.pyplot as plt
import numpy as np

# Exemple 1 : Graphique en ligne de la fonction cos de -5 à +5
x = np.linspace(-5, 5, 500)
y = np.cos(x)
plt.figure(figsize=(8, 4))
plt.plot(x, y, label='cos(x)')
plt.title("Fonction cosinus")
plt.xlabel("x")
plt.ylabel("cos(x)")
plt.legend()
plt.grid(True)
plt.show()

# Exemple 2 : Nuage de points des tailles et poids
np.random.seed(0)
heights = np.random.normal(170, 10, 100)  # cm, moyenne 170, écart-type 10
weights = heights**1.5*(0.03) + np.random.normal(0, 8, 100)    # kg, moyenne 65, écart-type 8

plt.figure(figsize=(8, 4))
plt.scatter(heights, weights, alpha=0.7, edgecolor='k')
plt.title("Taille vs Poids simulés d'une personne")
plt.xlabel("Taille (cm)")
plt.ylabel("Poids (kg)")
plt.grid(True)
plt.show()


### * **Afficher un "champ"**

Une image peut être représentée comme une matrice, où chaque élément correspond à une valeur de pixel.
Illustrons cela avec un exemple en utilisant matplotlib :

In [None]:
from PIL import Image
import numpy as np
import matplotlib.pyplot as plt

img = np.asarray(Image.open('./images/stinkbug.png'))
plt.imshow(img, cmap='gray', vmin=np.min(img), vmax=np.max(img))
plt.title("Exemple d'image en noir et blanc comme matrice")
plt.colorbar(label='Valeur du pixel')
plt.show()

La fonction `imshow` est souvent utilisée pour afficher une matrice ou une fonction de deux variables. Par exemple

In [None]:
# Exemple 1 : Afficher une matrice en utilisant imshow
matrix = np.array([[1, 2, 3],
                   [4, 5, 6],
                   [7, 8, 9]])
plt.imshow(matrix, cmap='viridis')
plt.title("Affichage d'une matrice avec imshow")
plt.colorbar(label='Valeur')
plt.show()

# Exemple 2 : Afficher sin(x) * sin(y) comme un champ
x = np.linspace(0, 2 * np.pi, 100)
y = np.linspace(0, 2 * np.pi, 100)
X, Y = np.meshgrid(x, y)
Z = np.sin(X) * np.sin(Y)

plt.imshow(Z, extent=[x.min(), x.max(), y.min(), y.max()], origin='lower',
           cmap='coolwarm', aspect='auto')
plt.title(r"Champ : $\sin(x)\sin(y)$")
plt.xlabel('x')
plt.ylabel('y')
plt.colorbar(label='Valeur')
plt.show()

* **Histogramme** : il est souvent très utile de tracer l'histogramme d'une propriété d'un grand nombre d'échantillons. Il indique comment la population est distribuée par rapport à cette propriété. Voici un exemple

In [None]:
# Exemple : Histogramme de la distribution de la taille des hommes adultes

# Simuler des données de taille (en centimètres) pour les hommes adultes
mean_height = 175   # taille moyenne en cm
std_dev = 7         # écart-type en cm
num_samples = 1000  # nombre d'échantillons

heights = np.random.normal(loc=mean_height, scale=std_dev, size=num_samples)

plt.hist(heights, bins=25, color='skyblue', edgecolor='black')
plt.title("Histogramme de la distribution de la taille (Homme adulte)")
plt.xlabel("Taille (cm)")
plt.ylabel("Fréquence")
plt.grid(axis='y', alpha=0.75)
plt.show()
