# Python & Numpy basiques

Bienvenue à votre premier workshop IA organisé par PoC !
Ce notebook vous donne une brève introduction au langage Python. Même si vous avez déjà codé en Python avant, cela vous sera utile pour vous familiariser avec les fonctions dont vous aurez besoin.  

**Instructions:**
- Vous utiliserez Python 3
- N'utilisez pas de boucle 'for' ou 'while', à moins qu'on ne vous le demande de façon explicite.
- Après avoir codé votre fonction, lancez la cellule qui suit afin de vérifier votre résultat.

**A la fin de ce workshop, vous saurez:**
- Utiliser des notebooks iPython
- Utiliser les fonctions de numpy et les opérations vectorielles et matricielles
- Comprendre le concept de broadcasting
- Vectoriser du code

Si vous vous sentez bloqués ou ne comprenez pas un concept, n'hésitez pas à venir nous voir. **Nous sommes là pour ça !**

## A propos des Notebooks IPython ##

Les notebooks iPython sont des environnemments de code interactif au sein d'une page web. Ils vous permettent d'éxécuter du code pas à pas et de pouvoir visualiser directement le contenu d'une variable ou un résultat par exemple. Vous utiliserez des notebooks iPython lors de vos workshops. Vous avez uniquement besoin d'écrire du code entre les commentaires ### Début du code ### et ### Fin du code ###. Après avoir écrit votre code, vous pouvez exécuter la cellule soit en entrant SHIFT+ENTREE, soit en cliquant sur 'Exécuter' (symbole play dans la barre de haut).

Vous rencontrerez souvent des "≈ X lignes de code". Il ne s'agit que d'une estimation du nombre de lignes nécessaire, libre à vous d'en écrire plus ou moins.

**Exercise**: Définissez la variable 'test' en 'Hello world !' pour afficher 'Hello world !' et éxécutez les deux cellules qui suivent.

In [None]:
### Début du code ### (≈ 1 ligne de code)
test = None
### Fin du code ###

In [None]:
print ("test: " + test)

**Résultat attendu**:
test: Hello world !

<font color='blue'>
    
**Ce que vous devez retenir**:
- Exécutez vos cellules en entrant SHIFT+ENTREE (ou en cliquant sur Exécuter)
- Ecrire votre code uniquement dans les cellules prévues à cet effet
- Ne pas modifier les autres cellules

## 1 - Créer des fonctions basiques avec Numpy ##

Numpy est le package officiel pour le calcul scientifique en Python. Il est maintenu par une large communauté (www.numpy.org).
Dans cet exercice, vous allez apprendre plusieurs fonctions clés de Numpy tels que np.exp, np.log et np.reshape. Retenez les bien car vous en aurez besoin pour les futurs workshops.

### 1.1 - La fonction sigmoïde, np.exp() ###

Avant d'utiliser np.exp(), vous utiliserez math.exp() pour implémenter la fonction sigmoïde. Vous comprendrez ainsi pourquoi np.exp() est préférable à math.exp().


**Exercise**: Créez une fonction qui retourne la sigmoïde d'une nombre réel x. Utilisez math.exp() pour la fonction exponentielle.

**Rappel**:
$sigmoid(x) = \frac{1}{1+e^{-x}}$ est aussi connue parfois sous le nom de fonction logistique. Il s'agit d'une fonction non linéaire qui n'est pas utilisée uniquement en Machine Learning (cf. régression logistique), mais aussi en Deep Learning.

<img src="images/Sigmoid.png" style="width:500px;height:228px;">

Pour se référer à une fonction appartenant à un package spécifique, vous pouvez l'appeler en utilisant nom_du_package.fonction(). Exécutez le code ci-dessous pour voir un exemple avec math.exp()

In [None]:
import math

def sigmoid_math(x):
    """
    Arguments:
    x -- un nombre scalaire

    Return:
    s -- sigmoid_math(x)
    """
    
    ### Début du code ### (≈ 1 ligne de code)
    s = None
    ### Fin du code ###
    
    return s

In [None]:
sigmoid_math(2.5)

**Résultat attendu**: 
0.9241418199787566

En fait, on utilise rarement la librairie "math" en deep learning parce que les inputs des fonctions sont des nombres réels. En deep learning, on va plutôt utiliser des matrices et des vecteurs. C'est là qu'on aperçoit l'utilité de numpy.

In [None]:
### Une des raisons pourquoi on utilise "numpy" au lieu de "math" ###
x = [1, 2, 3]
sigmoid_math(x) # vous verrez une erreur s'afficher si vous éxécutez la cellule. 
                # Ceci est dû au fait que x est un vecteur.

En fait, si $ x = (x_1, x_2, ..., x_n)$ est un vecteur, alors $np.exp(x)$ va appliquer la fonction exponentielle à chaque élément de x. Le résultat sera alors: $np.exp(x) = (e^{x_1}, e^{x_2}, ..., e^{x_n})$

In [None]:
import numpy as np

# example de np.exp
x = np.array([1, 2, 3])
print(np.exp(x)) # le résultat est (exp(1), exp(2), exp(3))

De plus, si x est un vecteur, alors une opération Python comme $s = x + 3$ ou $s = \frac{1}{x}$ donnera en sortie s un vecteur de la même dimension que x.

In [None]:
# exemple d'une opération vectorielle
x = np.array([1, 2, 3])
print (x + 3)

A chaque fois que vous aurez besoin d'une information supplémentaire sur une fonction numpy, nous vous encourageons d'aller jeter un oeil à [la doc officielle](https://docs.scipy.org/doc/numpy-1.10.1/reference/generated/numpy.exp.html). 

Vous pouvez aussi créer une nouvelle cellule dans ce notebook et écrire `np.exp?` (par exemple) pour avoir un accès rapide à la doc.

**Exercise**: Implémentez la fonction sigmoïde en utilisant numpy.

**Instructions**: x peut être un nombre réel, un vecteur, ou une matrice. La structure de données qu'on utilise dans numpy pour représenter ces dimensions (vecteurs, matrices, etc.) sont appelés des numpy array. Vous n'avez pas besoin d'en savoir plus pour l'instant.
$$ \text{Pour tout x } x \in \mathbb{R}^n \text{,     } sigmoid(x) = sigmoid\begin{pmatrix}
    x_1  \\
    x_2  \\
    ...  \\
    x_n  \\
\end{pmatrix} = \begin{pmatrix}
    \frac{1}{1+e^{-x_1}}  \\
    \frac{1}{1+e^{-x_2}}  \\
    ...  \\
    \frac{1}{1+e^{-x_n}}  \\
\end{pmatrix}\tag{1} $$

In [None]:
import numpy as np # np est un raccourci pour numpy. Cela vous permettra de taper uniquement np.exp() au lieu de numpy.exp()

def sigmoid(x):
    """
    Arguments:
    x -- un nombre scalaire ou un numpy array de n'importe quelle taille

    Return:
    s -- sigmoid(x)
    """
    
    ### Début du code ### (≈ 1 ligne de code)
    s = None
    ### Fin du code ###
    
    return s

In [None]:
x = np.array([1.5, 2.5, 3.5])
sigmoid(x)

**Résultat attendu**: 
array([0.81757448, 0.92414182, 0.97068777])


### 1.2 - Gradient de la sigmoïde

Comme vous l'avez entendu au début du workshop, vous aurez besoin de calculer les gradients afin d'optimiser la fonction de coût en utilisant la backpropagation.

**Exercise**: Implémentez la fonction sigmoid_gradient pour calculer le gradient de la fonction sigmoïde. La formule est la suivante: $$dérivée\_sigmoïde(x) = \sigma'(x) = \sigma(x) (1 - \sigma(x))\tag{2}$$
Vous allez coder cette fonction en 2 étapes:
1. Définissez s comme la sigmoïde de x. La fonction sigmoid(x) peut vous être utile.
2. Calculez $\sigma'(x) = s(1-s)$

In [None]:
def sigmoid_deriv(x):
    """    
    Arguments:
    x -- un nombre scalaire ou un numpy array

    Return:
    ds -- votre gradient
    """
    
    ### Début du code ### (≈ 2 lignes de code)
    s = None
    ds = None
    ### Fin du code ###
    
    return ds

In [None]:
x = np.array([1.5, 2.5, 3.5])
print ("sigmoid_deriv(x) = " + str(sigmoid_deriv(x)))

**Expected Output**: 
sigmoid_deriv(x) = [0.14914645 0.07010372 0.02845302]



### 1.3 - Redimensionner les arrays ###

Deux fonctions numpy courantes utilisées en deep learning sont [np.shape](https://docs.scipy.org/doc/numpy/reference/generated/numpy.ndarray.shape.html) et [np.reshape()](https://docs.scipy.org/doc/numpy/reference/generated/numpy.reshape.html). 
- X.shape vous permet d'avoir le shape (dimension) d'une matrice ou d'un vecteur X.
- X.reshape(...) est utilisé pour redimensionner X en une autre dimension.

Par exemple, en informatique, une image est représentée par un array de 3 dimensions $(longueur, largeur, profondeur = 3)$.
Cependant, quand vous donnez une image en entrée d'un algorithme, vous devez le convertir en un vecteur de shape (longueur\*largeur\*3, 1). En d'autres mots, vous enroulez, ou redimensionnez, l'array 3D en un vecteur 1D.


<img src="images/image2vector_kiank.png" style="width:500px;height:300;">

**Exercise**: Implementez `image_to_vector()` qui prend en entrée une matrice de shape (longueur, largeur, 3) et return un vecteur de shape (longueur\*largeur\*3, 1). Par exemple, si vous voulez reshape un array v de shape (a, b, c) en un vecteur de shape (a\*b, c), vous ferez:
``` python
v = v.reshape((v.shape[0]*v.shape[1], v.shape[2])) # v.shape[0] = a ; v.shape[1] = b ; v.shape[2] = c
```
- S'il vous plaît, ne harcodez pas les dimensions de l'image comme une constante ! Regardez plutôt les valeurs dont vous avez besoin avec `image.shape[0]`, etc. 

In [None]:
def image_to_vector(image):
    """
    Argument:
    image -- un numpy array de shape (longueur, largeur, profondeur)
    
    Returns:
    v -- un vecteur de shape (longueur*largeur*profondeur, 1)
    """
    
    ### Début du code ### (≈ 1 ligne de code)
    v = None
    ### Fin du code ###
    
    return v

In [None]:
# Il s'agit d'un array de shape (3, 3, 2). En général, les images seront de shape (nb_pix_x, nb_pix_y, 3) où 3 représenteront les valeurs RGB
image = np.array([[[ 0.67126139,  0.29381281],
        [ 0.90714982,  0.52835547],
        [ 0.42245251 ,  0.45012151]],

       [[ 0.92814219,  0.96677647],
        [ 0.85114703,  0.52351845],
        [ 0.19981397,  0.27417313]],

       [[ 0.6213595,  0.00531265],
        [ 0.1210313,  0.49974237],
        [ 0.3432129,  0.94631277]]])
print ("image_to_vector(image) = " + str(image_to_vector(image)))

**Résultat attendu**: 

image_to_vector(image) = [[0.67126139]
 [0.29381281]
 [0.90714982]
 [0.52835547]
 [0.42245251]
 [0.45012151]
 [0.92814219]
 [0.96677647]
 [0.85114703]
 [0.52351845]
 [0.19981397]
 [0.27417313]
 [0.6213595 ]
 [0.00531265]
 [0.1210313 ]
 [0.49974237]
 [0.3432129 ]
 [0.94631277]]

### 1.4 - Normalisez vos données

Une autre technique courante qu'on utilise en Machine Learning et Deep Learning est de normaliser nos données. Cela permet souvent d'apporter une meilleure perfomance parce que la descente de gradient convergera plus rapidement après la normalisation. Ici, par normalisation on signifie changer x par $ \frac{x}{\| x\|} $ (diviser chaque vecteur de x par sa norme).

Par exemple, si $$x = 
\begin{bmatrix}
    0 & 3 & 4 \\
    2 & 6 & 4 \\
\end{bmatrix}\tag{3}$$ alors $$\| x\| = np.linalg.norm(x, axis = 1, keepdims = True) = \begin{bmatrix}
    5 \\
    \sqrt{56} \\
\end{bmatrix}\tag{4} $$et        $$ x\_normalized = \frac{x}{\| x\|} = \begin{bmatrix}
    0 & \frac{3}{5} & \frac{4}{5} \\
    \frac{2}{\sqrt{56}} & \frac{6}{\sqrt{56}} & \frac{4}{\sqrt{56}} \\
\end{bmatrix}\tag{5}$$ 
Notez que vous pouvez diviser des matrices de tailles différentes, et cela fonctionne bien: il s'agit du broadcasting dont nous en parlerons dans la section 1.5.


**Exercise**: Implementez normalize_rows() pour normaliser les lignes d'une matrice. Après avoir appliqué cette function à une matrice x, chaque ligne de x doit être un vecteur de taille unique.

In [None]:
def normalize_rows(x):
    """
    Argument:
    x -- une matrice numpy x de shape (n, m)
    
    Returns:
    x -- la matrice normalisée x
    """
    
    ### Début du code ### (≈ 2 lignes de code)
    # Calculez d'abord la norme de x. Utilisez np.linalg.norm(..., ord = 2, axis = ..., keepdims = True)
    x_norm = None
    
    # Divisez x par x_norm.
    x = None
    ### Fin du code ###

    return x

In [None]:
x = np.array([
    [2, 3, 6],
    [5, 2, 8]])
print("normalize_rows(x) = " + str(normalize_rows(x)))

**Résultat attendu**: 

normalize_rows(x) = [[0.28571429 0.42857143 0.85714286]
 [0.51847585 0.20739034 0.82956136]]

**Note**:
Dans la fonction normalize_rows, vous pouvez essayer de print les shapes de x_norm et de x, et répéter l'action autant de fois que vous voulez. Vous remarquerez qu'ils peuvent avoir des shapes différents. C'est normal car x_norm prend la norme de chaque ligne de x. Donc x_norm a le même nombre de lignes, mais qu'une seule colonne. Comment cela fonctionne quand vous divisez x par x_norm ? Il s'agit du broadcasting et nous en parlons tout de suite ! 

### 1.5 - Le broadcasting et la fonction softmax ####

Le broadcasting est un concept très important à comprendre dans numpy. Il s'agit d'une notion très utile pour pouvoir faire des opérations mathématiques entre des arrays de shapes différents. Pour plus d'informations, vous pouvez consulter [la documentation du broadcasting](http://docs.scipy.org/doc/numpy/user/basics.broadcasting.html).

**Exercise**: Implémentez la fonction softmax en utilisant numpy. Vous pouvez voir softmax comme une fonction de normalisation utilisée quand votre algorithme a besoin de classifier 2 classes ou +. Vous en apprendrez plus sur cette fonction dans un futur workshop.

Attention: Votre code doit pouvoir fonctionner avec un vecteur, mais aussi une matrice

**Instructions**:
- $ \text{Pour tout } x \in \mathbb{R}^{1\times n} \text{,     } softmax(x) = softmax(\begin{bmatrix}
    x_1  &&
    x_2 &&
    ...  &&
    x_n  
\end{bmatrix}) = \begin{bmatrix}
     \frac{e^{x_1}}{\sum_{j}e^{x_j}}  &&
    \frac{e^{x_2}}{\sum_{j}e^{x_j}}  &&
    ...  &&
    \frac{e^{x_n}}{\sum_{j}e^{x_j}} 
\end{bmatrix} $ 

- $\text{Pour une matrice } x \in \mathbb{R}^{m \times n} \text{,  $x_{ij}$ correspond à l'élément de la $i^{ième}$ ligne et de la  $j^{ième}$ colonne de $x$, on a donc: }$  $$softmax(x) = softmax\begin{bmatrix}
    x_{11} & x_{12} & x_{13} & \dots  & x_{1n} \\
    x_{21} & x_{22} & x_{23} & \dots  & x_{2n} \\
    \vdots & \vdots & \vdots & \ddots & \vdots \\
    x_{m1} & x_{m2} & x_{m3} & \dots  & x_{mn}
\end{bmatrix} = \begin{bmatrix}
    \frac{e^{x_{11}}}{\sum_{j}e^{x_{1j}}} & \frac{e^{x_{12}}}{\sum_{j}e^{x_{1j}}} & \frac{e^{x_{13}}}{\sum_{j}e^{x_{1j}}} & \dots  & \frac{e^{x_{1n}}}{\sum_{j}e^{x_{1j}}} \\
    \frac{e^{x_{21}}}{\sum_{j}e^{x_{2j}}} & \frac{e^{x_{22}}}{\sum_{j}e^{x_{2j}}} & \frac{e^{x_{23}}}{\sum_{j}e^{x_{2j}}} & \dots  & \frac{e^{x_{2n}}}{\sum_{j}e^{x_{2j}}} \\
    \vdots & \vdots & \vdots & \ddots & \vdots \\
    \frac{e^{x_{m1}}}{\sum_{j}e^{x_{mj}}} & \frac{e^{x_{m2}}}{\sum_{j}e^{x_{mj}}} & \frac{e^{x_{m3}}}{\sum_{j}e^{x_{mj}}} & \dots  & \frac{e^{x_{mn}}}{\sum_{j}e^{x_{mj}}}
\end{bmatrix} = \begin{pmatrix}
    softmax\text{(première ligne de x)}  \\
    softmax\text{(deuxième ligne de x)} \\
    ...  \\
    softmax\text{(dernière ligne de x)} \\
\end{pmatrix} $$

In [None]:
def softmax(x):
    """
    Argument:
    x -- Un vecteur ou une matrice numpy de shape (n,m)

    Returns:
    s -- Une matrice numpy égale au softmax de x, de shape (n,m)
    """
    
    ### Début du code ### (≈ 3 lignes de code)
    # Calculez l'exponentielle de chaque élément de x. Utilisez np.exp()
    x_exp = None

    # Créez un vecteur x_sum qui fait la somme de chaque ligne de x_exp. Utilisez np.sum(..., axis = 1, keepdims = True)
    x_sum = None
    
    # Calculer softmax(x) en divisant x_exp par x_sum. Cela utilisera automatiquement le broadcasting de numpy.
    s = x_exp / x_sum
    ### Fin du code ###
    print(x_exp.shape, x_sum.shape, s.shape)
    
    return s

In [None]:
x_vect = np.array([[9, 4, 0, 0 ,0]]) #sisi 94 RPZ

print("softmax(x_vect) = " + str(softmax(x_vect)))

x_matr = np.array([
    [1, 7, 5, 0, 6],
    [3, 4, 0, 2 ,0]])

print("softmax(x_matr) = " + str(softmax(x_matr)))


**Résultat attendu**:

softmax(x_vect) = [[9.92941993e-01 6.69039052e-03 1.22538777e-04 1.22538777e-04
  1.22538777e-04]]

softmax(x_matr) = [[1.64525645e-03 6.63743823e-01 8.98279582e-02 6.05256022e-04
  2.44177707e-01]
 [2.38906644e-01 6.49415590e-01 1.18944614e-02 8.78888428e-02
  1.18944614e-02]]


**Note**:
- Si vous printez les shapes de x_exp, x_sum et de s ci-dessus et reéxécutez la cellule, dans le cas de la matrice vous verrez que x_sum est de shape (2, 1) alors que x_exp et s sont de shape (2, 5). **x_exp/x_sum** fonctionne correctement grâce au broadcasting.

Bravo ! Vous avez maintenant acquis une bonne compréhension de python et de sa librairie numpy, et avez implémenté quelques fonctions qui vous seront utiles en deep learning !

<font color='blue'>
    
**Ce que vous devez retenir:**
- np.exp(x) fonctionne pour n'importe quel np.array x et applique la fonction exponentielle à tous ses éléments
- la fonction sigmoïde et son gradient
- image_to_vector est couramment utilisé en deep learning
- np.reshape est souvent utilisé. Plus tard, vous verrez que sa bonne utilisation vous permettra d'éviter de nombreux bugs
- numpy a des functions de built-in très efficaces
- le broadcasting est extrêmement utile

## 2) La vectorisation

En deep learning, on manipule de très gros datasets. De ce fait, une fonction de calcul non optimisée peut présenter un poids lourd à votre algorithme et produira un modèle qui mettrait des années à s'éxécuter. Pour être sûr que votre code est suffisamment optimisé en terme de calcul, vous utiliserez le concept de vectorisation. Par exemple, essayez de me dire quelle est la différence entre les différentes implémentations de produits dot/outer/elementwise.

In [None]:
import time

x1 = [9, 2, 5, 0, 0, 7, 5, 0, 0, 0, 9, 2, 5, 0, 0]
x2 = [9, 2, 2, 9, 0, 9, 2, 5, 0, 0, 9, 2, 5, 0, 0]

### Implémentation classique d'un produit dot de vecteurs ###
tic = time.process_time()
dot = 0
for i in range(len(x1)):
    dot += x1[i] * x2[i]
toc = time.process_time()
print ("dot = " + str(dot) + "\n ----- Temps de calcul = " + str(1000*(toc - tic)) + "ms\n")

### Implémentation classique d'un produit outer ###
tic = time.process_time()
outer = np.zeros((len(x1),len(x2))) # on crée une matrice de taille len(x1)*len(x2) matrix avec que des 0
for i in range(len(x1)):
    for j in range(len(x2)):
        outer[i,j] = x1[i] * x2[j]
toc = time.process_time()
print ("outer = " + str(outer) + "\n ----- Temps de calcul = " + str(1000*(toc - tic)) + "ms\n")

### Implémentation classique élément-wise ###
tic = time.process_time()
mul = np.zeros(len(x1))
for i in range(len(x1)):
    mul[i] = x1[i] * x2[i]
toc = time.process_time()
print ("multiplication élément-wise = " + str(mul) + "\n ----- Temps de calcul = " + str(1000*(toc - tic)) + "ms\n")

### Implémentation classique général d'un produit dot ###
W = np.random.rand(3, len(x1)) # Random 3*len(x1) numpy array
tic = time.process_time()
gdot = np.zeros(W.shape[0])
for i in range(W.shape[0]):
    for j in range(len(x1)):
        gdot[i] += W[i,j]*x1[j]
toc = time.process_time()
print ("gdot = " + str(gdot) + "\n ----- Temps de calcul = " + str(1000*(toc - tic)) + "ms")

In [None]:
x1 = [9, 2, 5, 0, 0, 7, 5, 0, 0, 0, 9, 2, 5, 0, 0]
x2 = [9, 2, 2, 9, 0, 9, 2, 5, 0, 0, 9, 2, 5, 0, 0]

### Implémentation numpy du produit dot ###
tic = time.process_time()
dot = np.dot(x1,x2)
toc = time.process_time()
print ("dot = " + str(dot) + "\n ----- Temps de calcul = " + str(1000*(toc - tic)) + "ms\n")

### Implémentation numpy de l'outer ###
tic = time.process_time()
outer = np.outer(x1,x2)
toc = time.process_time()
print ("outer = " + str(outer) + "\n ----- Temps de calcul = " + str(1000*(toc - tic)) + "ms\n")

### Implémentation numpy de l'élement-wise ###
tic = time.process_time()
mul = np.multiply(x1,x2)
toc = time.process_time()
print ("elementwise multiplication = " + str(mul) + "\n ----- Temps de calcul = " + str(1000*(toc - tic)) + "ms\n")

### Implémentation numpy du dot général ###
tic = time.process_time()
dot = np.dot(W,x1)
toc = time.process_time()
print ("gdot = " + str(dot) + "\n ----- Temps de calcul = " + str(1000*(toc - tic)) + "ms")

Comme vous avez pu le remarquer, l'implémentation numpy est plus propre et plus efficace. Pour des vecteurs et matrices de taille supérieure, les différences en temps de calcul deviennent plus grande.

### 2.1 Implémentez les fonctions de loss L1 et L2

**Exercise**: Implémentez la version numpy de la fonction de loss L1. La fonction abs(x) (valeur absolue de x) peut s'avérer très utile.


**Rappel**:
- La loss est utilisée pour évaluer la performance de votre modèle. Plus la loss est grande, plus vos prédictions ($ \hat{y} $) sont éloignées des vraies valeurs ($y$). En deep learning, vous utilisez des algorithmes d'optimisation comme la descente de gradient afin d'entraîner votre modèle et de minimiser le coût.
- L1 est défini comme suit:
$$\begin{align*} & L_1(\hat{y}, y) = \sum_{i=0}^m|y^{(i)} - \hat{y}^{(i)}| \end{align*}\tag{6}$$

In [None]:
def L1_function(y_predicted, y):
    """
    Arguments:
    y_predicted -- vecteur de size m contenant vos valeurs prédites
    y -- vecteur de size m contenant les vraies valeurs
    
    Returns:
    L1 -- valeur de la fonction de loss L1
    """
    
    ### Début du code ### (≈ 1 ligne de code)
    L1 = None
    ### Fin du code ###
    
    return L1

In [None]:
y_predicted = np.array([.8, 0.3, 0.2, .6, .2])
y = np.array([1, 1, 0, 1, 0])
print("L1 = " + str(L1_function(y_predicted,y)))

**Résultat attendu**:
L1 = 1.7

**Exercise**: Implémentez la version vectorisée de la fonction de loss L2. Il y a plusieurs manières de le faire. Vous pourrez trouver la fonction np.dot() utile. Pour rappel, si $x = [x_1, x_2, ..., x_n]$, alors `np.dot(x,x)` = $\sum_{j=0}^n x_j^{2}$. 


- La fonction de loss L2 est définie comme suit: $$\begin{align*} & L_2(\hat{y},y) = \sum_{i=0}^m(y^{(i)} - \hat{y}^{(i)})^2 \end{align*}\tag{7}$$

In [None]:
def L2_function(y_predicted, y):
    ### Début du code ### (≈ 1 ligne de code)
    L2 = None
    ### Fin du coee ###
    
    return L2

In [None]:
y_predicted = np.array([.8, 0.3, 0.2, .6, .2])
y = np.array([1, 1, 0, 1, 0])
print("L2 = " + str(L2_function(y_predicted,y)))

**Résultat attendu**: 
L2 = 0.77

Félicitations, vous avez terminé ce workshop ! On espère que ce petit exercice vous a permis de bien vous familiariser avec Python et numpy, ce qui constitue de très bonnes bases pour les prochains workshops (qui seront bien plus intéressants). A la semaine prochaine ! ;) 

<font color='blue'>
    
**Ce que vous devez retenir:**
- La vectorisation est très importante en deep learning. Elle permet une meilleure performance de calcul et un code plus lisible
- Les fonctions L1 et L2
- Vous pouvez maintenant voir d'autres fonctions numpy comme np.sum, np.dot, np.multiply, np.maximum, etc...