# Est-il possible d’utiliser MAPE au lieu de MSE comme fonction de loss?

## Rappel 

La fonction de coût, "**loss function**", est la fonction qui **mesure l'erreur** entre les prédictions faites par notre modèle et la vraie valeur de l'output.  
C'est cette fonction que l'on veut **minimiser** (par la méthode de la descente de gradient) pendant la phase d'entraînement du modèle.  
Il en existe une grande variété, que ce soit pour des problèmes de classification ou de régression.  
Deux exemples de ces fonctions, spécialisées pour des problèmes de régression, sont les fonction **Mean Absolute Percentage Error** (MAPE) et **Mean Squared Error** (MSE).

## Formules

$MAPE = \frac{1}{n}\Sigma_{i=1}^{n}\frac{|y_i - \hat{y_i}|}{y_i}$  
  
$MSE = \frac{1}{n}\Sigma_{i=1}^{n}(\hat{y_i} - y_i)^2$  
  
$\hat{y_i}$ : valeur prédite par le modèle  
$y_i$ : valeur réelle


In [1]:
import numpy as np
from sklearn.metrics import mean_squared_error

def mean_absolute_percentage_error(y_true, y_pred): 
    y_true, y_pred = np.array(y_true), np.array(y_pred)
    return 100*np.mean(np.abs((y_true - y_pred) / y_true))

## Exemple 1 

In [2]:
y_pred = [5]
y_true = [15]

In [3]:
mape = mean_absolute_percentage_error(y_true, y_pred)
mse = mean_squared_error(y_true, y_pred)
print(f"MAPE: Le modèle s'est trompé de {mape}%")
print(f"MSE : Le modèle s'est trompé de {mse}")

MAPE: Le modèle s'est trompé de 66.66666666666666%
MSE : Le modèle s'est trompé de 100.0


## Exemple 2

In [4]:
y_pred = [1010]
y_true = [1000]

In [5]:
mape = mean_absolute_percentage_error(y_true, y_pred)
mse = mean_squared_error(y_true, y_pred)
print(f"MAPE: Le modèle s'est trompé de {mape}%")
print(f"MSE: Le modèle s'est trompé de {mse}")

MAPE: Le modèle s'est trompé de 1.0%
MSE: Le modèle s'est trompé de 100.0


Dans les deux cas la MSE renvoie une erreur de 100, alors que dans le premier cas le modèle s'est complètement trompé et dans le deuxième, il a prédit une valeur très proche de la réalité. La MAPE est plus utile que la MSE dans ce cas pour montrer l'efficacité du modèle.

## Exemple 3 

In [6]:
y_pred = [10]
y_true = [0]

In [7]:
mape = mean_absolute_percentage_error(y_true, y_pred)
mse = mean_squared_error(y_true, y_pred)
print(f"Le modèle s'est trompé de {mape}%")
print(f"Le modèle s'est trompé de {mse}")

Le modèle s'est trompé de inf%
Le modèle s'est trompé de 100.0


  


## Observations

Dans les exemples 1 et 2, on voit que la fonction MAPE peut être utilisée à la place de MSE et rend mieux compte de l'importance de l'erreur.  
  
L'exemple 3 nous montre que la MAPE n'est pas utilisable pour tous les problèmes de régression, notamment si l'output peut prendre 0 comme valeur.  
  
On peut en conclure qu'il est possible d'utiliser la MAPE comme fonction de loss, en faisant attention à quel problème on l'applique.

## Sources

[https://www.deeplearning-academy.com/p/ai-wiki-loss-functions-in-deep-learning](https://www.deeplearning-academy.com/p/ai-wiki-loss-functions-in-deep-learning)  
[https://stats.stackexchange.com/questions/58391/mean-absolute-percentage-error-mape-in-scikit-learn](https://stats.stackexchange.com/questions/58391/mean-absolute-percentage-error-mape-in-scikit-learn)