# S03 - Exercices en classe : Structures de données Python - Partie I (solution)

## Instructions

La plupart des exercices présentés ici vous permettent de pratiquer la programmation Python de base pour certaines applications en gestion des opérations et de la logistique.

Pour chaque exercice, vous avez une cellule de code pour la réponse en dessous, où vous devez écrire votre réponse entre les lignes contenant `### commencez votre code ici ###` et `### terminez votre code ici ###` . Votre code peut contenir une ou plusieurs lignes et vous pouvez exécuter cette cellule afin de terminer l'exercice. Pour exécuter la cellule, vous pouvez taper `Shift+Enter` ou appuyer sur le bouton de lecture dans la barre d'outils ci-dessus. Vos résultats apparaîtront juste en dessous de cette cellule de réponse.

**REMARQUE :** Veuillez prêter attention au nom de la variable de sortie que vous devez fournir sous chaque question. Vous devez utiliser le même nom de variable pour la sortie afin que le résultat puisse être imprimé correctement.

## String
### Exercice 1 : Générer des codes de référence pour les nouvelles commandes
Une petite entreprise souhaite créer son propre modèle de bon de commande et attribuer un code informatif à chaque nouvelle commande. Créez une fonction avec le nom `OrderRef`, qui renvoie un nouveau code au format spécifié ci-dessous en fonction des informations suivantes :

* ID client (3 caractères)
* date à laquelle la commande est passée (au format « JJ/MM/AAAA », par exemple, 13/06/2020)
* heure à laquelle la commande a été passée (au format « HH:MM », par exemple, 14:05)

Le format souhaité du code pour chaque commande est :


<div>
<img src="https://raw.githubusercontent.com/acedesci/scanalytics/master/FR/S03_Data_Structures_1/_static/OrderRev_V2.png" width="500">
</div>

**Astuce :** vous pouvez utiliser la méthode `.split('character')` et l'opérateur `+` pour effectuer la concaténation de strings.

In [6]:
# définir une fonction qui crée un code de référence pour chaque commande
def OrderRef(client_id, plac_date, plac_time):
    """
    Return an order code
    Parameters:
        client_id: (string) client identification number of 3 characters AAA
        plac_date: (string) date in which the order was placed in the format DD/MM/YYYY
        plac_time: (string) time at which the order was placed in the format HH:MM
    return:
        code (string) in the format AAA.YYYY-MM-DD.HHMM
    """  
    ### commencez votre code ici ###
    split_plac_date = plac_date.split('/')
    split_plac_time = plac_time.split(':')
    code =  (client_id + '.' 
             + split_plac_date[2] + '-' + split_plac_date[1] + '-' + split_plac_date[0] + "."
             + split_plac_time[0] + split_plac_time[1])
    return code
    ### terminez votre code ici ###

# Générer un nouveau code pour une nouvelle commande
placement_date = '13/01/2021'
placement_time = '18:20'
client = 'CA1'
print("The code of the order placed on", placement_date, "at ", placement_time,"by client", client,"is: ", 
      OrderRef(client, placement_date, placement_time))
# Le code doit être 'CA1.2021-01-13.1820'

The code of the order placed on 13/01/2021 at  18:20 by client CA1 is:  CA1.2021-01-13.1820


## Listes

### Exercice 2 : Moyenne mobile pondérée (WMA)

La moyenne mobile simple suppose que les $k$ dernières observations ont la même importance pour déterminer la prévision. Cependant, dans certains cas, des données plus récentes peuvent être plus représentatives de la demande actuelle que des données plus anciennes. Dans de tels cas, nous pouvons choisir d'utiliser la **méthode de la moyenne mobile pondérée (WMA)**, qui est également une autre méthode couramment utilisée. [Ce lien](https://en.wikipedia.org/wiki/Moving_average#Weighted_moving_average) fournit plus de détails sur cette méthode.

**Brève description du modèle :** cette méthode calcule la prévision comme la demande moyenne pondérée en considérant les $k$ périodes les plus récentes comme suit :

$$F_{t+1}=\frac{kD_t+(k-1)D_{t-1}+(k-2)D_{t-2}+...+2D_{(t-k)+2}+D_{(t-k)+1}}{k+(k-1)+(k-2)+...+2+1}$$
Où:
- $F_t$ : prévision pour la période $t$
- $k$ : nombre d'observations récentes utilisées dans le calcul
- $D_t$ : demande pour la période $t$

On voit aussi que le dénominateur est égal à $k(k+1)/2$. On peut donc aussi écrire :
$$F_{t+1}=\frac{kD_t+(k-1)D_{t-1}+(k-2)D_{t-2}+...+2D_{(t-k)+2}+D_{(t-k)+1}}{k(k+1)/2}$$
À titre d'exemple, considérons que les ventes en janvier, février, mars et avril étaient respectivement de 125 unités, 142 unités, 120 unités et 153 unités. Nous voulons prévoir la demande pour mai en utilisant la méthode exponentielle pondérée avec $k=3$. Le dénominateur sera alors $=3(3+1)/2 = 6$ (ou $3 + 2 +1 = 6$). La prévision est calculée comme $F_{May}=\frac{3D_{April}+2D_{March}+1D_{Feb}}{6}=140.167 \approx 140$

L’avantage de la méthode de la moyenne mobile pondérée est qu’elle reflète plus rapidement les tendances à la hausse ou à la baisse (car les données récentes ont plus de poids).

Créez une fonction qui calcule la prévision pour la période suivante en utilisant la méthode de la moyenne mobile pondérée, à partir d'une liste de données historiques et du nombre de périodes de rétrospection. Cette fonction doit également inclure les composantes suivantes :
* **Vérification d'erreur** : Elle doit renvoyer le message `'Error: not enough data'` dans le cas où le nombre d'observations dans les données historiques est inférieur au nombre de périodes de rétrospection $k$. **Astuce :** vous pouvez utiliser la fonction ``len()`.
* **Calcul de prévision** : S'il n'y a pas de problème ci-dessus, la fonction effectue le calcul de prévision et renvoie la valeur de prévision pour $t$.

* Vous pouvez utiliser des listes de compréhension pour calculer la prévision.
* La prévision doit être arrondie (c'est-à-dire une valeur entière) **Astuce :** vous pouvez utiliser la fonction `round()`.

**Solution 1** : plus explicite

In [7]:
# définition d'une fonction pour la méthode de la moyenne mobile pondérée
def weightedMovingAvg(historical_sales, t, k):
    """
    Return the predicted demand for the next period
    parameters:
        historical_sales: (list) real sales in the previous periods
        t: (int number) period to forecast
        k: (int number) parameter of the weighted moving avg method
    return:
        forecast for period t
    """
    ### commencez votre code ici ###
    # vérifier s'il y a suffisamment de données pour faire des prédictions
    if len(historical_sales) < k:
        return 'Error: not enough data'
    else:
        denominator = (k * (k + 1)) / 2  # préparer le dénominateur
        # imprimer(dénominateur)
        past_k_demand = historical_sales[t-k:t]  # extraire les k points de données les plus récents, vous pouvez les imprimer pour vérifier
        # imprimer(past_k_demand)
        weights = list(range(1, k+1)) # préparer les poids pour le numérateur, vous pouvez imprimer pour vérifier
        # imprimer(poids)
        weighted_demand = [weights[i] * past_k_demand[i] / denominator for i in range(k)] # calculer la demande pondérée de chaque point

        return round(sum(weighted_demand))
    ### terminez votre code ici ###

# Tester si votre fonction est correcte en utilisant les données suivantes
sales = [125, 142, 120, 153, 156, 135, 128, 117, 140, 134, 132, 126] # ici nous avons l'index 0->11

print('Forecast sales for the next period with k = 2 is: ', weightedMovingAvg(sales, 12, 2))
print('Forecast sales for the next period with k = 5 is: ', weightedMovingAvg(sales, 12, 5))
print('Forecast sales for the next period with k = 15 is: ', weightedMovingAvg(sales, 12, 15))

Forecast sales for the next period with k = 2 is:  128
Forecast sales for the next period with k = 5 is:  130
Forecast sales for the next period with k = 15 is:  Error: not enough data


**Solution 2** : plus implicite

In [8]:
# définition d'une fonction pour la méthode de la moyenne mobile pondérée
def weightedMovingAvg(historical_sales, t, k):
    """
    Return the predicted demand for the next period
    parameters:
        historical_sales: (list) real sales in the previous periods
        t: (int number) period to forecast
        k: (int number) parameter of the weighted moving avg method
    return:
        forecast for period t
    """
    ### commencez votre code ici ###
    # vérifier s'il y a suffisamment de données pour faire des prédictions
    if len(historical_sales) < k:
        return 'Error: not enough data'
    else:
        forecast_t = sum([(k-i) * historical_sales[t-i-1] 
                          for i in range(k)])
        forecast_t = round(forecast_t / (k*(k+1)/2))
        return forecast_t
    ### terminez votre code ici ###

# Testez si votre fonction est correcte en utilisant les données suivantes
sales = [125, 142, 120, 153, 156, 135, 128, 117, 140, 134, 132, 126] # ici nous avons l'index 0->11

print('Forecast sales for the next period with k = 2 is: ', weightedMovingAvg(sales, 12, 2))
print('Forecast sales for the next period with k = 5 is: ', weightedMovingAvg(sales, 12, 5))
print('Forecast sales for the next period with k = 15 is: ', weightedMovingAvg(sales, 12, 15))

Forecast sales for the next period with k = 2 is:  128
Forecast sales for the next period with k = 5 is:  130
Forecast sales for the next period with k = 15 is:  Error: not enough data


## Dictionnaires

### Exercice 3 : Méthodes de prévision à l'aide de dictionnaires

Considérez les données historiques du dictionnaire `sales_2020` sur les ventes de véhicules au Canada en 2020.

(*Remarque : nous prévoyons la demande pour les périodes futures. Dans cet exercice particulier, vous devez prévoir la demande pour certaines périodes où des données de ventes réelles sont déjà disponibles. Il s'agit simplement d'une illustration pour les besoins de l'exercice, alors essayez de vous imaginer à la fin du mois d'octobre 2020 en train d'essayer de faire des prévisions pour le mois suivant, une fois à la fois, jusqu'en décembre 2020*)

In [9]:
# Format du dictionnaire : {'mois' : volume de vente en unités}
sales_2020 = {'January': 83512,
             'February': 101788,
             'March': 148052,
             'April': 152187,
             'May': 157082,
             'June': 156891,
             'July': 150800,
             'August': 138210,
             'September': 137349,
             'October': 125731,
             'November': 118521,
             'December': 114376} 
print("dict:", sales_2020)
print("keys:", list(sales_2020.keys()))
print("values:", list(sales_2020.values()))   

dict: {'January': 83512, 'February': 101788, 'March': 148052, 'April': 152187, 'May': 157082, 'June': 156891, 'July': 150800, 'August': 138210, 'September': 137349, 'October': 125731, 'November': 118521, 'December': 114376}
keys: ['January', 'February', 'March', 'April', 'May', 'June', 'July', 'August', 'September', 'October', 'November', 'December']
values: [83512, 101788, 148052, 152187, 157082, 156891, 150800, 138210, 137349, 125731, 118521, 114376]


Nous souhaitons effectuer un backtesting pour voir la qualité des prévisions par rapport aux ventes réelles au cours des deux derniers mois (novembre et décembre) de 2020. En utilisant les données historiques de `sales_2020` et la fonction créée dans l'exercice 2, prévoyez les ventes pour les mois indiqués dans le dictionnaire `forecast_wma` ci-dessous en utilisant la méthode de la moyenne mobile pondérée (WMA).

Vous devez enregistrer vos prévisions dans un dictionnaire imbriqué de `forecast_wma` qui a la structure suivante.

```
forecast_wma =  {'k=3': {'November', WMA_November, 'December': WMA_December}, 
                 'k=4': {'November', WMA_November, 'December': WMA_December}}
```

**Astuce :** vous pouvez effectivement utiliser `list(sales_2020.values())` pour obtenir les valeurs du dictionnaire et les transmettre à la fonction. Vous pouvez utiliser les boucles `for`, la compréhension de liste, le constructeur `list()` et des méthodes de dictionnaire utiles telles que `.keys()`.

In [10]:
forecast_wma ={'k=3':{'November': {}, 'December': {}},
               'k=4':{'November': {}, 'December': {}}}

### commencez votre code ici ###
sales_list = list(sales_2020.values())
print(sales_list)

# initialiser forecast_wma
forecast_wma['k=3']['November'] = weightedMovingAvg(sales_list, 10, 3)
forecast_wma['k=3']['December'] = weightedMovingAvg(sales_list, 11, 3)

forecast_wma['k=4']['November'] = weightedMovingAvg(sales_list, 10, 4) 
forecast_wma['k=4']['December'] = weightedMovingAvg(sales_list, 11, 4)
### terminez votre code ici ###

print('Forecasting based on WMA', forecast_wma)

[83512, 101788, 148052, 152187, 157082, 156891, 150800, 138210, 137349, 125731, 118521, 114376]
Forecasting based on WMA {'k=3': {'November': 131684, 'December': 124062}, 'k=4': {'November': 134219, 'December': 126418}}
