# Correction

## Correction plan d'action

1. **Importation et Fusion des Données**
   - Charger toutes les données des 10 fichiers Excel en utilisant `pd.read_excel()`.
   - Fusionner ces données en un seul DataFrame en utilisant `pd.concat()`.

2. **Nettoyage et Préparation des Données**
   - Convertir la colonne 'Date' au format datetime avec `pd.to_datetime()`.
   - Assurer l'absence de valeurs manquantes ou les traiter si nécessaire.

3. **Analyse des Ventes**
   - Calculer le chiffre d'affaires total et le chiffre d'affaires par produit et par région.
   - Utiliser `pd.pivot_table()` pour créer un tableau croisé qui montre le chiffre d'affaires par mois et par région.

4. **Jointures de Données**
   - Supposer qu'un fichier supplémentaire "referentiel.xlsx" contient des informations sur les catégories de produits. Charger ce fichier.
   - Effectuer une jointure avec le DataFrame principal pour ajouter la catégorie de chaque produit en utilisant `pd.merge()`.

5. **Extraction de Données Temporelles**
   - Extraire le mois de la date de vente et créer une nouvelle colonne 'Mois' avec `.dt.month`.
   - Analyser les tendances de vente mensuelles.

6. **Mise à Jour des Résultats dans Excel**
   - Utiliser `xlwings` pour ouvrir le fichier Excel initial et ajouter une nouvelle feuille qui contiendra les tableaux croisés dynamiques créés.
   - Mettre à jour le fichier Excel avec les résultats de l'analyse de tendances mensuelles.


## Correction bouts de code

Voici des exemples de code pour chaque étape des exercices de l'examen. Ces extraits aideront les étudiants à comprendre comment ils peuvent utiliser les techniques mentionnées pour accomplir les tâches spécifiées.

### 1. Importation et Fusion des Données
```python
import pandas as pd

# Charger les données de chaque fichier en une liste de DataFrames
dataframes = [pd.read_excel(f'/mnt/data/Ventes_2023_Part_{i}.xlsx') for i in range(1, 11)]

# Fusionner tous les DataFrames en un seul
all_data = pd.concat(dataframes, ignore_index=True)
```

### 2. Nettoyage et Préparation des Données
```python
# Convertir la colonne 'Date' en datetime
all_data['Date'] = pd.to_datetime(all_data['Date'])

# Gestion des valeurs manquantes
all_data.fillna(method='ffill', inplace=True)  # Remplacer les valeurs manquantes par la valeur précédente
```

### 3. Analyse des Ventes
```python
# Calcul du chiffre d'affaires total
total_revenue = all_data['Chiffre d\'affaires'].sum()

# Pivot table pour le chiffre d'affaires par produit et par région
pivot_table = pd.pivot_table(all_data, values='Chiffre d\'affaires', index='Produit', columns='Région', aggfunc='sum')
```

### 4. Jointures de Données
```python
# Charger le fichier référentiel
referentiel = pd.read_excel('/mnt/data/referentiel.xlsx')

# Jointure pour ajouter la catégorie de chaque produit
all_data = pd.merge(all_data, referentiel, on='Produit', how='left')
```

### 5. Extraction de Données Temporelles
```python
# Extraire le mois de la date de vente
all_data['Mois'] = all_data['Date'].dt.month

# Analyse des ventes par mois
monthly_sales = all_data.groupby('Mois')['Chiffre d\'affaires'].sum()
```

### 6. Mise à Jour des Résultats dans Excel
```python
import xlwings as xw

# Ouvrir le fichier Excel et ajouter une nouvelle feuille
wb = xw.Book('/mnt/data/Ventes_2023.xlsx')
ws = wb.sheets.add('Analyse des Ventes')

# Exporter le pivot table dans la nouvelle feuille
ws.range('A1').value = pivot_table

# Sauvegarder et fermer le fichier
wb.save()
wb.close()
```



## Correction exercices avancés 



1. **Analyse de Variance des Ventes** :
   - Calculer et analyser la variance et l'écart-type des ventes par produit pour identifier les produits avec les variations de vente les plus élevées.
   ```python
   variance_ventes = all_data.groupby('Produit')['Chiffre d\'affaires'].var()
   ecart_type_ventes = all_data.groupby('Produit')['Chiffre d\'affaires'].std()
   ```

2. **Analyse de Corrélation** :
   - Évaluer la corrélation entre la quantité vendue et le chiffre d'affaires pour voir si les prix plus élevés affectent la quantité vendue.
   ```python
   correlation = all_data[['Quantité', 'Chiffre d\'affaires']].corr()
   ```

3. **Régression Linéaire** :
   - Effectuer une régression linéaire pour prédire le chiffre d'affaires en fonction de la quantité vendue et du prix unitaire.
   ```python
   from sklearn.linear_model import LinearRegression

   model = LinearRegression()
   X = all_data[['Quantité', 'Prix unitaire']]
   y = all_data['Chiffre d\'affaires']
   model.fit(X, y)
   ```
   

4. **Test de Hypothèse** :
   - Réaliser un test de hypothèse pour déterminer si la moyenne des ventes du premier trimestre est significativement différente de celle du dernier trimestre.
   ```python
   from scipy.stats import ttest_ind

   Q1_sales = all_data[all_data['Mois'].isin([1, 2, 3])]['Chiffre d\'affaires']
   Q4_sales = all_data[all_data['Mois'].isin([10, 11, 12])]['Chiffre d\'affaires']
   t_stat, p_value = ttest_ind(Q1_sales, Q4_sales)
   ```
