---
# Machine Learning pour expliquer les variations journalières des prix des contrats à terme d'électricité en France et en Allemagne
---

# Introduction

# Compréhension du problème métier

## Qu'est-ce que le prix des contrats a terme d'electricite ?

Le prix des contrats à terme d'électricité est un prix négocié entre un acheteur et un vendeur pour un certain volume d'électricité à une date future spécifiée. Ces contrats permettent à l'acheteur de garantir un prix fixe pour l'électricité à une date future, ce qui lui permet de se protéger contre les fluctuations imprévues des prix du marché de l'électricité. Pour le vendeur, ces contrats lui permettent de garantir un prix fixe pour la vente d'électricité à une date future, ce qui peut lui permettre de planifier ses revenus futurs avec plus de certitude. Les prix des contrats à terme sont souvent basés sur les prix du marché spot de l'électricité, qui fluctuent en fonction de l'offre et de la demande. Les contrats à terme peuvent avoir des échéances différentes, allant de quelques heures à plusieurs années.

## Qui sont les acheteurs et vendeurs des contrats a terme d'electricite ?

Les acheteurs peuvent être des consommateurs d'électricité tels que des entreprises industrielles ou commerciales qui ont besoin d'acheter de grandes quantités d'électricité pour leur activité. Les vendeurs peuvent être des producteurs d'énergie tels que des centrales électriques qui produisent de l'électricité et vendent leur production sur le marché de l'électricité, ou des courtiers en énergie qui achètent et vendent de l'électricité sur les marchés pour réaliser des profits.

---
Compréhension des données
===

Nous avons trois datasets au format csv:
- **Data_x.csv**: les données d'entrée
- **Data_y.csv**: les données de sorties, c'est-à-dire la variation du prix de futures d'électricités
- **DataNew_x.csv**: les nouvelles données d'entrée non labélisées

Description des données d'entrée 
---

Les datasets d'entrée **Data_x** et **DataNew_x** sont composés de **1494** et **654** entrées respectivement avec **35** variables. 
Nous avons donc **2148** enregistrements au total.

**1. Identifiants :**
  - `ID` : Identifiant unique pour chaque entrée

**2. Variables temporelles :**
- `DAY_ID` : Date de l'entrée sous forme numérique

**3. Variable catégorielle :**
- `COUNTRY` : Pays concerné par l'entrée - DE = Allemagne, FR = France

**4. Variables de consommation et d'échange d'électricité :**
- France:
    - `FR_CONSUMPTION` : Consommation d'électricité en France
    - `FR_DE_EXCHANGE` : Electricité échangée entre France et Allemagne
    - `FR_NET_EXPORT` : Electricité exportée par la France vers l'Europe
    - `FR_NET_IMPORT` : Electricité importée en France depuis l'Europe
- Allemagne:
    - `DE_CONSUMPTION` : Consommation d'électricité en Allemagne
    - `DE_FR_EXCHANGE` : Electricité échangée entre Allemagne et France
    - `DE_NET_EXPORT` : Electricité exportée par l'Allemagne vers l'Europe
    - `DE_NET_IMPORT` : Electricité importée en Allemagne depuis l'Europe

**5. Variables de consommation d'énergie :**
- France:
    - `FR_GAS` : Volume de gaz naturel consommé en France
    - `FR_COAL` : Volume de charbon consommé en France
- Allemagne:
    - `DE_GAS` : Volume de gaz naturel consommé en Allemagne
    - `DE_COAL` : Volume de charbon consommé en Allemagne
    - `DE_LIGNITE` : Volume de lignite consommé en Allemagne

**6. Variables de production d'électricité :**
- France:
    - `FR_HYDRO` : Production d'électricité d'origine hydraulique en France
    - `FR_NUCLEAR` : Production d'électricité d'origine nucléaire en France
    - `FR_SOLAR` : Production d'électricité d'origine photovoltaïque en France
    - `FR_WINDPOW` : Production d'électricité d'origine éolienne en France
- Allemagne:
    - `DE_HYDRO` : Production d'électricité d'origine hydraulique en Allemagne
    - `DE_NUCLEAR` : Production d'électricité d'origine nucléaire en Allemagne
    - `DE_SOLAR` : Production d'électricité d'origine photovoltaïque en Allemagne
    - `DE_WINDPOW` : Production d'électricité d'origine éolienne en Allemagne

**7. Variables de charge résiduelle :**
- France:
    - `FR_RESIDUAL_LOAD` : Electricité consommée après utilisation des énergies renouvelables en France
- Allemagne:
    - `DE_RESIDUAL_LOAD` : Electricité consommée après utilisation des énergies renouvelables en Allemagne

**8. Variables météorologiques :**
- France:
    - `FR_RAIN` : Quantité de pluie tombée en France
    - `FR_WIND` : Vitesse du vent en France
    - `FR_TEMP` : Température en France
- Allemagne:
    * `DE_RAIN` : Quantité de pluie tombée en Allemagne
    * `DE_WIND` : Vitesse du vent en Allemagne
    * `DE_TEMP` : Température en Allemagne

**9. Variables de prix :**
- `GAS_RET` : Prix journalier du gaz naturel en Europe
- `COAL_RET` : Prix journalier du charbon en Europe
- `CARBON_RET` : Prix journalier des émissions de carbone en Europe


Description des données de sortie 
---

Le dataset de sortie **Data_y** est composé de **1494** entrées \
avec **2** variables:
- `ID` : Identifiant unique pour chaque entrée
- `TARGET` : Variation journalière du prix de futures d'électricité (maturité 24h)