# Température et consommation électrique en France

## 1. Introduction
- Motivations
- Problématique
- Pourquoi la France et la température ?

## 2. Sources
- Données électricité (RTE)
- Données climatiques (NASA POWER API)
- Intervalle de temps et régions

## 3. Préparation des données
- Agrégation
- Fusion
- Valeurs manquants

## 4. Statistiques descriptives
- Résumé
- Chiffres clefs
- Patterns saisonniers

## 5. Liens entre température et consommation
- Corrélations
- Séries temporelles indexées par régions

## 6. Régressions et analyses
- Régression globale
- Régression spécifique par région
- Interprétation

## 7. Discussion
- Le cas de l'Île-de-France
- Hétérogéneité régionale
- Ce que la température explique... ou pas

## 8. Limites
- Variables omises 
- Non-causalité
- Agrégation des données

## 9. Conclusion
- Réponse à la problématique
- Ce que nous avons appris
- Ouvertures possibles

 ## 1. Introduction

La consommation d'électricité est une question centrale pour les économies modernes, car elle reflète le comportement des ménages et l'activité économique, tout en posant des défis majeurs pour la planification énergétique et la stabilité du réseau. Dans un contexte de changement climatique et de variabilité météorologique croissante, il est particulièrement important de comprendre les déterminants de la demande d'électricité.

Parmi ces déterminants, la température joue un rôle clé, car elle représente une contrainte majeure dans la vie quotidienne, que ce soit au travail ou à la maison. Un chauffage en panne peut transformer une belle journée d'hiver en véritable cauchemar. À plus grande échelle, dans les pays où le chauffage repose principalement sur l'électricité, des températures plus froides sont généralement associées à une hausse de la demande, tandis que les périodes plus douces correspondent à une consommation plus faible. Ces effets sont souvent saisonniers et peuvent varier d'une région à l'autre selon le climat, la densité de population et la structure économique.

Ce projet étudie la relation entre la **température quotidienne et la consommation d'électricité dans les régions françaises** sur la période **2020-2024**. La France constitue une étude de cas pertinente en raison de la diversité de ses climats régionaux, de sa part relativement élevée de chauffage électrique (66 % selon EDF) et de la disponibilité de données ouvertes détaillées sur la consommation d'électricité et les conditions météo.

La problématique principale est la suivante : 

> **Dans quelle mesure la température quotidienne influence-t-elle la consommation d'électricité à travers les régions de France ?**

Pour répondre à cette question, l'analyse se décline en trois étapes. Premièrement, des statistiques descriptives sont utilisées pour documenter les tendances régionales et saisonnières. Deuxièmement, la relation entre la température et la consommation d'électricité est explorée à l'aide de corrélations et de visualisations de séries temporelles. Ces résultats justifient ensuite une analyse économétrique plus formelle présentée plus loin dans le rapport.

## 2. Sources 
Cette étude s'appuie sur deux sources principales de données ouvertes, toutes deux disponibles à une fréquence quotidienne et couvrant la période du **1er janvier 2020 au 31 décembre 2024**.

### 2.1 Données de consommation d'électricité

Les données de consommation d'électricité proviennent du gestionnaire du réseau de transport d'électricité français (RTE). Le jeu de données fournit **la consommation d'électricité quotidienne agrégée au niveau régional** pour la France métropolitaine, mesurée en mégawattheures (MWh).

Ces données permettent d'analyser les dynamiques temporelles et l'hétérogénéité régionale de la demande d'électricité à travers la France.

### 2.2 Données météorologiques

Les données météorologiques sont extraites de **l'API NASA POWER**, qui fournit des variables météorologiques standardisées issues d'observations satellites et de modèles de réanalyse. La variable principale utilisée dans cette étude est la **température moyenne quotidienne à 2 mètres (T2M)**, exprimée en degrés Celsius.

L'API permet un accès reproductible aux données météorologiques historiques pour des coordonnées géographiques spécifiques, rendant possible la construction d'indicateurs de température régionaux cohérents.

## 3. Préparation des données
Les données de consommation d'électricité et les données météorologiques provenant de sources différentes, elles nécessitent un prétraitement avant de pouvoir être analysées conjointement.

Les données de consommation d'électricité obtenues auprès de RTE sont agrégées au **niveau régional quotidien**. Cette agrégation permet d'aligner les données sur la fréquence quotidienne des observations météorologiques et de lisser les fluctuations intra-journalières à court terme, permettant ainsi à l'analyse de se concentrer sur les variations de la demande qui sont plausiblement liées à la température.

Les données météorologiques sont construites à partir de **plusieurs points géographiques représentatifs au sein de chaque région**. Pour chaque région, la température moyenne quotidienne (T2M) est calculée comme la moyenne de ces points, ce qui permet de capturer les conditions climatiques régionales tout en réduisant la sensibilité à un lieu unique.

<center> <img src="/home/onyxia/work/Python_Project_2A/figure/weather_map.png" alt="Drawing" style="width: 600px;"/> </center>

La **Figure 1** montre que les observations météorologiques sont réparties spatialement au sein de chaque région plutôt que concentrées en un seul endroit. Cette couverture spatiale permet de construire des séries de températures régionales représentatives des conditions climatiques globales de la région et moins sensibles aux extrêmes locaux.

Après l'harmonisation des formats de date et des identifiants régionaux, les données de consommation d'électricité et les données météorologiques sont fusionnées en utilisant la **région et la date** comme clés communes. Des contrôles de validation de base confirment la cohérence du jeu de données fusionné et l'absence de valeurs manquantes systématiques.

## 4. Statistiques descriptives
Cette section présente les statistiques descriptives de la consommation d'électricité et de la température afin de caractériser les tendances globales, l'hétérogénéité régionale et les variations saisonnières avant de passer à l'analyse formelle.

### 4.1 Différences régionales dans la consommation d'électricité

La consommation moyenne d'électricité diffère considérablement d'une région à l'autre, avec des écarts importants dans la demande de base à travers la France.

<center> <img src="../figure/avg_ele_consumption_region.png" alt="Consommation moyenne d'électricité par région" style="width: 600px;"/> </center>

**Figure 2.** Consommation quotidienne moyenne d'électricité par région.

Nous observons une forte hétérogénéité régionale. L'Île-de-France se distingue comme une exception évidente avec la demande moyenne la plus élevée, ce qui indique que les niveaux de consommation de base diffèrent sensiblement entre les régions et ne peuvent être expliqués par la seule température.

Analyse de la distribution

Les graphiques en violon mettent en évidence un contraste majeur dans la volatilité de la demande entre les différentes parties du pays.

<center> <img src="../figure/consummation_distribution.png" alt="Distribution de la consommation d'électricité" style="width: 600px;"/> </center>

**Figure 3.** Distribution de la consommation quotidienne d'électricité par région.

Les régions ayant la consommation la plus élevée, comme Auvergne-Rhône-Alpes, présentent des distributions très larges, reflétant une demande quotidienne qui fluctue de manière significative. En comparaison, les formes plus étroites observées dans des régions comme la Bretagne ou la Normandie indiquent une charge énergétique beaucoup plus stable et constante tout au long de l'année.

Analyse des températures

Les boxplots révèlent que, bien que les températures médianes restent relativement proches dans tout le pays, l'amplitude thermique diffère considérablement entre les côtes et l'intérieur des terres.

<center> <img src="../figure/temperature_distribution.png" alt="Distribution des températures" style="width: 600px;"/> </center>

**Figure 4.** Distributions des températures par région.

Les régions du sud comme PACA et l'Occitanie affichent des maximums beaucoup plus élevés, tandis que les zones continentales comme le Grand-Est connaissent des pics de froid plus extrêmes. En revanche, la Bretagne présente une distribution beaucoup plus serrée avec moins d'extrêmes, ce qui explique probablement pourquoi sa demande d'énergie reste plus stable que dans les régions sujettes à de fortes baisses de température en hiver.

### 4.2 Tendances saisonnières

La consommation d'électricité et la température présentent des cycles saisonniers marqués et opposés au cours de l'année.

<center> <img src="../figure/seasonal_pattern.png" alt="Consommation nationale et température au cours du temps" style="width: 600px;"/> </center>

**Figure 5.** Moyenne nationale de la consommation quotidienne et de la température au cours du temps.

On observe une forte relation saisonnière inverse entre les deux variables : les périodes de basses températures coïncident avec les pics de demande d'électricité. Cette tendance est cohérente avec l'augmentation des besoins en chauffage pendant les mois les plus froids et suggère que la température joue un rôle majeur dans les variations saisonnières de la consommation.

### 4.3 Comparaison régionale annuelle

Pour évaluer la stabilité des tendances régionales dans le temps, les moyennes annuelles de consommation et de température sont calculées pour chaque région.

<center> <img src="../figure/yearly_temperature_by_region.png" alt="Température annuelle moyenne par région" style="width: 600px;"/> </center>

<center> <img src="../figure/yearly_consumption_by_region.png" alt="Consommation annuelle moyenne par région" style="width: 600px;"/> </center>

**Figure 6.** Température et consommation d'électricité annuelles moyennes par région.

Nous observons que les profils de température et de consommation sont stables d'une année sur l'autre. Si les régions du sud affichent systématiquement des températures plus élevées et que les régions du nord restent plus froides, l'Île-de-France ne figure pas parmi les régions les plus froides. Malgré cela, elle affiche invariablement la consommation d'électricité la plus élevée chaque année. Ce contraste indique que la forte demande en Île-de-France est largement dictée par des facteurs structurels plutôt que climatiques, tandis que la température explique principalement les fluctuations de court terme au sein de chaque région.

## 5. Liens entre température et consommation
Cette section explore la relation entre la température quotidienne et la consommation d'électricité à travers les régions, en se concentrant sur les corrélations et les variations intra-régionales.

### 5.1 Analyse de corrélation

<center> <img src="../figure/ele_vs_consommation.png" alt="Consommation moyenne d'électricité par région" style="width: 600px;"/> </center>

## 6. Régressions et analyses
Cette section quantifie la relation entre la température quotidienne et la consommation d'électricité à l'aide de modèles de régression linéaire. L'objectif est de mesurer comment la demande d'électricité répond aux variations de température tout en tenant compte des différences régionales persistantes dans les niveaux de consommation.

Tous les modèles sont estimés par la méthode OLS. Des erreurs-types robustes à l'hétéroscédasticité sont présentées pour tenir compte de l'hétéroscédasticité potentielle de la consommation quotidienne d'électricité.

### Régression OLS sur données agrégées

Nous estimons d'abord une régression OLS sur données agrégées qui met en relation la consommation d'électricité et la température moyenne quotidienne pour l'ensemble des régions et des dates :

$$
\text{Consommation}_{it} = \alpha + \beta\,\text{T2M}_{it} + \gamma_{it} + \varepsilon_{it}
$$
 
où $Consommation_{it}$
 représente la consommation quotidienne d'électricité dans la région $i$ au jour $t$, et $T2M_{it}$
 est la température moyenne quotidienne.

Cette spécification capture l'association moyenne entre la température et la consommation d'électricité, en ignorant l'hétérogénéité régionale.

<center> <img src="../figure/pool_OLS.png" alt="Consommation moyenne d'électricité par région" style="width: 600px;"/> </center>

Le coefficient estimé pour la température est négatif et statistiquement significatif. Une augmentation d'un degré Celsius de la température moyenne quotidienne est associée à une réduction d'environ $5 160$ MWh de la consommation d'électricité. Ce résultat est cohérent avec une demande d'électricité plus élevée lors des jours plus froids en raison des besoins de chauffage.

Cependant, le modèle n'explique qu'une part limitée de la variation totale de la consommation d'électricité, avec un $R^2$ d'environ $0,13$. Cela indique que la température seule ne peut pas justifier les grands écarts de consommation entre les régions.

### Modèle à effets fixes régionaux

Pour contrôler les différences régionales persistantes, nous estimons un modèle incluant des effets fixes par région :

$$
\text{Consommation}_{it} = \alpha + \beta\,\text{T2M}_{it} + \gamma_{it} + \varepsilon_{it}
$$
 
où $\gamma_{it}$
 capture les caractéristiques régionales invariantes dans le temps, telles que la taille de la population, l'activité économique et le parc immobilier.

<center> <img src="../figure/fixed_OLS.png" alt="Consommation moyenne d'électricité par région" style="width: 650px;"/> </center>

Une fois les effets fixes régionaux inclus, le coefficient de température estimé reste négatif, statistiquement significatif et d'une ampleur similaire (environ -5 070 MWh par °C). Cela suggère que la relation température-consommation reflète davantage les variations intra-régionales au fil du temps que les différences entre les régions.

Les capacités explicatives du modèle augmentent considérablement, avec un $R^2$ d'environ $0,90$, ce qui indique que l'hétérogénéité régionale explique la majeure partie de la variation de la consommation d'électricité. La température explique principalement les fluctuations à (très) court terme au sein des régions.

Les effets fixes estimés confirment que l'Île-de-France a une consommation d'électricité systématiquement plus élevée que les autres régions, même après avoir contrôlé la température.

### Comparaison des spécifications du modèle

<center> <img src="../figure/compare.png" alt="Comparaison des modèles" style="width: 450px;"/> </center>

La comparaison des deux spécifications montre que l'effet estimé de la température est stable d'un modèle à l'autre, tandis que le contrôle des effets fixes régionaux améliore considérablement l'ajustement du modèle. Cela souligne le rôle dominant des facteurs régionaux structurels dans la détermination des niveaux de consommation, la température agissant comme un moteur clé des variations à court terme.

Ces résultats doivent être interprétés comme des corrélations statistiques plutôt que comme des effets causaux. Néanmoins, ils sont cohérents avec l'analyse descriptive et fournissent des éléments de preuve montrant que la température joue un rôle important dans la structure de la consommation quotidienne d'électricité en France.

## 7. Discussion
Cette section discute des principaux résultats de l'analyse en synthétisant les preuves descriptives et les résultats des régressions. L'objectif est de clarifier ce que la température explique dans les schémas de consommation d'électricité, et ce qui reste dicté par des facteurs régionaux structurels.

### Le cas de l'Île-de-France

À travers toutes les étapes de l'analyse, l'Île-de-France apparaît comme un cas à part. Les statistiques descriptives montrent qu'elle présente systématiquement la consommation d'électricité moyenne la plus élevée, bien qu'elle ne figure pas parmi les régions les plus froides. Cette tendance persiste lorsqu'on examine les contrastes saisonniers et les moyennes annuelles.

Les résultats de la régression confirment cette observation. Même après avoir contrôlé la température via un modèle à effets fixes régionaux, l'Île-de-France affiche un effet fixe positif et significatif. Cela indique que sa forte demande d'électricité n'est pas principalement dictée par les conditions climatiques, mais plutôt par des caractéristiques structurelles telles que la densité de population, l'activité économique et les infrastructures urbaines.

### Hétérogénéité régionale de la consommation d'électricité

L'analyse révèle une hétérogénéité régionale substantielle et persistante des niveaux de consommation d'électricité. Si la température explique une grande partie de la variation à court terme au sein des régions, elle ne justifie pas les écarts importants de consommation de base (le "baseline") observés entre les régions.

L'augmentation spectaculaire des capacités d'explication ($via$ le $R^2$) lors de l'inclusion des effets fixes régionaux souligne l'importance des caractéristiques régionales invariantes dans le temps. Ces facteurs structurels dominent les niveaux globaux de la demande d'électricité, tandis que la température régit principalement les fluctuations quotidiennes et saisonnières.

### Ce que la température explique... et ce qu'elle n'explique pas

Considérés dans leur globalité, les résultats suggèrent une division claire du rôle de la température. La température est un déterminant clé de la demande d'électricité à court terme, notamment par son influence sur les besoins en chauffage pendant les périodes froides. Cette relation est robuste d'une spécification à l'autre et reste stable même en contrôlant l'hétérogénéité régionale.

Toutefois, la température n'explique pas pourquoi certaines régions consomment systématiquement plus d'électricité que d'autres. Les différences à long terme de la demande d'électricité sont largement dictées par des facteurs structurels et socio-économiques plutôt que par le seul climat. Cette distinction est cruciale pour interpréter les résultats et pour comprendre la portée des explications de la consommation d'électricité basées sur la température.

## 8. Limites 
Bien que l'analyse fournisse des preuves claires d'une relation étroite entre la température et la consommation d'électricité, plusieurs limites doivent être soulignées.

### Variables omises

Les modèles de régression se concentrent principalement sur la température et les effets fixes régionaux. D'autres facteurs susceptibles d'influencer la consommation d'électricité — tels que les prix de l'électricité, les niveaux de revenus, l'activité industrielle ou les caractéristiques du parc immobilier — ne sont pas explicitement inclus. Par conséquent, les relations estimées peuvent capturer en partie l'influence de variables omises corrélées à la température ou aux caractéristiques régionales. 

Nous n'avons par exemple pas les variables concernant l'isolation des bâtiments ou la structure du parc industriel, ce qui pourrait aussi expliquer pourquoi deux régions avec la même température ne consomment pas la même chose.

### Absence de causalité

Les coefficients estimés doivent être interprétés comme des associations statistiques plutôt que comme des effets causaux. La température n'est pas assignée de manière aléatoire, et des facteurs inobservés peuvent affecter simultanément la température et la demande d'électricité. Bien que la cohérence entre les tendances descriptives et les résultats des régressions renforce l'interprétation, l'analyse n'identifie pas un effet causal au sens économétrique strict.

### Agrégation des données

La consommation d'électricité et les variables météorologiques sont toutes deux agrégées au niveau régional quotidien. Cette agrégation peut masquer les variations intra-journalières et l'hétérogénéité locale au sein des régions. De plus, l'utilisation de points météorologiques représentatifs peut ne pas capturer pleinement les différences micro-climatiques au sein de régions vastes.

Malgré ces limites, l'analyse reste informative pour comprendre les tendances générales de la consommation d'électricité et le rôle de la température aux niveaux régional et quotidien.

## 9. Conclusion
Ce projet a étudié la relation entre la température quotidienne et la consommation d'électricité dans les régions françaises sur la période **2020-2024**. L'analyse démontre une relation négative claire et robuste entre la température et la demande d'électricité : les journées les plus froides sont systématiquement associées à une consommation plus élevée, reflétant l'importance des besoins en chauffage.

Au-delà de cet effet à court terme, l'étude met en évidence une **hétérogénéité régionale forte et persistante**. Les statistiques descriptives et les régressions à effets fixes montrent que la température explique les fluctuations quotidiennes et saisonnières au sein des régions, mais qu'elle ne justifie pas les écarts importants de niveaux de consommation moyens observés entre les régions. En particulier, **l'Île-de-France présente invariablement une demande d'électricité supérieure, même après avoir contrôlé l'effet de la température**, ce qui indique que des facteurs structurels tels que la densité de population et l'activité économique jouent un rôle dominant.

Plusieurs extensions pourraient enrichir davantage cette analyse. L'intégration de variables climatiques supplémentaires (comme les degrés-jours de chauffage ou des indicateurs de températures extrêmes), de contrôles socio-économiques ou d'effets fixes temporels pourrait améliorer le pouvoir explicatif du modèle. Enfin, explorer les effets non linéaires de la température ou distinguer la consommation résidentielle de la consommation industrielle permettrait d'obtenir une compréhension plus fine de la dynamique de la demande d'électricité en France.