# **Projet Python : prévision de la production éléctrique éolienne en France**
#### Florian Basso, Théo Ferry, Julien Peignon
***
L'objectif de ce projet est d'utiliser des données météorologiques de vents ainsi que des données liées au parc éolien français (position des éoliennes, puissance potentielle, etc..) afin de mettre en place des modèles de prédiction de la production d'énergie éolienne.
***
## 1) Données
### a) Récupération
Les données du Ministère de la Transition Écologique et de RTE sont en open data. Les données de Météo France sur les vents sont disponibles avec une API.

**Code à venir:** API données métérologiques, code téléchargement données éoliennes + données RTE

### b) Travail sur nos bases de données

L’enjeu sera de fusionner nos trois bases de données, de les retravailler de manière à associer les vents (qui sont mesurés à une localisation précise) aux éoliennes qui produisent dans un rayon proche afin d’estimer le plus finement possible la production en fonction des conditions météorologiques locales.

### c) Analyse descriptive

Premièrement, nous allons créer une carte afin de visualiser la position des installations éoliennes sur le territoire français

In [None]:
!pip install matplotlib
!pip install geopandas
!pip install pandas  

In [10]:
import pandas as pd
import geopandas as gpd
import matplotlib.pyplot as plt

In [11]:
url = 'https://opendata.agenceore.fr/explore/dataset/installations-de-production-eolien-par-commune/download?format=csv&timezone=Europe/Berlin&use_labels_for_header=false'

In [None]:
df=pd.read_csv(url, sep = ';')
df.head()
df.info()

In [None]:
#Next step, utiliser Cartiflette et les contours communaux français et plot les éoliennes en France.
!git clone https://github.com/InseeFrLab/cartogether.git
%cd ./cartogether
!pip install -r requirements.txt
!pip install .

In [13]:
df[['Latitude','Longitude']] = df.coordonnees.str.split(",",expand=True,)
#Je transforme le dataframe en geodataframe grâce à la géométrie que j'ai obtenue en séparant la colonne 'coordonnees' en deux colonnes.
gdf = gpd.GeoDataFrame( df, geometry=gpd.points_from_xy(df.Longitude, df.Latitude))

In [None]:
import cartiflette.s3

#Liste des codes INSEE des régions de la métropole
liste_reg = ["84","27","53","24","94","44","32","11","28","75","76","52","93"]

#Affichage de la carte de la France (il faut compter 15mn pour que la carte s'affiche (lol))
shp_communes = cartiflette.s3.download_vectorfile_url_all(
    values = liste_reg,
    level = "DEPARTEMENT",
    vectorfile_format="geojson",
    decoupage="region",
    year=2022)

ax = shp_communes.plot()
ax.set_axis_off()

## 2) Modélisation
### a) Modèle linéaire simple

Nous commencerons la modélisation pour une prédiction « naïve » de la production électrique avec un modèle de régression linéaire simple.

### b) Machine learning

Nous utilisons ensuite des modèles de machine learning plus performants pour d’avoir des prédictions plus précises. Nous pourrons comparer les résultats des deux modèles afin d’illustrer les faiblesses du modèle linéaire simple.