In [None]:
import pandas as pd

In [None]:
import matplotlib

In [None]:
matplotlib.__version__

# Introduction rapide à Python


## Les opérations de base

In [None]:
# additions, soustractions, etc.
1+2

In [None]:
# déclaration des variables :
x = 2
x+2

In [None]:
# Par défaut en notebook, seul le résultat du dernier calcul s'affiche
# Pour afficher un résultat en cours de calcul, utiliser la fonction print
print(3**2)
print("exemple de calcul d'une puissance", 3**2)

## Les listes et dictionnaires

In [None]:
# On regroupe souvent les objets dans des listes :
l = [1,2,5,"a",2]
l

In [None]:
# On accède facilement aux éléments de la liste en indiquant leur numéro, en commençant par 0:
print("le premier élément : ", l[0])
print("le troisième élément : ", l[2])
print("le dernier élément : ", l[-1])
print("les trois premiers éléments : ", l[0:3])

In [None]:
# on peut aussi regrouper des objets dans des dictionnaires :
d = {'a':1, 'b':4, 'c':8}
d['a']

In [None]:
# longeur d'une liste :
l = [1,2,5,"a",2]
len(l)

## Les boucles *for*

In [None]:
# On itère dans une liste grâce aux boucles for :
l = [1,2,5,"a",2]
for x in l:
  print(x)


In [None]:
# On itère facilement sur des entiers grâce à la fonction range :
for i in range(11):
  print(i, i**3)

In [None]:
# On peut aussi faire des liste régulières grâce à la fonction np.arange :
import numpy as np
np.arange(2,10,0.5)

In [None]:
# On peut construire une nouvelle liste à partir d'une liste, en y insérant une boucle for :
l = [1, 3, 5, 7]
[x+1 for x in l]

## Les instructions conditionnelles *if*

In [None]:
# les éléments booléens
print(2==2)
print(2==3)

In [None]:
for i in range(11):
  if i%3==0: #le signe % veut dire modulo
    print(i)

In [None]:
for i in range(11):
  if i%3==0: #le signe % veut dire modulo
    print(i)
  elif i%3==1:
    print(2*i)
  else :
    print(3*i)

## Les fonctions

In [None]:
# Les fonctions classiques
CONSTANTE_1 = 8
def exemple_fonction(x, y):
  z = x**2+y
  return CONSTANTE_1*z

exemple_fonction(2,5)

In [None]:
# Pour les fonctions très simples, on peut utiliser une "lambda function":
f = lambda x: 2*x + 3
f(2)

## Les graphiques

In [None]:
# la bibliothèque classique de graphes en python est matplotlib
import matplotlib.pyplot as plt
plt.style.use( 'seaborn-v0_8-paper') #pour avoir un joli style

In [None]:
plt.plot(range(10), [x**2 for x in range(10)])

## Bibliothèques utiles

In [None]:
import math as m #Fonctions mathématiques de base
import numpy as np #Fonctions numériques
import scipy #Fonctions mathématiques avancées
import pandas as pd #Séries temporelles
import os #Navigation dans les dossiers

## Exercice

Tracer sur le même graphe les fonctions sin(n*x) sur l'intervale [0;10], pour n entier entre 0 et 10

# Premières analyses de données sur un fichier

## Import du fichier de données

Les données du TD sont ici : https://github.com/riad-z-phys/master2-IPE-data/tree/main/TD1/Input

Pour charger un fichier de données, deux options sont possibles :

* télécharger à la main les données à partir de Github, mettre les fichiers en local ou dans son drive, et les importer comme dans la méthode 1 ci-dessous
* directement depuis Github, il faut indiquer l'url permanente, que l'on peut obtenir en cliquant sur le bouton avec "..." et en cliquant sur "Copy permalink", puis remplacer le mot "blob" par "raw" dans l'url

### Méthode 1 : Connection à google drive

In [None]:
from google.colab import drive
drive.mount('/content/drive')

In [None]:
input_dir = '/content/drive/MyDrive/Cours Data M2/TD1/Input'
output_dir = '/content/drive/MyDrive/Cours Data M2/TD1/Output'

In [None]:
import os
os.listdir('/content/drive/MyDrive/Travail/Cours/Data/Cours Data M2/TD1/Input')

In [None]:
df = pd.read_csv(os.path.join(input_dir, 'EcoMix_2012_2024.csv'), sep=',', index_col=0, parse_dates=True)

### Méthode 2 : connexion à Github

In [None]:
# Exemple d'import de fichier directement depuis Github
# url du fichier :
url = 'https://github.com/riad-z-phys/master2-IPE-data/blob/55debe5fddf808f8bfc13dbed757bc2d7cac2a05/TD1/Input/EcoMix_2012_2024.csv'
# On corrige 'blob' par 'raw'
corrected_url = url.replace('/blob', '/raw')
# On peut charger les données :
df = pd.read_csv(corrected_url, sep=',', index_col=0, parse_dates=True)

## Afficher le Dataframe

In [None]:
df

## Manipulations de base d'un DataFrame

In [None]:
#Index
df.index

In [None]:
#Liste des colonnes
df.columns
l_prod = ['Fioul', 'Charbon', 'Gaz', 'Nucléaire', 'Eolien',
       'Solaire', 'Hydraulique', 'Pompage', 'Bioénergies', 'Ech. physiques']

In [None]:
df[l_prod]

In [None]:
#Sélection d'une colonne ; le résultat est une "Série":
df['Consommation']

In [None]:
#Sélection de plusieurs colonnes ; le résultat est une DataFrame :
df[['Fioul', 'Charbon']]

In [None]:
#Sélection sur l'index
df.loc['2013-01-01 00:00:00':'2013-01-01 05:00:00']

## Opérations sur les DataFrames

In [None]:
#Sommes sur les colonnes :
df.sum()

In [None]:
#Sommes sur les lignes :
df[['Fioul', 'Charbon']].sum(axis=1)

In [None]:
#Multiplications, divisions par un nombre :
2*df['Fioul']

In [None]:
#Multiplications, divisions par une Séries
df['Nucléaire']/df['Consommation']

## Les opérations temporelles

In [None]:
# Resampling au jour, mois ou à l'année :
df['Consommation'].resample('D').sum()
df[['Fioul', 'Charbon']].resample('MS').min()
df['Taux de Co2'].resample('YS').mean()

In [None]:
df['Consommation'].resample('YS').sum()

## Les graphiques

In [None]:
df['Consommation'].plot(figsize=(10,6))

In [None]:
df['Consommation'].resample('YS').sum().plot.bar(figsize=(10,6))

In [None]:
df[['Nucléaire', 'Charbon']].resample('MS').sum().plot(figsize=(10,6))

## Exercice

Equilibre offre-demande :

* Tracer la somme des productions et la consommation sur le même graphe
* Calculer l'écart max entre production et consommation ; conclure

Mix énergétique :

* Tracer pour chaque année le mix énergétique en graphique batons
* Calculer les pourcentages de chaque production pour chaque année
* Montrer graphiquement que la part d'EnR dans le mix énergétique a augmenté ces dernières années
* Montrer que le taux de CO2 du mix énergétique dépend fortement de l'utilisation des moyens de production fossiles
* Etudier la variabilité de la production solaire, de la production éolienne et la somme des deux, à différents pas de temps. Conclure