# Notebook : Préparation des données énergie UE

Ce notebook montre les étapes pour :
1. Charger le fichier Excel `owid-energy-data.xlsx` dans une base SQLite.
2. Filtrer et transformer les données via SQL.
3. Exporter le résultat final en fichier Excel (`energie_transfo_01.xlsx`) pour analyse et visualisation (ex. Tableau).

**Sources** : Données OWID (Our World In Data) sur l'énergie en Europe.

In [None]:
# Importer les bibliothèques nécessaires

import pandas as pd
import sqlite3

In [None]:
# Charger le fichier Excel et l'importer dans SQLite

# 1. Charger le fichier Excel
df = pd.read_excel("owid-energy-data.xlsx", sheet_name="Data")

# 2. Connexion / création de la base SQLite
conn = sqlite3.connect("Base_SQL_Projet_Energie.db")

# 3. Importer le DataFrame dans SQLite
df.to_sql("ma_table", conn, if_exists="replace", index=False)

# 4. Fermer la connexion
conn.close()

# Vérification
print("Fichier Excel chargé dans SQLite avec succès !")

In [None]:
# Requête SQL pour filtrer les données

# Connexion à la base SQLite
conn = sqlite3.connect("Base_SQL_Projet_Energie.db")

# Requête SQL
query = """
WITH base AS (
    SELECT *
    FROM ma_table m
    WHERE country IN ('Austria', 'Belgium', 'Czechia', 'Denmark', 'Estonia', 'Finland', 'France', 'Germany',
                      'Greece', 'Hungary', 'Iceland', 'Ireland', 'Italy', 'Latvia', 'Lithuania', 'Luxembourg', 
                      'Netherlands', 'Norway', 'Poland', 'Portugal', 'Slovakia', 'Slovenia',
                      'Spain', 'Sweden', 'Switzerland', 'Turkey', 'United Kingdom')
)
SELECT country, year, fossil_fuel_consumption, fossil_share_energy,
       nuclear_consumption, nuclear_share_energy, 
       renewables_consumption, renewables_share_energy,
       gas_consumption, gas_share_energy
FROM base
WHERE year > 1999
GROUP BY country, year
ORDER BY country, year ASC
"""

# Charger le résultat dans un DataFrame
df_filtered = pd.read_sql_query(query, conn)

# Vérifier les premières lignes
df_filtered.head()


In [None]:
# Exporter le DataFrame filtré dans un nouveau fichier Excel

# Exporter en Excel pour utilisation dans Tableau
df_filtered.to_excel("energie_transfo_01.xlsx", index=False)

print("Dataset final exporté : energie_transfo_01.xlsx")

# Notes

- Ce notebook reproduit exactement les scripts Python utilisés pour préparer les données.
- Il peut être exécuté de bout en bout pour générer le dataset final.
- Les données brutes (`owid-energy-data.xlsx`) ne sont pas versionnées sur GitHub (voir .gitignore).
- Dataset final prêt pour visualisation dans Tableau.