# üóÑÔ∏è Partie 5 : Cr√©ation du Data Warehouse (AWS RDS)

## üéØ Objectif
Structurer les donn√©es brutes pour les rendre exploitables. Nous passons de fichiers plats (CSV) √† une base de donn√©es relationnelle SQL h√©berg√©e dans le Cloud.

## üõ† Choix Techniques
* **AWS RDS (PostgreSQL)** : Base de donn√©es manag√©e robuste et performante pour les requ√™tes analytiques.
* **SQLAlchemy** : Utilisation d'un ORM (Object Relational Mapper) pour ins√©rer les DataFrames Pandas directement en base.
    * *Avantage* : Gestion automatique des types de donn√©es (Schema) et s√©curit√© accrue par rapport aux requ√™tes SQL brutes.

In [None]:
import pandas as pd
import os
from dotenv import load_dotenv
from sqlalchemy import create_engine, text

# 1. Chargement de la configuration DB
load_dotenv()

DB_ENDPOINT = os.getenv("DB_HOST")
DB_PASSWORD = os.getenv("DB_PASSWORD")
DB_USER = os.getenv("DB_USER")
DB_PORT = os.getenv("DB_PORT")
DB_NAME = os.getenv("DB_NAME")

# Cha√Æne de connexion SQLAlchemy
conn_str = f"postgresql+psycopg2://{DB_USER}:{DB_PASSWORD}@{DB_ENDPOINT}:{DB_PORT}/{DB_NAME}"

try:
    print(f"üîå Connexion √† la base RDS : {DB_ENDPOINT}...")
    engine = create_engine(conn_str)
    
    # Test simple
    with engine.connect() as connection:
        connection.execute(text("SELECT 1"))
        print("‚úÖ Connexion r√©ussie !")

    # 2. Chargement et Envoi des Donn√©es M√©t√©o
    if os.path.exists('cities_weather_data_7days.csv'):
        print("\nüì§ Traitement table 'weather'...")
        df_weather = pd.read_csv('cities_weather_data_7days.csv')
        df_weather.to_sql('weather', engine, if_exists='replace', index=False)
        print(f"   ‚úÖ {len(df_weather)} lignes ins√©r√©es.")
    
    # 3. Chargement et Envoi des Donn√©es H√¥tels
    if os.path.exists('hotels_data.csv'):
        print("\nüì§ Traitement table 'hotels'...")
        df_hotels = pd.read_csv('hotels_data.csv')
        df_hotels.to_sql('hotels', engine, if_exists='replace', index=False)
        print(f"   ‚úÖ {len(df_hotels)} lignes ins√©r√©es.")

    print("\nüéâ Data Warehouse mis √† jour avec succ√®s.")

except Exception as e:
    print(f"\n‚ùå Erreur critique : {e}")

üîå Tentative de connexion √† kayak-db.cnssuskuy2g7.eu-north-1.rds.amazonaws.com...
‚úÖ CONNEXION R√âUSSIE √Ä LA BASE DE DONN√âES !

üì§ Lecture et envoi des donn√©es m√©t√©o...
   ‚úÖ Table 'weather' cr√©√©e avec 35 lignes.

üì§ Lecture et envoi des donn√©es h√¥tels...
   ‚úÖ Table 'hotels' cr√©√©e avec 620 lignes.

üéâ MISSION DATA WAREHOUSE ACCOMPLIE !
Tes donn√©es sont maintenant stock√©es et structur√©es dans le Cloud.
