# üì¶ Partie 4 : Cr√©ation du Data Lake (AWS S3)

## üéØ Objectif
S√©curiser les donn√©es brutes collect√©es (CSV) en les envoyant vers le Cloud AWS. Cette √©tape garantit la p√©rennit√© des donn√©es avant leur transformation.

## üõ† Choix Techniques
* **AWS S3** : Standard industriel pour le stockage d'objets (Data Lake), fiable et peu co√ªteux.
* **Boto3** : Utilisation du SDK AWS pour Python pour automatiser l'envoi.
* **S√©curit√©** : Les identifiants AWS (`Access Key` / `Secret Key`) sont g√©r√©s via des variables d'environnement (`.env`) pour ne jamais √™tre expos√©s dans le code source.

In [1]:
import boto3
import os
from dotenv import load_dotenv

# 1. Chargement des secrets
load_dotenv()

AWS_ACCESS_KEY_ID = os.getenv("AWS_ACCESS_KEY_ID")
AWS_SECRET_ACCESS_KEY = os.getenv("AWS_SECRET_ACCESS_KEY")
BUCKET_NAME = os.getenv("AWS_BUCKET_NAME")

if not AWS_ACCESS_KEY_ID or not BUCKET_NAME:
    raise ValueError("‚ùå Erreur : Identifiants AWS manquants dans le .env")

# 2. Connexion √† S3
session = boto3.Session(
    aws_access_key_id=AWS_ACCESS_KEY_ID,
    aws_secret_access_key=AWS_SECRET_ACCESS_KEY,
    region_name="eu-west-3" # Paris
)
s3 = session.client("s3")

# 3. Liste des fichiers √† envoyer
files_to_upload = [
    "cities_coordinates.csv",
    "cities_weather_data_7days.csv",
    "hotels_data.csv"
]

print(f"üì¶ D√©but du transfert vers le bucket '{BUCKET_NAME}'...")

for file_name in files_to_upload:
    try:
        if os.path.exists(file_name):
            print(f"   ‚¨ÜÔ∏è Envoi de {file_name}...")
            s3.upload_file(file_name, BUCKET_NAME, file_name)
            print(f"   ‚úÖ {file_name} envoy√© avec succ√®s !")
        else:
            print(f"   ‚ö†Ô∏è Fichier local introuvable : {file_name}")
            
    except Exception as e:
        print(f"   ‚ùå Erreur d'upload sur {file_name} : {e}")

print("\nüéâ Transfert vers le Data Lake termin√©.")

üì¶ D√©but du transfert vers le bucket 'kayak-project-aws'...
   ‚¨ÜÔ∏è Envoi de cities_coordinates.csv...
   ‚úÖ cities_coordinates.csv envoy√© avec succ√®s !
   ‚¨ÜÔ∏è Envoi de cities_weather_data_7days.csv...
   ‚úÖ cities_weather_data_7days.csv envoy√© avec succ√®s !
   ‚¨ÜÔ∏è Envoi de hotels_data.csv...
   ‚úÖ hotels_data.csv envoy√© avec succ√®s !

üéâ Transfert vers le Data Lake termin√©.
