# üó∫Ô∏è Partie 6 : Visualisation & Recommandation

## üéØ Objectif
Pr√©senter les r√©sultats finaux sous forme de tableau de bord interactif pour l'utilisateur final ou l'√©quipe marketing.

## üõ† Choix Techniques
* **Plotly Express (`scatter_mapbox`)** : Choix d'une librairie interactive (zoom, survol) plut√¥t que statique (Matplotlib) pour une meilleure exp√©rience utilisateur sur des donn√©es g√©ographiques.
* **Double Visualisation** :
    1.  **Top 5 Destinations** : Bas√© purement sur le score m√©t√©o.
    2.  **Top 20 H√¥tels** : Filtrage des meilleurs √©tablissements situ√©s *uniquement* dans les zones recommand√©es.

In [1]:
import pandas as pd
import plotly.express as px

# Chargement des donn√©es (Simulation d'une lecture depuis le Data Warehouse ou CSV locaux)
# Dans un contexte de production, on ferait un `pd.read_sql` ici.
df_weather = pd.read_csv('cities_weather_data_7days.csv')
df_hotels = pd.read_csv('hotels_data.csv')

# --- PARTIE 1 : ANALYSE M√âT√âO ---
# On trie par temp√©rature (descendant) pour avoir les villes les plus chaudes
# On pourrait aussi pond√©rer avec la pluie (ex: score = temp - (pluie * 2))
top_5_cities = df_weather.sort_values(by='avg_temp_7_days', ascending=False).head(5)

print("üèÜ Top 5 Destinations (M√©t√©o) :")
print(top_5_cities[['city_name', 'avg_temp_7_days']])

# Carte 1 : M√©t√©o
fig_weather = px.scatter_mapbox(
    top_5_cities, 
    lat="latitude", 
    lon="longitude",
    color="avg_temp_7_days",
    size="avg_temp_7_days",
    color_continuous_scale=px.colors.sequential.Bluered,
    size_max=20,
    zoom=4.5,
    mapbox_style="open-street-map",
    title="Top 5 Destinations de la Semaine (Bas√© sur la m√©t√©o)",
    hover_name="city_name",
    hover_data=["total_rain_7_days", "main_weather"]
)
fig_weather.show()

# --- PARTIE 2 : RECOMMANDATION H√îTELS ---
# Filtrage : On ne garde que les h√¥tels situ√©s dans nos Top 5 villes
best_cities_list = top_5_cities['city_name'].tolist()
df_hotels_filtered = df_hotels[df_hotels['city'].isin(best_cities_list)].copy()

# Nettoyage et conversion du score en num√©rique
df_hotels_filtered['score'] = pd.to_numeric(df_hotels_filtered['score'], errors='coerce')

# S√©lection des 20 meilleurs h√¥tels dans ces zones
top_20_hotels = df_hotels_filtered.sort_values(by='score', ascending=False).head(20)

# Pour la carte, on a besoin des coordonn√©es. 
# Simplification : On utilise les coordonn√©es de la ville (dispo dans df_weather)
df_merged = top_20_hotels.merge(df_weather[['city_name', 'latitude', 'longitude']], 
                                left_on='city', right_on='city_name')

print(f"\nüè® S√©lection des 20 meilleurs h√¥tels dans les zones : {best_cities_list}")

# Carte 2 : H√¥tels
fig_hotels = px.scatter_mapbox(
    df_merged, 
    lat="latitude", 
    lon="longitude",
    color="score",
    size="score",
    color_continuous_scale=px.colors.sequential.Viridis, # Vert = Bien
    size_max=15,
    zoom=5,
    mapbox_style="open-street-map",
    title="Top 20 H√¥tels dans les Meilleures Zones M√©t√©o",
    hover_name="hotel_name",
    hover_data=["city", "score", "url"]
)
fig_hotels.show()

üèÜ Top 5 Destinations (M√©t√©o) :
                   city_name  avg_temp_7_days
20                 Marseille            13.04
27                 Collioure            12.38
19                    Cassis            12.08
26  Saintes Maries de la mer            11.65
21           Aix en Provence            11.55


  fig_weather = px.scatter_mapbox(



üè® S√©lection des 20 meilleurs h√¥tels dans les zones : ['Marseille', 'Collioure', 'Cassis', 'Saintes Maries de la mer', 'Aix en Provence']



*scatter_mapbox* is deprecated! Use *scatter_map* instead. Learn more at: https://plotly.com/python/mapbox-to-maplibre/



## üèÜ Conclusion du Projet

Ce projet a permis de construire un pipeline de donn√©es complet (**End-to-End Data Engineering**) r√©pondant √† une probl√©matique business concr√®te.

**Points cl√©s valid√©s :**
* ‚úÖ **Collecte de donn√©es h√©t√©rog√®nes** : API structur√©e (M√©t√©o) et Web Scraping complexe (Booking).
* ‚úÖ **Infrastructure Cloud Hybride** : Utilisation conjointe d'un Data Lake (S3) pour le stockage brut et d'un Data Warehouse (RDS SQL) pour la donn√©e structur√©e.
* ‚úÖ **Robustesse** : Impl√©mentation de m√©canismes de s√©curit√© (Variables d'environnement) et de r√©silience (Retry logic).
* ‚úÖ **Valorisation** : Livraison d'un outil de visualisation interactif aide √† la d√©cision.