# 🧭 Projet Kayak – Recommandation de destinations en France

## 🎯 Objectif
Créer une application de recommandation de destinations et d'hôtels à partir :
- des prévisions météo sur 5 jours
- des hôtels disponibles sur Booking enrichis en coordonnées GPS

## 🛠️ Méthodologie
- Extraction des coordonnées GPS (API Nominatim)
- Récupération météo (OpenWeatherMap)
- Scraping des hôtels sur Booking
- Enrichissement des données
- Visualisation des résultats via Plotly


In [9]:
import pandas as pd

# Charger le dataset consolidé final
df = pd.read_csv('../booking_scraping/data/processed/consolidated_data_utf8.csv')

df.head()

Unnamed: 0,city,city_lat,city_lon,hotel_name,hotel_url,latitude,longitude,rating,description,price,...,wind_speed_31,wind_speed_32,wind_speed_33,wind_speed_34,wind_speed_35,wind_speed_36,wind_speed_37,wind_speed_38,wind_speed_39,wind_speed_40
0,Mont Saint Michel,48.635954,-1.51146,Gites Bellevue,https://www.booking.com/hotel/fr/gites-bellevu...,48.608106,-1.516814,9.3,Located just 2 km from the famous Mont Saint-M...,,...,3.18,2.32,2.95,1.88,2.11,2.05,1.89,0.91,1.43,1.99
1,St Malo,48.649518,-2.026041,Le Pilo,https://www.booking.com/hotel/fr/le-pilori.en-...,48.649221,-2.018422,9.7,"Set in Saint Malo, just 400 metres from Mole B...",,...,3.22,4.2,3.6,2.41,2.81,2.6,2.87,0.98,0.87,2.12
2,Bayeux,49.276462,-0.702474,Hotel Le Lion D'Or et Restaurant La Table Du Lion,https://www.booking.com/hotel/fr/le-lion-d-or-...,49.276074,-0.698512,8.6,This former 18th-century post office is now a ...,,...,3.65,3.17,2.24,2.25,0.84,0.83,0.76,2.24,3.6,4.38
3,Le Havre,49.493898,0.107973,JOST Hostel Le Havre Centre Gare,https://www.booking.com/hotel/fr/melt-auberge-...,49.493988,0.122733,8.7,JOST Hostel Le Havre Centre Gare features a sh...,,...,5.46,5.07,7.47,7.67,2.91,0.24,0.96,1.28,5.54,3.72
4,Rouen,49.440459,1.093966,Appart Rouen Centre,https://www.booking.com/hotel/fr/appart-rouen-...,49.444668,1.088917,8.1,Appart Rouen Centre offers accommodation withi...,,...,5.52,6.06,5.05,3.73,4.16,2.29,1.73,1.64,2.64,3.8


In [10]:
# Aperçu général
df.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 876 entries, 0 to 875
Columns: 330 entries, city to wind_speed_40
dtypes: float64(166), int64(80), object(84)
memory usage: 2.2+ MB


## 🌤️ Visualisation météo – Top 5 destinations

Nous sélectionnons les 5 villes avec la température moyenne la plus élevée pour les jours à venir.


In [11]:
import plotly.express as px

# Calcul de la température moyenne
temp_cols = [col for col in df.columns if 'temp' in col]
df['mean_temp'] = df[temp_cols].mean(axis=1)

top5 = df[['city', 'mean_temp', 'city_lat', 'city_lon']].drop_duplicates().sort_values(by='mean_temp', ascending=False).head(5)

fig = px.scatter_mapbox(
    top5,
    lat='city_lat',
    lon='city_lon',
    hover_name='city',
    hover_data={'mean_temp': True},
    color='mean_temp',
    color_continuous_scale='thermal',
    zoom=5
)
fig.update_layout(mapbox_style='open-street-map')
fig.update_layout(title='🌡️ Top 5 destinations les plus chaudes')
fig.show()

  fig = px.scatter_mapbox(


## 🏨 Visualisation – Top 20 hôtels selon la note utilisateur


In [12]:
top_hotels = df[['hotel_name', 'rating', 'latitude', 'longitude']].dropna().drop_duplicates()
top_hotels = top_hotels.sort_values(by='rating', ascending=False).head(20)

fig = px.scatter_mapbox(
    top_hotels,
    lat='latitude',
    lon='longitude',
    hover_name='hotel_name',
    hover_data={'rating': True},
    color='rating',
    color_continuous_scale='viridis',
    zoom=4
)
fig.update_layout(mapbox_style='open-street-map')
fig.update_layout(title='⭐ Top 20 hôtels selon les utilisateurs')
fig.show()


*scatter_mapbox* is deprecated! Use *scatter_map* instead. Learn more at: https://plotly.com/python/mapbox-to-maplibre/



## ✅ Conclusion

- Les villes avec les meilleures conditions météo ont été identifiées.
- Les meilleurs hôtels selon les notes utilisateurs sont affichés sur la carte.
- Ces données peuvent être utilisées par l'application Kayak pour recommander intelligemment les destinations.

**Améliorations possibles :**
- Ajouter un identifiant unique (`id`) dès l'extraction
- Sécuriser les clés API utilisées
- Développer une interface utilisateur (ex : Streamlit) pour filtrer en direct

👉 Projet prêt à être mis en production 🚀
