# Importing Libraries

In [1]:
from bs4 import BeautifulSoup
import requests
import csv
import pandas as pd

# Defining the List of Cities to Scrape

In [10]:
# Liste des villes à scraper
cities = ['marrakech', 'casablanca', 'agadir','fes']

# Setting the Base URL

In [11]:
# URL de base de Booking.com pour les villes marocaines
base_url = "https://www.booking.com/city/ma/"

# Function to Scrape Hotel Information

In [27]:
# Fonction pour scraper les informations de l'hôtel
def scrape_hotels(soup):
    hotels = []

    # Sélectionner les conteneurs des hôtels
    hotel_containers = soup.find_all('div', class_='a09a85d275')

    # Parcourir chaque conteneur d'hôtel et extraire les informations
    for container in hotel_containers:
        hotel_info = {}

        # Extraire le nom de l'hôtel
        name = container.find('h3', class_='e1eebb6a1e')
        if name:
            hotel_info['name'] = name.get_text(strip=True)

        # Extraire la note de l'hôtel
        rating = container.find('div', class_='ac4a7896c7')
        if rating:
            hotel_info['rating'] = rating.get_text(strip=True)

        # Extraire le nombre d'avis
        reviews = container.find('div', class_='abf093bdfe')
        if reviews:
            hotel_info['reviews'] = reviews.get_text(strip=True)

        # Extraire le prix de l'hôtel
        price = container.find('span', class_='d746e3a28e')
        if price:
            hotel_info['price'] = price.get_text(strip=True)

        # Extraire la description de l'hôtel
        description = container.find('div', class_='c6666c448e')
        if description:  # Change this check to 'description'
            hotel_info['description'] = description.get_text(strip=True)

        hotels.append(hotel_info)

    return hotels

In [28]:
# Liste pour stocker les données de tous les hôtels
all_hotels = []

# Parcourir chaque ville et scraper les hôtels
for city in cities:
    # Construire l'URL de la ville
    url = base_url + f"{city}.fr.html"
    
    # Envoyer une requête pour obtenir le contenu de la page
    response = requests.get(url)
    soup = BeautifulSoup(response.content, 'html.parser')
    
    # Obtenir les informations des hôtels
    hotels = scrape_hotels(soup)
    
    # Ajouter la ville à chaque entrée d'hôtel
    for hotel in hotels:
        hotel['city'] = city  # Ajout de la ville dans l'information de l'hôtel
        all_hotels.append(hotel)


# Creating a DataFrame

In [29]:
# Créer une DataFrame à partir des données des hôtels
hotels_df = pd.DataFrame(all_hotels)

# Afficher la DataFrame
hotels_df

Unnamed: 0,name,rating,reviews,price,description,city
0,Savoy Le Grand Hotel Marrakech,Avec une note de 8.5,Rafai,"€ 247,46",Savoy Le Grand Hotel MarrakechHôtel à Marrakec...,marrakech
1,Hotel Al Kabir,Avec une note de 6.4,Pascale Jacq,€ 83,Hotel Al KabirHôtel à Marrakech (Guéliz)Situé ...,marrakech
2,Kenzi Menara Palace & Resort,Avec une note de 8.4,Chloe,"€ 164,95",Kenzi Menara Palace & ResortHôtel à Marrakech ...,marrakech
3,Kennedy Hospitality Resort,Avec une note de 6.9,Guillaume,"€ 88,70",Kennedy Hospitality ResortHôtel à Marrakech (L...,marrakech
4,Hivernage Hotel & Spa,Avec une note de 8.4,Yassine,"€ 190,10",Hivernage Hotel & SpaHôtel à Marrakech (L’Hive...,marrakech
5,Hôtel Du Golf Rotana Palmeraie,Avec une note de 7.5,Sonia,"€ 175,86",Hôtel Du Golf Rotana PalmeraieHôtel à Marrakec...,marrakech
6,Marrakech Ryads Parc All inclusive,Avec une note de 7.4,Gaëlle,"€ 215,17",Marrakech Ryads Parc All inclusiveHôtel à Marr...,marrakech
7,Zalagh Kasbah Hotel & Spa,Avec une note de 6.8,Maeva,"€ 139,78",Zalagh Kasbah Hotel & SpaHôtel à Marrakech (L'...,marrakech
8,Hotel Imperial Plaza & Spa,Avec une note de 6.9,NABIH,"€ 56,02",Hotel Imperial Plaza & SpaHôtel à MarrakechL'H...,marrakech
9,Yaad City Hotel,Avec une note de 7.7,soukaina,"€ 55,20",Yaad City HotelHôtel à MarrakechDoté d'une pis...,marrakech


# Creating and Writing to a CSV File

In [30]:
# Créer un fichier CSV pour stocker les résultats
csv_file = 'hotels.csv'

# Écrire les données des hôtels dans le fichier CSV
hotels_df.to_csv(csv_file, index=False, encoding='utf-8', mode='w', quoting=csv.QUOTE_NONNUMERIC)

print(f"Données des hôtels enregistrées avec succès dans '{csv_file}'.")

Données des hôtels enregistrées avec succès dans 'hotels.csv'.


In [31]:
# Sauvegarder le DataFrame dans un fichier Excel
hotels_df.to_excel('hotels.xlsx', index=False)

print("Données des hôtels enregistrées avec succès dans 'hotels.xlsx'.")

Données des hôtels enregistrées avec succès dans 'hotels.xlsx'.
