
**Introduction :**

Dans le cadre de notre étude de cas sur les services de livraison alimentaire (Food Delivery), nous analysons les performances des bases de données relationnelles (SQL) et non relationnelles (NoSQL) à travers des requêtes concrètes sur un dataset représentatif.
L’objectif principal est de comprendre les avantages et inconvénients de chaque approche, en mettant en évidence leurs performances, leur facilité d’utilisation, et leur pertinence pour notre cas d’usage.

Les données étudiées couvrent différents aspects des commandes, tels que :

Les commandes passées par jour de la semaine.

Les temps de préparation et de livraison.

Le coût moyen des commandes selon le type de cuisine.

La relation entre le temps de livraison et la satisfaction des clients.


Plan du Notebook :

Introduction et Contexte


Présentation de l'étude de cas (livraison alimentaire).


**Objectif :** comparer SQL et NoSQL sur la base de requêtes spécifiques.

Préparation des Données :

Importation des données brutes en format CSV.
Conversion en format JSON pour MongoDB.
Chargement des données dans MySQL (SQL) et MongoDB (NoSQL).


Requêtes SQL (Analyse des données relationnelles) :

Compter les commandes par jour (Weekday vs Weekend).

Temps moyen de préparation et de livraison par jour.

Coût moyen par type de cuisine.

Relation entre le temps de livraison et la satisfaction des clients.

Requêtes NoSQL (Analyse des données non relationnelles) :

Équivalents des requêtes SQL, exécutées avec MongoDB.

**Installation pymongo dans Google Colab**

In [None]:
!pip install pymongo[srv]




In [None]:
!pip install "requests"



**Connection a MongoDB**

In [None]:

from pymongo.mongo_client import MongoClient
from pymongo.server_api import ServerApi

uri = "mongodb+srv://hyibtissam:eg414PzErO1yrQv1@cluster0.aplt5.mongodb.net/?retryWrites=true&w=majority&appName=Cluster0"

# Create a new client and connect to the server
client = MongoClient(uri, server_api=ServerApi('1'))

# Send a ping to confirm a successful connection
try:
    client.admin.command('ping')
    print("Pinged your deployment. You successfully connected to MongoDB!")
except Exception as e:
    print(e)

Pinged your deployment. You successfully connected to MongoDB!


**Charger le fichier JSON dans MongoDB**

In [None]:
import json

# Nom de la base de données et de la collection
db = client["FoodDeliveryDB"]  # Crée une base de données appelée "FoodDeliveryDB"
collection = db["FoodOrders"]  # Crée une collection appelée "FoodOrders"

# Chemin vers le fichier JSON
json_file_path = "/content/drive/MyDrive/Colab Notebooks/csvjson.json"
# Charger le fichier JSON
with open(json_file_path, 'r', encoding='utf-8') as file:
    data = json.load(file)  # Charge le contenu du fichier en tant que liste de dictionnaires

# Insérer les données dans MongoDB
if isinstance(data, list):
    collection.insert_many(data)  # Si le fichier contient une liste de documents
    print(f"{len(data)} documents ajoutés avec succès !")
else:
    collection.insert_one(data)  # Si le fichier contient un seul document
    print("1 document ajouté avec succès !")


1898 documents ajoutés avec succès !


**Vérifier les données dans MongoDB**

In [None]:
# Afficher les 5 premiers documents
for document in collection.find().limit(5):
    print(document)


{'_id': ObjectId('6739b574f8da042d57f9d95f'), 'order_id': 1477147, 'customer_id': 337525, 'restaurant_name': 'Hangawi', 'cuisine_type': 'Korean', 'cost_of_the_order': 30.75, 'day_of_the_week': 'Weekend', 'rating': 'Not given', 'food_preparation_time': 25, 'delivery_time': 20}
{'_id': ObjectId('6739b574f8da042d57f9d960'), 'order_id': 1477685, 'customer_id': 358141, 'restaurant_name': 'Blue Ribbon Sushi Izakaya', 'cuisine_type': 'Japanese', 'cost_of_the_order': 12.08, 'day_of_the_week': 'Weekend', 'rating': 'Not given', 'food_preparation_time': 25, 'delivery_time': 23}
{'_id': ObjectId('6739b574f8da042d57f9d961'), 'order_id': 1477070, 'customer_id': 66393, 'restaurant_name': 'Cafe Habana', 'cuisine_type': 'Mexican', 'cost_of_the_order': 12.23, 'day_of_the_week': 'Weekday', 'rating': 5, 'food_preparation_time': 23, 'delivery_time': 28}
{'_id': ObjectId('6739b574f8da042d57f9d962'), 'order_id': 1477334, 'customer_id': 106968, 'restaurant_name': 'Blue Ribbon Fried Chicken', 'cuisine_type': '

**Tester des interactions avec la base de données**

Compter le nombre total de documents :

In [None]:
count = collection.count_documents({})
print(f"Nombre total de documents : {count}")


Nombre total de documents : 7592


1. Compter les commandes par jour (Weekday vs Weekend)

En SQL, tu utilises GROUP BY pour regrouper les commandes par jour. En MongoDB, on va utiliser l'agrégation (aggregate), qui est l'équivalent de GROUP BY dans MongoDB.


In [None]:
# Compter les commandes par jour
pipeline = [
    {
        "$group": {
            "_id": "$day_of_the_week",  # Grouper par "day_of_the_week"
            "total_orders": { "$sum": 1 }  # Compter les commandes
        }
    },
    {
        "$sort": {"total_orders": -1}  # Trier les résultats par nombre de commandes
    }
]

result = collection.aggregate(pipeline)

# Afficher les résultats
for document in result:
    print(document)


{'_id': 'Weekend', 'total_orders': 5404}
{'_id': 'Weekday', 'total_orders': 2188}


2. Temps moyen de préparation et de livraison par jour de la semaine
Ici, en SQL, tu calcules la moyenne des temps de préparation et de livraison pour chaque jour. En MongoDB, on va également utiliser aggregate avec l'opérateur $avg pour calculer les moyennes.

In [None]:
# Calculer le temps moyen de préparation et de livraison par jour de la semaine
pipeline = [
    {
        "$group": {
            "_id": "$day_of_the_week",  # Grouper par "day_of_the_week"
            "avg_preparation_time": { "$avg": "$food_preparation_time" },  # Moyenne du temps de préparation
            "avg_delivery_time": { "$avg": "$delivery_time" }  # Moyenne du temps de livraison
        }
    },
    {
        "$sort": {"_id": 1}  # Trier les résultats par jour de la semaine
    }
]

result = collection.aggregate(pipeline)

# Afficher les résultats
for document in result:
    print(document)


{'_id': 'Weekday', 'avg_preparation_time': 27.212065813528337, 'avg_delivery_time': 28.340036563071298}
{'_id': 'Weekend', 'avg_preparation_time': 27.436713545521837, 'avg_delivery_time': 22.4700222057735}


3. Coût moyen par type de cuisine
En SQL, tu utilises GROUP BY pour grouper par type de cuisine et calculer la moyenne du coût. En MongoDB, on peut utiliser la même logique avec l'agrégation et l'opérateur $avg.

In [None]:
# Calculer le coût moyen par type de cuisine
pipeline = [
    {
        "$group": {
            "_id": "$cuisine_type",  # Grouper par "cuisine_type"
            "avg_cost": { "$avg": "$cost_of_the_order" }  # Moyenne du coût de la commande
        }
    },
    {
        "$sort": {"avg_cost": -1}  # Trier par coût moyen décroissant
    }
]

result = collection.aggregate(pipeline)

# Afficher les résultats
for document in result:
    print(document)


{'_id': 'French', 'avg_cost': 19.79388888888889}
{'_id': 'Southern', 'avg_cost': 19.300588235294118}
{'_id': 'Thai', 'avg_cost': 19.207894736842103}
{'_id': 'Spanish', 'avg_cost': 18.99416666666667}
{'_id': 'Middle Eastern', 'avg_cost': 18.82061224489796}
{'_id': 'Mexican', 'avg_cost': 16.93311688311688}
{'_id': 'Indian', 'avg_cost': 16.91972602739726}
{'_id': 'Italian', 'avg_cost': 16.418691275167788}
{'_id': 'American', 'avg_cost': 16.31982876712329}
{'_id': 'Chinese', 'avg_cost': 16.30520930232558}
{'_id': 'Japanese', 'avg_cost': 16.304531914893616}
{'_id': 'Mediterranean', 'avg_cost': 15.474782608695653}
{'_id': 'Korean', 'avg_cost': 14.001538461538463}
{'_id': 'Vietnamese', 'avg_cost': 12.882857142857144}


4. Relation entre le temps de livraison et la satisfaction des clients
En SQL, tu effectues une moyenne des notes en fonction du temps de livraison. En MongoDB, on peut faire cela en filtrant les documents et en utilisant $avg sur le champ de la note (après l'avoir converti en nombre).

In [None]:
# Relation entre le temps de livraison et la satisfaction des clients
pipeline = [
    {
        "$match": {
            "rating": {"$ne": "Not given"}  # Exclure les commandes sans note
        }
    },
    {
        "$group": {
            "_id": "$delivery_time",  # Grouper par "delivery_time"
            "avg_rating": { "$avg": { "$toDecimal": "$rating" } }  # Moyenne des notes
        }
    },
    {
        "$sort": {"_id": 1}  # Trier par temps de livraison
    }
]

result = collection.aggregate(pipeline)

# Afficher les résultats
for document in result:
    print(document)


{'_id': 15, 'avg_rating': Decimal128('4.296296296296296296296296296296296')}
{'_id': 16, 'avg_rating': Decimal128('4.489361702127659574468085106382979')}
{'_id': 17, 'avg_rating': Decimal128('4.509090909090909090909090909090909')}
{'_id': 18, 'avg_rating': Decimal128('4.375')}
{'_id': 19, 'avg_rating': Decimal128('4.294117647058823529411764705882353')}
{'_id': 20, 'avg_rating': Decimal128('4.372881355932203389830508474576271')}
{'_id': 21, 'avg_rating': Decimal128('4.196078431372549019607843137254902')}
{'_id': 22, 'avg_rating': Decimal128('4.42')}
{'_id': 23, 'avg_rating': Decimal128('4.234042553191489361702127659574468')}
{'_id': 24, 'avg_rating': Decimal128('4.303921568627450980392156862745098')}
{'_id': 25, 'avg_rating': Decimal128('4.227848101265822784810126582278481')}
{'_id': 26, 'avg_rating': Decimal128('4.425287356321839080459770114942529')}
{'_id': 27, 'avg_rating': Decimal128('4.290697674418604651162790697674419')}
{'_id': 28, 'avg_rating': Decimal128('4.375')}
{'_id': 29, '

Scénario : Trouver tous les clients ayant passé une commande dans des restaurants de cuisine "Italian" ou "Mexican" avec une note supérieure ou égale à 4.

En MongoDB, il faut travailler sans relations explicites (car MongoDB ne supporte pas nativement les jointures comme SQL). On se base sur des filtres simples :

In [None]:
result = collection.find(
    {
        "cuisine_type": {"$in": ["Italian", "Mexican"]},
        "rating": {"$gte": 4}
    },
    {"customer_id": 1, "_id": 0}
)

# Affichage des résultats
for doc in result:
    print(doc)


{'customer_id': 66393}
{'customer_id': 221206}
{'customer_id': 371590}
{'customer_id': 181782}
{'customer_id': 118709}
{'customer_id': 378482}
{'customer_id': 322162}
{'customer_id': 152786}
{'customer_id': 67538}
{'customer_id': 309513}
{'customer_id': 86731}
{'customer_id': 309513}
{'customer_id': 222879}
{'customer_id': 82041}
{'customer_id': 128243}
{'customer_id': 250494}
{'customer_id': 40010}
{'customer_id': 94524}
{'customer_id': 62359}
{'customer_id': 348787}
{'customer_id': 93133}
{'customer_id': 354719}
{'customer_id': 352247}
{'customer_id': 105164}
{'customer_id': 136876}
{'customer_id': 295111}
{'customer_id': 85633}
{'customer_id': 96877}
{'customer_id': 261400}
{'customer_id': 129597}
{'customer_id': 46859}
{'customer_id': 128353}
{'customer_id': 60052}
{'customer_id': 47280}
{'customer_id': 81166}
{'customer_id': 91879}
{'customer_id': 22405}
{'customer_id': 109221}
{'customer_id': 165130}
{'customer_id': 50123}
{'customer_id': 115519}
{'customer_id': 77793}
{'customer

In [None]:
#Étape 1 : Ajouter une promotion en MongoDB
collection.update_one(
    {"order_id": 1477147},  # Ajouter une promotion pour cet ID
    {"$set": {"promotion_code": "PROMO30"}}
)

document = collection.find_one({"order_id": 1477147})
print(document)




{'_id': ObjectId('6739b574f8da042d57f9d95f'), 'order_id': 1477147, 'customer_id': 337525, 'restaurant_name': 'Hangawi', 'cuisine_type': 'Korean', 'cost_of_the_order': 30.75, 'day_of_the_week': 'Weekend', 'rating': 'Not given', 'food_preparation_time': 25, 'delivery_time': 20, 'promotion_code': 'PROMO30'}


In [None]:
document = collection.find_one({"order_id": 1477147})
print(document)


{'_id': ObjectId('6739b574f8da042d57f9d95f'), 'order_id': 1477147, 'customer_id': 337525, 'restaurant_name': 'Hangawi', 'cuisine_type': 'Korean', 'cost_of_the_order': 30.75, 'day_of_the_week': 'Weekend', 'rating': 'Not given', 'food_preparation_time': 25, 'delivery_time': 20, 'promotion_code': 'PROMO30'}


In [None]:
document = collection.find_one({"order_id": 1477146})
print(document)


{'_id': ObjectId('6739b574f8da042d57f9df0e'), 'order_id': 1477146, 'customer_id': 49793, 'restaurant_name': 'Yama Japanese Restaurant', 'cuisine_type': 'Japanese', 'cost_of_the_order': 32.93, 'day_of_the_week': 'Weekend', 'rating': 5, 'food_preparation_time': 29, 'delivery_time': 17}
