 # **TP : Manipulation de Données Clients avec MongoDB et les Structures de Données Python**



### Objectifs pédagogiques :
#### 1.	Comprendre et utiliser les structures de données Python (listes, dictionnaires, tuples).
#### 2.	Interagir avec une base MongoDB pour stocker et récupérer des données.
#### 3.	Réaliser des analyses simples avec des structures Python sans bibliothèques avancées.
#### 4.	Implémenter des algorithmes d'extraction et de transformation des données.
### Scénario :
Un magasin collecte des avis clients sur ses produits. Ces avis sont stockés dans MongoDB. Votre mission est d'extraire ces avis, de les transformer en structures Python (listes, dictionnaires, tuples) et de réaliser des analyses simples comme la recherche du meilleur produit ou le client ayant laissé le plus d'avis.
### Tâches principales :
#### 1. Création et insertion de données dans MongoDB :
- Les données des avis clients sont initialement fournies dans une liste de dictionnaires Python :






In [None]:
from xml.sax.expatreader import version

avis_clients=[
  {"client_id": "C001", "product_id": "P001", "rating": 5, "connect": "Excellent", "date" :"2024 -01-01"},
  {"client_id": "C002", "product_id": "P002", "rating": 3, "connect": "Average product", "date" :"2024 -01-02"},
   {"client_id": "C00a1", "product_id": "P003", "rating": 4, "connect": "Very good!", "date" :"2024 -01-03"}
]

- Insérer ces données dans MongoDB en utilisant Python (pymongo).
#### 2. Extraction des données :
- Récupérer les données depuis MongoDB et les convertir en une liste de tuples :



In [None]:
# Exemple de structure
[("C001", "P001", 5, "Excellent!", "2024 -01-01"),
("C002", "P002", 3, "Average product", "2024 -01-02")
 ]

#### 3. Manipulation et analyse des données :
- 	Réaliser des analyses simples à partir des listes et dictionnaires :
#### 1.	Trouver le produit avec la meilleure note moyenne.
#### 2.	Trouver le client ayant laissé le plus d'avis.
#### 3.	Compter le nombre total d'avis par produit.
#### 4. Visualisation des résultats :
-	Afficher les résultats dans un format lisible directement dans la console :
-	Exemple : Le produit P001 a la meilleure note moyenne : 4.8.
-	Exemple : Le client C001 a laissé le plus d'avis : 3.


# Réponses

#### 1. Création et insertion de données dans MongoDB 

In [270]:
import pymongo

In [271]:
myclient = pymongo.MongoClient("mongodb://localhost:27017/")

mydb = myclient["BD_avis_clients"]

In [272]:
print(myclient.list_database_names())

['BD_avis_clients', 'admin', 'config', 'local', 'mydb', 'vde']


In [273]:
dblist = myclient.list_database_names()
if "BD_avis_clients" in dblist:
  print("The maBD exists.")

The maBD exists.


In [None]:
"""
mydb.avis_clients.insertMany([
  {'client_id': 'C001', 'product_id': 'P001', 'rating': 5, 'connect': 'Excellent', 'date': '2024-01-01'},
  {'client_id': 'C002', 'product_id': 'P002', 'rating': 3, 'connect': 'Average product', 'date': '2024-01-02'},
  {'client_id': 'C003', 'product_id': 'P003', 'rating': 4, 'connect': 'Very good!', 'date': '2024-01-03'}
])
"""


In [None]:

# •	Insérer les données dans MongoDB 
mycol = mydb["avis_clients"]
x = mycol.insert_many(avis_clients)

# Afficher les _id des documents inserés:
print(x.inserted_ids)

#### 2. Extraction des données 

In [285]:
y = mycol.find_one()
print(x)

{'client_id': 'C00a1', 'product_id': 'P003', 'rating': 4, 'connect': 'Very good!', 'date': '2024 -01-03'}


In [276]:
#Retrouvez le premier document de la collection clients 
y = mycol.find_one()
print(x)

{'_id': ObjectId('6795033e49942db206d4bcaf'), 'client_id': 'C002', 'product_id': 'P002', 'rating': 3, 'connect': 'Average product', 'date': '2024 -01-02'}


In [277]:
# Renvoyer tous les documents de la collection "avis_clients" et imprimer chaque document :
for x in mycol.find():
  print(x)

{'_id': ObjectId('6794f45f49942db206d4bca6'), 'client_id': 'C001', 'product_id': 'P001', 'rating': 5, 'connect': 'Excellent', 'date': '2024 -01-01'}
{'_id': ObjectId('6794f45f49942db206d4bca7'), 'client_id': 'C002', 'product_id': 'P002', 'rating': 3, 'connect': 'Average product', 'date': '2024 -01-02'}
{'_id': ObjectId('6794f45f49942db206d4bca8'), 'client_id': 'C00a1', 'product_id': 'P003', 'rating': 4, 'connect': 'Very good!', 'date': '2024 -01-03'}
{'_id': ObjectId('679501ac49942db206d4bcaa'), 'client_id': 'C001', 'product_id': 'P001', 'rating': 5, 'connect': 'Excellent', 'date': '2024 -01-01'}
{'_id': ObjectId('679501ac49942db206d4bcab'), 'client_id': 'C002', 'product_id': 'P002', 'rating': 3, 'connect': 'Average product', 'date': '2024 -01-02'}
{'_id': ObjectId('679501ac49942db206d4bcac'), 'client_id': 'C00a1', 'product_id': 'P003', 'rating': 4, 'connect': 'Very good!', 'date': '2024 -01-03'}
{'_id': ObjectId('6795033e49942db206d4bcae'), 'client_id': 'C001', 'product_id': 'P001', '

In [278]:
# Renvoyer uniquement les rating et le connect, pas les _ids :
for x in mycol.find({},{ "_id": False, "rating": True, "connect": True }):
  print(x)

{'rating': 5, 'connect': 'Excellent'}
{'rating': 3, 'connect': 'Average product'}
{'rating': 4, 'connect': 'Very good!'}
{'rating': 5, 'connect': 'Excellent'}
{'rating': 3, 'connect': 'Average product'}
{'rating': 4, 'connect': 'Very good!'}
{'rating': 5, 'connect': 'Excellent'}
{'rating': 3, 'connect': 'Average product'}
{'rating': 4, 'connect': 'Very good!'}
{'rating': 5, 'connect': 'Excellent'}
{'rating': 3, 'connect': 'Average product'}
{'rating': 4, 'connect': 'Very good!'}
{'rating': 5, 'connect': 'Excellent'}
{'rating': 3, 'connect': 'Average product'}
{'rating': 4, 'connect': 'Very good!'}


In [279]:
 liste_dict=[]
for x in mycol.find({},{ "_id": False}):
     liste_dict.append(x)

In [280]:
liste_dict

[{'client_id': 'C001',
  'product_id': 'P001',
  'rating': 5,
  'connect': 'Excellent',
  'date': '2024 -01-01'},
 {'client_id': 'C002',
  'product_id': 'P002',
  'rating': 3,
  'connect': 'Average product',
  'date': '2024 -01-02'},
 {'client_id': 'C00a1',
  'product_id': 'P003',
  'rating': 4,
  'connect': 'Very good!',
  'date': '2024 -01-03'},
 {'client_id': 'C001',
  'product_id': 'P001',
  'rating': 5,
  'connect': 'Excellent',
  'date': '2024 -01-01'},
 {'client_id': 'C002',
  'product_id': 'P002',
  'rating': 3,
  'connect': 'Average product',
  'date': '2024 -01-02'},
 {'client_id': 'C00a1',
  'product_id': 'P003',
  'rating': 4,
  'connect': 'Very good!',
  'date': '2024 -01-03'},
 {'client_id': 'C001',
  'product_id': 'P001',
  'rating': 5,
  'connect': 'Excellent',
  'date': '2024 -01-01'},
 {'client_id': 'C002',
  'product_id': 'P002',
  'rating': 3,
  'connect': 'Average product',
  'date': '2024 -01-02'},
 {'client_id': 'C00a1',
  'product_id': 'P003',
  'rating': 4,
  '

In [281]:
# Initialisation d'une liste pour stocker les tuples
liste_tuple = []

# Boucle pour transformer chaque dictionnaire en tuple et l'ajouter à liste_tuple
for x in liste_dict:
    liste_tuple.append(tuple(x.values()))

# Affichage de la liste des tuples
print(liste_tuple)

[('C001', 'P001', 5, 'Excellent', '2024 -01-01'), ('C002', 'P002', 3, 'Average product', '2024 -01-02'), ('C00a1', 'P003', 4, 'Very good!', '2024 -01-03'), ('C001', 'P001', 5, 'Excellent', '2024 -01-01'), ('C002', 'P002', 3, 'Average product', '2024 -01-02'), ('C00a1', 'P003', 4, 'Very good!', '2024 -01-03'), ('C001', 'P001', 5, 'Excellent', '2024 -01-01'), ('C002', 'P002', 3, 'Average product', '2024 -01-02'), ('C00a1', 'P003', 4, 'Very good!', '2024 -01-03'), ('C001', 'P001', 5, 'Excellent', '2024-01-01'), ('C002', 'P002', 3, 'Average product', '2024-01-02'), ('C003', 'P003', 4, 'Very good!', '2024-01-03'), ('C001', 'P001', 5, 'Excellent', '2024 -01-01'), ('C002', 'P002', 3, 'Average product', '2024 -01-02'), ('C00a1', 'P003', 4, 'Very good!', '2024 -01-03')]


####  3.	Trouver le client ayant laissé le plus d'avis.



In [282]:
from bson.son import SON
# Agrégation pour calculer la moyenne des notes par produit
pipeline = [
    {
        "$group": {
            "_id": "$client_id",  # Remplacez "produit" par le champ de votre collection
            "averageRating": {"$avg": "$rating"}
        }
    },
    {
        "$sort": SON([("averageRating", -1)])
    },
    {
        "$limit": 1
    }
]
result = mycol.aggregate(pipeline)
# Affiche le produit avec la meilleure note moyenne
for client in result:
    print(f'Le client {client['_id']} a laissé le plus d\' avis : {client['averageRating']}')

Le client C001 a laissé le plus d' avis : 5.0


####  4.	Compter le nombre total d'avis par produit.

In [283]:
from bson.son import SON
# Agrégation pour calculer la moyenne des notes par produit
pipeline = [
    {
        "$group": {
            "_id": "$product_id", 
            "sumRating": {"$sum": "$rating"}
        }
    },
    {
        "$sort": SON([("sumRating", -1)])
    },
    {
        "$limit": 1
    }
]
result = mycol.aggregate(pipeline)
# Affiche le produit avec la meilleure note moyenne
for product in result:
    print(f'Le produit {product['_id']} a la meilleure note moyenne: {product['sumRating']}')

Le produit P001 a la meilleure note moyenne: 25
