# MongoDB

- MongoDB est une base de données NoSQL (Not Only SQL), non relationnelle, qui est appropriée au stockage de documents
- Elle est non relationnelle, donc il n'y a pas de notion de Foreign Key
- L'accès à un objet sur la base de son id, ou grâce à un index, est extrêmement rapide
- Les objets sont stockés sous forme de dictionnaires
- La syntaxe des ORM est étudiée pour être extrêmement brève :
    - on écrit moins de lignes en pymongo qu'avec psycopg2 pour faire la même chose
    - par exemple, appeler un objet qui n'existe pas le crée (IF EXISTS automatique)
 
- **MongoDB n'est pas la solution à tous les problèmes, dans de nombreux cas, une base de données relationnelles est la meilleure abstraction**

- **En revanche, pour pas mal de situations, on sous-estime MongoDB, principalement parce qu'on pense 'en mode SQL'**
    - Par exemple, la redondance de données peut être une très bonne idée avec MongoDB

## Rapatrier les données products de NorthWind

In [29]:
import os
from dotenv import load_dotenv
# Ajouter aux variables environnementales celles contenues dans le .env
load_dotenv("../../../.env")

USER = os.environ.get("POSTGRESQL_LOCAL_USER")
PASSWORD = os.environ.get("POSTGRESQL_LOCAL_PASSWORD")

import psycopg2

db_name = "northwind"

# Connexion à la base de données
conn = psycopg2.connect(
    user=USER, 
    dbname=db_name,
    password=PASSWORD, 
    host="localhost", 
    port="5432"
)
cur = conn.cursor()

# Rapatrier les données de products
cur.execute("SELECT * FROM products")
products = cur.fetchall()    

cur.close()
conn.close()

## Se connecter a MongoDB.com

In [30]:
import os
from dotenv import load_dotenv
# Ajouter aux variables environnementales celles contenues dans le .env
load_dotenv("../../../.env")

import pymongo

USER = os.environ.get("MONGO_DB_USER")
PASSWORD = os.environ.get("MONGO_DB_PASSWORD")


# Code généré par MongoDB.Com

uri = f"mongodb+srv://{USER}:{PASSWORD}@cluster0.ygpq3bw.mongodb.net/?retryWrites=true&w=majority"
# Create a new client and connect to the server
client = pymongo.mongo_client.MongoClient(uri)
# Send a ping to confirm a successful connection
try:
    client.admin.command('ping')
    print("Pinged your deployment. You successfully connected to MongoDB!")
except Exception as e:
    print(e)

Pinged your deployment. You successfully connected to MongoDB!


## Créer une base de données

In [31]:
db = client['northwind_mongo']

## Créer une collection (=table)

In [47]:
# Création d'une collection pour les produits
products_collection = db['products']
# db['products'].drop()

## Insérer les données

In [48]:
# Insertion des données dans la collection
# Il faut insérer des listes de dictionnaires 
# (ou des listes de types clefs / valeurs reconnus par Mongo)
# on ne peut pas insérer directement les listes de tuples

column_names = [
    "product_id",
    "product_name",
    "supplier_id",
    "category_id",
    "quantity_per_unit",
    "unit_price",
    "units_in_stock",
    "units_on_order",
    "reorder_level",
    "discontinued"
]

documents = [dict(zip(column_names, row)) for row in products]


products_collection.insert_many(documents)

<pymongo.results.InsertManyResult at 0x10dd6a980>

## Lire des données

In [49]:
for product in products_collection.find():
    print(product)
    break

{'_id': ObjectId('6552baa9e2848eb8d1767d04'), 'product_id': 1, 'product_name': 'Chai', 'supplier_id': 8, 'category_id': 1, 'quantity_per_unit': '10 boxes x 30 bags', 'unit_price': 18.0, 'units_in_stock': 39, 'units_on_order': 0, 'reorder_level': 10, 'discontinued': 1}


## Sélectionner un seul document

In [50]:
# Lire un document spécifique
product = products_collection.find_one({"product_name": "Chai"})

## ObjectID

In [52]:
product["_id"]

ObjectId('6552baa9e2848eb8d1767d04')

## Insérer un document

In [53]:
new_product = {"product_name": "Blanche de Bruxelles", "unit_price": 1.99}
products_collection.insert_one(new_product)

<pymongo.results.InsertOneResult at 0x10e743f80>

## Mettre à jour un document

In [54]:
products_collection.update_one(
    {"product_name": "Blanche de Bruxelles"}, 
    {"$set": {"unit_price": 12.99}}
)

<pymongo.results.UpdateResult at 0x10e1ebf80>

## Supprimer un document

In [55]:
products_collection.delete_one({"product_name": "Blanche de Bruxelles"})

<pymongo.results.DeleteResult at 0x11db8e440>

## Supprimer une collection


In [58]:
# db['products'].drop()

## Exemple d'aggréation
- Les aggrégations en MongoDB sont extrêmement efficaces
- Elles permettent de faire des opérations complexes avec une représentation sous la forme d'un dictionnaire

In [62]:
from bson.son import SON
print(product["_id"], product["product_name"])
print("\n")
pipeline = [
    {"$group": {"_id": product["_id"], "AveragePrice": {"$avg": "$unit_price"}}}
]

avg_price = list(products_collection.aggregate(pipeline))
print(avg_price)

6552baa9e2848eb8d1767d04 Chai


[{'_id': ObjectId('6552baa9e2848eb8d1767d04'), 'AveragePrice': 28.421375}]


## Usage avec pandas

In [63]:
import pandas as pd
df = pd.DataFrame.from_records(db.products.find())