#  Requ√™tes MongoDB ‚Äì Projet RH NoSQL

**Contexte :**  
Projet de gestion des ressources humaines utilisant MongoDB et PyMongo dans le cadre du projet acad√©mique M1 Big data et IA.  
Ce document pr√©sente une s√©lection de requ√™tes MongoDB avec des explications m√©tier concr√®tes.

## Projet pr√©sent√© par BOUWEKA BIDJADA M Essodolom et DJOHSON Daniel


##  1. Connexion √† la base de donn√©es

In [1]:

from pymongo import MongoClient
import os
from dotenv import load_dotenv

# Chargement des variables d'environnement
load_dotenv()

# Connexion
client = MongoClient(os.getenv("MONGO_URI"))
db = client["rh_database"]

employees = db["employees"]
departments = db["departments"]
leave_requests = db["leave_requests"]


Import des donn√©es

In [5]:
import json

# Charger et ins√©rer les donn√©es depuis un fichier JSON (facultatif)
def import_json_collection(json_file_path, collection):
    with open(json_file_path, "r", encoding="utf-8") as file:
        data = json.load(file)
    if isinstance(data, list):
        collection.insert_many(data)
    else:
        collection.insert_one(data)

# Exemple :
# import_json_collection("data/employees.json", employees)


## Liste des requetes

# 1. Tous les employ√©s

In [6]:
# But : Afficher tous les employ√©s.
for emp in employees.find():
    print(emp)

# R√©sultat : It√©ration sur tous les documents.

# 2. Trouver un employ√© par nom

In [8]:
# But : Trouver un employ√© avec le nom "Koffi".

employees.find_one({"last_name": "Koffi"})


# R√©sultat : Renvoie le premier document correspondant.

# 3. les employ√©s d'un d√©partement 

In [9]:
#  But m√©tier :
# Obtenir la liste de tous les employ√©s appartenant au d√©partement D001.
# Cela peut √™tre utile pour l‚Äôanalyse RH d‚Äôune entit√© sp√©cifique (ex. : d√©partement informatique).

employees.find({"department_id": "D001"})

#  Lecture du r√©sultat :
# Retourne un curseur contenant tous les documents dont le champ "department_id" est √©gal √† "D001".
# Chaque document correspond √† un employ√© du d√©partement concern√©.


<pymongo.synchronous.cursor.Cursor at 0x1ead21760d0>

# 4. Nombre total d'employ√©s

In [11]:
# But : Obtenir le nombre total d'employ√©s.

employees.count_documents({})


# R√©sultat : Affiche un entier.

0

# 5. Les employ√©s par date d'embauche d√©croissante

In [12]:
#  But m√©tier :
# Afficher tous les employ√©s class√©s par date d'embauche d√©croissante.
# Cela permet d‚Äôidentifier les derniers employ√©s recrut√©s (plus r√©cents en haut de la liste).

employees.find().sort("hire_date", -1)

#  Lecture du r√©sultat :
# - `employees.find()` r√©cup√®re tous les employ√©s.
# - `.sort("hire_date", -1)` trie ces documents en ordre d√©croissant de la date d'embauche.
#    Le `-1` signifie "d√©croissant".
# R√©sultat : le premier document correspond √† l‚Äôemploy√© embauch√© le plus r√©cemment.


<pymongo.synchronous.cursor.Cursor at 0x1ead2176990>

# 6. Mise a jour du salaire d'un employ√© 

In [None]:
# But : Mettre √† jour le salaire de l'employ√©

employees.update_one(
    {"_id": ObjectId("64b9f6e8ecdb16d93771e9f2")},
    {"$set": {"salary": 750000}}
)

# r√©sultat : Le champ salary est modifi√© pour 64b9f6e8ecdb16d93771e9f2

# 7. Suppression d'un employ√©

In [None]:
# But : Supprimer l'employ√© 64b9f6e8ecdb16d93771e9f2.

employes.delete_one({"_id": ObjectId("64b9f6e8ecdb16d93771e9f2")})


# R√©sultat : Document 64b9f6e8ecdb16d93771e9f2 supprim√©.

# 8. Ajout d'un nouveau d√©partement 

In [None]:
#  But m√©tier :
# Ajouter un nouveau d√©partement nomm√© "Innovation" dans la base RH,
# avec pour responsable (manager) la personne nomm√©e "ADJOVI".

departments.insert_one({
    "department_id": "D005",
    "name": "Innovation",
    "manager": "ADJOVI"
})

#  Lecture du r√©sultat :
# - Ins√®re un nouveau document dans la collection "departments".
# - Le document contient un identifiant unique "D005", un nom de d√©partement et un manager associ√©.
# - Si l'insertion r√©ussit, PyMongo retourne un objet avec l‚Äô`_id` g√©n√©r√© automatiquement (ou d√©fini si pr√©cis√©).


# 9. Liste des d√©partements 

In [None]:
#  But m√©tier :
# Obtenir la liste compl√®te de tous les d√©partements enregistr√©s dans la base RH.
# Cela permet, par exemple, d'afficher tous les d√©partements disponibles dans une interface ou de les analyser.

list(departments.find())

#  Lecture du r√©sultat :
# - `departments.find()` renvoie un curseur contenant tous les documents de la collection "departments".
# - La fonction `list()` convertit ce curseur en liste Python pour faciliter l'affichage ou l'it√©ration.
# R√©sultat : une liste de dictionnaires (un par d√©partement), avec leurs champs (ex: department_id, name, manager, etc.).


## Filtres et requetes avanc√©es 

# 1. Employ√©s avec salaire > 500000 et dans le d√©partement D001

In [None]:
# But : Trouver employ√©s avec salaire > 500000 ET department_id = D001.
cursor = employees.find({
    "$and": [
        {"salary": {"$gt": 500000}},
        {"department_id": "D001"}
    ]
})
for e in cursor:
    print(e)
# R√©sultat : Documents filtr√©s selon deux conditions.


# 2. Employ√©s avec pr√©nom commen√ßant par "A" (regex)

In [None]:
# But : Lister employ√©s dont le pr√©nom commence par "A".
cursor = employees.find({"first_name": {"$regex": "^A", "$options": "i"}})
for e in cursor:
    print(e)
# R√©sultat : Recherche insensible √† la casse.


# 3. Employ√©s dans une liste de d√©partements

In [None]:
# But : Chercher employ√©s dans les d√©partements D001, D002 ou D003.
cursor = employees.find({"department_id": {"$in": ["D001", "D002", "D003"]}})
for e in cursor:
    print(e)
# R√©sultat : Documents avec department_id dans la liste.


# 4. Employ√©s avec champ "phone" existant

In [None]:
# But : Trouver employ√©s avec un num√©ro de t√©l√©phone renseign√©.
cursor = employees.find({"phone": {"$exists": True}})
for e in cursor:
    print(e)
# R√©sultat : Documents avec champ phone.


# 5. Employ√©s avec salaire entre 400000 et 600000

In [None]:
# But : Filtrer salari√©s dans une fourchette salariale.
cursor = employees.find({
    "salary": {"$gte": 400000, "$lte": 600000}
})
for e in cursor:
    print(e)
# R√©sultat : Documents filtr√©s par salaire.


# 6. Projection : afficher nom, pr√©nom et salaire tri√©s par salaire d√©croissant

In [None]:
# But : Afficher seulement last_name, first_name, salary, tri√©s par salary d√©croissant.
cursor = employees.find(
    {},
    {"_id": 0, "last_name": 1, "first_name":1, "salary": 1}
).sort("salary", -1)
for e in cursor:
    print(e)
# R√©sultat : Liste avec les champs projet√©s et tri√©e.


## Agr√©gations

# 1. Moyenne de salaire par d√©partement 

In [None]:
# But : Calculer la moyenne des salaires par d√©partement.
pipeline = [
    {"$group": {
        "_id": "$department_id",
        "avg_salary": {"$avg": "$salary"}
    }}
]
result = list(employees.aggregate(pipeline))
print(result)
# R√©sultat : Liste avec moyenne par d√©partement.


# 2. Top 3 employ√©s les mieux pay√©s

In [None]:
# But : Lister les 3 employ√©s avec les plus hauts salaires.
pipeline = [
    {"$sort": {"salary": -1}},
    {"$limit": 3}
]
result = list(employees.aggregate(pipeline))
print(result)
# R√©sultat : Les 3 documents avec les salaires les plus √©lev√©s.


# 3. Nombre d‚Äôemploy√©s par fonction

In [None]:
# But : Compter combien d'employ√©s par job_title.
pipeline = [
    {"$group": {
        "_id": "$job_title",
        "count": {"$sum": 1}
    }}
]
result = list(employees.aggregate(pipeline))
print(result)
# R√©sultat : Documents avec job_title et nombre d'employ√©s.


# 4. employ√©s avec infos d√©partement

In [None]:
# But : Afficher employ√©s avec leur d√©partement (join departments).
pipeline = [
    {
        "$lookup": {
            "from": "departments",
            "localField": "department_id",
            "foreignField": "department_id",
            "as": "department_info"
        }
    }
]
result = list(employees.aggregate(pipeline))
print(result)
# R√©sultat : Chaque employ√© a un tableau department_info attach√©.


# 5. D√©composer tableau de cong√©s (unwind) puis compter par employ√©

In [None]:
#  But m√©tier :
# Compter le nombre de jours de cong√© pris par employ√© (si on a un tableau `leave_days`).

pipeline = [
    {"$unwind": "$leave_days"},  # D√©compose chaque jour du tableau
    {"$group": {
        "_id": "$employee_id",
        "total_leave_days": {"$sum": 1}
    }}
]

# üìå R√©sultat :
# Liste avec chaque employ√© et le nombre de jours de cong√© utilis√©s.
# ‚ö†Ô∏è √Ä adapter si ta structure ne contient pas de tableau `leave_days`.


# 6. Filtrer cong√©s approuv√©s puis compter par employ√©



In [None]:
#But m√©tier :
# Identifier les employ√©s ayant eu le plus de cong√©s approuv√©s.

pipeline = [
    {"$match": {"status": "Approved"}},
    {"$group": {
        "_id": "$employee_id",
        "approved_leaves": {"$sum": 1}
    }}
]

result = list(leave_requests.aggregate(pipeline))
print(result)

#  R√©sultat :
# Chaque ligne indique le nombre de demandes de cong√© approuv√©es par employ√©.


# 7. Projeter uniquement nom et d√©partement, trier par nom

In [None]:
#  But m√©tier :
# Cr√©er une liste alphab√©tique des employ√©s avec leur d√©partement pour affichage ou export.

pipeline = [
    {"$project": {
        "first_name": 1,
        "last_name": 1,
        "department_id": 1,
        "_id": 0
    }},
    {"$sort": {"last_name": 1}}
]

result = list(employees.aggregate(pipeline))
print(result)

#  R√©sultat :
# Liste des employ√©s avec noms tri√©s (sans _id), utile pour un tableau ou une interface.


# 8. Agr√©gation imbriqu√©e : Moyenne des salaires des employ√©s par manager

In [None]:
#  But m√©tier :
# Calculer la moyenne des salaires par manager (en se basant sur les d√©partements qu'ils dirigent).

pipeline = [
    {
        "$lookup": {
            "from": "departments",
            "localField": "department_id",
            "foreignField": "department_id",
            "as": "dept_info"
        }
    },
    {"$unwind": "$dept_info"},
    {"$group": {
        "_id": "$dept_info.manager",
        "avg_salary": {"$avg": "$salary"}
    }},
    {"$sort": {"avg_salary": -1}}
]

result = list(employees.aggregate(pipeline))
print(result)

#  R√©sultat :
# Liste avec chaque manager et la moyenne des salaires des employ√©s de son d√©partement.


# 9. Nombre de cong√©s par employ√©

In [None]:
#  But m√©tier :
# Calculer le **nombre total de demandes de cong√©s** effectu√©es par chaque employ√©.
# Cette analyse permet √† la RH de visualiser la fr√©quence des demandes de cong√© par employ√©.

pipeline = [
    {"$group": {
        "_id": "$employee_id",                  # Grouper les documents par identifiant d'employ√©
        "total_leaves": {"$sum": 1}             # Compter le nombre de demandes (chaque document = 1)
    }}
]

list(leave_requests.aggregate(pipeline))

#  Lecture du r√©sultat :
# - Chaque document retourn√© contient :
#     - `_id`: l'identifiant de l'employ√© (ex: "EMP001")
#     - `total_leaves`: le nombre total de demandes de cong√©s faites par cet employ√©
# R√©sultat attendu :
# [
#   {"_id": "EMP001", "total_leaves": 3},
#   {"_id": "EMP002", "total_leaves": 1},
#   ...
# ]


---

¬© 2025 Essodolom BOUWEKA & DJOHSON Daniel
