# Création d'une BDD NoSQL pour stocker les Transactions de comptes bancaires

> EPSI - 2025

```mermaid
classDiagram

class Affectation{
    +str titre
    +Affectation parent
    +List~Affectation~ enfants
}

class Compte{
    +str id
    +str nom
    +str banque
}

class Montant{
    +str valeur
    +str monnaie
}

class Adresse{
    +str adresse
    +str code_postal
    +str ville
}

class Tiers {
    +str nom
    +Adresse adresse
}

class Transaction {
    +str libelle
    +datetime date
    +Compte compte
    +Montant montant
    +str uuid
    +Tiers tiers
    +List~Affectation~ affectations
    gen_uuid()
}

Transaction "*" -- "*" Affectation
Affectation "1" -- "*" Affectation
Tiers "*" --> "1" Adresse 
Transaction "1" <-- "*" Tiers
Transaction "1" <-- "*" Compte
Transaction "1" <-- "*" Montant
```

## Installer MongoDB

https://www.mongodb.com/docs/manual/installation/#std-label-tutorial-installation

alternative : utiliser un hébergement gratuit "mongo atlas".

## Création de l'environnement virtuel python

### Option 1 (pour windows)

Selectionnez "Select Kernel", en haut à droite, puis "create new", "create .venv", et cochez "requirements.txt".

### Option 2

Création d'un venv en ligne de commande

```sh
# Linux
virtualenv .venv -ppython3
```

## Dépendances

Puis on installe les dépendances pour Jupyter et mongodb :

### Pour linux

```sh
.venv/bin/pip install -r requirements.txt
```

### Pour windows

```sh
.venv/Scripts/pip.exe install -r requirements.txt
```

Si besoin, se référer au [tutorial pymongo](https://pymongo.readthedocs.io/en/stable/tutorial.html).

In [None]:
from pymongo import MongoClient
# TODO à adapter avec votre configuration
conn = "mongodb+srv://user:pwd@url"
client = MongoClient(conn)

## Si on raisonne comme en relationnel

Alors il faut créer une collection par entité !

Comme il n'y a pas de schéma fixe en NoSQL, on le simule en créant des dataclasses python qui respectent le diagramme de classe ci-dessus.

In [None]:
# Création de la bdd
db = client.epsi_banque

# Création des collections
transactions = db.transactions
comptes = db.comptes
affectations = db.affectations
adresses = db.adresses
# on omet les montants, que l'on sauvegardera en sous-documents
tiers = db.tiers


> [!warning]
> 
> Si vous rejouez le notebook cela créera des "doublons" de données

In [None]:
from transaction import Tiers, Transaction, Compte, Adresse, Affectation, Montant
from dataclasses import asdict

# Comme en relationnel : on crée la ligne puis on la lie grâce à sa PK :

## TODO insérer une adresse puis insérer un nouveau tiers, lié à cette adresse

## ... 

## On contrôle la collection :
[t for t in tiers.find()]


In [None]:
# Mais comme il n'y a pas de schema obligatoire, on pourrait insérer directement l'adresse dans le document :

## TODO insérer sans utiliser la classe "Adresse"

## On contrôle
[t for t in tiers.find()]

In [None]:
## On contrôle les adresses, il ne devrait y en avoir qu'une ! la deuxième adresse est incluse dans le tiers, et pas dans la collection "adresses"
[a for a in adresses.find()]

On affiche la liste des collections disponibles :

In [None]:
db.list_collection_names()

On voit que les collections ne sont créées que lorsque des données sont insérées (pareil pour les bdd).

In [None]:
## TODO insérer un compte

# On contrôle :
[c for c in comptes.find()]

On cherche à créer de nouvelles affectations, en gardant en tête qu'il y a une hierarchie, donc il faut en créer 2. Une pour le parent d'abord (par ex: "Logement") puis une pour l'enfant (par ex: "Loyer").

In [None]:
## TODO insérer affectations avec hiérarchie

# Avec un ORM on aurait "enfants" rempli automatiquement à la sélection
[a for a in affectations.find()]

### Requêter les données

`find()` sur une collection pour récupérer des documents. Critères de filtre exprimés par un dictionnaire python. (dans l'interpréteur mongo ce serait un objet JSON)

`find_one()` pour récupérer un seul document, s'il existe.

Données renvoyées sous forme de dictionnaire python.

In [None]:
{
    "tiers": tiers.find_one({"nom": "EPSI logement"}),
    "compte": comptes.find_one(),
    "affectation": affectations.find_one({"titre": "Loyer"}),
}

In [None]:
from datetime import datetime

## TODO insérer plusieurs transactions, avec les relations vers des documents précédement créés.
transactions.insert_many([
    asdict(
        Transaction(
            ## ...
        )
    ),
    asdict(
        Transaction(
            ## ...
        )
    ),
])

Résultat d'un insert simple : `InsertOneResult(ObjectId('67d851d0434998bfa032a0d3'), acknowledged=True)`

In [None]:
# On contrôle :
[t for t in transactions.find()]

### Requêtes avec "clauses" conditionnelles

Voir [query and projection operators](https://www.mongodb.com/docs/manual/reference/operator/query/).

NB: on en profite pour voir que l'on peut requêter dans les sous-documents en utilisant "`.`"

In [None]:
[t for t in transactions.find({
    "montant.valeur": { "$gt": "600" }
})]

### Agrégation

`aggregate` permet d’effectuer une série de traitements.

Le résultat du premier traitement est mis en entrée du second etc.

Avec [`$lookup`](https://www.mongodb.com/docs/manual/reference/operator/aggregation/lookup/), permet de faire une jointure.

Syntaxe :

```py
{ "$lookup":
    {
        "from": <collection to join>,
        "localField": <field from the input documents>,
        "foreignField": <field from the documents of the "from" collection>,
        "as": <output array field>
    }
}
```

In [None]:
## TODO écrire la requête aggregate pour récupérer les transactions et leurs sous-documents associés
[t for t in transactions.aggregate(
    [
        # ...
    ]
)]

Dans cet exemple façon "SGBDR", on constate que séparer les entités entre elles est particulièrement pénible dans une base NoSQL!

On pourrait s'aider d'un "ODM" (un "ORM" mais pour les Documents) comme [mongoengine](https://docs.mongoengine.org/tutorial.html), mais on sent quand même qu'on tord l'idée.