# [SPIN OFF #3][MOVIES] Et si on allait ensemble plus loin avec MongoDB ?

Après installation de MongoDB, vérification du bon fonctionnement :

![console](https://cdn.discordapp.com/attachments/778291355473412107/789109532105244692/unknown.png)

La base de données "test" a bien été créée.

In [1]:
# On importe les bibliothèques CSV et PyMongo
import csv
import pymongo

In [2]:
from pymongo import MongoClient
# On crée la variable client qui renvoie à nos informations
# connexion à MongoDB.
client = MongoClient('localhost', 27017)

In [3]:
# On crée une nouvelle base de données, FloupicsDB ; sur python, la variable db.
db = client['FloupicsDB']

Avec MongoDB, une base de données et ses collections (équivalent de tables) ne sont définitivement créées que lorsqu'on y a inséré des données. Donc on ne pourra vérifier la création qu'à la fin.

In [4]:
# On crée des collections, une pour chaque fichier csv, et on leur donne un nom
# de variable sur python.
col_movies = db['movies']
col_ratings = db['ratings']
col_tags = db['tags']
col_links = db['links']

In [5]:
# On définit une fonction qui lit les fichiers CSV sous forme de liste
# de dictionnaires (une liste par ligne), puis insère chaque dictionnaire
# comme document dans la collection.
def inserer_donnees(nom_fichier, collection):
    try:
        # On crée une liste vide
        data = []
        # On ouvre le fichier CSV
        with open(nom_fichier, newline='', encoding='UTF-8') as csvfile:
            # On déclare une variable correspondant à la lecture par DictReader
            reader = csv.DictReader(csvfile)
            # On ajoute les données dans la liste data, à chaque fois en rapport
            # à la colonne (qui devient clef du dictionnaire)
            for row in reader:
                data.append(row)
            
            # Enfin on insère toutes les données dans la collection sélectionnée
            db.collection.insert_many(data)
            print("Insertion effectuée")
    except:
        print("Erreur : l'insertion n'a pas pu s'effectuer")

In [6]:
inserer_donnees('csvfiles/movies.csv', col_movies)

Insertion effectuée


In [7]:
inserer_donnees('csvfiles/ratings.csv', col_ratings)

Insertion effectuée


In [8]:
inserer_donnees('csvfiles/tags.csv', col_tags)

Insertion effectuée


In [9]:
inserer_donnees('csvfiles/links.csv', col_links)

Insertion effectuée


On peut vérifier la création de la base de données avec cette commande :

In [10]:
print(client.list_database_names())

['FloupicsDB', 'admin', 'config', 'local', 'test']


On peut faire une recherche simple pour vérifier l'insertion des données. Par exemple ici, avec find_one, on renvoie le premier document de la collection movies :

In [12]:
print(col_movies.find_one())

{'_id': ObjectId('5fdb5dabf450b82f55a3ec82'), 'movieId': '1', 'title': 'Toy Story (1995)', 'genres': 'Adventure|Animation|Children|Comedy|Fantasy'}


On peut aussi voir sur MongoDB Compass que les insertions ont bien été effectuées.

![compass](https://cdn.discordapp.com/attachments/778291355473412107/789123074905473024/unknown.png)

![floupic](https://cdn.discordapp.com/attachments/778291355473412107/789143192955256882/unknown.png)