# Bases de données Orientée Graphe : Neo4j
<img src="images/Neo4j.png" width="30%">

### Introduction

<p>Neo4j est l'une des bases de données de graphes et du langage de requête Cypher (CQL) les plus populaires. Neo4j est écrit en langage Java. Ce tutoriel explique les bases de Neo4j et Python avec Neo4j.
</p>
<p>
    Ce tutoriel a été préparé pour les débutants afin de les aider à comprendre les concepts de base de Neo4j.
</p>

### Pré-requis
Avant de poursuivre ce tutoriel, vous devez avoir des connaissances de base sur la base de données, la théorie des graphes et le langage Python.

### Rappels

#### Qu'est-ce qu'une base de données de graphes ?
<p>
Un graphe est une représentation picturale d'un ensemble d'objets où certaines paires d'objets sont reliées par des liens. Il est composé de deux éléments : les <b>nœuds</b> (sommets) et les <b>relations</b> (arêtes).
</p>
<p>
La base de données orientée graphes est une base de données utilisée pour modéliser les données sous forme de graphes. Ici, les nœuds d'un graphe représentent les entités tandis que les relations décrivent l'association de ces nœuds.
</p>

#### Bases de données orientées graphes populaires
<p>
Neo4j est une base de données orientée graphes populaire. Les autres bases de données de graphes sont Oracle NoSQL Database, OrientDB, HyperGraphDB, GraphBase, InfiniteGraph et AllegroGraph.
</p>

#### Pourquoi des bases de données de graphes ?
<p>
De nos jours, la plupart des données existent sous la forme de relations entre différents objets et le plus souvent, la relation entre les données est plus précieuse que les données elles-mêmes.
</p>
<p>
Les bases de données relationnelles stockent des données hautement structurées qui ont plusieurs enregistrements stockant le même type de données afin qu'elles puissent être utilisées pour stocker des données structurées et, elles ne stockent pas les relations entre les données.
</p>
<p>
Contrairement à d'autres bases de données, les bases de données de graphes stockent les relations et les connexions en tant qu'entités de première classe.
</p>
<p>
Le modèle de données pour les bases de données de graphes est plus simple que celui d'autres bases de données et peut être utilisé avec les systèmes OLTP. Ils fournissent des fonctionnalités telles que l'intégrité transactionnelle et la disponibilité opérationnelle.
</p>

#### SGBDR vs base de données de graphes

<p>
    Voici un tableau qui compare les bases de données relationnelles et les bases de données de graphes.
</p>
<table>
    <tr><td><b>RDBMS</b></td><td><b>Graph database</b></td></tr>
    <tr><td>Tables</td><td>Graphs</td></tr>
    <tr><td>Rows</td><td>Nodes</td></tr>
    <tr><td>Columns and Data</td><td>Properties and its values</td></tr>
    <tr><td>Constraints</td><td>Relationships</td></tr>
    <tr><td>Joins</td><td>Traversal</td></tr>
</table>

### Avantages de Neo4j
<p>Voici quelques avantages de Neo4j.</p>
<ul>
    <li><i><u>Flexible data model (Modèle de données flexible) :</u></i> Neo4j fournit un modèle de données flexible, simple et puissant, qui peut être facilement modifié en fonction des applications et des industries.</li>
    <li><i><u>Real-time insights (Informations en temps réel) :</u></i> Neo4j fournit des résultats basés sur des données en temps réel.</li>
    <li><i><u>High availability (Haute disponibilité) :</u></i> Neo4j est hautement disponible pour les applications en temps réel des grandes entreprises avec des garanties transactionnelles.</li>
    <li><i><u>Connected and semi structures data  (Données connectées et semi-structurées) :</i> Avec Neo4j, vous pouvez facilement représenter des données connectées et semi-structurées.</li>
    <li><i><u>Easy retrieval (Récupération facile) :</u></i> En utilisant Neo4j, vous pouvez non seulement représenter mais aussi récupérer facilement (parcourir/naviguer) les données connectées plus rapidement par rapport à d'autres bases de données.</li>
    <li><i><u>Scalability and reliability (Évolutivité et fiabilité) :</u></i> Vous pouvez faire évoluer la base de données en augmentant le nombre de lectures/écritures et le volume sans affecter la vitesse de traitement des requêtes et l'intégrité des données. Neo4j prend également en charge la réplication pour la sécurité et la fiabilité des données.</li>
    <li><i><u>Cypher query language (Langage de requête Cypher) :</u></i> Neo4j fournit un langage de requête déclaratif pour représenter visuellement le graphique, en utilisant une syntaxe ASCII. Les commandes de ce langage sont dans un format lisible par l'homme et très faciles à apprendre.</li>
    <li><i><u>Built-in web application (Application Web intégrée) :</u></i> Neo4j fournit une application Web intégrée au navigateur Neo4j. Grâce à cela, vous pouvez créer et interroger vos données de graphique.</li>  
    <li><i><u>No joins (Pas de jointures) :</u></i> En utilisant Neo4j, il ne nécessite PAS de jointures complexes pour récupérer des données connectées/associées car il est très facile de récupérer ses détails de nœud ou de relation adjacents sans jointures ni index.</li>
</ul>

### Modèle de graphes de propriétés Neo4j

<p>La base de données de graphes Neo4j suit le modèle de graphe de propriétés pour stocker et gérer ses données.</p>

<p>Voici les principales caractéristiques du modèle de graphes de propriétés</p>
<ul>
    <li>Le modèle représente les données dans les nœuds, les relations et les propriétés</li>
    <li>Les propriétés sont des paires clé-valeur</li>
    <li>Les nœuds sont représentés à l'aide d'un cercle et les relations sont représentées à l'aide des flèches orientées</li>
    <li>Les relations ont des directions : unidirectionnelles et bidirectionnelles</li>
    <li>Chaque relation contient "Noeud de début" ou "Noeud de départ" et "Noeud vers" ou "Noeud de fin"</li>
    <li>Les nœuds et les relations contiennent des propriétés</li> 
    <li>Les relations relient les nœuds</li>
</ul>



<p>Dans Neo4j, les relations doivent être directionnelles. Si nous essayons de créer des relations sans direction, alors Neo4j lancera un message d'erreur indiquant que <b>"Les relations doivent être directionnelles"</b>.</p>

<p>La base de données de graphes Neo4j stocke toutes ses données dans des nœuds et des relations. Nous n'avons besoin d'aucune base de données RDBMS supplémentaire ni d'aucune base de données SQL pour stocker les données de la base de données Neo4j. Il stocke ses données en termes de graphes dans son format natif.</p>

<p>Les principaux blocs de construction du modèle de données Graph DB sont :</p>
<ul>
    <li>Nœuds</li>
    <li>Des relations</li>
    <li>Propriétés</li>
</ul>
<p>
Voici un exemple simple d'un graphe de propriétés.
    </p>
    <img src="images/rs1.png" width="500">
    
<p>Dans ce graphe on représente un certain nombre d'utilisateurs (U1, U2 et U3) qui aiment (like) des films (M1, M2, M3 et M4). Les utilisateurs sont reliés par une relation d'amitié (friend). </p>
<p>Les noeuds sont représentés par des cercles, alors que les relations sont représentées par des flèches orientées.</p>

### Neo4j : Eléments de base

<p>La base de données de graphes Neo4j a les blocs de construction suivants :</p>
<ul>
    <li>Nœuds</li>
    <li>Propriétés</li>
    <li>Des relations</li>
    <li>Étiquettes</li>
    <li>Navigateur de données</li>
</ul>

#### Nœud
<p>
Le nœud est une unité fondamentale d'un graphe. Il contient des propriétés avec des paires clé-valeur, comme illustré dans l'image suivante.
</p>
<img src='images/node.png' width=150>
<p>
Ici, le nom du noeud est "Employee" et il contient un ensemble de propriétés sous forme de paires clé-valeur.
</p>

#### Propriétés

<p>La propriété est une paire clé-valeur pour décrire les nœuds de graphe et les relations.</p>

<table><tr><td>Clé = Valeur</td></tr></table>
<p>
Où clé est une chaîne et la valeur peut être représentée à l'aide de n'importe quel type de données Neo4j.
</p>

#### Relations
<p>Les relations sont un autre élément constitutif majeur d'une base de données de graphes. La relation relie deux nœuds comme illustré dans la figure suivante.</p>
<img src="images/relationship1.png" width="300">
<p>
Ici, Emp et Dept sont deux nœuds différents. "WORKS_FOR" est une relation entre les nœuds Emp et Dept.
</p>


<p>
Chaque relation contient un nœud de début et un nœud de fin. Ici, "Emp" est un nœud de début et "Dept" est un nœud de fin.</p>

<p>Comme cette flèche (relation) représente une relation entre le nœud "Emp" et le nœud "Dept", cette relation est connue sous le nom de "Relation entrante" vers le nœud "Dept" et de "Relation sortante" du nœud "Emp".</p>

<p>Comme les nœuds, les relations peuvent également contenir des propriétés sous forme de paires clé-valeur.</p>

<img src="images/relationship2.png" width="300">

<p>Ici, la relation "WORKS_FOR" a une propriété en tant que paire clé-valeur.</p>

<table><tr><td>identifiant = 123</td></tr></table>

<p>la propriété représente un identifiant de cette relation.</p>

#### Étiquettes

<p>Le label associe un nom commun à un ensemble de nœuds ou de relations. Un nœud ou une relation peut contenir une ou plusieurs étiquettes. Nous pouvons créer de nouvelles étiquettes pour les nœuds ou relations existants. Nous pouvons supprimer les étiquettes existantes des nœuds ou relations existants.</p>

<p>D'après le schéma précédent, nous pouvons observer qu'il y a deux nœuds.</p>

<p>Le nœud de gauche a une étiquette : "Emp" et le nœud de droite a une étiquette : "Dept".</p>

<p>La relation entre ces deux nœuds a également une étiquette : "WORKS_FOR".</p>

<i>Remarque :</i>Neo4j stocke les données dans les propriétés des nœuds ou des relations.

#### Navigateur de données Neo4j

<p>Une fois que nous avons installé Neo4j, nous pouvons accéder au navigateur de données Neo4j en utilisant l'URL suivante :</p>

<i>http://localhost:7474/browser/</i>

<img src="images/browser.png">