# Introduction aux Bases de données Orientée Graphe
<img src="images/Neo4j.png" width="30%">

## Introduction
<p>
    Le monde de bases de données a connu énormément de changements ces dernières
années. Pour faire face aux nombreux défis introduits par un monde connecté et
digitalisé, beaucoup de solutions ont émergé, se détachant du paradigme relationnel
et correspondant à des usages particuliers.
</p>
<p>
    Les bases de données NoSQL ....
</p>   
<p>
    Il existe quatre grandes familles de bases de données NoSQL :
    <ul>
        <li>Bases de données orientées documents : MongoDB, CouchBase, ... </li>
        <li>Bases de données orientées colonnes : HBase, Cassandra, ... </li>
        <li>Bases de données orientées clefs-valeurs : Redis, Riak, ...</li>
        <li>Bases de données orientées graphes : Neo4j, ...</li>
    </ul>
</p>
<p>
    Les bases de données orientées graphes permettent de modéliser, stocker et requêter en temps réel vos données connectées. Ici, on ne parle plus de table ou de document, mais de nœud et de relation.
</p>

## Qu'est ce qu'une base de données orientée graphes ?

<p>Une base de données orientée graphes (<b>GraphDB</b>) stocke les données sous forme de nœuds et de relations au lieu de tables dans le modèle relationnel ou de documents dans les bases de données orientées documents. </p>
<p>
Comme n'importe quelle base de données NoSQL, les données sont stockées sans les restreindre à un schéma prédéfini (schemaless), ce qui permet une manière très flexible de les penser et de les utiliser.
</p>
<p>
Une base de données orientée graphe stocke, donc, tout type de données en utilisant :
<ul>
    <li>Nœuds</li>
    <li>Des relations</li>
    <li>Propriétés</li>
</ul>

#### Noeuds
<p>
Les noeuds dans une base de données orientée graphes correspondent aux points qui vont composer le graphe. On parle également de sommets.
</p>
<p>
Les nœuds correspondent aux enregistrements (données) dans une bases de données relationnelle. Les données sont stockées sous forme de propriétés et les propriétés sont de simples paires nom/valeur ou clé/valeur.
</p>
<p>
Les nœuds peuvent être regroupés en appliquant une étiquette à chaque membre. Un nœud peut avoir zéro ou plusieurs étiquettes. Stocker des données dans Neo4j est similaire pour ajouter plus d'enregistrements dans d'autres bases de données.
</p>
    
#### Relations

<p>
    Les liens qui relient les noeuds sont appelés des relations. Les termes arêtes, arcs ou vertex sont également utilisés.
</p>
<p>Une relation est utilisée pour connecter des nœuds. Elle spécifie comment les nœuds sont liés.</p> <p>Dans neo4j :</p>
<ul>
    <li>Les relations ont toujours une direction.</li>
    <li>Les relations ont toujours un type.</li>
    <li>Les relations forment des modèles de données.</li>
</ul>

#### Propriétés
<p>
Les propriétés (caractéristiques, informations, attributs, ...) sont des valeurs de données nommées. Les propriétés sont représentées par des pairs clés/valeurs.
</p>

#### Chemin
<p>
    Un chemin d'un noeud <b>A</b> à un noeud <b>B</b> correspond à une suite de relations qui vont relier <b>A</b> et <b>B</b>. Le chemin est dit élémentaire si on ne passe pas deux fois par un même noeud. Il est simple si on ne passe pas deux fois par une même relation. Un chemin dont le noeud de départ correspond au noeud d'arrivée est appelé un cycle.
</p>

#### Distance et diamètre
<p>
    La distance (ou écart) entre deux noeuds représente le plus court chemin entre ceux-ci (lorsque celui-ci existe). La distance entre deux noeuds directement reliés est 1. 
</p>
<p>
    Le diamètre correspond quant à lui à la plus grande distance possible entre deux noeuds d'un graphe.
</p>
    
#### Degré
<p>    
Le degré ou la valence d'un noeud est équivaut au nombre de relations dont il est une extrémité.
</p>

#### Ordre et taille
<p>
L'ordre d'un graphe correspond au nombre de ses sommets, et sa taille au nombre de ses relations.
</p>

#### Matrice d'adjacence
<p>
Une matrice d'adjacence est une représentation sous forme matricielle d'un graphe.
</p>
<p><img src="images/graph1.png" width="30%"></p>
<p>
    En prenant le graphe précédent, nous pouvons remplir la première ligne de la matrice par
0 1 1 0.
En effet, A n'est pas lié à lui-même (0), A est lié à B (1), A est lié à C (1), A n'est pas lié à D (0).
</p>
<p>
    La matrice d'adjacence M associée à ce graphe est donc la suivante : <br>
    <center>
        <table>
            <tr><td> </td><td>A</td><td>B</td><td>C</td><td>D</td></tr>
            <tr><td>A</td><td>0</td><td>1</td><td>1</td><td>0</td></tr>
            <tr><td>B</td><td>1</td><td>0</td><td>1</td><td>1</td></tr>
            <tr><td>C</td><td>1</td><td>1</td><td>0</td><td>1</td></tr>
            <tr><td>D</td><td>0</td><td>1</td><td>1</td><td>0</td></tr>
        </table>
    </center>
Une matrice d'adjacence de graphe non orientée est symétrique.
</p>

## Pourquoi une base de données orientée graphe

Une GraphDB est très utile de nos jours, car dans ce type de bases de données, les données existent sous la forme de relations entre différents objets. Contrairement aux bases de données relationnelles qui insistent sur les données, les relations entre les données sont plus précieuses que les données elles-mêmes.

Les bases de données relationnelles, quand à elles, stockent des données hautement structurées qui ont plusieurs enregistrements de même type de données. Ce bases de données ne stockent pas les relations entre les données tandis que les GraphDB stockent les relations et les connexions en tant qu'entités de première classe.


## GraphDB populaires
Neo4j est la base de données de graphes la plus populaire. D'autres bases de données de graphes sont :
<ul>
    <li>Base de données Oracle NoSQL</li>
    <li>OrientDB</li>
    <li>HyperGraphDB</li>
    <li>GraphBase</li>
    <li>InfiniteGraph</li>
</ul>

## GraphDB vs RDBMS
Différences entre la base de données orientée graphes et le système de gestion de bases de données relationnelles (SGBDR) :
<table border="1">
    <tr align="left">
        <td>
            <strong>Graph Database</strong>
        </td>
        <td>
            <strong>RDBMS</strong>
        </td>
    </tr>
    <tr>
        <td>
            Dans une GraphDB, les données sont stockées dans des graphes
        </td>
        <td>
            Dans RDBMS, les données sont stockées dans des tables
        </td>
    </tr>
    <tr>
        <td>
            Dans une GraphDB, il y a des nœuds
        </td>
        <td>
            Dans RDBMS, il y a des lignes
        </td>
    </tr>
    <tr>
        <td>
            Dans une GraphDB, il existe des propriétés et leurs valeurs
        </td>
        <td>
            Dans RDBMS, il y a des colonnes et des données
        </td>
    </tr>
    <tr>
        <td>
            Dans une GraphDB, les nœuds connectés sont définis par des relations
        </td>
        <td>
            Dans RDBMS, les contraintes sont utilisées à la place de cela
        </td>
    </tr>
    <tr>
        <td>
            Dans une GraphDB, la traversée de la base de données est utilisée à la place de la jointure
        </td>
        <td>
            Dans RDBMS, la jointure est utilisée à la place de la traversée
        </td>
    </tr>
</table>
    

## Modèle de données de Neo4j
La base de données Neo4j suit le <b>modèle de graphe de propriétés</b> pour stocker et gérer ses données. Neo4j est une base de données orientée graphes qui contient les fonctionnalités suivantes du modèle de graphe de propriétés.
<ul>
<li>Le modèle Graph contient des nœuds, des relations et des propriétés qui spécifient les données et leur fonctionnement.</li>
    <li>Les propriétés sont des paires clé-valeur.</li>
<li>Les nœuds sont représentés à l'aide d'un cercle et les relations sont représentées à l'aide des arcs fléchées.</li>
    <li>La relation spécifie le lien entre deux nœuds.</li>
<li>Il existe deux types de relations entre les nœuds selon leurs directions : Unidirectionnelle et Bidirectionnelle</li>
<li>Chaque relation contient deux nœuds : « Noeud de début » ou « Noeud de départ » et « Noeud de destination » ou « Noeud de fin ».</li>
    <li>Les nœuds et les relations contiennent des propriétés.</li>
<li>Les relations doivent être directionnelles en mode de données de graphique de propriété. Si vous créez une relation sans direction, cela passera par un message d'erreur.</li>
</ul>