# Waarom NoSQL?

Relationele (SQL) database-systemen zijn (veruit) de meest-gebruikte database-systemen.
Maar een relationele database vormt niet voor elk database-probleem de beste oplossing.
Daarom zijn in de loop van de tijd alternatieve *NoSQL* database-systemen ontwikkeld.
In dit gedeelte gaan we in op de redenen om af te wijken van de relationele principes.
Later geven we een concreet voorbeeld van het gebruik van een NoSQL database.

De belangrijkste redenen voor het gebruik van een NoSQL database zijn:

* de *structuur van de data*: als deze niet past bij een "rechthoekige tabel-structuur";
* de *aard van het gebruik*: als deze niet past bij de aannames en doelstellingen van relationele database-systemen (RDBMS-en).


## Structuur van de data



We hebben gezien dat het ontwerpen van een database in hoofdlijnen uit twee fases bestaat.
In de eerste fase bepaal je de structuur van de data uit de eisen en eigenschappen van de "business",
zonder rekening te houden met de beschikbare structuren van een bepaald database-systeem.
In de tweede fase vertaal je de data-structuren naar de beschikbare structuren van een bepaald database-systeem, bijvoorbeeld naar de tabellen van een relationeel (SQL) DBMS.

In principe kun je elke data-structuur vertalen naar een relationele tabelstructuur. 
Maar dat levert niet altijd een efficiënt resultaat op.
Zoals we eerder gezien hebben, zijn de volgende onderdelen lastig voor een relationele tabelstructuur:

* **(veel) optionele attributen.** Deze optionele attributen geven "gaten" in de tabellen. Als er veel gaten zijn, is de tabelstructuur niet efficiënt.
* **meerwaardige attributen.** Voor elk meerwaardig attribuut heb je (in principe) een extra tabel nodig; voor het raadplegen daarvan heb je dan steeds extra join-operaties nodig.
* **samengestelde attributen.** Een SQL-tabel kent geen "nesting": de elementen van een samengesteld attribuut moet je "platslaan" tot het niveau van de tabel.

```{figure} ./images/contact-model.png
:name: contact-entiteit
:width: 500px

Contact-entiteit met attributen
```

Een *contact*, zoals je dat tegenkomt in een contacten-database op een smartphone, combineert veel van deze lastige elementen:

* er zijn veel optionele attributen, die maar door enkele contacten gebruikt worden (denk aan: verjaardig, naam partner, e.d.);
* een contact kan meerdere telefoonnummers of adressen hebben (meerwaardige attributen);
* een adres is samengesteld uit meerdere delen: straat, huisnummer, postcode, woonplaats. Dit is een voorbeeld van een meerwaardig samengesteld attribut. 

Een dergelijk contact kun je wel eenvoudig vertalen naar een JSON-structuur, zoals we later zullen zien.

### Oplossingen met tabellen

Je kunt een aantal van deze problemen oplossen met behulp van een klein aantal extra tabellen. 

## Aard van het gebruik

Relationele database-systemen zijn ontworpen met bepaalde aannames over het gebruik.
Als het gebruik van een database niet aansluit bij deze aannames, is de relationele oplossing minder efficiënt.
Als deze efficiëntie een grote rol speelt bij dit gebruik, dan is een NoSQL-oplossing mogelijk beter.

Enkele van de aannames van RDBMS-en:

* relatief stabiele data-structuur (statische typering);
* consistentie als essentiële eigenschap
* meerdere (verschillende) toepassingen
* 


### Stabiliteit versus flexibiliteit

Relationele DBMS-en zijn gericht op stabiliteit. De tabellen hebben een vast schema, met statische typering van de velden. (Dat wil zeggen: de tabel bepaalt het type van de velden; niet de indivuduele rijen of records.)
De prijs hiervoor is dat het lastiger is om de structuur van de tabellen te veranderen; en een verandering in het schema van een tabel geldt voor alle rijen (records) in die tabel.

Een document-database zoals MongoDB maakt een veel flexibeler aanpak mogelijk, waarbij het "schema" van een *collection* (verzameling gelijksoortige documenten) geleidelijk aangepast kan worden.

### Meerdere (verschillende) toepassingen

Bij een relationele database staat de data voorop: later kunnen verschillende toepassingen ontworpen worden die deze data gebruiken.
Een gevolg van deze aanname is dat de database in principe verantwoordelijk is voor de integriteit en consistentie van de data.
Een toepassing die zich niet geheel volgens de regels gedraagt kan de consistentie van de data niet zomaar aantasten.

Als je een database ontwerpt voor gebruik door één toepassing, bijvoorbeeld een webwinkel, dan kan een andere taakverdeling tussen database-systeem en toepassing efficiënter zijn.

### Consistentie

Bij databases heb je met verschillende soorten consistentie te maken.

* interne consistentie
* consistentie met betrekking tot schijf- en leesopdrachten
* consistentie tussen de database en de "business"

De (onmiddellijke) consistentie van een relationele database betekent dat een leesopdracht het resultaat omvat van de voorafgaande schrijfopdrachten.

NoSQL database-systemen bieden vaak een zwakkere vorm: uiteindelijke consistentie (eventual consistency).
Dit betekent dat het resultaat van een schrijfopdracht uiteindelijk in de leesopdrachten terug te vinden is; maar dat hoef niet bij de eerstvolgende leesopdracht al het geval te zijn.




### Overzicht

| SQL                          | NoSQL                                   |
| :---                         | :---                                    |
| (onmiddellijke) consistentie | uiteindelijke consistentie              |
| centrale database            | distributie, replicatie, synchronisatie |