[Schema](Schema.ipynb) <- vorige - [Inhoudsopgave](Inhoud.ipynb) - volgende -> [Linked data(1)](Linked-data-1.ipynb)

# JSON-schema

Met JSON-schema kun je schema's voor JSON-objecten maken.
Deze kun je gebruiken als documentatie van JSON-objecten die bijvoorbeeld in een web-API gebruikt worden.
Vervolgens kun je JSON-objecten valideren tegen een schema.
Dit kan handig zijn voor JSON-objecten in web-API's,
zowel bij het genereren als bij het accepteren van JSON objecten.


## JSON-schema in MongoDB

In MongoDB kun je schema's in de JSON-schema notatie gebruiken voor het valideren van documenten in een collection.

## Definiëren van een schema

### Annotaties

Deze annotaties zijn niet verplicht, maar wel "good practice".

* `$schema` - welke (standaard)notatie gebruiken we hier? ("schema van het schema")
* `title` - de naam van het schema
* `description` - een beschrijving van het schema

### Type, object, properties

Een document heeft als type: `object`.

Per veld (*property*) van dit object geef je de naam en het type.
Je kunt ook aangeven of welke velden verplicht (*required*) zijn.

In [None]:
contact_schema = {
    "$schema": "http://json-schema.org/draft-07/schema#",
    "title": "Contact",
    "description": "schema for documents in the contacts collection",
    "type": "object",
    "properties": {
        "name": {"type": "string"},
        "email": {"type": "string"},
        "telephone": {"type": "string"},
    },
    "required": ["name", "email", "telephone"]
}

## JSON-schema in Python

Je kunt in Python een schema definiëren als een Python dictionary.
(Dit is vrijwel dezelfde notatie als JSON.)

De libraries `jsonschema` (https://python-jsonschema.readthedocs.io) en `fastjsonschema` geven je functies om JSON-objecten te valideren tegen een schema.



In [None]:
from jsonschema import validate

In [None]:
mycontact = {
    "name": "Harry van Doorn",
    "email": "harryvdoorm@friendmail.org",
    "tel": "06-1357 8642"
}

validate(instance=mycontact, schema=contact_schema)

* Verbeter `mycontact` en valideer opnieuw.

### Arrays

Als we meerdere e-mailadressen toestaan dan kunnen we daarvan een `array` maken:

In [None]:
contact_schema_1 = {
    "$schema": "http://json-schema.org/draft-07/schema#",
    "title": "Contact",
    "description": "schema for documents in the contacts collection",
    "type": "object",
    "properties": {
        "name": {"type": "string"},
        "email": {"type": "array", 
                  "items": {"type": "string"}},
        "telephone": {"type": "string"},
    },
    "required": ["name", "email", "telephone"]
}

In [None]:
mycontact_1 = {
    "name": "Harry van Doorn",
    "email": "harryvdoorm@friendmail.org",
    "telephone": "06-1357 8642"
}

validate(instance=mycontact_1, schema=contact_schema_1)

* Verbeter het veld `email` door daar een array van te maken, en valideer opnieuw.

## Alternatieven

In een contact moeten we tenminste een e-mailadres opnemen of een telefoonnummer, beide is niet verplicht.

We gebruiken hiervoor het keyword `anyOf`, met een lijst van alternatieven.

In [None]:
contact_schema_2 = {
    "$schema": "http://json-schema.org/draft-07/schema#",
    "title": "Contact",
    "description": "schema for documents in the contacts collection",
     "type": "object",
          "required": ["name"],
          "properties": {
              "name": {"type": "string"}
          },
          "anyOf": [
                  {"properties": {"email": {"type": "array",
                                            "items": {"type": "string"}
                                           }
                                                     
                                 },
                   "required": ["email"]},
              
                  {"properties": {"telephone": {"type": "string"}},
                   "required": ["telephone"]}
          ]
         }

In [None]:
mycontact_2 = {
    "name": "Harry van Doorn"
}

validate(instance=mycontact_2, schema=contact_schema_2)

* verbeter `mycontact2` door een e-mailadres of een telefoonnummer toe te voegen, en valideer opnieuw.

(Merk op dat het eerste missende alternatief als ontbrekend gemeld wordt,
terwijl je natuurlijk ook de andere alternatieven kunt opgeven.

## Patronen (reguliere expressies)

Zoals je ziet is een waarde van een veld vaak een string.
In veel gevallen moet die string aan een bepaald patroon (reguliere expressie) voldoen.
Dit patronen kun je ook beschrijven in JSON-schema.

Zie: https://json-schema.org/understanding-json-schema/reference/regular_expressions.html


## Gestandaardiseerde schema's

Voor veel voorkomende domeinen zijn standaard-schema's gemaakt.
Je vindt deze bijvoorbeeld via (in json-schema formaat).
Schema.org bevat een *ontologie* van veel-voorkomende begrippen.
Deze begrippen zijn in samenhang met elkaar gedefinieerd.

Zie bijvoorbeeld:

* https://schema.org/ContactPoint
* https://json.schemastore.org/schema-org-contact-point (hetzelfde, in json-ld)
* en de lijst: 
* https://schema.org/Person
** met bijvoorbeeld: `givenName` en `familyName`.

(Dit vormt een opstapje naar Linked Open Data.)