# Données multimédia : Python pour le traitement d’images et de données audio

## Master Humanités Numériques du [CESR](https://cesr.univ-tours.fr/)

Clément Plancq (MSH VDL / CITERES)

![logo iiif](../img/Logo_Stacked_lightweight.png)

[iiif.io](https://iiif.io)

iiif définit un cadre technique commun à destination des fournisseurs d’image numériques afin de : 
 - délivrer les images de manière standardisée sur le web
 - les décrire à l’aide de métadonnées structurées
 - les rendre consultables, manipulables, annotables
 

Concrètement ce cadre techinque ce sont des [APIs](https://iiif.io/api/index.html) :
 - *Image API*
 - *Presentation API*
 - Authentification
 - Content Search

iiif est porté par un consortium de musées, d’universités, de bibliothèques nationales, … Voir la [liste des membres](https://iiif.io/community/consortium/members/)

![carte](../img/iiif-implementations.png)

Voir la [carte](https://bit.ly/iiifmap)

iiif est né en réponse aux problèmes rencontrés après les années 2000 et la prolifération des projets de bibliothéques numériques : 
- incapacité des systèmes à échanger des données : manque d’interopérabilité
- développement de serveur de diffusion d’image et/ou de visualiseur propre à chaque projet : long, coûteux et difficile à maintenir
- outils avec UIs et fonctionnalités différentes : difficile à appréhender par les chercheurs

En plus des standards, iiif soutient et fédère le développement d’applications open source et partagées : 
 - serveur d’images
 - visualiseurs
 - outils d’annotation
 - modules pour CMS
 
Voir [https://github.com/IIIF/awesome-iiif](https://github.com/IIIF/awesome-iiif)

## Zoom profond

![Japanese Tax Map](https://training.iiif.io/iiif-online-workshop/day-one/img/img_5813.jpg)

[Voir la carte sur Stanford Digital Repository](https://purl.stanford.edu/hs631zg4177)

## Comparaison d’images

[https://www.theleidencollection.com/viewer/david-and-uriah/](https://www.theleidencollection.com/viewer/david-and-uriah/)



## Images de plusieurs sites

Le manuscrit 5 de la Bibliothèque municipale de Châteauroux, c. 1460.  
Folio est à la BVMM (Bibliotheque Virtuelle de Manuscrits medievaux, IRHT)  
Miniature est à la BNF

[http://demos.biblissima-condorcet.fr/chateauroux/demo/
](http://demos.biblissima-condorcet.fr/chateauroux/demo/
)


## Recherche

Exemple de recherche sur manuscrit avec OCR

[https://mirador-textoverlay.netlify.app/](https://mirador-textoverlay.netlify.app/)

## Annotations

- Exemple avec Mirador : [https://projectmirador.org/](https://projectmirador.org/) cliquez sur "Try a live demo"  
- Exemple ave Adno : [https://adno.app/en/example/](https://adno.app/en/example/)
- Exemple avec [Annona](https://ncsu-libraries.github.io/annona/) : [https://ericayhayes.github.io/audubon/exhibits/](https://ericayhayes.github.io/audubon/exhibits/)

## Visites guidées

- Exemple avec [Exhibit](https://www.exhibit.so/) : [Jane Austen](https://www.exhibit.so/exhibits/H8eRALyZNl8STQKrNev9?screen=SGtYJLcsaJgGpEhv55Lp)


## Comment ça marche ?

Deux APIs principales :

- [Image API](https://iiif.io/api/image/3.0/)
- [Presentation API](https://iiif.io/api/presentation/3.0/)

## Image API

Elle spécifie un service web qui renvoie une image en réponse à une requête HTTP ou HTTPS  
La requête peut porter sur :
- l’image elle-même
- de l’information sur l’image

La requête sur l’image se fait via une URI avec la syntaxe suivante :  
`{scheme}://{server}{/prefix}/{identifier}/{region}/{size}/{rotation}/{quality}.{format}`

Exemple :
https://ids.lib.harvard.edu/ids/iiif/25286607/full/200,/0/default.jpg


scheme: `https`  
server: `ids.lib.harvard.edu`  
prefix: `/ids/iiif/`  
identifier: `25286607`  
region: `full`  
size: `200,`  
rotation: `0`  
quality: `default`  
format: `jpg`  
![](https://ids.lib.harvard.edu/ids/iiif/25286607/full/200,/0/default.jpg)

### `region`

| Valeur |  Description |
| ------------------- | ------------ |
| `full`              | Image entière |
| `square`            | Image au format carré renvoyée par le serveur |
| _`x,y,w,h`_         | _`x`_ : nombre de pixels depuis la position 0 sur l’axe horizontal, _`y`_  position 0 sur l’axe vertical (0,0 est le coin gauche par exemple).  _`w`_ : larguer, _`h`_ : hauteur en pixels  |
| _`pct:x,y,w,h`_     | Même chose mais en pourcentage de l’image originale |


### `size`

| Valeur      | Description |
| --------- | ----------- |
| `max`     | Taille maximal mais pas d’upscale |
| _`w,`_    | L’image renvoyée doit faire cette largeur (attention pas plus grande que la largeur de l’image) |
| _`,h`_    | Idem pour la hauteur
| _`pct:n`_ | Largeur et hauteur au `n` pourcent de l’image originale |
| _`w,h`_   | Largeur, hauteur |

Et autres subtilités, voir [les spécifications](https://iiif.io/api/image/3.0/#42-size)



### `rotation`

Une valeur entre 0 et 360

### `quality`

| Valeur   | Description |
| --------- | ------------------ |
| `color`   | En couleur |
| `gray`    | En niveau de gris |
| `bitonal` | Noir et blanc |
| `default` | Valeur par défaut indiquée par le serveur |

### `format`

Les formats supportés par le serveur parmi `jpg`, `tif`, `png`, `pdf`, `jp2`

Vous pouvez modifier les paramètres d’une requête sur cette page : [https://www.learniiif.org/image-api/playground](https://www.learniiif.org/image-api/playground)

Afficher avec Pilow l’image `https://ids.lib.harvard.edu/ids/iiif/25286607` à la 10% de sa taille, inversée et en niveaux de gris

![](https://ids.lib.harvard.edu/ids/iiif/25286607/full/pct:10/180/gray.jpg
)

## Information

`{scheme}://{server}{/prefix}/{identifier}/info.json`

Donne des informations sur l’image (taille notamment) et sur le serveur (formats, version de l’API supportée, _)

Voir [https://iiif.io/api/image/3.0/#5-image-information](https://iiif.io/api/image/3.0/#5-image-information)


## Serveurs et clients pour *Image API*

Serveurs :

- [Cantaloupe](https://cantaloupe-project.github.io/) - Image server written in Java fully conformant to all IIIF Image API versions through 3.0.
- [IIPImage Server](http://iipimage.sourceforge.net/documentation/server/) - High performance image server.
- [Loris](https://github.com/loris-imageserver/loris) - Written in Python.

Clients, visualiseurs :

- [Mirador](projectmirador.org/) - Multi-up workspace. See also [Awesome Mirador list](https://github.com/ProjectMirador/mirador-awesome).
- [Tify](https://github.com/subugoe/tify) - Slim and fast IIIF document viewer built with Vue.js.
- [Universal Viewer](universalviewer.io/) - Rich embeddable interface.
- [OpenSeadragon](https://openseadragon.github.io/examples/tilesource-iiif/) - IIIF tile support.


Liste complète : [https://github.com/IIIF/awesome-iiif](https://github.com/IIIF/awesome-iiif)



# JSON

JavaScript Object Notation  
Format de données structurées de type texte  
Léger, peu verbeux, beaucoup utilisé par les APIs

Il peut contenir :
 - des objets Javascript (dict)
 - des tableaux Javascript (list)
 - booléens
 - nombres
 - chaînes de caractères
 - valeur `null`


In [1]:
import requests

# Exemple pour récupérer largeur et hauteur de l’image

r = requests.get("https://ids.lib.harvard.edu/ids/iiif/25286607/info.json")
if r.status_code == requests.codes.ok:
    info = r.json()
    width = info['width']
    height = info['height']
    print(f"Largeur : {width}, hauteur : {height}")

Largeur : 4132, hauteur : 8176


## Presentation API

[https://iiif.io/api/presentation/3.0/](https://iiif.io/api/presentation/3.0/)

Permet de décrire un objet numérique complexe comme une collection d’images par exemple

Cette description est écrite dans un *manifest* le plus souvent distribué au formant JSON-LD (JSON Linked Data)


![](https://iiif.io/api/assets/images/data-model.png)

Exemple pour une image : [https://iiif.io/api/cookbook/recipe/0001-mvm-image/manifest.json](https://iiif.io/api/cookbook/recipe/0001-mvm-image/manifest.json)  
Voir dans [Mirador](https://projectmirador.org/embed/?iiif-content=https://iiif.io/api/cookbook/recipe/0001-mvm-image/manifest.json)

Un livre : [https://iiif.io/api/cookbook/recipe/0009-book-1/manifest.json](https://iiif.io/api/cookbook/recipe/0009-book-1/manifest.json)
Voir dans [Universal Viewer](https://uv-v3.netlify.app/#?c=&m=&s=&cv=&manifest=https://iiif.io/api/cookbook/recipe/0009-book-1/manifest.json)

Avec des métadonnées : [https://iiif.io/api/cookbook/recipe/0029-metadata-anywhere/manifest.json](https://iiif.io/api/cookbook/recipe/0029-metadata-anywhere/manifest.json)
[Mirador](https://projectmirador.org/embed/?iiif-content=https://iiif.io/api/cookbook/recipe/0029-metadata-anywhere/manifest.json)

Voir [iiif cookbook](https://iiif.io/api/cookbook/)

## Écrire un manifest

- Via un programme, en Python par exemple :-)
- Avec un éditeur spécialisé : [http://digital.bodleian.ox.ac.uk/manifest-editor/](http://digital.bodleian.ox.ac.uk/manifest-editor/)

Pour votre projet vous devrez enrichir les métadonnées d’un manifest

Vous pouvez tester la validité de votre fichier manifest avec [https://presentation-validator.iiif.io/](https://presentation-validator.iiif.io/) mais il faut que le fichier soit accessible en ligne.

In [1]:
import requests
import json

r = requests.get("https://iiif.io/api/cookbook/recipe/0029-metadata-anywhere/manifest.json")
manifest = r.json()
metadata = manifest['metadata']

## Création d’un nouvel item de métadonnées
description = {
    "label": {
        "en": ["Detected objects"],
        "fr": ["Objets détectés"]
    },
    "value": {
        "en": ["rabbit, zebra, pot"],
        "fr": ["lapin, zèbre, casserole"]
    }
}

# Insertion dans la liste de metadata
# (attention si je modifie metadata, manifest aussi est modifié)
metadata.append(description)

# Écriture du fichiers JSON résultat
with open('manifest_rabbit.json', 'w') as json_file:
    json.dump(manifest, json_file)

## Sources

Ce notebook s’appuie sur le contenu et les références des ressources suivantes :

 - [Introduction aux protocoles IIIF. Formation Enssib (Régis Robineau, 23 janvier 2019)](https://projet.biblissima.fr/fr/introduction-protocoles-iiif-formation-enssib-2019)
 - [IIIF Online workshop ](https://training.iiif.io/iiif-online-workshop/)