
# Accès aux Données Basé sur les Ontologies pour les Animaux avec Ontop
### Un Tutoriel

**Auteurs :**  
Frances Gillis-Webber, C. Maria Keet  
*Université du Cap, Afrique du Sud*

---

L'objectif de ce TP est de montrer le concept de Ontology-Based Data Access (OBDA), où les données d'une base sont interrogées.
Nous utilisons pour cela le framework Ontop, qui est compatible avec l'environnement de développement d'ontologie Protégé (ODE), et MySQL est utilisé comme base de données relationnelle. Les tâches suivantes sont démontrées dans ce tutoriel :
* l'implémentation d'Ontop et la connexion à une source de données.
* la création d'un mappage dans la couche de mappage.
* l'utilisation des données virtualisées pour (a) effectuer une requête dans SPARQL et (b) se matérialiser sous forme de triplets non virtualisés.

Le reste de ce tutoriel est structuré comme suit : la section 1 présente un bref
aperçu ; l'installation d'Ontop dans Protégé est décrite dans la section 2, et la section 3 démontre le processus de mappage. La section 4 se termine par une démonstration de l'utilisation des données de la section 3. 
Remarque : des supports de didacticiel similaires (et sur lesquels se basent les instructions générales de ce didacticiel) pour un domaine de sujet autre que les éléphants habitant l'un des 10 plus grands parcs nationaux du monde sont disponibles sur `https://github.com/ontop/ontop/wiki` et `https://ontop-vkg.org/tutorial/`.

---

### Table des Matières

1. [Introduction](#1.-Introduction)  
2. [Installation d'Ontop dans Protégé](#2.-Installation-d'Ontop-dans-Protégé)  
3. [Le Processus de Mapping](#3.-Le-Processus-de-Mapping)  
4. [Objectif Avancé](#4.-Objectif-Avancé)  
5. [Travail avec les Données Virtualisées](#5.-Travail-avec-les-Données-Virtualisées)
    


## 1. Introduction

L'Accès aux Données Basé sur les Ontologies (OBDA) connecte la TBox d'une ontologie à l'ABox contenant des données stockées dans une base de données relationnelle. Ce tutoriel utilise le framework Ontop pour interroger ces données via SPARQL ou les matérialiser en triples RDF.

---

L'accès aux données basé sur l'ontologie (OBDA) connecte la TBox de l'ontologie à l'ABox
avec les données stockées dans une base de données relationnelle (plutôt que dans un fichier OWL), avec une couche de mappage comme intermédiaire. Les données relationnelles qui sont récupérées en tant que résultats d'une requête peuvent ensuite être renvoyées telles quelles ou peuvent être virtualisées en RDF au moyen de mappages, pour générer un graphe de connaissances [3].

Cela transforme ainsi le composite en une base de connaissances, avec une indépendance des données entre la TBox et l'ABox, mais sans perdre la possibilité d'interroger ces données à l'aide de SPARQL.
Les motivations de ce type d'architecture, ainsi que les détails techniques, sont décrits dans le chapitre 8 du manuel d'ingénierie d'ontologie.

---



## 2. Installation d'Ontop dans Protégé

### 2.1 Prérequis

- **Protégé 5.x** : [Téléchargez ici](https://protege.stanford.edu/)  
- **Java Runtime Environment (JRE) 8.x**  
- **Plugin Ontop** : [Releases d'Ontop](https://github.com/ontop/ontop/releases)  
- **Ontologie de la Faune Africaine** (AWO) : [Téléchargement AWO](https://people.cs.uct.ac.za/~mkeet/OEbook/ontologies/)  
- **Base de données des Animaux (ADB)** : [Étude Movebank](https://www.movebank.org/movebank/#page%3Dstudies%2Cpath%3Dstudy736029750)  
- **MySQL** : [Téléchargements MySQL](https://dev.mysql.com/downloads/mysql/)
    


### 2.2 Configuration d'Ontop dans Protégé

1. Téléchargez le fichier `.jar` du plugin Ontop.
2. Fermez Protégé s'il est ouvert.
3. Placez le fichier `.jar` dans le dossier `plugins` du répertoire d'installation de Protégé.
4. Redémarrez Protégé. Ontop devrait maintenant apparaître dans la barre de menu.
5. Activez les onglets **Ontop Mappings** et **Ontop SPARQL** via `Window > Tabs`.
6. Après avoir ouvert Protege, Ontop devrait maintenant être visible dans la barre de menu.
7. Dans la barre de menu, cliquez sur **Window** puis sur **Tabs**.
8. Sélectionnez **Ontop Mappings**, puis sélectionnez **Ontop SPARQL**. Les deux onglets devraient s'affichent maintenant dans la fenêtre principale, comme le montre la Figure 1.

<img src="./ressources/Figure1_Ontop_installed_in_Protege.png" title="Figure 1 : OnTop intallé dans Protégé">

<u><center>Figure 1 : OnTop intallé dans Protégé
-


## 3. Le Processus de Mapping

L'objectif est de créer un mapping entre l'ontologie AWO et la base de données ADB pour permettre des requêtes SPARQL sur les données.

### 3.1 Écriture de la Requête SQL pour les Mappings

Exemple de requête SQL pour récupérer les éléphants :

```sql
SELECT animals.id 
FROM animals
INNER JOIN speciesList ON speciesList.scientificName = animals.taxon
WHERE speciesList.class = 'Elephant'
ORDER BY animals.id;
```

Testez la requête SQL dans l'onglet **Ontop Mappings** de Protégé.

---

### 3.2 Écriture du Modèle de Triples pour les Mappings

Exemple de modèle de triples :

```text
:Animal{id} a :Elephant .
```

Enregistrez le mapping avec un identifiant unique (par exemple, `MAPID-instanceElephants`).
    

In [None]:

# Exemple de Requête SPARQL
# À exécuter dans l'onglet Ontop SPARQL de Protégé

PREFIX : <http://www.meteck.org/teaching/OEbook/ontologies/AfricanWildlifeOntology4obda.owl#>

SELECT DISTINCT *
WHERE { 
  ?animalId a :Elephant 
}
    


---

## 4. Objectif Avancé

Nous visons à identifier les éléphants équipés de colliers dans les parcs nationaux sud-africains.

### 4.1 Mapping des Instances Virtuelles

Requête SQL pour les parcs nationaux sud-africains :

```sql
SELECT nationalParks.shortName 
FROM nationalParks
WHERE nationalParks.countriesId = 1;
```

Modèle de triples :

```text
:{shortName}NationalPark a :SouthAfricaNationalPark .
```

---

### 4.2 Mapping des Relations

Requête SQL pour les relations :

```sql
SELECT animals.id, nationalParks.shortName
FROM animalTags
INNER JOIN animals ON animals.id = animalTags.animalsId
INNER JOIN speciesList ON speciesList.scientificName = animals.taxon
INNER JOIN studies ON studies.id = animalTags.studiesId
INNER JOIN nationalParks ON nationalParks.id = studies.nationalParksId
WHERE speciesList.class = 'Elephant'
ORDER BY animals.id;
```

Modèle de triples :

```text
:Animal{id} :tagged-in :{shortName}NationalPark .
```

---


In [None]:

# Requête SPARQL pour les Éléphants Marqués

PREFIX : <http://www.meteck.org/teaching/OEbook/ontologies/AfricanWildlifeOntology4obda.owl#>
PREFIX rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#>

SELECT DISTINCT *
WHERE {
  ?nationalPark a :SouthAfricaNationalPark .
  ?animalId a :Elephant ; :tagged-in ?nationalPark .
}
    


---

## 5. Travail avec les Données Virtualisées

### Matérialisation des Triples

1. Dans Protégé, sélectionnez `Ontop > Materialize Triples`.
2. Choisissez d'enregistrer les triples dans l'ontologie ou de les exporter dans un fichier.

---

### Références

- [Données de suivi détaillées](https://doi.org/10.5441/001/1.403h24q5)  
- [Vue d'ensemble des Graphes de Connaissances Virtuels](https://doi.org/10.3389/fevo.2019.00004)  

[3] Xiao, G., Ding, L., Cogrel, B., Calvanese, D.: Virtual knowledge graphs: An
 overview of systems and use cases. Data Intelligence 1, 201223 (2019)
    