# Application CLIP

Refonte de l'application développée par [ThorkildFregi](https://github.com/ThorkildFregi) et [Altomator](https://github.com/altomator).

**NOTA BENE** : l'intégration d'une étape de _fine-tuning_ est en développement.

L'application utilise le modèle CLIP (_Contrastive Language-Image Pre-training_) pour traiter un fonds d'images et l'interroger avec des requêtes textuelles, le tout depuis une interface web.

Pour accéder à la table des matières, cliquez sur l'icône de menu déroulant à gauche de votre écran :

<img src="README_images/notebook_toc.png" alt="Notebook ToC" width="30"/>

## Cloner l'application

On va créer une copie de l'application, un "clone" sur cet espace Jupyter. Cela permettra de mettre à jour l'application très simplement.

Rendez-vous sur la [page GitHub de l'application](https://github.com/NatachaGrim/Application-CLIP/tree/main).

En haut de la page se trouve un bouton vert **clone** :

<img src="README_images/github_code_button.png" alt="Code button" width="100"/>

Cliquez dessus et copiez l'url alors affichée :

<img src="README_images/github_clone_url.png" alt="Clone URL" width="360"/>

Dans l'interface Jupyter, ouvez un nouvel onglet et sélectionnez **Terminal** :

<img src="README_images/jupyter_new_terminal.png" alt="New terminal in Jupyter" width="100"/>

### Comment se déplacer depuis le terminal

À gauche de votre curseur clignotant permettant de saisir des commandes est affiché l'endroit où vous vous trouvez dans l'arborescence du serveur.

Au sein du terminal, on se déplace de dossier en dossier (_directory_ en anglais) grâce à la commande ```cd``` (_change directory_). Par exemple :

```
📁 dossier_1
 ├─── 📁 dossier_2
 └─── 📁 dossier_3
```

On se trouve dans le ```dossier_1```. Pour aller dans le ```dossier_2```, il faut saisir :

```cd dossier_2```

Pour remonter d'un cran dans l'arborescence, il faut saisir la commande ```cd ..```. On se trouve dans le ```dossier_2```, pour aller dans le ```dossier_3``` on va donc saisir :

```cd ..```

```cd dossier_3```

Pour aller plus vite, on peut utiliser la touche de tabulation pour autocompléter le nom du dossier où on souhaite se déplacer. L'autocomplétion est partielle pour les noms de dossier qui commencent identiquement mais dont la fin est différente.

Pour l'exemple ci-dessus, saisir ```cd do``` puis appuyer sur la touche de tabulation va donner ```cd dossier_```. Il faut alors saisir ```2``` ou ```3``` pour compléter le nom.

Déplacez-vous à l'endroit où vous voulez cloner l'application, saisissez la commande ```git clone``` puis collez l'URL copiée sur GitHub :

```git clone <URL>```

## Structure

Pour utiliser l'application, il faut intégrer un fonds d'images et une ontologie dans sa structure. Ci-dessous, son architecture de base :

```
📁 CLIP-app
 ├─── 📁 app
 │     ├─── app.py
 │     ├─── config.py
 │     ├─── 📁 models
 │     ├─── 📁 routes
 │     ├─── 📁 scripts
 │     ├─── 📁 static
 │     ├─── 📁 templates
 │     └─── 📁 utils
 ├─── 📁 clip_env
 ├─── launch_PowerShell
 ├─── launch_Bash
 ├─── run.py
 └─── requirements.txt
```

### Dossiers et fichiers à créer

C'est dans le dossier ```📁 static``` que vous chargez vos données. Vous devez créer les dossiers suivants en son sein :

```
📁 static
 └─── 📁 project_name
       ├─── 📁 images
       │     ├─── 📁 subfoler_01
       │     ├─── 📁 subfolder_02
       │     └─── 📁 subfolder_...
       └─── 📁 ontology
             └─── project_name_ontology.txt
```

Vous pouvez librement nommer le dossier ```📁 project_name``` ainsi que chaque ```📁 subfolder``` (les espaces, accents et caractères spéciaux sont proscrits). En conséquence, le fichier ```project_name_ontology.txt``` doit être nommé d'après le nom du dossier ```📁 project_name```. Le nom des dossiers ```📁 images``` et ```📁 ontology``` doit rester inchangé :

```
📁 static
 └─── 📁 Royere
       ├─── 📁 images
       │     ├─── 📁 petites_gouaches
       │     ├─── 📁 grandes_gouaches
       │     ├─── 📁 calques_vue_ensemble
       │     └─── 📁 calques_execution
       └─── 📁 ontology
             └─── Royere_ontology.txt
```

### Données requises

L'application a besoin de deux types de données pour fonctionner : des données visuelles (images) et des données textuelles (ontologie).
- Les images se trouvent dans le dossier ```📁 images``` ;
- L'ontologie se trouve dans le fichier ```project_name_ontology.txt```.

Le fichier d'ontologie ```.txt``` contient les mots-clés et leur description. La structure ci-dessous doit être respectée :

```
"Chaise": "siège à dossier et généralement sans bras"
"Tapis": "panneau d'étoffe, ouvrage que l'on pose sur un meuble, un mur ou un sol"
"Luminaire": "tout objet constituant l'éclairage et la décoration lumineuse"
```

### Fichiers générés

Les scripts exécutés lors du lancement vont générer trois fichiers dans le dossier ```📁 project_name``` :

- ```project_name_ontology.csv``` ;
- ```project_name_list.txt``` ;
- ```project_name_directory.txt```.

Le fichier ```project_name_ontology.csv``` résulte de la conversion du fichier ```project_name_ontology.txt``` au format ```.csv```. Il sera utilisé par le modèle pour traiter les requêtes.

Le fichier ```project_name_list.txt``` liste les images du fonds et indique leur chemin relatif.

Le fichier ```project_name_directory.txt``` synthétise des informations sur le dossier ```📁 project_name``` : son chemin relatif, son chemin absolu, le nombre de sous-dossiers et le nombre total d'images. Sur un pas de 10, le chemin d'une image est listé.

Une fois les scripts exécutés, la structure du dossier ```📁 project_name``` est donc la suivante :

```
📁 static
 └─── 📁 project_name
       ├─── 📁 images
       ├─── 📁 ontology
       │     ├─── project_name_ontology.txt
       │     └─── project_name_ontology.csv
       ├─── project_name_list.txt
       └─── project_name_directory.txt
```

## Installer l'environnement virtuel

À la racine de l'application se trouve le dossier ```📁 clip_env```. Il s'agit de l'environnement virtuel qu'il faut créer pour faire fonctionner le code de l'application.

### Étape 1 : créer l'environnement virtuel

Pour faire fonctionner l'application, il faut installer des "paquets" sur lesquels reposent le code source. On parle alors de dépendances. Pour ce faire, on créé un environnement virtuel afin d'éviter les conflits avec d'autres paquets ou d'autres versions déjà présents sur l'ordinateur.

Ouvrez votre terminal et déplacez-vous dans le dossier ```📁 CLIP-app``` puis exécutez la commande suivante :

```python3 -m venv clip_env```

Un dossier ```clip_env``` devrait alors apparaître :

<img src="README_images/jupyter_clip_env.png" alt="Virtual env" width="150"/>

### Étape 2 : installer les dépendances

Activez l'environnement virtuel :

```source clip_env/bin/activate```

Installez les dépendances contenues dans le fichier ```requirements.txt``` :
```pip install -r requirements.txt```

L'installation peut prendre plus ou moins de temps en fonction de votre vitesse de calcul et de la qualité de votre connexion. Vous devez attendre jusqu'à ce que le chemin ```~/Application-CLIP/CLIP-app$``` s'affiche à gauche de votre curseur.

Vous disposez maintenant d'un environnement virtuel. Lorsqu'il est activé, le chemin indiqué à gauche de votre curseur est précédé de l'indicateur ```(clip_env)```.

Vous devrez l'activer à chaque lancement de l'application et le désactiver après chaque session d'utilisation.

L'activer :

```source clip_env/bin/activate```

Le désactiver :

```deactivate```

## Lancement

Pour chaque lancement, il faut suivre les étapes ci-dessous :

### Étape 1 : se positionner au bon endroit

Positionnez-vous dans le dossier ```📁 CLIP-app```.

### Étape 2 : activer l'environnement virtuel

```source clip_env/bin/activate```

### Étape 3 : lancer le _launcher Jupyter_

Saisissez la commande suivante :

```bash launch_Jupyter.sh```

L'interface suivante devrait s'afficher :

<img src="README_images/jupyter_launcher.png" alt="New terminal in Jupyter" width="650"/>

Copiez l'URL affichée puis saisissez le nom de votre ```📁 project_name```. L'application va se lancer directement dans le terminal. Ouvrez alors un nouvel onglet dans votre navigateur et collez l'URL.

### Étape 4 : quitter l'application

Depuis le terminal, pressez simplement la touche ```ctrl``` enfoncée et appuyez sur la touche ```c```. N'oubliez pas de désactiver l'environnement virtuel.