### Objectifs

- Mise en place d'un [système de recommandation] (https://en.wikipedia.org/wiki/Recommender_system) bien commenté en Python
- Rédaction du rapport de projet.

### Projet


L'objectif de ce projet est de recommander des images en fonction des préférences
de l'utilisateur. Vous disposez de trois séances pratiques pour construire ce système. Vous devez vous assurer que toutes les tâches liées à l'acquisition, l'annotation, l'analyse et la visualisation des données sont automatisées.

Les principales tâches du projet sont présentées ci-dessous :

1.  Collecte de données
2.  Étiquetage et annotation
3.  Analyses de données
4.  Visualisation des données
5.  Système de recommandation
6.  Tests
7.  Rapport

#### Collecte de données

Vous devez collecter et télécharger un ensemble d'images. Vous avez les tâches suivantes à programmer, en automatisant le processus autant que possible :

1.  Créer un dossier appelé *images*.
2.  Télécharger les images sous licence ouverte dans le dossier *images* (minimum 100
    images).
3.  Enregistrez les métadonnées de chaque image comme la taille de l'image, le format de l'image (.jpeg,
    .png, etc.), l'orientation de l'image (paysage, portrait, carré, etc.),
    date de création, modèle d'appareil photo, etc. dans un ou plusieurs fichiers JSON. Vous pouvez utiliser les informations [Exif](https://en.wikipedia.org/wiki/Exif) présentes dans les fichiers d'images.

Pour cette tâche, vous devez rechercher les sources disposant d'informations supplémentaires
comme les balises, les catégories, etc.

#### Étiquetage et annotation

Dans cette tâche, vous devrez peut-être étiqueter, annoter et enregistrer des
des informations sur chaque image. Vous pouvez analyser les images en utilisant
des algorithmes de regroupement pour trouver les couleurs prédominantes.

Vous disposez déjà de certaines métadonnées provenant de l'EXIF des images de la précédente
tâche. Dans cette tâche, votre objectif est d'obtenir des informations supplémentaires, comme
les couleurs prédominantes, les tags. Et si vous demandiez aux utilisateurs de tagger les images ?
Par exemple, les noms de couleurs, \#cat, \#fleur, \#sous-fleur, rose etc.

Comment prévoyez-vous de traiter ces tags ? Est-il possible d'automatiser ce
processus ?

#### Analyses de données

Demandez à l'utilisateur de sélectionner quelques images et d'ajouter des balises. Pour chaque utilisateur, vous êtes
maintenant prêt à construire un profil de préférences d'utilisateur, basé sur cette sélection.
Vous pouvez recueillir les informations suivantes manuellement, mais l'objectif de
cette tâche consiste à les obtenir en utilisant les images sélectionnées de manière automatisée : 

1.  Couleurs préférées
2.  Orientation de l'image préférée
3.  Tailles d'images préférées (vignettes, grandes images, images de taille moyenne
    images, etc.)
4.  Balises favorites
5.  \...

Maintenant, grâce à votre connaissance des différents types de classificateurs et
les algorithmes de regroupement, quelles informations supplémentaires ajouterez-vous pour chaque
image ?

Votre prochain objectif est d'analyser les informations des utilisateurs et leur
les images préférées. Comment avez-vous créé des utilisateurs aléatoires ? Combien d'utilisateurs avez-vous
créer ? Quelles informations avez-vous stockées pour chaque utilisateur ? Quels types d'analyses avez-vous effectuées ?

#### Visualisation des données

Dans cette tâche, votre objectif est de visualiser les différentes caractéristiques de
toutes les images téléchargées.

1.  Le nombre d'images disponibles pour chaque année
2.  Le nombre d'images disponibles pour les différents types : taille de l'image,
    l'orientation des images, les modèles d'appareils photo, etc. 
3.  Caractéristiques des couleurs

Les utilisateurs peuvent également visualiser les informations ci-dessus relatives à leurs images préférées. Dans cette tâche, vous devez également ajouter une fonctionnalité permettant aux utilisateurs de visualiser les informations liées à leur propre profil d'utilisateur.

#### Système de recommandation

Êtes-vous maintenant prêt à recommander des images à un utilisateur ? Dans cette tâche, votre objectif est de construire le système de recommandation. Quelle approche avez-vous décidé de prendre ? Filtrage collaboratif, basé sur le contenu ou une approche hybride ? Pour chaque utilisateur, êtes-vous maintenant en mesure de construire une profil ? Quel type d'information avez-vous utilisé pour établir un profil d'utilisateur profil ? Qu'est-ce qui manque ? Quelles sont les limites de votre proposition ?

#### Tests

Votre prochaine tâche consiste à mettre au point et à effectuer différents tests sur votre proposition système. Les différentes fonctions sont-elles fonctionnelles ? Comment avez-vous testé votre projet ? Comment vérifiez-vous que votre système de recommandation fonctionne ?

#### Rapport

Votre tâche finale consiste à préparer un rapport de 4 pages sur le projet (en français ou en anglais). 
anglais) en format PDF, qui détaille les points suivants :

- Le but de votre projet
- Sources des données de vos images et leur licence.
- Taille de vos données.
- Informations que vous avez décidé de stocker pour chaque image.
- Informations concernant les préférences de l'utilisateur
- Les modèles d'exploration de données et/ou d'apprentissage machine que vous avez utilisés avec les métriques obtenues.
- l'auto-évaluation de votre travail.
- Remarques concernant les séances pratiques, les exercices et les possibilités d'amélioration.
- Conclusion

**Note** : Veuillez n'ajouter aucun programme (ou code) dans ce rapport.

### Soumission


- Veuillez **ne pas** soumettre vos images.
- Renommez votre rapport de projet sous le nom de Nom1\_Nom2\_\[Nom3\].pdf, où Nom1, Nom2, etc. sont vos noms.
- Ajoutez votre rapport de projet dans votre dossier de projet.
- Compressez et renommez votre travail de projet comme Nom1\_Nom2\_\[Nom3\].zip, où Nom1, Nom2 sont vos noms.
- Soumettez votre **projet** en ligne.

### Évaluation


Les critères d'évaluation des projets sont indiqués ci-dessous : 

1.  Collecte de données
    1. Approches automatisées de la collecte de données
    2. Utilisation d'images sous licence libre
    3. Stockage et gestion des images et des métadonnées associées
2.  Étiquetage et annotation
    1. Approches automatisées de l'étiquetage
    2. Stockage et gestion des étiquettes et des annotations des images
    3. Utilisation d'algorithmes de classification et de regroupement
3.  Analyses de données
    1. Types d'analyses utilisées
    2. Utilisation de Pandas et Scikit-learn
    3. Utilisation d'algorithmes d'exploration de données
4.  Visualisation des données
    1. Types de techniques de visualisation utilisées
    2. Utilisation de matplotlib
5.  Système de recommandation
    1. Stockage et gestion des préférences et du profil de l'utilisateur
    2. Utilisation d'algorithmes de recommandation
6.  Tests
    1. Présence de tests fonctionnels
    2. Présence de tests utilisateurs
7.  Rapport
    1. Clarté de la présentation
    2. Présence d'une introduction et d'une conclusion claires, architecture
        des diagrammes, un résumé des différentes tâches réalisées et des limites
    3. Bibliographie




In [103]:
import urllib.request
import json
import pandas as pd
import requests
from PIL import Image
from PIL.ExifTags import TAGS

def saveImg(url_Img, nom):
  f = open(nom,'wb')
  f.write(requests.get(url_Img).content)
  f.close()

def get_exif(fn):
    ret = {}
    i = Image.open(fn)
    info = i._getexif()
    for tag, value in info.items():
        decoded = TAGS.get(tag, tag)
        ret[decoded] = value
    return ret

In [101]:
#Recup les images et tout

Recup_donnees = {'patisserie':"https://query.wikidata.org/sparql?query=SELECT%20%3Fobjet%20%3Flabel%20%3Fimage%20WHERE%20%7B%0A%20%20%0A%20%20SERVICE%20wikibase%3Alabel%20%7B%20bd%3AserviceParam%20wikibase%3Alanguage%20%22%5BAUTO_LANGUAGE%5D%2Cen%22.%20%7D%0A%20%20%3Fobjet%20wdt%3AP279%20wd%3AQ2095.%0A%20%20%3Fobjet%20wdt%3AP18%20%3Fimage.%0A%20%20%3Fobjet%20wdt%3AP279%20wd%3AQ477248.%0A%7D%0ALIMIT%2030&format=json",
                'montagne' : "https://query.wikidata.org/sparql?query=SELECT%20%3Fobjet%20%3Flabel%20%3Fimage%20WHERE%20%7B%0A%20%20SERVICE%20wikibase%3Alabel%20%7B%20bd%3AserviceParam%20wikibase%3Alanguage%20%22%5BAUTO_LANGUAGE%5D%2Cen%22.%20%7D%0A%20%20%3Fobjet%20wdt%3AP279%20wd%3AQ8502%3B%0A%20%20%20%20wdt%3AP18%20%3Fimage.%0A%7D%0ALIMIT%2030&format=json"}

lien_images = []
theme_images = []
nom_fichier = []
indice = 0;
for theme in Recup_donnees:
    url = Recup_donnees[theme]
    response = urllib.request.urlopen(url)
    responsedata =  json.loads(response.read().decode('utf-8'))
    for data in responsedata['results']['bindings']:
        lien_images.append([data['image']['value']])
        theme_images.append(theme)
        nom_fichier.append('./images/'+theme+str(indice)+'.jpg')
        indice += 1

#url = "https://query.wikidata.org/sparql?query=%23Images%20des%20acides%20organiques%0A%23defaultView%3AImageGrid%0ASELECT%20%3Fnourriture%20%3FnourritureLabel%20%3Fimage%20WHERE%20%7B%0A%20%20%0A%20%20SERVICE%20wikibase%3Alabel%20%7B%20bd%3AserviceParam%20wikibase%3Alanguage%20%22%5BAUTO_LANGUAGE%5D%2Cen%22.%20%7D%0A%20%20%3Fnourriture%20wdt%3AP279%20wd%3AQ2095.%0A%20%20%3Fnourriture%20wdt%3AP18%20%3Fimage.%0A%20%20%3Fnourriture%20wdt%3AP279%20wd%3AQ477248.%0A%7D%0ALIMIT%2030&format=json"
#response = urllib.request.urlopen(url)
#responsedata =  json.loads(response.read().decode('utf-8'))
indice = range(len(theme_images))
dataframe = pd.DataFrame(zip(indice, lien_images,theme_images, nom_fichier),
     columns=['indice', 'lien', 'theme', 'nomFichier'])

print(dataframe)

    indice                                               lien       theme  \
0        0  [http://commons.wikimedia.org/wiki/Special:Fil...  patisserie   
1        1  [http://commons.wikimedia.org/wiki/Special:Fil...  patisserie   
2        2  [http://commons.wikimedia.org/wiki/Special:Fil...  patisserie   
3        3  [http://commons.wikimedia.org/wiki/Special:Fil...  patisserie   
4        4  [http://commons.wikimedia.org/wiki/Special:Fil...  patisserie   
5        5  [http://commons.wikimedia.org/wiki/Special:Fil...  patisserie   
6        6  [http://commons.wikimedia.org/wiki/Special:Fil...  patisserie   
7        7  [http://commons.wikimedia.org/wiki/Special:Fil...  patisserie   
8        8  [http://commons.wikimedia.org/wiki/Special:Fil...  patisserie   
9        9  [http://commons.wikimedia.org/wiki/Special:Fil...  patisserie   
10      10  [http://commons.wikimedia.org/wiki/Special:Fil...  patisserie   
11      11  [http://commons.wikimedia.org/wiki/Special:Fil...  patisserie   

In [104]:
#Enregistrement des images
for i in dataframe.indice:
    lien = dataframe.loc[indice[i], "lien"][0]
    saveImg(lien,dataframe.loc[indice[i], "nomFichier"])

<class 'str'>


In [110]:
#Recuperation des metadonnees

#Création des nouvelles futures colonnes dans des listes qui sont issus des metadonnees de l'image
liste_metadonnee_date=[]
liste_metadonnee_hauteur=[]
liste_metadonnee_largeur=[]
liste_metadonnee_modele=[]
liste_metadonnee_formatimg=[]

exif_ok = True;

for img in dataframe.nomFichier:
    try:
        get_exif(img)
    except:
        exif_ok = False
        
    #Si on  des metadonnees de disponible
    if(exif_ok):
        metadonnee_image = get_exif(img)

        #Récuperation des metadonnee en fonction de la clé
        date = metadonnee_image.get('DateTimeOriginal')
        hauteur = metadonnee_image.get('ExifImageHeight')
        largeur = metadonnee_image.get('ExifImageWidth')
        modele= metadonnee_image.get('Model')
        formatimg= metadonnee_image.get('Orientation')


         #Ajout de la metadonne dans la liste 
        liste_metadonnee_date.append(date)
        liste_metadonnee_hauteur.append(hauteur)
        liste_metadonnee_largeur.append(largeur)
        liste_metadonnee_modele.append(modele)
        liste_metadonnee_formatimg.append(formatimg)
        
        exif_ok = True
        
    #Sinon on met None dans les etiquettes
    else:
        
        liste_metadonnee_date.append(None)
        liste_metadonnee_hauteur.append(None)
        liste_metadonnee_largeur.append(None)
        liste_metadonnee_modele.append(None)
        liste_metadonnee_formatimg.append(None)

Base_de_donnees = pd.DataFrame(zip(liste_metadonnee_date,liste_metadonnee_hauteur,liste_metadonnee_largeur,liste_metadonnee_modele,liste_metadonnee_formatimg) , columns = ["Date", "Longueur","Largeur","Modele","Format"])
print(Base_de_donnees)
    



                   Date  Longueur  Largeur          Modele  Format
0   2005:10:27 17:09:58     768.0   1024.0           E4300     1.0
1   2013:01:12 18:01:12    3456.0   4411.0  Canon EOS 600D     1.0
2   2015:01:04 15:40:36    6000.0   4000.0     NIKON D7100     1.0
3                  None       NaN      NaN            None     NaN
4                  None       NaN      NaN            None     NaN
5                  None       NaN      NaN            None     NaN
6                  None       NaN      NaN            None     NaN
7                  None       NaN      NaN            None     NaN
8                  None       NaN      NaN            None     NaN
9                  None       NaN      NaN            None     NaN
10                 None       NaN      NaN            None     NaN
11                 None       NaN      NaN            None     NaN
12                 None       NaN      NaN            None     NaN
13                 None       NaN      NaN            None    