## Importation des fichiers utiles

In [4]:
import urllib.request
import json
import pandas as pd
import numpy as np
from PIL import Image, ExifTags
from sklearn.cluster import KMeans
from collections import Counter

NOMBRE_IMAGE=141

<br>

## Demande de Json
Nous Faisons une Requète WikiData pour demander un Json contenant le lien menant à des libres d'une certaine catégorie. Nous avons essayé plusieurs types d'images différentes :

mythical creature = Q2239243<br>
photograph = Q125191<br>
flower = Q506<br>
fruit = Q1364<br>
Chien = Q144<br>
lac  = Q23397<br>


SELECT ?image ?im WHERE {
  ?image wdt:P31 wd:Q506.
  ?image wdt:P18 ?im
  }
LIMIT 200

In [27]:
lstSources = [1364,144,23397]
limitPerSources = 5
sources = {}
for cat in lstSources:
    url ="https://query.wikidata.org/sparql?query=SELECT%20%3Fimage%20%3Fim%20WHERE%20%7B%0A%20%20%3Fimage%20wdt%3AP31%20wd%3AQ"+str(cat)+".%0A%20%20%3Fimage%20wdt%3AP18%20%3Fim%0A%20%20%7D%0ALIMIT%20"+str(limitPerSources)+"&format=json"
    response = urllib.request.urlopen(url)
    myJson = json.loads(response.read().decode("utf-8"))
    if cat == lstSources[0]:
        sources = myJson
    else:
        sources["results"]["bindings"] = sources["results"]["bindings"]+myJson["results"]["bindings"]
myJsonNormalized = pd.json_normalize(sources)

<br>

## Télechargement des images ##
A partir du Json contenant les liens menant aux images, nous lancons des requètes URLLIB pour télecharger ces images.

In [28]:
#telechargement des images

responseJson = myJsonNormalized["results.bindings"]
for i in range(len(responseJson[0])):   
    imageLink = responseJson[0][i]["im"]["value"]
    urllib.request.urlretrieve(imageLink, "./images/image"+str(i)+".jpg")
    NOMBRE_IMAGE=i
NOMBRE_IMAGE

14

<br>

## Récupération des métadonnées
L'obhectif de cette partie est de récupérer les informations des images, nous récupérons les images suivantes :<br>
1. Récupération Exif utiles
2. Récupération couleurs dominantes (K-means)
3. Récupération taille des images
4. Détermination portrait ou paysage

Apres cela, nous avons creer un Json **metaDataJson.json** contenant toutes les informationns precedentes

In [15]:
# Récupération des métadonnées

metaData ={}
for i in range(NOMBRE_IMAGE):
    im = "./images/image"+str(i)+".jpg"
    try:
        imgfile = Image.open(im).convert("RGB")

        #Recupération Exif utiles
        exif = {}
        exifCritere= ("Model","Make","ImageDescription","ExposureTime","GPSInfo","ISO","DateTimeOriginal")
        for k,v in  imgfile.getexif().items() :
            if k in ExifTags.TAGS :
                if ExifTags.TAGS[k] in exifCritere:
                    exif = {ExifTags.TAGS[k]:v}

        # Recupération couleurs dominantes (K-means)
        numarray = np.array(imgfile.getdata(), np.uint8)
        clusters  = KMeans(n_clusters=3)
        clusters.fit(numarray[::50])
        L = clusters.cluster_centers_.astype(int).tolist()

        # Recupération taille des images
        width = imgfile.width
        height = imgfile.height
        mode = imgfile.mode

        # Détermination portrait ou paysage
        if abs(1-width/height)<0.1 :
            orientation='carre' 
        elif width>height:
            orientation='paysage'
        else: 
            orientation="portrait"

        metaData["image"+str(i)] = { "width" : width, "height": height, "exif": exif, "mode":mode, "tags":[], "couleurs":L, "orientation":orientation }
    except Exception:
        print("l'image "+str(i) +" ne peut pas etre ouverte")
metaData

metaDatajson = json.dumps(metaData)
f = open("metaDataJson.json", "w")
f.write(metaDatajson)
f.close()





## Analyse 

In [7]:
def most_frequent(List):
    occurence_count = Counter(List)
    return occurence_count.most_common(1)[0][0]

def analyse(numUser):
    
    jsonUser=json.load(open("jsonUser.json"))
    jsonUserNormalized = pd.json_normalize(jsonUser)
    L = jsonUserNormalized[numUser]["data"]["like"]
    c=np.array(np[0,0,0],[0,0,0],[0,0,0])
    
    orientationPref=[]
    for image in L:
        for j in range(len(c)):
            c[0]+=np.square(np.array(jsonUserNormalized[image]['couleurs'][0][j]))
            c[1]+=np.square(np.array(jsonUserNormalized[image]['couleurs'][1][j]))
            c[2]+=np.square(np.array(jsonUserNormalized[image]['couleurs'][2][j]))

        orientationPref.append(jsonUserNormalized[image]['exif']['model'])

    
    for i in range(len(c)):
        newColor = np.sqrt((c[i])/2),np.sqrt(c[i]/2),np.sqrt((c[i])/2)
    newOrientation = most_frequent(orientationPref)
    return [newColor,newOrientation]
a=analyse(0)
print(a[0])

KeyError: 0

In [None]:
def visualisation(parametres,nameUser='ALL'):
    
    myJson = json.loads("metaDataJson.json")
    myJsonNormalized = pd.json_normalize(myJson)
    L=[]

    jsonUser=json.loads("jsonUser.json")
    jsonUserNormalized = pd.json_normalize(jsonUser)
    L = jsonUserNormalized[nameUser]["image"]
    yearData =[]
    modelData =[]
    for image in L:
        if 'year' in myJsonNormalized[image]['exif']:
            yearData.append(myJsonNormalized[image]['exif']['year'])
        if 'mode1' in myJsonNormalized[image]:
            modelData.append(myJsonNormalized[image]['exif']['model'])
    max(yearData, key=yearData.count)
    max(modelData, key=modelData.count)

