## Problématique

#### Identifier si une image provenant d'un anime est officielle ou un fan art à l'aide d'une prédiction par catégorie. Les données proviennent des résultats du moteur de recherche duckduckgo.com et seront labelisées à l'aide des mots-clés de recherche.

In [None]:
# Installation de fastai
!pip install -Uqq fastai

### Téléchargement des images officielles et faites par des fans

In [None]:
# Installation de duckduckgo_search pour faire les recherche d'images
!pip install -Uqq duckduckgo_search

In [None]:
from duckduckgo_search import ddg_images
from fastcore.all import *

# fonction qui permet de chercher des images
def search_images(term, max_images=200): return L(ddg_images(term, max_results=max_images)).itemgot('image')

In [None]:
# recherche d'une image avec les mots clés : "anime", "official" et "art"
urls = search_images('anime official art', max_images=1)
urls[0]

In [None]:
# On télécharge l'image et on l'affiche
from fastdownload import download_url
dest = 'anime-official.jpg'
download_url(urls[0], dest, show_progress=False)

from fastai.vision.all import *
im = Image.open(dest)
im.to_thumb(256,256)

In [None]:
# On fait de même avec les mots-clés : "anime", "fan" et "art". On télécharge et on affiche l'image
download_url(search_images('anime fan art', max_images=2)[1], 'anime-fan-art.jpg', show_progress=False)
Image.open('anime-fan-art.jpg').to_thumb(256,256)

#### Les images ont l'air de correspondre à notre problématique, nous allons donc maintenant en télécharger une certaines quantité et les séparer dans deux dossiers différents appelés anime-official et anime-fan-art

In [None]:
# Chemin du dossier où on va ranger les images
path = Path('official-or-fan-art')

In [None]:
# mots clés pour la recherche 
searches = 'anime official art','anime fan art'

# import sleep pour faire une pause entre chaque dl pour éviter le surchargement du serveur
from time import sleep

# téléchargement des images
for o in searches:
    dest = (path/o)
    dest.mkdir(exist_ok=True, parents=True)
    download_images(dest, urls=search_images(o))
    sleep(10)  # Pause between searches to avoid over-loading server
    resize_images(path/o, max_size=400, dest=path/o)

#### Maintenant qu'on possède nos données, on vérifie si elles ont bien été téléchargées, si non on les supprime

In [None]:
failed = verify_images(get_image_files(path))
failed.map(Path.unlink)
len(failed)

#### On prépare les données pour les entraîner

In [None]:
# On construit notre dataloader pour pouvoir entraîner nos données
dls = DataBlock(
    # Première variable : variable indépendante utilisé pour faire la prédiction (des images)
    # Deuxième variable :  variable dépendante utilsé pour les catégories
    blocks=(ImageBlock, CategoryBlock), 
    # On lui donne nos images
    get_items=get_image_files, 
    # On split les données en 2, avec les données d'entraînement et de validation, ici les données de validation sont de 20% 
    # Et on met un random seed de 42 pour pouvoir varier les données d'entraînement 
    splitter=RandomSplitter(valid_pct=0.2, seed=42),
    # On précise que nos données sont labelisé par le nom du dossier dans lequel il est
    get_y=parent_label,
    # On change la taille de nos images
    item_tfms=[Resize(200, method='squish')]
).dataloaders(path)

dls.show_batch(max_n=6)

### On entraîne le modèle avec le réseau de neurones resnet18

In [None]:
learn = vision_learner(dls, resnet18, metrics=error_rate)
learn.fine_tune(3)

In [None]:
# On vérifie si le model fonctionne à l'aide d'une matrice de confusion, on remarque que notre model détecte correctement 
# nos images et les classifie à quelques erreurs près
interp = ClassificationInterpretation.from_learner(learn)
interp.plot_confusion_matrix()

In [None]:
# On peut vérifier à l'aide de cette fonction nos images provoquant le plus de problème dans la détection et ayant donc le plus de pertes
interp.plot_top_losses(5, nrows=5)

### Utilisation du modèle

In [None]:
is_official,_,probs = learn.predict(PILImage.create('anime-official.jpg')) # on fait une prédiction sur notre première image téléchargé
print(f"This is a: {is_official}.")
print(f"Probability it's an anime official image: {probs[1]:.4f}")

In [None]:
learn.export() # on exporte notre objet learner pour pouvoir l'utiliser ailleurs si besoin

In [None]:
path = Path()
path.ls(file_exts='.pkl') # l'export a créé un fichier pkl

In [None]:
learn_inf = load_learner(path/'export.pkl') # on charge notre model

In [None]:
# retourne la categorie prédit, l'index de la categorie prédit et la probabilité de chaque categorie
learn_inf.predict(path/'anime-fan-art.jpg')

In [None]:
learn_inf.dls.vocab # liste des catégories de notre model

#### Création d'une mini application sur notebook

In [None]:
from fastai.vision.widgets import *

In [None]:
btn_upload = widgets.FileUpload()
btn_upload 

In [None]:
#hide
# For the book, we can't actually click an upload button, so we fake it
btn_upload = SimpleNamespace(data = ['anime-fan-art.jpg'])

In [None]:
img = PILImage.create(btn_upload.data[-1])

In [None]:
#hide_output
out_pl = widgets.Output()
out_pl.clear_output()
with out_pl: display(img.to_thumb(128,128))
out_pl

In [None]:
pred,pred_idx,probs = learn_inf.predict(img)

In [None]:
#hide_output
lbl_pred = widgets.Label()
lbl_pred.value = f'Prediction: {pred}; Probability: {probs[pred_idx]:.04f}'
lbl_pred

In [None]:
#hide_output
btn_run = widgets.Button(description='Classify')
btn_run

In [None]:
def on_click_classify(change):
    img = PILImage.create(btn_upload.data[-1])
    out_pl.clear_output()
    with out_pl: display(img.to_thumb(128,128))
    pred,pred_idx,probs = learn_inf.predict(img)
    lbl_pred.value = f'Prediction: {pred}; Probability: {probs[pred_idx]:.04f}'

btn_run.on_click(on_click_classify)

In [None]:
#hide
#Putting back btn_upload to a widget for next cell
btn_upload = widgets.FileUpload()

In [None]:
#hide_output
VBox([widgets.Label('Select your image!'), 
      btn_upload, btn_run, out_pl, lbl_pred])

In [None]:
pip install gradio

In [None]:
# Création d'une application temporaire gradio avec notre model

import gradio as gr

learn = load_learner('export.pkl')

labels = learn.dls.vocab
def predict(img):
    img = PILImage.create(img)
    pred,pred_idx,probs = learn.predict(img)
    return {labels[i]: float(probs[i]) for i in range(len(labels))}

title = "Anime official image Classifier"
description = "<p style='text-align: center'>Identifier si une image provenant d'un anime est officielle ou un fan art. <br/> Peut par exemple aider à la diffusion de contenu en ligne (articles, posts sur les réseaux sociaux) avec des illustrations officielles.</p>"

demo = gr.Interface(fn=predict, title=title, description=description, examples = [path/'anime-official.jpg', path/'anime-fan-art.jpg'], inputs=gr.Image(shape=(512, 512)), outputs=gr.Label(num_top_classes=2))

demo.launch(share=True)