# IMPORT

In [None]:
%matplotlib inline
import PIL.Image
import tensorflow as tf
import numpy as np
import matplotlib.pyplot as plt
import os
import time
import inspect
import sys
import pygame

#serve per fare la progress bar del download
from clint.textui import progress
#serve per effetturare richieste http
import requests

# DOWNLOAD MODELLO VGG-16

In [None]:
if not os.path.exists("modello"):
    os.makedirs("modello")

percorso = "modello/vgg16.tfmodel"

if os.path.isfile(percorso):
    print("Modello già scaricato.")

else:
    url_modello = "https://s3.amazonaws.com/cadl/models/vgg16.tfmodel"

    richiesta = requests.get(url_modello, stream=True)
    with open(percorso, "wb") as file:
        lunghezza_totale = int(richiesta.headers.get('content-length'))
        for chunk in progress.mill(richiesta.iter_content(chunk_size=1024), expected_size=(lunghezza_totale/1024) + 1):
            if chunk:
                file.write(chunk)
                file.flush()
    print("Modello scaricato con successo.")

# CLASSE VGG-16

In [None]:
class VGG16:
    
    nome_tensore_immagine_input = "images:0"
    
    #Strati convoluzionali da utilizzare ai fini dello Style Transfer
    nomi_strati = ['conv1_1/conv1_1', 'conv1_2/conv1_2',
                   'conv2_1/conv2_1', 'conv2_2/conv2_2',
                   'conv3_1/conv3_1', 'conv3_2/conv3_2', 'conv3_3/conv3_3',
                   'conv4_1/conv4_1', 'conv4_2/conv4_2', 'conv4_3/conv4_3',
                   'conv5_1/conv5_1', 'conv5_2/conv5_2', 'conv5_3/conv5_3']
    
    #costruttore
    def __init__(self):
        
        self.graph = tf.Graph()
        
        with self.graph.as_default():
            
            #apre il file precedentemente scaricato
            with tf.gfile.FastGFile(percorso, 'rb') as file:
                
                #copia di un grafo di tensorflow, inizialmente vuoto
                graph_def = tf.GraphDef()
                
                #viene aggiornata con il grafo del modello VGG16
                graph_def.ParseFromString(file.read())
                
                #infine viene importato sul grafo di default
                tf.import_graph_def(graph_def, name='')
                
            #ottiene un riferimento al tensore per dare in input le immagini al grafo
            self.input = self.graph.get_tensor_by_name(self.nome_tensore_immagine_input)
            
            #ottiene riferimenti ai tensori per gli strati convoluzionali presi in considerazione
            self.tensori_strati = [self.graph.get_tensor_by_name(nome + ":0") for nome in self.nomi_strati]
            
    def get_tensori_strati(self, id_strati):
        
        return [self.tensori_strati[indice] for indice in id_strati]
    
    def crea_feed_dict(self, immagine):
        #feed_dict contenente l'immagine da passare al grafo
        
        #VGG16 è stata progettata per prendere più immagini per input, è necessario
        #quindi aggiungere una dimensione alla terna che abbiamo inizialmente
        immagine = np.expand_dims(immagine, axis=0)
        
        feed_dict = {self.nome_tensore_immagine_input: immagine}
        
        return feed_dict

# MANIPOLAZIONE IMMAGINI

In [None]:
def carica_immagine(nomefile, dimensione_massima=None):
    immagine = PIL.Image.open(nomefile)
    
    if dimensione_massima is not None:
        #calcolo del fattore per il rescaling dell'immagine volto a mantenere le 
        #proporzioni tra altezza e larghezza
        fattore_rescaling = dimensione_massima / np.max(immagine.size)

        dimensione = np.array(immagine.size) * fattore_rescaling
        dimensione = dimensione.astype(int)

        immagine = immagine.resize(dimensione, PIL.Image.LANCZOS)
    
    return np.float32(immagine)
    
    

In [None]:
def salva_immagine(immagine, nomefile):
    
    immagine = np.clip(immagine, 0.0, 255.0)
    
    immagine = immagine.astype(np.uint8)
    
    with open(nomefile, "wb") as file:
        PIL.Image.fromarray(immagine).save(file, 'jpeg')

In [None]:
def mostra_immagine(immagine):
    
    immagine = np.clip(immagine, 0.0, 255.0)
    
    immagine = immagine.astype(np.uint8)
    
    display(PIL.Image.fromarray(immagine))

# FUNZIONI PER IL CALCOLO DELLA PERDITA

In [None]:
def MSE(x, y):
    return tf.reduce_mean(tf.square(x-y))

## CALCOLO PERDITA CONTENUTO

In [None]:
def calcola_perdita_contenuto(sessione, modello, immagine_contenuto, id_strati):
    
    feed_dict = modello.crea_feed_dict(immagine=immagine_contenuto)
    
    strati = modello.get_tensori_strati(id_strati)
    
    valori = sessione.run(strati, feed_dict=feed_dict)
    
    with modello.graph.as_default():
        
        perdite_strati = []
        
        for valore, strato in zip(valori, strati):
            
            costante_valore = tf.constant(valore)
            
            perdita = MSE(strato, costante_valore)
            
            perdite_strati.append(perdita)
            
        perdita_totale = tf.reduce_mean(perdite_strati)
        
    return perdita_totale

## MATRICE GRAM

In [None]:
def matrice_gram(tensore):
    
    shape = tensore.get_shape()
    
    numero_canali = int(shape[3])
    
    matrice = tf.reshape(tensore, shape=[-1, numero_canali])
    
    gramiana = tf.matmul(tf.transpose(matrice), matrice)
    
    return gramiana

## CALCOLO PERDITA STILE

In [None]:
def calcola_perdita_stile(sessione, modello, immagine_stile, id_strati):
    
    feed_dict = modello.crea_feed_dict(immagine = immagine_stile)
    
    strati = modello.get_tensori_strati(id_strati)
    
    with modello.graph.as_default():
        
        strati_gram = [matrice_gram(strato) for strato in strati]
        
        valori = sessione.run(strati_gram, feed_dict=feed_dict)
        
        perdite_strati = []
        
        for valore, strato_gram in zip(valori, strati_gram):
            
            costante_valore = tf.constant(valore)
            
            perdita = MSE(strato_gram, costante_valore)
            
            perdite_strati.append(perdita)
            
        perdita_totale = tf.reduce_mean(perdite_strati)
        
    return perdita_totale

# STYLE TRANSFER

In [None]:
def style_transfer(immagine_contenuto, immagine_stile, id_strati_contenuto, 
                   id_strati_stile, peso_contenuto=1.5, peso_stile=10.0,
                   minuti=60, passo=10.0):
    
    ora = time.time()
    
    timeout = time.time() + 60*minuti
    
    modello = VGG16()
    
    sessione = tf.InteractiveSession(graph=modello.graph)
    
    print("Ora inizio: "+str(ora))
    
    print("INZIO ALGORITMO STYLE TRANSFER")
    time.sleep(1)
    
    print()
    print("IMMAGINE CONTENUTO:")
    mostra_immagine(immagine_contenuto)
    time.sleep(1)
    
    print()
    print("IMMAGINE STILE:")
    mostra_immagine(immagine_stile)
    time.sleep(1)
    
    perdita_contenuto = calcola_perdita_contenuto(sessione=sessione,
                                                  modello=modello,
                                                  immagine_contenuto=immagine_contenuto,
                                                  id_strati=id_strati_contenuto)
    
    perdita_stile = calcola_perdita_stile(sessione=sessione, modello=modello,
                                         immagine_stile=immagine_stile,
                                         id_strati=id_strati_stile)
    
    #inizializzate a valori prossimi allo 0
    agg_contenuto = tf.Variable(1e-10, name='agg_contenuto')
    agg_stile = tf.Variable(1e-10, name='agg_stile')
    
    #inizializza variabili
    sessione.run([agg_contenuto.initializer,
                 agg_stile.initializer])
    
    #la somma ha lo scopo di evitare divisioni per zero
    aggiorna_agg_contenuto = agg_contenuto.assign(1.0 / (perdita_contenuto + 1e-10))
    aggiorna_agg_stile = agg_stile.assign(1.0 / (perdita_stile + 1e-10))

    perdita_complessiva = peso_contenuto * agg_contenuto * perdita_contenuto + \
                          peso_stile * agg_stile * perdita_stile
    
    gradiente = tf.gradients(perdita_complessiva, modello.input)
    
    run_lista = [gradiente, aggiorna_agg_contenuto, aggiorna_agg_stile]
    
    #randomizzazione
    immagine_risultato = np.random.rand(*immagine_contenuto.shape) + 128
    
    #VERSIONE BASATA SU CONVERGENZA
    #total_loss_log = [[sys.maxsize, sys.maxsize]]
    
    i = 0
    
    while True:
        
        inizio = time.time()
        
        feed_dict = modello.crea_feed_dict(immagine=immagine_risultato)
        
        grad, valore_agg_contenuto, valore_agg_stile = sessione.run(run_lista, feed_dict=feed_dict)
        
        #Rimuove entry monodimensionali dalla shape di un array.
        grad = np.squeeze(grad)
        
        passo_scalato = passo/ (np.std(grad) + 1e-8)
        
        immagine_risultato -= grad*passo_scalato
        
        immagine_risultato = np.clip(immagine_risultato, 0.0, 255.0)
        
        fine = time.time()
        
        trascorso = fine - inizio
        
        print()
        print("Iterazione "+str(i)+" completata in "+str(trascorso)+" secondi")
        print('Perdita Stile: {} Perdita Contenuto: {}'.format(valore_agg_stile, valore_agg_contenuto))

        if (i % 10 == 0):
            
            print()
            print("Risultato dopo "+str(i)+" iterazioni: ")
            mostra_immagine(immagine_risultato)
            
        #total_loss_log.append([valore_agg_stile, valore_agg_contenuto])
        
        i += 1
        
        #print((total_loss_log[-1][0]-total_loss_log[-2][0]) + abs(total_loss_log[-1][1]-total_loss_log[-2][1])*pow(10,11))
        #if (abs(total_loss_log[-1][0]-total_loss_log[-2][0]) + abs(total_loss_log[-1][1]-total_loss_log[-2][1]))*pow(10,11) < precisione and i > 2:
            
        #    break
        
        print("Tempo totale trascorso: "+str(fine-ora)+" secondi")
        
        if time.time() > timeout:
            
            break
    
    sessione.close()
    
    return immagine_risultato

In [None]:
file_immagine_contenuto = "immagini/erika.jpg"
immagine_contenuto = carica_immagine(file_immagine_contenuto, dimensione_massima=None)

In [None]:
file_immagine_stile = "immagini/notte.jpg"
immagine_stile = carica_immagine(file_immagine_stile, dimensione_massima=512)

In [None]:
id_strato_contenuto = [4]

In [None]:
id_strati_stile = list(range(13))

In [None]:
%%time
opera = style_transfer(immagine_contenuto, immagine_stile,
                   id_strato_contenuto, id_strati_stile,
                   peso_contenuto=1.5, peso_stile=10.0,
                   minuti=60, passo=0.5)

In [None]:
pygame.init()
pygame.mixer.music.load('squillo.mp3')
pygame.mixer.music.play(-1)

In [None]:
pygame.mixer.music.stop()

In [None]:
nome_immagine = "opera"
mostra_immagine(opera)

In [None]:
if not os.path.exists("opere"):
    os.makedirs("opere")

nome_opera = "opera"
salva_immagine(opera, "opere/"+nome_opera)