# IMPORT

In [None]:
from __future__ import print_function

import torch
import torch.nn as nn
from torch.autograd import Variable
import torch.optim as optim

from PIL import Image
import matplotlib.pyplot as plt

import torchvision.transforms as trasforma
import torchvision.models as modelli

import os
import copy
import time
import pygame
import sys

# USARE CUDA SE DISPONIBILE

In [None]:
usa_cuda = torch.cuda.is_available()
dtype = torch.cuda.FloatTensor if usa_cuda else torch.FloatTensor

# MANIPOLAZIONE IMMAGINI

In [None]:
dimensione_immagine = 1024 if usa_cuda else 512

manipolazione = trasforma.Compose([
    trasforma.Resize((dimensione_immagine,dimensione_immagine)),
    trasforma.ToTensor()
])

def carica_immagine(nome_immagine):
    immagine = Image.open(nome_immagine)
    immagine = Variable(manipolazione(immagine))
    #Aggiunge una dimensione al tensore
    immagine = immagine.unsqueeze(0)
    return immagine

immagine_contenuto = carica_immagine("immagini/erika.jpg").type(dtype)
immagine_stile = carica_immagine("immagini/notte.jpg").type(dtype)

assert immagine_contenuto.size() == immagine_stile.size()

In [None]:
riottieni_immagine = trasforma.ToPILImage() 

if not os.path.exists("immagini_esecuzione"):
    os.makedirs("immagini_esecuzione")

#Attiva modalitÃ  interattiva
plt.ion()

def mostra_immagine(tensore, titolo):
    immagine = tensore.clone().cpu()
    #reshape
    immagine = immagine.view(3, dimensione_immagine, dimensione_immagine)
    immagine = riottieni_immagine(immagine)
    immagine.save("immagini_esecuzione/"+titolo+".png")
    plt.imshow(immagine)
    plt.axis("off")
    plt.title(titolo)

plt.figure()
mostra_immagine(immagine_contenuto.data, titolo="Contenuto")

plt.figure()
mostra_immagine(immagine_stile.data, titolo="Stile")

# FUNZIONI PER CALCOLO PERDITA

In [None]:
class PerditaContenuto(nn.Module):
    
    def __init__(self, obiettivo, peso):
        super(PerditaContenuto, self).__init__()
        
        self.obiettivo = obiettivo.detach()*peso
        self.peso = peso
        self.criterio = nn.MSELoss()
        
    def forward(self, input):
        self.perdita = self.criterio(input*self.peso, self.obiettivo)
        self.output = input
        return self.output
    
    def backward(self, retain_graph=True):
        self.perdita.backward(retain_graph=retain_graph)
        return self.perdita

In [None]:
class MatriceGram(nn.Module):

    def forward(self, input):
        dim_batch, num_fmaps, xfmap, yfmap = input.size()  

        feature = input.view(dim_batch * num_fmaps, xfmap * yfmap)  

        gramiana = torch.mm(feature, feature.t())  
        
        #normalizzazione valori dividendo per il numero di elementi in ogni feature map
        return gramiana.div(dim_batch * num_fmaps * xfmap * yfmap)

In [None]:
class PerditaStile(nn.Module):

    def __init__(self, obiettivo, peso):
        super(PerditaStile, self).__init__()
        self.obiettivo = obiettivo.detach() * peso
        self.peso = peso
        self.gramiana = MatriceGram()
        self.criterio = nn.MSELoss()

    def forward(self, input):
        self.output = input.clone()
        self.G = self.gramiana(input)
        #moltiplicazione scalare in-place
        self.G.mul_(self.peso)
        self.perdita = self.criterio(self.G, self.obiettivo)
        return self.output

    def backward(self, retain_graph=True):
        self.perdita.backward(retain_graph=retain_graph)
        return self.perdita

# CARICA RETE NEURALE

In [None]:
rete = modelli.vgg19(pretrained=True).features

if usa_cuda:
    rete = rete.cuda()

In [None]:
strati_contenuto_selezionati = ['conv_4']
strati_stile_selezionati = ['conv_1', 'conv_2', 'conv_3', 'conv_4', 'conv_5']


def get_stile_modello_e_perdite(rete, immagine_stile, immagine_contenuto,
                               peso_stile=1000, peso_contenuto=1,
                               strati_contenuto=strati_contenuto_selezionati,
                               strati_stile=strati_stile_selezionati):
    rete = copy.deepcopy(rete)


    perdite_contenuto = []
    perdite_stile = []
    
    #inizializzazione modello
    modello = nn.Sequential()  
    gramiana = MatriceGram()  

    if usa_cuda:
        modello = modello.cuda()
        gramiana = gramiana.cuda()
    
    #popolazione modello
    i = 1
    for strato in list(rete):
        if isinstance(strato, nn.Conv2d):
            nome = "conv_" + str(i)
            modello.add_module(nome, strato)

            if nome in strati_contenuto:
                obiettivo = modello(immagine_contenuto).clone()
                perdita_contenuto = PerditaContenuto(obiettivo, peso_contenuto)
                modello.add_module("perdita_contenuto_" + str(i), perdita_contenuto)
                perdite_contenuto.append(perdita_contenuto)

            if nome in strati_stile:
                obiettivo_feature = modello(immagine_stile).clone()
                obiettivo_feature_gramiana = gramiana(obiettivo_feature)
                perdita_stile = PerditaStile(obiettivo_feature_gramiana, peso_stile)
                modello.add_module("perdita_stile_" + str(i), perdita_stile)
                perdite_stile.append(perdita_stile)

        if isinstance(strato, nn.ReLU):
            nome = "relu_" + str(i)
            modello.add_module(nome, strato)

            if nome in strati_contenuto:
                obiettivo = modello(immagine_contenuto).clone()
                perdita_contenuto = PerditaContenuto(obiettivo, peso_contenuto)
                modello.add_module("perdita_contenuto_" + str(i), perdita_contenuto)
                perdite_contenuto.append(perdita_contenuto)

            if nome in strati_stile:
                obiettivo_feature = modello(immagine_stile).clone()
                obiettivo_feature_gramiana = gramiana(obiettivo_feature)
                perdita_stile = PerditaStile(obiettivo_feature_gramiana, peso_stile)
                modello.add_module("perdita_stile_" + str(i), perdita_stile)
                perdite_stile.append(perdita_stile)

            i += 1

        if isinstance(strato, nn.MaxPool2d):
            nome = "pool_" + str(i)
            modello.add_module(nome, strato)


    return modello, perdite_stile, perdite_contenuto

In [None]:
immagine_input = immagine_contenuto.clone()

plt.figure()
mostra_immagine(immagine_input.data, titolo='Immagine Input')

# DISCESA DEL GRADIENTE

In [None]:
def esecuzione_style_transfer(rete, immagine_contenuto, immagine_stile, immagine_input, minuti = 60,
                       peso_stile=1000, peso_contenuto=1):
    
    inizio = time.time()
    timeout = time.time()+60*minuti
    
    print('Costruzione modello in corso...')
    modello, perdite_stile, perdite_contenuto = get_stile_modello_e_perdite(rete,
        immagine_stile, immagine_contenuto, peso_stile, peso_contenuto)
    
    
    parametri_input = nn.Parameter(immagine_input.data)
    ottimizzatore = optim.LBFGS([parametri_input])

    print('Ottimizzazione in corso...')
    esecuzione = [0]
    #VERSIONE BASATA SULLA CONVERGENZA
    #loss_log = [[sys.maxsize,sys.maxsize], [sys.maxsize-1,sys.maxsize-1]]
    #i = 0
    #while abs(loss_log[-2][0]-loss_log[-1][0])+abs(loss_log[-2][1]-loss_log[-1][1]) > precisione or i<2
    while time.time() < timeout :
        
        def avvicinamento():

            parametri_input.data.clamp_(0, 1)
            
            #setta i gradienti di tutti i parametri del modello a 0
            ottimizzatore.zero_grad()
            modello(parametri_input)
            score_stile = 0
            score_contenuto = 0

            for ps in perdite_stile:
                score_stile += ps.backward()
            for pc in perdite_contenuto:
                score_contenuto += pc.backward()

            esecuzione[0] += 1
            #ridondante ma mi accerto che tutto fili liscio
            print("Sto eseguendo...")

            print("esecuzione {}:".format(esecuzione))
            print('Perdita Stile: {:4f} Perdita Contenuto: {:4f}'.format(score_stile.data[0], score_contenuto.data[0]))
            print("Tempo totale trascorso: "+str(time.time()-inizio)+" secondi")
            print()
            
            #loss_log.append([score_stile.data[0],score_contenuto.data[0]])
            
            return score_stile + score_contenuto
        
        ottimizzatore.step(avvicinamento)
        
        #i += 1
        
    parametri_input.data.clamp_(0, 1)

    return parametri_input.data

# ESECUZIONE ALGORITMO

In [None]:
%%time
opera = esecuzione_style_transfer(rete, immagine_contenuto, immagine_stile, immagine_input)

plt.figure()
mostra_immagine(opera, titolo="Risultato Ottenuto")

plt.ioff()
plt.show()
pygame.init()
#Squilla quando ha finito
pygame.mixer.music.load('squillo.mp3')
pygame.mixer.music.play(-1)

In [None]:
#pygame.mixer.music.stop()