# TME4 - Les réseaux profonds avec auto-encodeurs

Les autoencodeurs sont de nouveaux types de réseaux de neurones, entrainés afin de reproduire les donnée en entrée $x$ dans les sorties.

Nous allons tenter dans ce TME, de créer un autoencodeur avec $5$ couches cachées sur le dataset $MNIST$. et d'apprendre chaque couche avec notre fonction de descente de gradient classique.

## Impotation des données MNIST

In [1]:
require 'torch'
require 'nn'
require 'optim'
local mnist = require 'mnist'


trainset = mnist.traindataset()
testset = mnist.testdataset()

print ( trainset )
print ( testset )

{


  data : ByteTensor - size: 60000x28x28
  size : 60000
  label : ByteTensor - size: 60000
}
{
  data : ByteTensor - size: 10000x28x28
  size : 10000
  label : ByteTensor - size: 10000
}


Nous disposons de 60000 images de taille $28\times 28$ et de leurs labels allant de $0..9$ pour l'ensemble d'entrainement ( 10000 pour l'ensemble de test )

On vas visualiser la première entrée et son label pour voir a quoi ça ressemble.

In [None]:
itorch.image(trainset.data[1])
print (trainset.label[1])

## Création du MLP

In [2]:
layer_size = 49
input_size = 28*28
model = nn.Sequential()

model:add(nn.Reshape(input_size))
model:add(nn.Linear(input_size, layer_size))
model:add(nn.Tanh())
model:add(nn.Linear(layer_size, input_size))
model:add(nn.Reshape(input_size))

criterion = nn.MSECriterion()

## Descente de gradient

In [3]:
function gradient_descent(model, inputs, labels, criterion)
   learning_rate = 1e-3
   nb_iter = 1000
    
   for i = 1,nb_iter do
      model:zeroGradParameters()
      
      idx = torch.randperm(inputs:size(1))
        for j = 1, inputs:size(1) do
            local x = inputs[idx[j]]:double()
            local y = labels[idx[j]]:double()
            
            local y_hat = model:forward(x)
            local loss = criterion:forward(y_hat,y)
            local delta = criterion:backward(y_hat,y)
            model:backward(x, delta)

            -- update
            model:updateParameters(learning_rate)
        if ( i % 100 == 0) then
            print(i,loss)
        end
      end
   end
    
   return loss
end

In [None]:
function step(inputs)
    local loss = gradient_descent(model, inputs, inputs, criterion)
    return loss
end

function eval(trainset)
    local loss = criterion:forward(model:forward(trainset), inputs) -- compare prediction to input
    return loss
end

max_iters = 30

for i = 1,max_iters do

    local loss = step(trainset.data)
    local validation_loss = eval({testset.data})

    print(string.format('Iteration: %d loss: %4f | validation loss: %4f', i, loss, validation_loss))

end


 60000
    28
    28
[torch.LongStorage of size 3]



## Forme de l'autoencodeur avec 5 couches cachées

Nous avons sur chaque couche 

In [None]:
--[[
function auto_encoder_train(encoder,decoder,x, criterion)
  auto_encoder = nn.Sequential()
    
  auto_encoder:add(encoder)
  auto_encoder:add(nn.Tanh())
  auto_encoder:add(decoder)
  auto_encoder:add(nn.Tanh()) 

  gradient_descent(auto_encoder, x, x, criterion) -- On apprend à reproduire les entrées.
  return encoder
end


layer_sizes = {50, 50, 50, 50}
criterion = nn.MSECriterion()
ml_encoder = nn.Sequential()


for i=1,(#layer_sizes)-1 do:
   x = ml_encoder:forward(train_data)
    
   encoder = nn.Linear(layer_sizes[i],layer_sizes[i+1])
   decoder = nn.Linear(layer_sizes[i+1],layer_sizes[i])
    
   trained_encoder = auto_encoder_train(encoder,decoder,x,criterion)

   ml_encoder:add(trained_encoder)
   ml_encoder:add(nn.Tanh())
end 
]]--

## Visualisation des features apprises

In [None]:
--[[ Autoencodeur: Eviter le vanishing gradient

permet de donner la garantie de ne pas perdre de l'information quand je passe d'une couche a l'autre

#vacances dans deux semaines
à la fin des vacances : rapport AS sur la base MNIST 
comparaison des deux manière d'ataqu 
visualisation


taille_couches_caches = 5
calcule de théta1*
]]--
