# Actividad Práctica 2
# Técnicas de aprendizaje profundo

In [1]:
# Definicion de librerias con la funciones que seran utilizadas por Keras.
import keras
from keras.layers import Activation, Dense, Flatten, Dropout
from keras.models import Sequential
from keras.layers.convolutional import Convolution2D, ZeroPadding2D, Conv2D
from keras.layers.normalization import BatchNormalization
from keras.layers.pooling import MaxPooling2D

Using TensorFlow backend.


In [45]:
# to start from scratch
del modelAlexNet

In [46]:
#Definicion de contenedor y primera capa de AlexNet.
modelAlexNet = Sequential()
modelAlexNet.add(ZeroPadding2D((2,2), input_shape=(224, 224, 3)))

# modelAlexNet.add(Convolution2D(96,11,11,subsam-ple=(4,4),border_mode='valid'))
# /home/diego/anaconda3/envs/tensor/lib/python3.6/site-packages/ipykernel/__main__.py:4: 
# UserWarning: Update your `Conv2D` call to the Keras 2 API: 
# `Conv2D(96, (11, 11), strides=(4, 4), padding="valid")`

modelAlexNet.add(Conv2D(96, (11,11), strides=(4,4), padding='valid'))
modelAlexNet.summary()
## aquí quedé
modelAlexNet.add(Activation(activation='relu'))
modelAlexNet.add(BatchNormalization())

# Redes neuronales convolucionales: AlexNet

## Actividad 1
Estructura de la red *antes* del `maxPooling2D`

In [47]:
print(modelAlexNet.output_shape)

(None, 55, 55, 96)


Considerando que `MaxPooling2D(3,3)` actúa para estos efectos como un mapeo de una matriz $M$ de $3\times3$ a un valor por cada dos columnas/filas de $M$, la dimensión resultante es aproxidamente
$$\frac{55}{2} = 27.5 \approx 27 $$

Estructura de la red *después* de `maxPooling2D`

In [48]:
modelAlexNet.add(MaxPooling2D((3,3), strides=(2,2)))
print(modelAlexNet.output_shape)

(None, 27, 27, 96)


## Actividad 2
La red con una sola capa tiene la siguiente forma

In [49]:
print(modelAlexNet.summary())

_________________________________________________________________
Layer (type)                 Output Shape              Param #   
zero_padding2d_10 (ZeroPaddi (None, 228, 228, 3)       0         
_________________________________________________________________
conv2d_10 (Conv2D)           (None, 55, 55, 96)        34944     
_________________________________________________________________
activation_10 (Activation)   (None, 55, 55, 96)        0         
_________________________________________________________________
batch_normalization_10 (Batc (None, 55, 55, 96)        384       
_________________________________________________________________
max_pooling2d_8 (MaxPooling2 (None, 27, 27, 96)        0         
Total params: 35,328
Trainable params: 35,136
Non-trainable params: 192
_________________________________________________________________
None


Si se agrega la segunda capa de `AlexNet`, la dimensionalidad de la red se modifica  de la siguiente manera:

In [50]:
# se agregan dos filas y columnas de ceros a los bordes de las capas resultantes
modelAlexNet.add(ZeroPadding2D((2,2)))

In [51]:
modelAlexNet.output_shape

(None, 31, 31, 96)

Se aplica convolución sobre las 96 capas anteriores, considerando un área de $5x5$ sobre cada una de las capas

In [52]:
# Se aplican 256 filtros sobre un área de 5x5
# modelAlexNet.add(Convolution2D(256, 5, 5, border_mode='valid'))
modelAlexNet.add(Conv2D(256, (5, 5), padding='valid'))

In [53]:
modelAlexNet.output_shape

(None, 27, 27, 256)

Se añade una capa de activación `relu`, que lleva a cero valores negativos y mantiene los positivos. En este caso la dimensionalidad debería mantenerse:

In [54]:
# TODO: ver los valores y dimensiones en esta capa.
modelAlexNet.add(Activation(activation='relu'))

In [55]:
modelAlexNet.output_shape

(None, 27, 27, 256)

Se normalizan los datos, dejándolos con media 0 y desviación estándar 1. Las dimensiones deberían mantenerse:


In [56]:
# TODO: ver los valores y dimensiones en esta capa.
modelAlexNet.add(BatchNormalization())

In [57]:
modelAlexNet.output_shape

(None, 27, 27, 256)

Luego se añade una nueva capa de `MaxPooling` con un stride de 2. De igual manera, la dimensionalidad de cada capa se ve reducida de $27\times27$ a $27/2\approx13$

In [58]:
# stride de 2 reduce la dimensionalidad de 27/2 approx 13
modelAlexNet.add(MaxPooling2D((3,3), strides=(2,2)))

In [59]:
modelAlexNet.output_shape

(None, 13, 13, 256)

la capa resultante es el resultado de todas estas acciones, las que se resumen de la siguiente manera

In [97]:
modelAlexNet.summary()

_________________________________________________________________
Layer (type)                 Output Shape              Param #   
zero_padding2d_10 (ZeroPaddi (None, 228, 228, 3)       0         
_________________________________________________________________
conv2d_10 (Conv2D)           (None, 55, 55, 96)        34944     
_________________________________________________________________
activation_10 (Activation)   (None, 55, 55, 96)        0         
_________________________________________________________________
batch_normalization_10 (Batc (None, 55, 55, 96)        384       
_________________________________________________________________
max_pooling2d_8 (MaxPooling2 (None, 27, 27, 96)        0         
_________________________________________________________________
zero_padding2d_11 (ZeroPaddi (None, 31, 31, 96)        0         
_________________________________________________________________
conv2d_11 (Conv2D)           (None, 27, 27, 256)       614656    
__________

### Cantidad de parámetros: Interpretando `summary()` y `Param #`

No entiendo

https://stackoverflow.com/questions/45561306/understanding-model-summary-keras
https://stackoverflow.com/questions/36946671/keras-model-summary-result-understanding-the-of-parameters


## Actividad 3
La tercera capa se construye bajo las siguientes consideraciones 

*  Se incluye un *padding* de 1 cero a cada lado del mapa de activaciones de entrada
*  No utiliza normalización *batch*
*  No se considera `MaxPooling`

Para la primera parte, el mapa de activaciones de entrada viene dado por el resultado del `MaxPooling` anterior

In [99]:
modelAlexNet.output_shape

(None, 13, 13, 256)

Donde el mapa es de dimensión $13\times13$. Se añade un padding de 1 cero en ambas direcciones 

In [100]:
modelAlexNet.add(ZeroPadding2D((1,1)))

In [101]:
modelAlexNet.output_shape

(None, 15, 15, 256)

Se agrega una capa de convolución de 384 filtros, con un tamaño de filtro de $3\times3$

In [102]:
modelAlexNet.add(Conv2D(384, (3, 3), padding='valid'))

In [103]:
modelAlexNet.output_shape

(None, 13, 13, 384)

La capa 3 finalmente queda definida por

In [107]:
modelAlexNet.summary()

_________________________________________________________________
Layer (type)                 Output Shape              Param #   
zero_padding2d_10 (ZeroPaddi (None, 228, 228, 3)       0         
_________________________________________________________________
conv2d_10 (Conv2D)           (None, 55, 55, 96)        34944     
_________________________________________________________________
activation_10 (Activation)   (None, 55, 55, 96)        0         
_________________________________________________________________
batch_normalization_10 (Batc (None, 55, 55, 96)        384       
_________________________________________________________________
max_pooling2d_8 (MaxPooling2 (None, 27, 27, 96)        0         
_________________________________________________________________
zero_padding2d_11 (ZeroPaddi (None, 31, 31, 96)        0         
_________________________________________________________________
conv2d_11 (Conv2D)           (None, 27, 27, 256)       614656    
__________

## Actividad 4
A continuación se definen las capas 4 y 5 siguientes. Las consideraciones son las mismas que las para la capa 3, esto es

*  Para la capa 4
    *  Se incluye un *padding* de 1 cero a cada lado del mapa de activaciones de entrada
    *  No utiliza normalización *batch*
    *  No se considera `MaxPooling`
*  Para la capa 5
    *  Se incluye un *padding* de 1 cero a cada lado del mapa de activaciones de entrada
    *  No utiliza normalización *batch*
    *  Si considera `MaxPooling`, con una ventana de $3\times3$ y un stride de 2

In [108]:
# Capa 4
modelAlexNet.add(ZeroPadding2D((1,1)))
modelAlexNet.add(Conv2D(384, (3, 3), padding='valid'))
modelAlexNet.summary()

_________________________________________________________________
Layer (type)                 Output Shape              Param #   
zero_padding2d_10 (ZeroPaddi (None, 228, 228, 3)       0         
_________________________________________________________________
conv2d_10 (Conv2D)           (None, 55, 55, 96)        34944     
_________________________________________________________________
activation_10 (Activation)   (None, 55, 55, 96)        0         
_________________________________________________________________
batch_normalization_10 (Batc (None, 55, 55, 96)        384       
_________________________________________________________________
max_pooling2d_8 (MaxPooling2 (None, 27, 27, 96)        0         
_________________________________________________________________
zero_padding2d_11 (ZeroPaddi (None, 31, 31, 96)        0         
_________________________________________________________________
conv2d_11 (Conv2D)           (None, 27, 27, 256)       614656    
__________

In [109]:
# capa 5
modelAlexNet.add(ZeroPadding2D((1,1)))
modelAlexNet.add(Conv2D(256, (3, 3), padding='valid'))
modelAlexNet.add(MaxPooling2D((3,3), strides=(2,2)))
modelAlexNet.summary()

_________________________________________________________________
Layer (type)                 Output Shape              Param #   
zero_padding2d_10 (ZeroPaddi (None, 228, 228, 3)       0         
_________________________________________________________________
conv2d_10 (Conv2D)           (None, 55, 55, 96)        34944     
_________________________________________________________________
activation_10 (Activation)   (None, 55, 55, 96)        0         
_________________________________________________________________
batch_normalization_10 (Batc (None, 55, 55, 96)        384       
_________________________________________________________________
max_pooling2d_8 (MaxPooling2 (None, 27, 27, 96)        0         
_________________________________________________________________
zero_padding2d_11 (ZeroPaddi (None, 31, 31, 96)        0         
_________________________________________________________________
conv2d_11 (Conv2D)           (None, 27, 27, 256)       614656    
__________

### Observaciones
> TODO

## Actividad 5
Esta actividad se refiere a las últimas capas de `AlexNet`, las cuales son densas. El primer paso es convertir la matriz de pesos de la capa 5 de $13\times13$ ($6\times6$ luego del `Maxpooling`) a una estructura plana unidimensional. 

In [117]:
modelAlexNet.add(Flatten())

In [118]:
modelAlexNet.summary()

_________________________________________________________________
Layer (type)                 Output Shape              Param #   
zero_padding2d_10 (ZeroPaddi (None, 228, 228, 3)       0         
_________________________________________________________________
conv2d_10 (Conv2D)           (None, 55, 55, 96)        34944     
_________________________________________________________________
activation_10 (Activation)   (None, 55, 55, 96)        0         
_________________________________________________________________
batch_normalization_10 (Batc (None, 55, 55, 96)        384       
_________________________________________________________________
max_pooling2d_8 (MaxPooling2 (None, 27, 27, 96)        0         
_________________________________________________________________
zero_padding2d_11 (ZeroPaddi (None, 31, 31, 96)        0         
_________________________________________________________________
conv2d_11 (Conv2D)           (None, 27, 27, 256)       614656    
__________

## Actividad 6

La capa 6 se obtiene entonces
1.  Mapeando la versión *plana* de la capa 5 sobre una capa densa de 4096 unidades
1.  Añadiendo una capa de activación que use una función `ReLu`. Esto no cambia la dimensionalidad de la capa.
1.  Añadiendo un `Dropout` de 0.5, lo que tampoco cambia la dimensionalidad de la capa

In [123]:
modelAlexNet.add(Dense(input_dim=9216, units=4096))

In [125]:
modelAlexNet.output_shape

(None, 4096)

In [126]:
modelAlexNet.add(Activation(activation='relu'))

In [127]:
modelAlexNet.output_shape

(None, 4096)

In [128]:
modelAlexNet.add(Dropout(0.5))

In [129]:
modelAlexNet.output_shape

(None, 4096)

In [130]:
modelAlexNet.summary()

_________________________________________________________________
Layer (type)                 Output Shape              Param #   
zero_padding2d_10 (ZeroPaddi (None, 228, 228, 3)       0         
_________________________________________________________________
conv2d_10 (Conv2D)           (None, 55, 55, 96)        34944     
_________________________________________________________________
activation_10 (Activation)   (None, 55, 55, 96)        0         
_________________________________________________________________
batch_normalization_10 (Batc (None, 55, 55, 96)        384       
_________________________________________________________________
max_pooling2d_8 (MaxPooling2 (None, 27, 27, 96)        0         
_________________________________________________________________
zero_padding2d_11 (ZeroPaddi (None, 31, 31, 96)        0         
_________________________________________________________________
conv2d_11 (Conv2D)           (None, 27, 27, 256)       614656    
__________

## Actividad 7
Las capas a continuación tienen las siguientes características

*  Capa 7
    *  Es una capa densa de 4096 unidades que acepta las entradas de la capa anterior
    *  Añade una capa de activación `ReLu` y otra de `Dropout` a la salida


In [131]:
modelAlexNet.add(Dense(input_dim=4096, units=4096))

In [132]:
modelAlexNet.add(Activation(activation='relu'))

In [133]:
modelAlexNet.add(Dropout(0.5))

*  Capa 8
    *  Capa densa de 1000 unidades que tiene una función activación `SoftMax`

In [134]:
modelAlexNet.add(Dense(1000))

In [135]:
modelAlexNet.add(Activation('softmax'))

In [136]:
modelAlexNet.summary()

_________________________________________________________________
Layer (type)                 Output Shape              Param #   
zero_padding2d_10 (ZeroPaddi (None, 228, 228, 3)       0         
_________________________________________________________________
conv2d_10 (Conv2D)           (None, 55, 55, 96)        34944     
_________________________________________________________________
activation_10 (Activation)   (None, 55, 55, 96)        0         
_________________________________________________________________
batch_normalization_10 (Batc (None, 55, 55, 96)        384       
_________________________________________________________________
max_pooling2d_8 (MaxPooling2 (None, 27, 27, 96)        0         
_________________________________________________________________
zero_padding2d_11 (ZeroPaddi (None, 31, 31, 96)        0         
_________________________________________________________________
conv2d_11 (Conv2D)           (None, 27, 27, 256)       614656    
__________

# Conclusiones
<div class="alert alert-danger">
TODO
</div>
