<a href="https://colab.research.google.com/github/rfernandes29/mlusp/blob/main/aula08_nn_e_cnn.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Redes Neurais

Redes neurais são formadas por nós organizados em camadas. Em uma rede neural **densa**, todos os nós de uma dada camada estão conectados a todos os nós das camadas anterior e posterior:

![User:Wiso, Public domain, via Wikimedia Commons](https://upload.wikimedia.org/wikipedia/commons/9/99/Neural_network_example.svg)
*<center>crédito: User:Wiso, Public domain, via Wikimedia Commons</center>*

A <font color='green'>primeira camada</font> é composta pelo vetor de entrada $X$, que também podemos chamar de *feature vector*. A <font color='purple'>última camada</font> é composta pelo vetor de saída $y$. As <font color='blue'>camadas intermediárias</font> são chamadas de camadas ocultas. Uma rede neural com mais de uma camada oculta é chamada de rede neural **profunda**. Daí vem o tão conhecido termo *deep learning*.

Cada nó faz uma combinação linear de todas as entradas que recebe e depois aplica uma transformação não-linear $\sigma$ a esta combinação:

$z_{nó} = \sigma(w_1 \cdot x_1 + w_2 \cdot x_2 + ... w_n \cdot x_n + b)$

Em notação vetorial, para uma dada camada, seu vetor de saída $Z$ é:

$Z = \sigma(W \cdot X + B)$

As matrizes de pesos $W$ são os parâmetros que queremos otimizar. A transformação não-linear $\sigma$ é chamada de **função de ativação**.

Podemos usar `keras`, uma biblioteca de alto nível, para construir uma rede como a do desenho acima. Chamando o método `.summary()` no modelo, podemos ver a quantidade de parâmetros dele.

In [1]:
from tensorflow.keras.layers import Input, Dense
from tensorflow.keras.models import Model, Sequential

x = Input(shape=(4,))

z = Dense(6, activation='relu')(x)
z = Dense(6, activation='relu')(z)

y = Dense(10, activation='softmax')(z)

model = Model(inputs=x, outputs=y)
model.summary()

Model: "model"
_________________________________________________________________
 Layer (type)                Output Shape              Param #   
 input_1 (InputLayer)        [(None, 4)]               0         
                                                                 
 dense (Dense)               (None, 6)                 30        
                                                                 
 dense_1 (Dense)             (None, 6)                 42        
                                                                 
 dense_2 (Dense)             (None, 10)                70        
                                                                 
Total params: 142 (568.00 Byte)
Trainable params: 142 (568.00 Byte)
Non-trainable params: 0 (0.00 Byte)
_________________________________________________________________


### Classificando dígitos do MNIST com redes neurais

In [2]:
from tensorflow.keras import datasets
from tensorflow.keras.layers import Conv2D, Flatten, MaxPooling2D

def compile_train(model, X_train, y_train):
    model.compile(
        optimizer='adam', loss='sparse_categorical_crossentropy', metrics=['accuracy'])
    model.summary()
    model.fit(
        X_train,
        y_train,
        verbose=1,
        epochs=5,
        batch_size=32,
        validation_split=0.1,
    )

In [3]:
(X_train, y_train), (X_test, y_test) = datasets.mnist.load_data()

print('dataset shape', X_train.shape)

X_train = X_train/255
X_test = X_test/255

X_train = X_train.reshape((-1, 784))
X_test = X_test.reshape((-1, 784))

model = Sequential()
model.add(Dense(64, activation='relu', input_shape=(784,)))
model.add(Dense(64, activation='relu'))
model.add(Dense(10, activation='softmax'))

compile_train(model, X_train, y_train)

Downloading data from https://storage.googleapis.com/tensorflow/tf-keras-datasets/mnist.npz
dataset shape (60000, 28, 28)
Model: "sequential"
_________________________________________________________________
 Layer (type)                Output Shape              Param #   
 dense_3 (Dense)             (None, 64)                50240     
                                                                 
 dense_4 (Dense)             (None, 64)                4160      
                                                                 
 dense_5 (Dense)             (None, 10)                650       
                                                                 
Total params: 55050 (215.04 KB)
Trainable params: 55050 (215.04 KB)
Non-trainable params: 0 (0.00 Byte)
_________________________________________________________________
Epoch 1/5
Epoch 2/5
Epoch 3/5
Epoch 4/5
Epoch 5/5


### Classificando peças de roupa com o Fashion MNIST

Esta é uma variante um pouco mais desafiadora do MNIST: é um dataset composto por 10 tipos de peça de roupa.

In [4]:
(X_train, y_train), (X_test, y_test) = datasets.fashion_mnist.load_data()

X_train = X_train/255
X_test = X_test/255

X_train = X_train.reshape((-1, 784))
X_test = X_test.reshape((-1, 784))

model = Sequential()
model.add(Dense(128, activation='relu', input_shape=(784,)))
model.add(Dense(128, activation='relu'))
model.add(Dense(10, activation='softmax'))

compile_train(model, X_train, y_train)

Downloading data from https://storage.googleapis.com/tensorflow/tf-keras-datasets/train-labels-idx1-ubyte.gz
Downloading data from https://storage.googleapis.com/tensorflow/tf-keras-datasets/train-images-idx3-ubyte.gz
Downloading data from https://storage.googleapis.com/tensorflow/tf-keras-datasets/t10k-labels-idx1-ubyte.gz
Downloading data from https://storage.googleapis.com/tensorflow/tf-keras-datasets/t10k-images-idx3-ubyte.gz
Model: "sequential_1"
_________________________________________________________________
 Layer (type)                Output Shape              Param #   
 dense_6 (Dense)             (None, 128)               100480    
                                                                 
 dense_7 (Dense)             (None, 128)               16512     
                                                                 
 dense_8 (Dense)             (None, 10)                1290      
                                                                 
Total params: 11

## Redes Neurais Convolucionais


Numa rede neural densa, a quantidade de conexões (e, consequentemente, de parâmetros) cresce *exponencialmente* ao adicionarmos mais nós. Assim, para dados de dimensão alta, ou para problemas que exigem modelos muito complexos, é preciso buscar estratégias de conectividade mais eficientes. No caso de imagens, usamos **convoluções**.

Numa camada convolucional, também são feitas combinações lineares da camada anterior. A diferença é que agora cada saída é resultado da combinação linear de um subconjunto da entrada, geralmente definido por uma janela quadrada. Isso reduz bastante a quantidade de parâmetros e facilita o reconhecimento de *padrões locais* em imagens.

![](https://github.com/vdumoulin/conv_arithmetic/raw/master/gif/full_padding_no_strides.gif)

*<center>crédito: https://github.com/vdumoulin/conv_arithmetic</center>*

Vamos construir uma rede neural usando convoluções para tentar melhorar nosso classificador do Fashion MNIST.

In [5]:
(X_train, y_train), (X_test, y_test) = datasets.fashion_mnist.load_data()

X_train = X_train.reshape(X_train.shape[0], 28, 28, 1)
X_test = X_test.reshape(X_test.shape[0], 28, 28, 1)

X_train = X_train/255
X_test = X_test/255

model = Sequential()
model.add(Conv2D(64, kernel_size=(3,3), input_shape=(28,28,1)))
model.add(Conv2D(32, kernel_size=(3,3)))
model.add(MaxPooling2D(pool_size=(2, 2)))
model.add(Flatten())
model.add(Dense(10, activation='softmax'))

compile_train(model, X_train, y_train)

Model: "sequential_2"
_________________________________________________________________
 Layer (type)                Output Shape              Param #   
 conv2d (Conv2D)             (None, 26, 26, 64)        640       
                                                                 
 conv2d_1 (Conv2D)           (None, 24, 24, 32)        18464     
                                                                 
 max_pooling2d (MaxPooling2  (None, 12, 12, 32)        0         
 D)                                                              
                                                                 
 flatten (Flatten)           (None, 4608)              0         
                                                                 
 dense_9 (Dense)             (None, 10)                46090     
                                                                 
Total params: 65194 (254.66 KB)
Trainable params: 65194 (254.66 KB)
Non-trainable params: 0 (0.00 Byte)
________________