<a href="https://colab.research.google.com/github/jsansao/idl/blob/main/Licao6_FashionMNIST_FullyConnected.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

##### Copyright 2019 The TensorFlow Authors.

Esse notebook foi adaptado de https://github.com/lmoroney/dlaicourse

In [None]:
#@title Licensed under the Apache License, Version 2.0 (the "License");
# you may not use this file except in compliance with the License.
# You may obtain a copy of the License at
#
# https://www.apache.org/licenses/LICENSE-2.0
#
# Unless required by applicable law or agreed to in writing, software
# distributed under the License is distributed on an "AS IS" BASIS,
# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
# See the License for the specific language governing permissions and
# limitations under the License.

# Um exemplo em visão computacional

Na lição anterior, usamos redes neurais para modelar uma funções matemáticas. As redes aprenderam o comportamento das funções a partir de pares dados. 

Agora vamos trabalhar com um conjunto diferente, um problema de visão computacional. O conjunto de imagens apresentea 10 tipos diferentes de itens de vestimenta.  

## Codificação inicial

Importação do TensorFlow

In [None]:
import tensorflow as tf
print(tf.__version__)


O conjunto de dados que usaremos é denominado "Fashion MNIST" e está incluído no bancos de dados embutidos no tf.keras. 

Ele pode ser carregado assim:

In [None]:
mnist = tf.keras.datasets.fashion_mnist



O método ``load_data`` do objeto ``mnist`` retorna dois conjuntos com duas listas. Um conjunto corresponde ao *treinamento* e outro ao *teste*. Cada conjunto é formado pelas imagens e respectivo rótulo. 

In [None]:
(training_images, training_labels), (test_images, test_labels) = mnist.load_data()

Mas como é feito esse armazenamento? Varie o índice ``item`` para verificar o conteúdo em diferentes itens da lista.


In [None]:
import numpy as np
np.set_printoptions(linewidth=200)
import matplotlib.pyplot as plt
item = 100
plt.imshow(training_images[item],cmap='Greys')
print(training_labels[item])
print(training_images[item])

As imagens são armazenadas em uma matriz 28 x 28. O valor de cada elemento da matriz contém a intensidade quantizada em 8 bits (0 a 255). 

Novamente, para facilitar o treinamento da rede, vamos ``normalizar`` os dados, divindindo as imagens por 255. 

In [None]:
training_images  = training_images / 255.0
test_images = test_images / 255.0

Sem a divisão dos conjuntos de treinamento e teste, não se
pode avaliar a acurácia do treinamento. 

Designando o modelo que será usado neste exemplo:

In [None]:
model = tf.keras.models.Sequential([tf.keras.layers.Flatten(), 
                                    tf.keras.layers.Dense(128, activation=tf.nn.relu), 
                                    tf.keras.layers.Dense(10, activation=tf.nn.softmax)])

**Sequential**: Esse comando define a seqüência de camadas da rede neural.

**Flatten**: Essa camada transforma a imagem "matricial" em um vetor linear. Literalmente um "achatamento"

**Dense**: Camada de neurônio. 

Cada camada de neurônios necessita de uma **função de ativação** para saber o que retornar para a camada seguinte. 

Existem diversas **funções de ativação**. Neste exemplo, temos duas: 

**Relu** "S X>0 retorne X, se não retorne 0" 

**Softmax** A partir de um conjunto de valores, escolhe o maior deles. Imagine um conjunto [0.1, 0.1, 0.05, 0.1, 9.5, 0.1, 0.05, 0.05, 0.05], a saída seria [0,0,0,0,1,0,0,0,0].




Vamos agora definir o modelo com **model.compile**, escolhendo uma função de perdas, um otimizar e a métrica para acompanhar o treinamento. 

O treinamento, novamente será feito com o **model.fit**, por 5 épocas. 

In [None]:
model.compile(optimizer = tf.optimizers.Adam(),
              loss = 'sparse_categorical_crossentropy',
              metrics=['accuracy'])

model.fit(training_images, training_labels, epochs=5)

Ao fim das 5 épocas, a acurácia vai da faixa de 80% até 90%. Isso significa que a rede neural treinada classifica 90% dos itens do conjunto de treinamento corretamente. 

Para validar o treinamento, deve-se avaliar o conjunto de treinamento também. A rede neural não tem conhecimento prévio deste conjunto. O comando utilizado é **model.evaluate**. As entradas são as imagens de teste e os respectivos rótulos.

In [None]:
model.evaluate(test_images, test_labels)

Note que a acurácia é ligeiramente inferior com o conjunto desconhecido. 

# Exercícios exploratório

###Exercício 1:
Vamos rodar o comando ``model.predict`` contra as imagens de teste, para gerar as classificações. Cada item da lista ``classifications`` é um vetor com 10 posições, que indicam a probabilidade de pertencer àquela determinada classe. 


In [None]:
classifications = model.predict(test_images)

print(classifications[0])

Vejam que a posição 9 para o item 0 é que apresenta maior valor. O rótulo original do item pode ser visto a seguir: 

In [None]:
print(test_labels[0])

Estes são os rótulos da base Fashion-MNIST

|Rótulos|	Descrição|
|-|-|
|0	|Camiseta|
|1	|Calça|
|2	|Pullover|
|3	|Vestido|
|4	|Casaco|
|5	|Sandália|
|6	|Camisa|
|7	|Tênis|
|8	|Bolsa|
|9	|Bota|


##Exercício 2: 


Vamos agora experimentar com diferentes números de neurônios na camada densa. Vamos comparar a função de perdas, o tempo de treinamento e acurácia. 

Vamos iniciar com 512 neurônios.

In [None]:
import tensorflow as tf
print(tf.__version__)

mnist = tf.keras.datasets.fashion_mnist

(training_images, training_labels) ,  (test_images, test_labels) = mnist.load_data()

training_images = training_images/255.0
test_images = test_images/255.0

model = tf.keras.models.Sequential([tf.keras.layers.Flatten(),
                                    tf.keras.layers.Dense(512, activation=tf.nn.relu),
                                    tf.keras.layers.Dense(10, activation=tf.nn.softmax)])

model.compile(optimizer = 'adam',
              loss = 'sparse_categorical_crossentropy', metrics=['accuracy'])

model.fit(training_images, training_labels, epochs=5)



In [None]:
model.evaluate(test_images, test_labels)

classifications = model.predict(test_images)

print(classifications[0])

print(test_labels[0])

###Questão 1. Aumente para 1024 Neurônios. Qual é o impacto no tempo de treinamento e acurácia?



In [None]:
import tensorflow as tf
print(tf.__version__)

mnist = tf.keras.datasets.fashion_mnist

(training_images, training_labels) ,  (test_images, test_labels) = mnist.load_data()

training_images = training_images/255.0
test_images = test_images/255.0

model = tf.keras.models.Sequential([tf.keras.layers.Flatten(),
                                    tf.keras.layers.Dense(1024, activation=tf.nn.relu),
                                    tf.keras.layers.Dense(10, activation=tf.nn.softmax)])

model.compile(optimizer = 'adam',
              loss = 'sparse_categorical_crossentropy', metrics=['accuracy'])

model.fit(training_images, training_labels, epochs=5)

model.evaluate(test_images, test_labels)

classifications = model.predict(test_images)

print(classifications[0])

print(test_labels[0])



##Exercício 3: 

 

Vamos acrescentar mais uma camada densa, entre a camada de 512 e a camada de saída com 10 neurônios. Existe algum impacto nesse caso?


In [None]:
import tensorflow as tf
print(tf.__version__)

mnist = tf.keras.datasets.fashion_mnist

(training_images, training_labels) ,  (test_images, test_labels) = mnist.load_data()

training_images = training_images/255.0
test_images = test_images/255.0

model = tf.keras.models.Sequential([tf.keras.layers.Flatten(),
                                    tf.keras.layers.Dense(512, activation=tf.nn.relu),
                                    tf.keras.layers.Dense(256, activation=tf.nn.relu),
                                    tf.keras.layers.Dense(10, activation=tf.nn.softmax)])

model.compile(optimizer = 'adam',
              loss = 'sparse_categorical_crossentropy', metrics=['accuracy'])

model.fit(training_images, training_labels, epochs=5)

model.evaluate(test_images, test_labels)

classifications = model.predict(test_images)

print(classifications[0])
print(test_labels[0])

#Exercício 4: 

Vamos considerar o número de épocas de treinamento. Considere a rede original com 128 neurônios na camada interna. Qual é o impacto?

Tente 15, 30 épocas.


In [None]:
import tensorflow as tf
print(tf.__version__)

mnist = tf.keras.datasets.fashion_mnist

(training_images, training_labels) ,  (test_images, test_labels) = mnist.load_data()

training_images = training_images/255.0
test_images = test_images/255.0

model = tf.keras.models.Sequential([tf.keras.layers.Flatten(),
                                    tf.keras.layers.Dense(128, activation=tf.nn.relu),
                                    tf.keras.layers.Dense(10, activation=tf.nn.softmax)])

model.compile(optimizer = 'adam',
              loss = 'sparse_categorical_crossentropy', metrics=['accuracy'])

model.fit(training_images, training_labels, epochs=15)

model.evaluate(test_images, test_labels)

classifications = model.predict(test_images)

print(classifications[34])
print(test_labels[34])

#Exercício 5: 

Dados não normalizados. Entre as imagens sem normalização (sem dividir por 255). Qual é o impacto?

In [None]:
import tensorflow as tf
print(tf.__version__)
mnist = tf.keras.datasets.fashion_mnist
(training_images, training_labels), (test_images, test_labels) = mnist.load_data()
#training_images=training_images/255.0
#test_images=test_images/255.0
model = tf.keras.models.Sequential([
  tf.keras.layers.Flatten(),
  tf.keras.layers.Dense(512, activation=tf.nn.relu),
  tf.keras.layers.Dense(10, activation=tf.nn.softmax)
])
model.compile(optimizer='adam', loss='sparse_categorical_crossentropy', metrics=['accuracy'])
model.fit(training_images, training_labels, epochs=5)
model.evaluate(test_images, test_labels)
classifications = model.predict(test_images)
print(classifications[0])
print(test_labels[0])

#Exercício 6: Callback para interrupção do treinamento.  

Aqui mostramos como interromper o treinamento caso a métrica escolhida (no exemplo, a função de perdas) fique menor que um determinado valor. Basta usar o recurso do ``callback``. 

In [None]:
import tensorflow as tf
print(tf.__version__)

class myCallback(tf.keras.callbacks.Callback):
  def on_epoch_end(self, epoch, logs={}):
    if(logs.get('loss')<0.4):
      print("\nAtingiu loss < 0.4, cancelando treinamento")
      self.model.stop_training = True

callbacks = myCallback()
mnist = tf.keras.datasets.fashion_mnist
(training_images, training_labels), (test_images, test_labels) = mnist.load_data()
training_images=training_images/255.0
test_images=test_images/255.0
model = tf.keras.models.Sequential([
  tf.keras.layers.Flatten(),
  tf.keras.layers.Dense(512, activation=tf.nn.relu),
  tf.keras.layers.Dense(10, activation=tf.nn.softmax)
])
model.compile(optimizer='adam', loss='sparse_categorical_crossentropy')
model.fit(training_images, training_labels, epochs=5, callbacks=[callbacks])
