# Deep Learning with Python
2.1 A first look at a neural network

Antes de mais nada os notebooks aqui mostrado tiveram como base/foram retirados dos seguintes repositórios: 
 > https://github.com/fchollet/deep-learning-with-python-notebooks 
 
 
 > https://github.com/cdfmlr/Deep-Learning-with-Python-Notebooks
 
 Sugiro fortemente que consultem os códigos originais e em caso de dúvida podem me contatar para conversarmos. 

Vamos começar nossos estudos práticos de DeepLearning construindo nossa primeira rede neural. Para isso vamos utilizar a base de dados do MNIST, um clássico dataset na comunidade de machinelearning. São diversas imagens em escala de cinza escritas a mão de digitos de 0 a 9 no tamanho de 28x28 pixels. O conjunto tem 60000 imagens de treino e mais 10000 de teste. 
Para mais informações sobre o conjunto: http://yann.lecun.com/exdb/mnist/

In [1]:
# Carregando a base de dados MNIST no Keras
from tensorflow.keras.datasets import mnist
(train_images, train_labels), (test_images, test_labels) = mnist.load_data()

In [2]:
#Vamos dar uma olhada no tamanho dos dados de treinamento
print(train_images.shape)
print(train_labels.shape)
train_labels

(60000, 28, 28)
(60000,)


array([5, 0, 4, ..., 5, 6, 8], dtype=uint8)

In [3]:
#Vamos dar uma olhada no tamanho dos dados de teste
print(test_images.shape)
print(test_labels.shape)
test_labels

(10000, 28, 28)
(10000,)


array([7, 2, 1, ..., 4, 5, 6], dtype=uint8)

Nosso fluxo de trabalho será o seguinte: primeiro apresentaremos nossa rede neural com os dados de treinamento, train_images e train_labels. A rede aprenderá a associar imagens e rótulos. Finalmente, pediremos à rede para produzir previsões para test_images e verificaremos se essas previsões correspondem aos rótulos de test_labels.

In [4]:
from tensorflow.keras import models
from tensorflow.keras import layers

network = models.Sequential()
network.add(layers.Dense(512, activation='relu', input_shape=(28 * 28, )))
network.add(layers.Dense(10, activation='softmax'))

In [5]:
network.compile(loss="categorical_crossentropy",
                optimizer='rmsprop',
                metrics=['accuracy'])

Antes do treinamento, é preciso passar os dados por um pré-processamento, de forma a remodelar essa informação para que a rede neural compreenda, ou seja, deixar em dimensões compreesíveis para a rede. Nesse caso dimensionando-os de forma que todos os valores fiquem no intervalo [0, 1]. Anteriormente, nossas imagens de treinamento, por exemplo, eram armazenadas em uma matriz de forma (60000, 28, 28) do tipo uint8 com valores no intervalo [0, 255]. Nós o transformamos em uma matriz float32 de forma (60000, 28 * 28) com valores entre 0 e 1.


In [6]:
train_images = train_images.reshape((60000, 28 * 28))
train_images = train_images.astype('float32') / 255

test_images = test_images.reshape((10000, 28 * 28))
test_images = test_images.astype('float32') / 255

In [7]:
from tensorflow.keras.utils import to_categorical

train_labels = to_categorical(train_labels)
test_labels = to_categorical(test_labels)

Agora estamos prontos para treinar nossa rede! Aqui nós vamos "fitar" o modelo, ou seja, ajudar a rede que construímos, fazendo o "fit" do modelo aos dados de treinamento que temos.


In [8]:
network.fit(train_images, train_labels, epochs=5, batch_size=128)

Train on 60000 samples
Epoch 1/5
Epoch 2/5
Epoch 3/5
Epoch 4/5
Epoch 5/5


<tensorflow.python.keras.callbacks.History at 0x28fef89b6c8>

Duas quantidades estão sendo exibidas durante o treinamento: a "perda" (loss) da rede nos dados de treinamento e a acurácia (accurancy) da rede nos dados de treinamento.

Alcançamos rapidamente uma acurácia de 0,989 (ou seja, 98,9%) nos dados de treinamento. Agora vamos verificar se nosso modelo tem um bom desempenho no conjunto de teste também:

In [9]:
test_loss, test_acc = network.evaluate(test_images, test_labels, verbose=2)   
# Colocamos o paramêtro verbose=2 para evitar um processo muito grande que enche a tela com "=". Podemos ver aqui:  https://github.com/tensorflow/tensorflow/issues/32286
print('test_acc:', test_acc)

10000/10000 - 1s - loss: 0.0654 - accuracy: 0.9814
test_acc: 0.9814


Massa demais!! Conseguimos então uma acurácia de 98,14% no conjunto de teste. Um valor muito bom!👏🏾👏🏾👏🏾👏🏾 Mas vamos continuar nossos estudos! 