# <font color='blue'>Data Science Academy</font>
# <font color='blue'>Deep Learning I</font>

# Deep Neural Networks com TensorFlow 
## Regressão

![TensorFlow](images/tensorflow.png "TensorFlow")

TensorFlow é uma biblioteca de software de código aberto para aprendizagem de máquinas em vários tipos de tarefas de compreensão de percepção e linguagem. Atualmente, ele é usado tanto para pesquisa quanto para produção por diferentes equipes em muitos produtos comerciais do Google, como reconhecimento de fala, Gmail, Google Photos e pesquisas, muitas das quais anteriormente utilizaram seu antecessor DistBelief. O TensorFlow foi originalmente desenvolvido pela equipe do Google Brain para fins de pesquisa e produção do Google e posteriormente lançado sob a licença de código aberto Apache 2.0 em 9 de novembro de 2015.

* [TensorFlow Homepage](https://www.tensorflow.org/)
* [TensorFlow GitHub](https://github.com/tensorflow/tensorflow)

In [1]:
# Para atualizar um pacote, execute o comando abaixo no terminal ou prompt de comando:
# pip install -U nome_pacote

# Para instalar a versão exata de um pacote, execute o comando abaixo no terminal ou prompt de comando:
# pip install nome_pacote==versão_desejada

# Depois de instalar ou atualizar o pacote, reinicie o jupyter notebook.

In [2]:
# Instala o pacote watermark. 
# Esse pacote é usado para gravar as versões de outros pacotes usados neste jupyter notebook.
!pip install -q -U watermark

In [3]:
# Imports
import tensorflow as tf
import numpy as np
import pandas as pd
import keras
import sklearn

Using TensorFlow backend.


In [4]:
# Versões dos pacotes usados neste jupyter notebook
%reload_ext watermark
%watermark -a "Data Science Academy" --iversions

numpy      1.18.2
keras      2.3.1
pandas     1.0.3
tensorflow 2.1.0
sklearn    0.22.2
Data Science Academy


# Usando TensorFlow

TensorFlow é uma API de matemática de baixo nível, semelhante ao [Numpy] (http://www.numpy.org/). No entanto, ao contrário de Numpy, TensorFlow é construído para aprendizagem profunda. O TensorFlow funciona permitindo que você defina grafos de computação com o Python. O TensorFlow compila esses grafos de computação em um código C ++ / [CUDA] (https://developer.nvidia.com/cuda-zone) altamente eficiente.

Neste exercício, seu trabalho é criar as camadas da rede neural, necessárias para construir o modelo de regressão, usando TensorFlow e Keras. Usaremos o dataset auto-mpg.csv e nosso objetivo é prever o MPG (Milhas por Galão - algo similar a Km/Litro) dos automóveis. Por se tratar de um valor numérico, regressão é a melhor solução nesse caso!

### Funções de Transformação (função de apoio para construção do modelo)

In [5]:
# Função para preencher os valores NA
def missing_median(df, name):
    med = df[name].median()
    df[name] = df[name].fillna(med)
    
# Converte um dataframe do Pandas para inputs x,y que o TensorFlow precisa
def to_xy(df, target):
    result = []
    for x in df.columns:
        if x != target:
            result.append(x)
    
    # Descubrindo o tipo da coluna de destino.  
    target_type = df[target].dtypes
    target_type = target_type[0] if hasattr(target_type, '__iter__') else target_type
    
    # Codificação. TensorFlow gosta de 32 bits.
    if target_type in (np.int64, np.int32):
        # Classificação
        dummies = pd.get_dummies(df[target])
        return df.values.astype('float32'), dummies.values.astype('float32')
    else:
        # Regressão
        return df.values.astype('float32'), df[target].astype('float32')

# TensorFlow Regression: MPG

Este exemplo mostra como codificar o conjunto de dados MPG para regressão. Isso é um pouco mais complexo que classificação, porque:

* A entrada tem valores numéricos e categóricos
* A entrada tem valores em falta (missing)

Para codificar valores categóricos que fazem parte do vetor de características, use as funções de ajuda acima. 

In [6]:
# Imports
from keras.models import Sequential
from keras.layers.core import Dense, Activation
import pandas as pd
import numpy as np
from sklearn import metrics
import io
import os
import requests

# Define o PATH onde estão os dados
path = "./data"

# Carrega o dataset
filename_read = os.path.join(path,"auto-mpg.csv")

# Preenche com o valor NA quando não houver dados na coluna
df = pd.read_csv(filename_read, na_values = ['NA','?'])

# Separa a variável name
cars = df['name']

# A variável name não é relevante no dataset. Removemos.
df.drop('name', 1, inplace = True)

# Preenchemos os valores NA com a mediana da coluna horsepower
missing_median(df, 'horsepower')

# Convertemos o input para x e y
x,y = to_xy(df,"mpg")

In [7]:
# Construindo a rede neural
model = Sequential()
model.add(??)
model.add(??)
model.compile(loss = 'mean_squared_error', optimizer = 'adam')
model.fit(x,y,verbose = 2, epochs = 100)

Epoch 1/100
 - 0s - loss: 765.3448
Epoch 2/100
 - 0s - loss: 236.4741
Epoch 3/100
 - 0s - loss: 149.4197
Epoch 4/100
 - 0s - loss: 148.1935
Epoch 5/100
 - 0s - loss: 140.5962
Epoch 6/100
 - 0s - loss: 138.3917
Epoch 7/100
 - 0s - loss: 136.9273
Epoch 8/100
 - 0s - loss: 136.1436
Epoch 9/100
 - 0s - loss: 135.5189
Epoch 10/100
 - 0s - loss: 133.7709
Epoch 11/100
 - 0s - loss: 132.3421
Epoch 12/100
 - 0s - loss: 130.6304
Epoch 13/100
 - 0s - loss: 129.8421
Epoch 14/100
 - 0s - loss: 128.7998
Epoch 15/100
 - 0s - loss: 126.5587
Epoch 16/100
 - 0s - loss: 124.8806
Epoch 17/100
 - 0s - loss: 123.3630
Epoch 18/100
 - 0s - loss: 122.4131
Epoch 19/100
 - 0s - loss: 120.6744
Epoch 20/100
 - 0s - loss: 118.5817
Epoch 21/100
 - 0s - loss: 116.7718
Epoch 22/100
 - 0s - loss: 115.1067
Epoch 23/100
 - 0s - loss: 114.1764
Epoch 24/100
 - 0s - loss: 111.5940
Epoch 25/100
 - 0s - loss: 110.3065
Epoch 26/100
 - 0s - loss: 109.0334
Epoch 27/100
 - 0s - loss: 106.6939
Epoch 28/100
 - 0s - loss: 106.2363
E

<keras.callbacks.callbacks.History at 0x7f9be8175b50>

Em seguida, iremos realizar previsões reais. Essas previsões são atribuídas à variável ** pred **. Estas são todas as previsões MPG da rede neural. Observe que esta é uma matriz 2D. Você sempre pode ver as dimensões do que é retornado ao imprimir ** pred.shape **. As redes neurais podem retornar valores múltiplos, então o resultado é sempre uma matriz. Aqui, a rede neural retorna apenas 1 valor por previsão (existem 398 carros, portanto, 398 previsões). No entanto, é necessária uma matriz 2D porque a rede neural possui o potencial de retornar mais de um valor.

In [8]:
pred = model.predict(x)
print("Shape: {}".format(pred.shape))
print(pred)

Shape: (398, 1)
[[11.8909445]
 [ 8.27349  ]
 [ 9.999595 ]
 [11.232257 ]
 [11.606978 ]
 [ 4.807285 ]
 [ 1.9780116]
 [ 3.0549998]
 [ 2.4784694]
 [ 4.9185557]
 [ 3.7767901]
 [ 8.186061 ]
 [ 3.6812015]
 [-7.646437 ]
 [24.652191 ]
 [18.98619  ]
 [17.910843 ]
 [16.933569 ]
 [24.818453 ]
 [23.262905 ]
 [27.499138 ]
 [25.500208 ]
 [25.789005 ]
 [22.465063 ]
 [17.347752 ]
 [13.447936 ]
 [17.193153 ]
 [16.020023 ]
 [20.48674  ]
 [25.006979 ]
 [21.556152 ]
 [23.774158 ]
 [24.081476 ]
 [13.566052 ]
 [20.194427 ]
 [17.02229  ]
 [17.17437  ]
 [18.647598 ]
 [12.288619 ]
 [ 9.060206 ]
 [12.031119 ]
 [14.878108 ]
 [14.182021 ]
 [11.159148 ]
 [14.096633 ]
 [13.277059 ]
 [22.397142 ]
 [16.870102 ]
 [15.708083 ]
 [22.265387 ]
 [22.922956 ]
 [27.271952 ]
 [25.721529 ]
 [26.09793  ]
 [25.160667 ]
 [23.296429 ]
 [24.579023 ]
 [24.37133  ]
 [24.82638  ]
 [26.674543 ]
 [22.232203 ]
 [22.507551 ]
 [12.84061  ]
 [ 8.704223 ]
 [15.5424185]
 [11.977748 ]
 [13.491691 ]
 [ 6.9024234]
 [14.806731 ]
 [14.289126 ]
 [ 8

Gostaríamos de ver quão boas são essas previsões. Sabemos qual é o MPG correto para cada carro, então podemos medir a proximidade da rede neural.

In [9]:
# Usamos a métrica de erro RMSE. O RMSE é comum para a regressão.
score = np.sqrt(metrics.mean_squared_error(pred,y))
print("Final score (RMSE): {}".format(score))

Final score (RMSE): 5.448952674865723


Isso significa que, em média, as previsões estavam dentro de +/- 6,24 valores do valor correto. Isso não é muito bom, mas logo veremos como melhorá-lo.

Nós também podemos imprimir os primeiros 10 carros, com previsões e MPG real.

In [10]:
# Previsões
for i in range(10):
    print("{}. Nome do Carro: {}, MPG Real: {}, MPG Previsto: {}".format(i+1,cars[i],y[i],pred[i]))

1. Nome do Carro: chevrolet chevelle malibu, MPG Real: 18.0, MPG Previsto: [11.8909445]
2. Nome do Carro: buick skylark 320, MPG Real: 15.0, MPG Previsto: [8.27349]
3. Nome do Carro: plymouth satellite, MPG Real: 18.0, MPG Previsto: [9.999595]
4. Nome do Carro: amc rebel sst, MPG Real: 16.0, MPG Previsto: [11.232257]
5. Nome do Carro: ford torino, MPG Real: 17.0, MPG Previsto: [11.606978]
6. Nome do Carro: ford galaxie 500, MPG Real: 15.0, MPG Previsto: [4.807285]
7. Nome do Carro: chevrolet impala, MPG Real: 14.0, MPG Previsto: [1.9780116]
8. Nome do Carro: plymouth fury iii, MPG Real: 14.0, MPG Previsto: [3.0549998]
9. Nome do Carro: pontiac catalina, MPG Real: 14.0, MPG Previsto: [2.4784694]
10. Nome do Carro: amc ambassador dpl, MPG Real: 15.0, MPG Previsto: [4.9185557]


# Carregando/Salvando o Modelo Treinado

Quando a rede neural é criada, devemos especificar um diretório no qual a rede neural é salva. Muitas vezes, especificamos esse diretório para que o treinamento possa começar de novo. Esta definição é realizada chamando o método ** get_model_dir ** com o segundo parâmetro igual a TRUE. O código abaixo treina uma rede neural do MPG, exatamente como antes, salva e depois carrega para ser reutilizado.

In [11]:
from keras.models import Sequential
from keras.layers.core import Dense, Activation
import pandas as pd
import io
import requests
import numpy as np
from sklearn import metrics
path = "./data"
save_path = "./save"

filename_read = os.path.join(path,"auto-mpg.csv")
df = pd.read_csv(filename_read, na_values = ['NA','?'])

cars = df['name']
df.drop('name',1,inplace=True)
missing_median(df, 'horsepower')
x,y = to_xy(df,"mpg")
model = Sequential()
model.add(??)
model.add(??)
model.compile(??)
model.fit(x, y, verbose = 0, epochs = 100)

# Previsões
pred = model.predict(x)

# Usamos a métrica de erro RMSE. O RMSE é comum para a regressão.
score = np.sqrt(metrics.mean_squared_error(pred,y))
print("Score antes de salvar o modelo (RMSE): {}".format(score))

# Salvando a estrutura da rede em formato JSON (sem os pesos)
model_json = model.to_json()
with open(os.path.join(save_path,"network.json"), "w") as json_file:
    json_file.write(model_json)

# Salvando a estrutura da rede em formato YAML (sem os pesos)
model_yaml = model.to_yaml()
with open(os.path.join(save_path,"network.yaml"), "w") as yaml_file:
    yaml_file.write(model_yaml)

# Salvando a rede inteira no formato HDF5 (salvando todos os componentes da rede, incluindo os pesos)
model.save(os.path.join(save_path,"network.h5"))

Score antes de salvar o modelo (RMSE): 12.786953926086426


Agora recarregamos a rede e realizamos outra previsão. O RMSE deve corresponder ao anterior, exatamente se a rede neural foi realmente salva e recarregada.

In [12]:
from keras.models import load_model
model2 = load_model(os.path.join(save_path,"network.h5"))
score = np.sqrt(metrics.mean_squared_error(pred, y))
print("Score depois de carregar o modelo salvo (RMSE): {}".format(score))

Score depois de carregar o modelo salvo (RMSE): 12.786953926086426


# Fim