## <font color='blue'>AutoML em Python</font>


# <font color='blue'>Machine Learning Automation</font>
# <font color='blue'>AutoML com Python - AutoKeras</font>


## AutoML - Parte 1

## Fonte de Dados

https://scikit-learn.org/stable/modules/generated/sklearn.datasets.fetch_california_housing.html

## Instalando e Carregando Pacotes

In [1]:
# Versão da Linguagem Python
from platform import python_version
print('Versão da Linguagem Python Usada Neste Jupyter Notebook:', python_version())

Versão da Linguagem Python Usada Neste Jupyter Notebook: 3.12.4


In [2]:
# Para atualizar um pacote, execute o comando abaixo no terminal ou prompt de comando:
# pip install -U nome_pacote

# Para instalar a versão exata de um pacote, execute o comando abaixo no terminal ou prompt de comando:
# !pip install nome_pacote==versão_desejada

# Depois de instalar ou atualizar o pacote, reinicie o jupyter notebook.

# Instala o pacote watermark. 
# Esse pacote é usado para gravar as versões de outros pacotes usados neste jupyter notebook.
# !pip install -q watermark

In [5]:
# Instala o autokeras
!pip install autokeras


^C


Collecting autokeras
  Downloading autokeras-2.0.0-py3-none-any.whl.metadata (5.8 kB)
Collecting keras-tuner>=1.4.0 (from autokeras)
  Downloading keras_tuner-1.4.7-py3-none-any.whl.metadata (5.4 kB)
Collecting keras-nlp>=0.8.0 (from autokeras)
  Downloading keras_nlp-0.15.1-py3-none-any.whl.metadata (6.7 kB)
Collecting keras>=3.0.0 (from autokeras)
  Downloading keras-3.5.0-py3-none-any.whl.metadata (5.8 kB)
Collecting dm-tree (from autokeras)
  Downloading dm_tree-0.1.8-cp312-cp312-win_amd64.whl.metadata (2.0 kB)
Collecting absl-py (from keras>=3.0.0->autokeras)
  Downloading absl_py-2.1.0-py3-none-any.whl.metadata (2.3 kB)
Collecting namex (from keras>=3.0.0->autokeras)
  Downloading namex-0.0.8-py3-none-any.whl.metadata (246 bytes)
Collecting optree (from keras>=3.0.0->autokeras)
  Downloading optree-0.12.1-cp312-cp312-win_amd64.whl.metadata (48 kB)
     ---------------------------------------- 0.0/48.7 kB ? eta -:--:--
     -------- ------------------------------- 10.2/48.7 kB ? e

In [6]:
# Filtro de warnings
import warnings
warnings.simplefilter(action='ignore', category=FutureWarning)
warnings.simplefilter(action='ignore', category=UserWarning)

In [7]:
# Imports
import tensorflow as tf
import autokeras as ak
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt 
import seaborn as sns
import sklearn
from sklearn.datasets import fetch_california_housing
from sklearn.model_selection import train_test_split
%matplotlib inline

ImportError: cannot import name 'pywrap_tensorflow' from 'tensorflow.python' (c:\Users\55839\anaconda3\Lib\site-packages\tensorflow\python\__init__.py)

In [None]:
# Versões dos pacotes usados neste jupyter notebook
%reload_ext watermark
%watermark -a "Ricardo Roberto de Lima" --iversions

## Carga e Exploração dos Dados

In [None]:
# Carrega os dados
dataset = fetch_california_housing()

In [None]:
# Elementos dos dados
dataset.keys()

In [None]:
# Converte em dataframe
dados = pd.DataFrame(dataset.data, columns = dataset.feature_names)

In [None]:
# Extrai a variável target
target = pd.Series(dataset.target, name = 'MedPrice')

In [None]:
# Shape
dados.shape

In [None]:
# Tipos de dados
dados.dtypes

In [None]:
# Visualiza
dados.head()

In [None]:
# Resumo estatístico
pd.options.display.float_format = '{:,.2f}'.format
dados.describe()

In [None]:
# Verificando valores nulos
dados.isnull().any()

In [None]:
# Divisão em treino e teste
X_treino, X_teste, y_treino, y_teste = train_test_split(dados, target, test_size = 0.2, random_state = 42)

In [None]:
# Shape
print("Shape Atributos em Treino: {}".format(X_treino.shape))
print("Shape Target em Treino: {}".format(y_treino.shape))
print("Shape Atributos em Teste: {}".format(X_teste.shape))
print("Shape Target em Teste: {}".format(y_teste.shape))

## Modelagem

https://autokeras.com/structured_data_regressor/

In [None]:
# Cria o modelo
# Vamos tentar 10 modelos diferentes
regressor = ak.StructuredDataRegressor(max_trials = 10, overwrite = True)

Agora buscamos o modelo.

In [None]:
%%time
regressor.fit(x = X_treino, y = y_treino, batch_size = 1024)

## Avaliação do Modelo

In [None]:
# Previsões
predicted_y = regressor.predict(X_teste)
print(predicted_y)

In [None]:
# Calcula as métricas
test_loss, test_mse = regressor.evaluate(X_teste, y_teste, verbose = 0)
print('MSE em Teste: ', test_mse)

In [None]:
!pip install -q pydot

In [None]:
# Visualiza o melhor modelo
best_model = regressor.export_model()
tf.keras.utils.plot_model(best_model, show_shapes = True, expand_nested = True) 

## Customizando o Aprendizado do Modelo com EarlyStopping

In [None]:
# Cria o modelo
regressor = ak.StructuredDataRegressor(max_trials = 100)

In [None]:
# Cria o callback EarlyStopping para interromper o aprendizado quando encontrar o melhor modelo
callback = tf.keras.callbacks.EarlyStopping(monitor = 'val_loss', patience = 10) 

Agora buscamos o melhor modelo.

In [None]:
%%time
regressor.fit(x = X_treino, 
              y = y_treino, 
              epochs = 200,
              batch_size = 4096, 
              verbose = 2, 
              callbacks = [callback])

In [None]:
# Calcula as métricas
test_loss, test_mse = regressor.evaluate(X_teste, y_teste, verbose = 0)
print('MSE em Teste: ', test_mse)

In [None]:
# Visualiza o melhor modelo
best_model = regressor.export_model()
tf.keras.utils.plot_model(best_model, show_shapes = True, expand_nested = True) 

# Terminando o processo 