# <font color='blue'>Python para Ciência de Dados</font>
# <font color='blue'>Capítulo 13</font>


In [None]:
# Versão da Linguagem Python
from platform import python_version
print('Versão da Linguagem Python usada neste Jupyter Notebook:', python_version())

# Introdução Machine Learning

## Regressão

### Regressão Linear Simples

In [None]:
from sklearn.linear_model import LinearRegression

# Dados de exemplo
X = [[1], [2], [3], [4], [5]]
y = [2, 4, 5, 4, 5]

# Criar e treinar o modelo
modelo = LinearRegression()
modelo.fit(X, y)

# Prever novos valores
novos_valores = [[6], [7]]
predicoes = modelo.predict(novos_valores)
print(predicoes)

### Regressão Linear Múltipla

In [None]:
# Dados de exemplo
X = [[1, 2], [2, 3], [3, 4], [4, 5], [5, 6]]
y = [2, 4, 5, 4, 5]

# Criar e treinar o modelo
modelo = LinearRegression()
modelo.fit(X, y)

# Prever novos valores
novos_valores = [[6, 7], [7, 8]]
predicoes = modelo.predict(novos_valores)
print(predicoes)

### Regressão Ridge

In [None]:
from sklearn.linear_model import Ridge

# Dados de exemplo
X = [[1], [2], [3], [4], [5]]
y = [2, 4, 5, 4, 5]

# Criar e treinar o modelo
modelo = Ridge(alpha=0.1) # Alpha é o parâmetro de regularização
modelo.fit(X, y)

# Prever novos valores
novos_valores = [[6], [7]]
predicoes = modelo.predict(novos_valores)
print(predicoes)


### Regressão Lasso

In [None]:
from sklearn.linear_model import Lasso

# Dados de exemplo
X = [[1], [2], [3], [4], [5]]
y = [2, 4, 5, 4, 5]

# Criar e treinar o modelo
modelo = Lasso(alpha=0.1) # Alpha é o parâmetro de regularização
modelo.fit(X, y)

# Prever novos valores
novos_valores = [[6], [7]]
predicoes = modelo.predict(novos_valores)
print(predicoes)


## Classificação

### Naive Bayes

In [None]:
from sklearn.naive_bayes import GaussianNB
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
from sklearn.metrics import accuracy_score

# Carregar conjunto de dados de exemplo
iris = load_iris()
X = iris.data
y = iris.target

# Dividir dados em conjunto de treinamento e teste
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=0)

# Criar e treinar o modelo
modelo = GaussianNB()
modelo.fit(X_train, y_train)

# Fazer previsões
predicoes = modelo.predict(X_test)

# Avaliar a precisão do modelo
precisao = accuracy_score(y_test, predicoes)
print("Precisão:", precisao)

In [None]:
### Árvores de Decisão

In [None]:
from sklearn.tree import DecisionTreeClassifier

# Criar e treinar o modelo
modelo = DecisionTreeClassifier()

modelo.fit(X_train, y_train)

# Fazer previsões
predicoes = modelo.predict(X_test)

# Avaliar a precisão do modelo
precisao = accuracy_score(y_test, predicoes)
print("Precisão:", precisao)

### Random Forest

In [None]:
from sklearn.ensemble import RandomForestClassifier

# Criar e treinar o modelo
modelo = RandomForestClassifier()
modelo.fit(X_train, y_train)

# Fazer previsões
predicoes = modelo.predict(X_test)

# Avaliar a precisão do modelo
precisao = accuracy_score(y_test, predicoes)
print("Precisão:", precisao)

### Gradient Boosting

In [None]:
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
from sklearn.metrics import accuracy_score
from sklearn.ensemble import GradientBoostingClassifier

# Carregar o conjunto de dados
iris = load_iris()
X = iris.data
y = iris.target

# Dividir o conjunto de dados em treino e teste
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# Criar e treinar o modelo Gradient Boosting
modelo = GradientBoostingClassifier(n_estimators=100, learning_rate=0.1, max_depth=3, random_state=42)
modelo.fit(X_train, y_train)

# Fazer previsões
previsoes = modelo.predict(X_test)

# Calcular a precisão do modelo
precisao = accuracy_score(y_test, previsoes)
print("Precisão:", precisao)

### XGBoost (Extreme Gradient Boosting) 

In [None]:
# Instalando a biblioteca xgboost
#!pip install xgboost

In [None]:
import xgboost as xgb
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
from sklearn.metrics import accuracy_score

# Carregar o conjunto de dados
iris = load_iris()
X = iris.data
y = iris.target

# Dividir o conjunto de dados em treino e teste
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# Criar o objeto DMatrix (necessário para o XGBoost)
dtrain = xgb.DMatrix(X_train, label=y_train)
dtest = xgb.DMatrix(X_test, label=y_test)

# Definir os parâmetros do modelo
parametros = {
 'max_depth': 3, # Profundidade máxima da árvore
 'eta': 0.3, # Taxa de aprendizado
 'objective': 'multi:softmax', # Função de perda para problemas de classificação multiclasse
 'num_class': 3 # Número de classes no conjunto de dados
}

# Treinar o modelo
num_round = 100
modelo = xgb.train(parametros, dtrain, num_round)

# Fazer previsões
previsoes = modelo.predict(dtest)

# Calcular a precisão do modelo
precisao = accuracy_score(y_test, previsoes)
print("Precisão:", precisao)

### Support Vector Machine (SVM)

In [None]:
from sklearn.svm import SVC

# Criar e treinar o modelo
modelo = SVC()
modelo.fit(X_train, y_train)

# Fazer previsões
predicoes = modelo.predict(X_test)

# Avaliar a precisão do modelo
precisao = accuracy_score(y_test, predicoes)
print("Precisão:", precisao)

### K-Nearest Neighbors (KNN)

In [None]:
from sklearn.neighbors import KNeighborsClassifier
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
from sklearn.metrics import accuracy_score

# Carregar o conjunto de dados Iris
iris = load_iris()
X = iris.data
y = iris.target

# Dividir os dados em conjunto de treinamento e teste
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# Criar e treinar o modelo KNN
modelo = KNeighborsClassifier(n_neighbors=5)  # k=5 (por exemplo)
modelo.fit(X_train, y_train)

# Fazer previsões
previsoes = modelo.predict(X_test)

# Calcular a precisão do modelo
precisao = accuracy_score(y_test, previsoes)
print("Precisão:", precisao)

### Rede Neural Artificial (ANN)

In [None]:
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
from sklearn.neural_network import MLPClassifier
from sklearn.metrics import accuracy_score

# Carregar o conjunto de dados Iris
iris = load_iris()
X = iris.data
y = iris.target

# Dividir os dados em conjunto de treinamento e teste
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# Pré-processamento dos dados: normalização
scaler = StandardScaler()
X_train_scaled = scaler.fit_transform(X_train)
X_test_scaled = scaler.transform(X_test)

# Criar e treinar o modelo de rede neural
modelo = MLPClassifier(hidden_layer_sizes=(10, 5), activation='relu', max_iter=1000, random_state=42)
modelo.fit(X_train_scaled, y_train)

# Fazer previsões
previsoes = modelo.predict(X_test_scaled)

# Calcular a precisão do modelo
precisao = accuracy_score(y_test, previsoes)
print("Precisão:", precisao)


## Deep Learning

### CNNs - Redes Neurais Convolucionais

In [None]:
# Instalando a biblioteca tensorflow
#!pip install tensorflow

In [None]:
import tensorflow as tf
from tensorflow.keras import datasets, layers, models
import matplotlib.pyplot as plt

# Carregar e preparar o conjunto de dados MNIST
(train_images, train_labels), (test_images, test_labels) = datasets.mnist.load_data()
train_images = train_images.reshape((60000, 28, 28, 1))
test_images = test_images.reshape((10000, 28, 28, 1))
train_images, test_images = train_images / 255.0, test_images / 255.0

# Definir a arquitetura da CNN
modelo = models.Sequential([
    layers.Conv2D(32, (3, 3), activation='relu', input_shape=(28, 28, 1)),
    layers.MaxPooling2D((2, 2)),
    layers.Conv2D(64, (3, 3), activation='relu'),
    layers.MaxPooling2D((2, 2)),
    layers.Conv2D(64, (3, 3), activation='relu'),
    layers.Flatten(),
    layers.Dense(64, activation='relu'),
    layers.Dense(10, activation='softmax')
])

# Compilar o modelo
modelo.compile(optimizer='adam',
              loss='sparse_categorical_crossentropy',
              metrics=['accuracy'])

# Treinar o modelo
history = modelo.fit(train_images, train_labels, epochs=5, 
                    validation_data=(test_images, test_labels))

# Avaliar o modelo
test_loss, test_acc = modelo.evaluate(test_images,  test_labels, verbose=2)
print('\nTest accuracy:', test_acc)

# Plotar a acurácia de treinamento e validação ao longo do tempo
plt.plot(history.history['accuracy'], label='accuracy')
plt.plot(history.history['val_accuracy'], label = 'val_accuracy')
plt.xlabel('Epoch')
plt.ylabel('Accuracy')
plt.ylim([0, 1])
plt.legend(loc='lower right')
plt.show()


### RNNs - Redes Neurais Recorrentes

In [None]:
import tensorflow as tf
from tensorflow.keras import layers, Sequential
import numpy as np

# Dados de exemplo
# Suponhamos que temos uma sequência de números de 0 a 9
# Queremos treinar a RNN para prever o próximo número na sequência
dados = np.array([i for i in range(10)])
dados = np.reshape(dados, (1, 10, 1))  # Formato de entrada para a RNN: (número de amostras, comprimento da sequência, número de recursos)

# Definir modelo RNN
modelo = Sequential([
    layers.SimpleRNN(50, input_shape=(10, 1), return_sequences=True),  # Camada RNN com 50 unidades
    layers.Dense(1)  # Camada densa para prever o próximo número
])

# Compilar o modelo
modelo.compile(optimizer='adam', loss='mse')

# Treinar o modelo
modelo.fit(dados, dados, epochs=100, verbose=1)

# Testar o modelo
previsoes = modelo.predict(dados)
print("Previsões:", previsoes)


### GANs -Redes Generativas Adversariais 

Rede Generativa Adversarial (GAN) usando a biblioteca TensorFlow para gerar imagens semelhantes ao conjunto de dados CIFAR-10:

In [None]:
# Exemplo de treinamento de uma GAN sobre o dataset MNIST
from numpy import expand_dims
from numpy import zeros
from numpy import ones
from numpy import vstack
from numpy.random import randn
from numpy.random import randint
from keras.datasets.mnist import load_data
from keras.optimizers import Adam
from keras.models import Sequential
from keras.layers import Dense
from keras.layers import Reshape
from keras.layers import Flatten
from keras.layers import Conv2D
from keras.layers import Conv2DTranspose
from keras.layers import LeakyReLU
from keras.layers import Dropout
from matplotlib import pyplot

# Definindo o modelo discriminador
def define_discriminator(in_shape=(28,28,1)):
	model = Sequential()
	model.add(Conv2D(64, (3,3), strides=(2, 2), padding='same', input_shape=in_shape))
	model.add(LeakyReLU(alpha=0.2))
	model.add(Dropout(0.4))
	model.add(Conv2D(64, (3,3), strides=(2, 2), padding='same'))
	model.add(LeakyReLU(alpha=0.2))
	model.add(Dropout(0.4))
	model.add(Flatten())
	model.add(Dense(1, activation='sigmoid'))
	# Compilar o modelo
	opt = Adam(lr=0.0002, beta_1=0.5)
	model.compile(loss='binary_crossentropy', optimizer=opt, metrics=['accuracy'])
	return model

# Definindo o modelo gerador
def define_generator(latent_dim):
	model = Sequential()
	# Base para imagem 7x7
	n_nodes = 128 * 7 * 7
	model.add(Dense(n_nodes, input_dim=latent_dim))
	model.add(LeakyReLU(alpha=0.2))
	model.add(Reshape((7, 7, 128)))
	# Aumentando a resolucao para 14x14
	model.add(Conv2DTranspose(128, (4,4), strides=(2,2), padding='same'))
	model.add(LeakyReLU(alpha=0.2))
	# Aumentando a resolucao para 28x28
	model.add(Conv2DTranspose(128, (4,4), strides=(2,2), padding='same'))
	model.add(LeakyReLU(alpha=0.2))
	model.add(Conv2D(1, (7,7), activation='sigmoid', padding='same'))
	return model

# Definindo o modelo combinado de gerador e discriminador, para atualizacao do gerador
def define_gan(g_model, d_model):
	# tornar os pesos no discriminador não treináveis
	d_model.trainable = False
	# conectar os modelos
	model = Sequential()
	# adicionar o gerador
	model.add(g_model)
	# adicionar o discriminador
	model.add(d_model)
	# compilar o modelo
	opt = Adam(lr=0.0002, beta_1=0.5)
	model.compile(loss='binary_crossentropy', optimizer=opt)
	return model

# Carregando e preparando as imagens de treino do dataset mnist
def load_real_samples():
	# carregar o dataset mnist
	(trainX, _), (_, _) = load_data()
	# expandir para 3d, por ex. adicionar dimensão de canais
	X = expand_dims(trainX, axis=-1)
	# converter de ints não atribuidos para floats
	X = X.astype('float32')
	# escalar de [0,255] para [0,1]
	X = X / 255.0
	return X

# Selecionando amostras reais
def generate_real_samples(dataset, n_samples):
	# escolher instancias randomicamente
	ix = randint(0, dataset.shape[0], n_samples)
	# recuperar imagens selecionadas
	X = dataset[ix]
	# gerar rótulos de classe 'real' (1)
	y = ones((n_samples, 1))
	return X, y

# Gerando pontos no espaço latente como entrada para o gerador
def generate_latent_points(latent_dim, n_samples):
	# gerar pontos no espaço latente
	x_input = randn(latent_dim * n_samples)
	# remodelar (reshape) em um batch de entradas para a rede
	x_input = x_input.reshape(n_samples, latent_dim)
	return x_input

# Usando o gerador para gerar n exemplos falsos, com rótulos de classe
def generate_fake_samples(g_model, latent_dim, n_samples):
	# gerar pontos no espaço latente
	x_input = generate_latent_points(latent_dim, n_samples)
	# prever resultados
	X = g_model.predict(x_input)
	# criar rótulos de classe 'fake' (0)
	y = zeros((n_samples, 1))
	return X, y

# Criando e salvando um gráfico de imagens geradas (tons de cinza invertidos)
def save_plot(examples, epoch, n=10):
	# plotar imagens
	for i in range(n * n):
		# definir subplot
		pyplot.subplot(n, n, 1 + i)
		# desligar axis
		pyplot.axis('off')
		# plotar dados brutos de pixel
		pyplot.imshow(examples[i, :, :, 0], cmap='gray_r')
	# salvar plot em arquivo
	filename = 'generated_plot_e%03d.png' % (epoch+1)
	pyplot.savefig(filename)
	pyplot.close()

# Avaliando o discriminador, plotando as imagens geradas e salvando o modelo gerador
def summarize_performance(epoch, g_model, d_model, dataset, latent_dim, n_samples=100):
	# preparar amostras reais
	X_real, y_real = generate_real_samples(dataset, n_samples)
	# avaliar o discriminador em exemplos reais
	_, acc_real = d_model.evaluate(X_real, y_real, verbose=0)
	# preparar amostras falsas
	x_fake, y_fake = generate_fake_samples(g_model, latent_dim, n_samples)
	# avaliar o discriminador em exemplos falsos
	_, acc_fake = d_model.evaluate(x_fake, y_fake, verbose=0)
	# resumir o desempenho do discriminador
	print('>Accuracy real: %.0f%%, fake: %.0f%%' % (acc_real*100, acc_fake*100))
	# savar plot
	save_plot(x_fake, epoch)
	# salve o arquivo de bloco do modelo do gerador
	filename = 'generator_model_%03d.h5' % (epoch + 1)
	g_model.save(filename)

# Treinando o gerador e o discriminador
def train(g_model, d_model, gan_model, dataset, latent_dim, n_epochs=100, n_batch=256):
	bat_per_epo = int(dataset.shape[0] / n_batch)
	half_batch = int(n_batch / 2)
	# enumerar epochs manualmente
	for i in range(n_epochs):
		# enumerar batches sobre o conjunto de treino
		for j in range(bat_per_epo):
			# obter amostras 'reais' selecionadas aleatoriamente
			X_real, y_real = generate_real_samples(dataset, half_batch)
			# gerar exemplos 'falsos'
			X_fake, y_fake = generate_fake_samples(g_model, latent_dim, half_batch)
			# criar conjunto de treinamento para o discriminador
			X, y = vstack((X_real, X_fake)), vstack((y_real, y_fake))
			# atualizar pesos do modelo discriminador
			d_loss, _ = d_model.train_on_batch(X, y)
			# preparar pontos no espaco latente como entrada para o gerador
			X_gan = generate_latent_points(latent_dim, n_batch)
			# crie rotulos invertidos para as amostras falsas
			y_gan = ones((n_batch, 1))
			# atualize o gerador atraves dos erros do discriminador
			g_loss = gan_model.train_on_batch(X_gan, y_gan)
			# resumir a perda neste batch
			print('>%d, %d/%d, d=%.3f, g=%.3f' % (i+1, j+1, bat_per_epo, d_loss, g_loss))
		# avaliar o desempenho do modelo, as vezes
		if (i+1) % 10 == 0:
			summarize_performance(i, g_model, d_model, dataset, latent_dim)

# Tamanho do espaço latente
latent_dim = 100
# Criando o discriminador
d_model = define_discriminator()
# Criando o gerador
g_model = define_generator(latent_dim)
# Criando a GAN
gan_model = define_gan(g_model, d_model)
# Carregando os dados de imagem
dataset = load_real_samples()
# Treinando o modelo
train(g_model, d_model, gan_model, dataset, latent_dim)

## Fim