<a href="https://colab.research.google.com/github/juliaNogueiraC/Estudos-em-Machine-Learning/blob/main/deep_learning.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Redes Neurais


## Perceptron
O perceptron é a unidade básica de uma rede neural. É um modelo simples de uma rede neural com uma única camada, usado para tarefas de classificação binária.

In [1]:
from sklearn.datasets import make_classification
from sklearn.linear_model import Perceptron
from sklearn.model_selection import train_test_split
from sklearn.metrics import accuracy_score, classification_report

# Criar um conjunto de dados de exemplo
X, y = make_classification(n_samples=100, n_features=2, n_classes=2, random_state=0)

# Dividir os dados em conjunto de treinamento e teste
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=0)

# Criar e treinar o Perceptron
model = Perceptron()
model.fit(X_train, y_train)

# Fazer previsões e avaliar o modelo
y_pred = model.predict(X_test)
print('Acurácia:', accuracy_score(y_test, y_pred))
print('Relatório de Classificação:')
print(classification_report(y_test, y_pred))


ValueError: Number of informative, redundant and repeated features must sum to less than the number of total features

## Redes Feedforward
Redes neurais feedforward são compostas por camadas de neurônios onde as conexões são direcionadas e não cíclicas. Elas são usadas para tarefas de classificação e regressão.

In [2]:
import tensorflow as tf
from tensorflow.keras.datasets import mnist
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Dense, Flatten
from tensorflow.keras.utils import to_categorical

# Carregar e preparar o conjunto de dados MNIST
(x_train, y_train), (x_test, y_test) = mnist.load_data()
x_train, x_test = x_train / 255.0, x_test / 255.0  # Normalização
y_train, y_test = to_categorical(y_train), to_categorical(y_test)

# Construir o modelo
model = Sequential([
    Flatten(input_shape=(28, 28)),
    Dense(128, activation='relu'),
    Dense(10, activation='softmax')
])

# Compilar o modelo
model.compile(optimizer='adam',
              loss='categorical_crossentropy',
              metrics=['accuracy'])

# Treinar o modelo
model.fit(x_train, y_train, epochs=5, validation_split=0.2)

# Avaliar o modelo
test_loss, test_acc = model.evaluate(x_test, y_test, verbose=2)
print('\nAcurácia de Teste:', test_acc)


Downloading data from https://storage.googleapis.com/tensorflow/tf-keras-datasets/mnist.npz
Epoch 1/5
Epoch 2/5
Epoch 3/5
Epoch 4/5
Epoch 5/5
313/313 - 1s - loss: 0.0841 - accuracy: 0.9752 - 1s/epoch - 4ms/step

Acurácia de Teste: 0.9751999974250793


## Backpropagation
O backpropagation é um algoritmo usado para treinar redes neurais, ajustando os pesos das conexões com base no erro calculado na saída.

#  Redes Neurais Convolucionais (CNNs)
CNNs são usadas principalmente para processamento de imagens e têm camadas convolucionais que extraem características dos dados.

In [3]:
from tensorflow.keras.datasets import cifar10
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Conv2D, MaxPooling2D, Flatten, Dense
from tensorflow.keras.utils import to_categorical

# Carregar e preparar o conjunto de dados CIFAR-10
(x_train, y_train), (x_test, y_test) = cifar10.load_data()
x_train, x_test = x_train / 255.0, x_test / 255.0  # Normalização
y_train, y_test = to_categorical(y_train), to_categorical(y_test)

# Construir o modelo CNN
model = Sequential([
    Conv2D(32, (3, 3), activation='relu', input_shape=(32, 32, 3)),
    MaxPooling2D((2, 2)),
    Conv2D(64, (3, 3), activation='relu'),
    MaxPooling2D((2, 2)),
    Conv2D(64, (3, 3), activation='relu'),
    Flatten(),
    Dense(64, activation='relu'),
    Dense(10, activation='softmax')
])

# Compilar o modelo
model.compile(optimizer='adam',
              loss='categorical_crossentropy',
              metrics=['accuracy'])

# Treinar o modelo
model.fit(x_train, y_train, epochs=5, validation_split=0.2)

# Avaliar o modelo
test_loss, test_acc = model.evaluate(x_test, y_test, verbose=2)
print('\nAcurácia de Teste:', test_acc)


Downloading data from https://www.cs.toronto.edu/~kriz/cifar-10-python.tar.gz
Epoch 1/5
Epoch 2/5
Epoch 3/5
Epoch 4/5
Epoch 5/5
313/313 - 4s - loss: 0.9508 - accuracy: 0.6711 - 4s/epoch - 14ms/step

Acurácia de Teste: 0.6711000204086304


edes Neurais Convolucionais (CNNs) são uma classe poderosa de redes neurais projetadas para processar dados com estrutura de grade, como imagens. Elas utilizam camadas convolucionais para capturar características espaciais e temporais dos dados. Vou explicar os principais componentes e fornecer exemplos práticos de código para ilustrar como as CNNs funcionam.

Componentes das Redes Neurais Convolucionais
Camadas Convolucionais:

Aplicam filtros (ou kernels) para extrair características locais das imagens.
Cada filtro é treinado para detectar um padrão específico (como bordas, texturas, etc.).
Camadas de Pooling (Subsampling):

Reduzem a dimensão espacial das características extraídas, mantendo as informações mais importantes.
Tipicamente usam operações de max pooling ou average pooling.
Camadas de Flatten:

Transformam a matriz de características em um vetor unidimensional, preparando-a para a camada densa final.
Camadas Densas (Fully Connected):

Conectam todos os neurônios da camada anterior a todos os neurônios da camada atual.
Usadas para a classificação final ou regressão.
Exemplo Prático com CNNs
Vamos usar o conjunto de dados MNIST, que contém imagens de dígitos manuscritos, para construir e treinar uma CNN.

In [None]:
import tensorflow as tf
from tensorflow.keras.datasets import mnist
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Conv2D, MaxPooling2D, Flatten, Dense
from tensorflow.keras.utils import to_categorical

# Carregar e preparar o conjunto de dados MNIST
(x_train, y_train), (x_test, y_test) = mnist.load_data()
x_train, x_test = x_train / 255.0, x_test / 255.0  # Normalização
x_train = x_train.reshape(-1, 28, 28, 1)  # Adicionar dimensão de canal
x_test = x_test.reshape(-1, 28, 28, 1)
y_train, y_test = to_categorical(y_train), to_categorical(y_test)

# Construir o modelo CNN
model = Sequential([
    Conv2D(32, (3, 3), activation='relu', input_shape=(28, 28, 1)),
    MaxPooling2D((2, 2)),
    Conv2D(64, (3, 3), activation='relu'),
    MaxPooling2D((2, 2)),
    Conv2D(64, (3, 3), activation='relu'),
    Flatten(),
    Dense(64, activation='relu'),
    Dense(10, activation='softmax')
])

# Compilar o modelo
model.compile(optimizer='adam',
              loss='categorical_crossentropy',
              metrics=['accuracy'])

# Treinar o modelo
history = model.fit(x_train, y_train, epochs=5, validation_split=0.2)

# Avaliar o modelo
test_loss, test_acc = model.evaluate(x_test, y_test, verbose=2)
print('\nAcurácia de Teste:', test_acc)

# Plotar o histórico de treinamento
import matplotlib.pyplot as plt

plt.plot(history.history['accuracy'], label='Acurácia de Treinamento')
plt.plot(history.history['val_accuracy'], label='Acurácia de Validação')
plt.xlabel('Épocas')
plt.ylabel('Acurácia')
plt.legend()
plt.show()


Explicação do Código:

Carregamento e Preparação dos Dados:

O conjunto de dados MNIST é carregado e normalizado.
As imagens são redimensionadas para ter uma dimensão de canal (1 para imagens em escala de cinza).
As etiquetas são convertidas em vetores de classe usando to_categorical.

Construção do Modelo CNN:

Conv2D: Camadas convolucionais com 32, 64 e 64 filtros, respectivamente. Cada filtro é de tamanho 3x3.
MaxPooling2D: Camadas de pooling para reduzir a dimensão espacial das características extraídas.
Flatten: Converte a saída da camada convolucional em um vetor unidimensional.
Dense: Camadas densas para a classificação final. A última camada tem 10 neurônios, correspondendo às 10 classes (dígitos 0-9).

Compilação e Treinamento:

O modelo é compilado com o otimizador Adam e a função de perda categorical_crossentropy.
O modelo é treinado por 5 épocas com uma divisão de validação de 20%.

Avaliação e Visualização:

O modelo é avaliado no conjunto de teste.
O histórico de treinamento é plotado para visualizar a acurácia de treinamento e validação ao longo das épocas.
Experimentos Adicionais:
Ajuste de Hiperparâmetros: Experimente diferentes números de filtros, tamanhos de kernel e camadas.
Aumento de Dados: Use técnicas de aumento de dados (data augmentation) para melhorar a robustez do modelo.
Modelos Pré-Treinados: Explore redes pré-treinadas como VGG, ResNet e Inception para tarefas mais complexas.

# Redes Neurais Recorrentes (RNNs)
RNNs são usadas para dados sequenciais, como séries temporais e NLP. Elas possuem conexões recorrentes que permitem que a informação persista.

Exemplo de RNN para Séries Temporais com Keras:

In [None]:
import numpy as np
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import SimpleRNN, Dense

# Gerar dados de exemplo
np.random.seed(0)
X = np.random.rand(100, 10, 1)  # 100 amostras, 10 passos de tempo, 1 característica
y = np.random.randint(2, size=(100, 1))

# Dividir os dados em treinamento e teste
X_train, X_test = X[:80], X[80:]
y_train, y_test = y[:80], y[80:]

# Construir o modelo RNN
model = Sequential([
    SimpleRNN(50, input_shape=(10, 1), activation='relu'),
    Dense(1, activation='sigmoid')
])

# Compilar o modelo
model.compile(optimizer='adam',
              loss='binary_crossentropy',
              metrics=['accuracy'])

# Treinar o modelo
model.fit(X_train, y_train, epochs=5, validation_split=0.2)

# Avaliar o modelo
test_loss, test_acc = model.evaluate(X_test, y_test, verbose=2)
print('\nAcurácia de Teste:', test_acc)


# Redes Generativas Adversariais (GANs)
GANs são usadas para gerar dados novos e realistas, como imagens, a partir de dados existentes. Consistem em duas redes: o gerador e o discriminador.

Exemplo Básico de GAN com TensorFlow/Keras:

Este exemplo é mais avançado e geralmente requer mais código, então aqui está um exemplo simplificado:

In [None]:
import tensorflow as tf
from tensorflow.keras.layers import Dense, Reshape, Flatten
from tensorflow.keras.models import Sequential
from tensorflow.keras.optimizers import Adam
import numpy as np

# Gerador
def build_generator():
    model = Sequential([
        Dense(128, activation='relu', input_shape=(100,)),
        Dense(784, activation='sigmoid'),
        Reshape((28, 28, 1))
    ])
    return model

# Discriminador
def build_discriminator():
    model = Sequential([
        Flatten(input_shape=(28, 28, 1)),
        Dense(128, activation='relu'),
        Dense(1, activation='sigmoid')
    ])
    return model

# Criar GAN
def build_gan(generator, discriminator):
    discriminator.compile(optimizer=Adam(), loss='binary_crossentropy')
    discriminator.trainable = False
    gan_input = tf.keras.Input(shape=(100,))
    x = generator(gan_input)
    gan_output = discriminator(x)
    model = tf.keras.Model(gan_input, gan_output)
    model.compile(optimizer=Adam(), loss='binary_crossentropy')
    return model

# Instanciar modelos
generator = build_generator()
discriminator = build_discriminator()
gan = build_gan(generator, discriminator)

# Treinamento (simplificado)
def train_gan(gan, generator, discriminator, epochs=1000, batch_size=128):
    for epoch in range(epochs):
        # Gerar dados falsos
        noise = np.random.normal(0, 1, size=[batch_size, 100])
        generated_images = generator.predict(noise)
        # Treinar o discriminador
        real_images = np.random.rand(batch_size, 28, 28, 1)  # Imagens reais de exemplo
        X = np.concatenate([real_images, generated_images])
        y_dis = np.zeros(2 * batch_size)
        y_dis[:batch_size] = 0.9  # Rótulo de verdadeiros
        discriminator.trainable = True
        d_loss = discriminator.train_on_batch(X, y_dis)
        # Treinar o gerador
        noise = np.random.normal(0, 1, size=[batch_size, 100])
        y_gen = np.ones(batch_size)
        discriminator.trainable = False
        g_loss = gan.train_on_batch(noise, y_gen)
        if epoch % 100 == 0:
            print(f'Epoch {epoch} | D Loss: {d_loss} | G Loss: {g_loss}')

# Treinar a GAN
train_gan(gan, generator, discriminator)


Explicação das Partes da GAN:

Gerador:

Objetivo: Criar novas amostras (como imagens) que sejam semelhantes às amostras reais do conjunto de dados.
Estrutura: Geralmente começa com uma camada densa para transformar o vetor de entrada (geralmente um vetor de ruído) em uma forma de imagem e, em seguida, utiliza camadas adicionais para refinar essa forma até que se assemelhe a uma imagem real.
Discriminador:

Objetivo: Diferenciar entre as imagens reais do conjunto de dados e as imagens geradas pelo gerador.
Estrutura: Recebe uma imagem e passa por camadas densas que ajudam a classificar se a imagem é real ou falsa (gerada).
GAN (Generative Adversarial Network):

Objetivo: Treinar o gerador para criar imagens que o discriminador não consiga distinguir das imagens reais.
Estrutura: Combina o gerador e o discriminador em uma rede. O gerador tenta enganar o discriminador, enquanto o discriminador tenta se tornar melhor em distinguir entre imagens reais e falsas.
Treinamento da GAN:

Treinamento do Discriminador:

Passo 1: O discriminador é treinado com um conjunto de imagens reais e um conjunto de imagens geradas pelo gerador.
Passo 2: As imagens reais são rotuladas como verdadeiras e as imagens geradas como falsas. O discriminador tenta melhorar sua capacidade de distinguir entre essas duas categorias.
Treinamento do Gerador:

Passo 1: O gerador cria novas imagens a partir de um vetor de ruído.
Passo 2: Essas imagens geradas são passadas ao discriminador. O objetivo do gerador é enganar o discriminador, fazendo com que ele classifique as imagens geradas como reais.
Passo 3: O gerador é treinado com base na perda do discriminador. Se o discriminador considera as imagens geradas como reais, o gerador está sendo bem-sucedido.
O treinamento continua alternando entre essas duas etapas, aprimorando tanto o gerador quanto o discriminador ao longo do tempo.

Resumo das Principais Técnicas de Deep Learning:

Perceptron: Unidade básica de redes neurais, usada para classificação binária.
Redes Feedforward: Redes neurais com camadas direcionadas, usadas para tarefas de classificação e regressão.
Backpropagation: Algoritmo para ajustar os pesos da rede neural durante o treinamento.
Redes Neurais Convolucionais (CNNs): Utilizadas para processamento de imagens, aplicando operações convolucionais.
Redes Neurais Recorrentes (RNNs): Usadas para dados sequenciais, como séries temporais e processamento de linguagem natural (NLP).
Redes Generativas Adversariais (GANs): Usadas para gerar dados novos e realistas, como imagens, a partir de dados existentes.
Frameworks de Deep Learning:

TensorFlow: Framework poderoso desenvolvido pelo Google, ideal para construir e treinar modelos complexos de deep learning.
Keras: API de alto nível para TensorFlow, simplifica a construção e o treinamento de redes neurais.
PyTorch: Framework desenvolvido pelo Facebook, conhecido por sua flexibilidade e facilidade de uso, especialmente para pesquisa e desenvolvimento.