<a href="https://colab.research.google.com/github/brunokobi/Bootcamp_BairesDev/blob/main/Treinamento_de_Redes_Neurais_com_Transfer_Learning.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# 🚀 **Descrição do Projeto**

Este projeto implementa uma solução de aprendizado profundo para classificar dígitos manuscritos usando o conjunto de dados MNIST. Ele combina a simplicidade do MNIST com a sofisticação de redes neurais convolucionais modernas através de **transfer learning** utilizando a MobileNetV2. O pipeline do projeto pode ser descrito em etapas principais:

---

## 📂 **Carregamento e Pré-processamento dos Dados**  
- 🔹 O conjunto de dados **MNIST** é carregado, contendo imagens de dígitos manuscritos de tamanho **28x28 pixels**.  
- 🔹 As imagens são normalizadas para valores entre **0 e 1** e convertidas para um formato compatível com redes convolucionais (**28x28x1**).  
- 🔹 As labels dos dígitos são transformadas em formato **categórico** para classificação de 10 classes (dígitos de **0 a 9**).  

---

## 🧠 **Transfer Learning com MobileNetV2**  
- ⚙️ A **MobileNetV2**, uma arquitetura moderna pré-treinada na **ImageNet**, é utilizada como base.  
- 🛠️ As camadas da MobileNetV2 são **congeladas** para reutilizar seus recursos extraídos sem treinamento adicional.  
- 🎨 As imagens MNIST, originalmente monocromáticas (**1 canal**), são redimensionadas para **224x224 pixels** e convertidas para **3 canais (RGB)** para compatibilidade com a MobileNetV2.  

---

## 🏗️ **Construção do Modelo**  
- 🔧 O modelo consiste em **camadas adicionais** para ajustar as entradas do MNIST à MobileNetV2 e processar sua saída.  
- 🔗 Inclui uma camada de **pooling global** e uma camada densa com ativação **softmax** para produzir as probabilidades das **10 classes**.  

---

## 🏋️ **Treinamento e Avaliação**  
- 📊 O modelo é treinado por **10 épocas** usando o otimizador **Adam** e a função de perda de **entropia cruzada categórica**.  
- ✅ O desempenho é avaliado no conjunto de teste, com a métrica de **acurácia** como principal indicador.  

---

## 📈 **Visualização**  
- 🖼️ A evolução da **acurácia** no conjunto de treinamento e validação é plotada para analisar o desempenho ao longo das épocas.  

---

# 🎯 **Objetivo do Projeto**  
Explorar a aplicação de **transfer learning** em tarefas simples como a classificação de dígitos manuscritos, utilizando uma arquitetura moderna e eficiente como a MobileNetV2 para:  
1. ⚡ Acelerar o desenvolvimento.  
2. 🎯 Melhorar a precisão do modelo.  

---

# 🏆 **Resultados Esperados**  
- 🎉 Uma **alta acurácia** na classificação dos dígitos do MNIST.  
- 💡 Demonstração da eficácia de **transfer learning** mesmo em problemas com dados diferentes do domínio da ImageNet.  

Este projeto é ideal para estudantes ou profissionais que desejam aprender sobre **transfer learning** e combinar redes modernas com datasets clássicos.  


In [None]:
# Importando bibliotecas necessárias
import tensorflow as tf
from tensorflow.keras import layers, models
from tensorflow.keras.preprocessing import image
import numpy as np
import matplotlib.pyplot as plt

# Carregando o conjunto de dados MNIST
(x_train, y_train), (x_test, y_test) = tf.keras.datasets.mnist.load_data()

# Pré-processando as imagens para que fiquem no formato correto (28x28x1)
x_train = np.expand_dims(x_train, axis=-1).astype('float32') / 255.0
x_test = np.expand_dims(x_test, axis=-1).astype('float32') / 255.0

# Ajustando o formato das labels
y_train = tf.keras.utils.to_categorical(y_train, 10)
y_test = tf.keras.utils.to_categorical(y_test, 10)

# Carregando a MobileNetV2 pré-treinada
base_model = tf.keras.applications.MobileNetV2(input_shape=(224, 224, 3), include_top=False, weights='imagenet')

# Congelando as camadas da MobileNetV2 para transfer learning
base_model.trainable = False

# Construindo o modelo com MobileNetV2 como base
model = models.Sequential([
    layers.InputLayer(input_shape=(28, 28, 1)),
    layers.UpSampling2D(size=(8, 8)),  # Aumentando a resolução da imagem para 224x224
    layers.Conv2D(3, (3, 3), padding='same', activation='relu'),  # Convertendo para 3 canais (RGB)
    base_model,
    layers.GlobalAveragePooling2D(),
    layers.Dense(10, activation='softmax')  # Saída para 10 classes
])

# Compilando o modelo
model.compile(optimizer='adam', loss='categorical_crossentropy', metrics=['accuracy'])

# Treinando o modelo
history = model.fit(x_train, y_train, epochs=10, batch_size=32, validation_data=(x_test, y_test))

# Avaliando o modelo
test_loss, test_acc = model.evaluate(x_test, y_test, verbose=2)
print(f'Test accuracy: {test_acc}')

# Plotando a acurácia do treinamento
plt.plot(history.history['accuracy'], label='accuracy')
plt.plot(history.history['val_accuracy'], label = 'val_accuracy')
plt.xlabel('Epoch')
plt.ylabel('Accuracy')
plt.ylim([0, 1])
plt.legend(loc='lower right')
plt.show()




Epoch 1/10
[1m1875/1875[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 3s/step - accuracy: 0.8632 - loss: 0.4888

KeyboardInterrupt: 