# 📘 Aula 4 – Atividade Prática

![](../../data/imagem/banner-pos-2022.jpg)


## Classificação de Dedos em Imagens de Mãos - Desafio de Desenvolvimento

Neste notebook, você irá construir e aprimorar um modelo de deep learning para classificar quantos dedos (0-5) estão sendo mostrados em imagens de mãos, ignorando a distinção entre mão esquerda e direita. Siga as orientações em cada seção e complete os códigos onde indicado.

**Dataset**

* 21.600 imagens de mãos (128x128 pixels)
    * Conjunto de treino: 18.000 imagens
    * Conjunto de teste: 3.600 imagens
* Cada imagem tem um rótulo indicando o número de dedos (0-5) nos últimos caracteres do nome do arquivo



# 1. Configuração Inicial e Exploração dos Dados

**Objetivo**: Preparar o ambiente e entender a estrutura dos dados.

**Tarefas:**

* Complete os valores faltantes nas configurações
* Verifique se o caminho do dataset está correto
* Explore a estrutura dos diretórios (quantas pastas? como estão organizadas?)

In [None]:
# TODO: Importe todas as bibliotecas necessárias
# Dica: Você precisará de tensorflow/keras, pandas, numpy, matplotlib, seaborn

# Configurações iniciais
IMAGE_SIZE = (____, ____)  # Complete com o tamanho adequado
BATCH_SIZE = ____          # Defina um batch size razoável
EPOCHS = ____              # Comece com 20 épocas
DATASET_PATH = "____"      # Complete com o caminho correto

# TODO: Liste os arquivos no diretório do dataset
# Dica: Use os.listdir() para verificar a estrutura de pastas

# 2. Pré-processamento e Criação dos DataFrames

**Objetivo:** Carregar os metadados das imagens e preparar para o treinamento.

**Tarefas:**

* Implemente a função extract_class corretamente
* Verifique se a distribuição de classes está balanceada
* Analise possíveis problemas de desbalanceamento

In [None]:
def extract_class(filename):
    """Extrai o número de dedos do nome do arquivo"""
    # TODO: Implemente a lógica para extrair a classe (0-5) do nome do arquivo
    # Dica: Analise a estrutura do nome dos arquivos para encontrar o padrão
    return ____

# TODO: Crie os DataFrames para treino e teste
# Dica: Use pd.DataFrame() com 'filename' e 'class' como colunas

# Visualização da distribuição de classes
plt.figure(figsize=(10,5))
# TODO: Plote a distribuição das classes usando sns.countplot()

# 3. Data Augmentation e Geradores de Imagens

**Objetivo:** Criar pipelines de pré-processamento para as imagens.

**Tarefas:**

* Experimente diferentes parâmetros de augmentation
* Verifique se os geradores estão criados corretamente
* Confirme o mapeamento de classes (class_indices)

In [None]:
# TODO: Configure o ImageDataGenerator para treino com augmentation
train_datagen = ImageDataGenerator(
    rescale=____,
    rotation_range=____,
    ____=____,  # Adicione pelo menos 3 transformações
    ____=____,
    ____=____
)

# TODO: Configure o ImageDataGenerator para teste (apenas normalização)

# Crie os geradores de dados
train_generator = train_datagen.flow_from_dataframe(
    ____=____,
    ____=____,
    # Complete todos os parâmetros necessários
)

# TODO: Crie o gerador para teste (similar ao de treino, mas sem shuffle)

# 4. Visualização e Análise Exploratória

**Objetivo:** Garantir que os dados estão sendo carregados corretamente.

Tarefas:

* Verifique se as transformações de augmentation estão funcionando
* Confirme que os rótulos correspondem às imagens
* Analise a qualidade das imagens após o pré-processamento

In [None]:
# TODO: Obtenha um batch de imagens do gerador de treino
images, labels = ____

# Visualização
plt.figure(figsize=(15, 10))
for i in range(min(9, len(images))):
    plt.subplot(3, 3, i+1)
    # TODO: Mostre cada imagem com seu respectivo rótulo
    plt.title(f"Class: {____}")
    plt.axis('off')

# 5. Construção da Arquitetura do Modelo

**Tarefa:** Implemente a arquitetura sequencial completa

**Camada de Input**:
   ```python
   layers.Input((128, 128, 3))
   ```

**Primeiro Bloco Convolucional:**

* Implemente uma camada Conv2D com:
    * 32 filtros
    * Kernel size 3x3
    * Ativação ReLU
* Adicione uma camada MaxPooling2D com pool size 2x2

**Segundo Bloco Convolucional:**

* Aumente para 64 filtros
* Mantenha as mesmas configurações do primeiro bloco

**Terceiro Bloco Convolucional:**

* Aumente para 128 filtros
* Mantenha as outras configurações

**Camadas Densas (Fully Connected):**

* Adicione uma camada Flatten() para transformar os features em 1D
* Implemente Dropout de 50% para regularização
* Adicione uma Dense layer com 128 neurônios e ativação ReLU
* Finalize com uma Dense layer de saída com ativação softmax

In [None]:
from tensorflow.keras import layers, models

model = models.Sequential([
    # Camada Input

    # Primeiro Bloco Convolucional

    # Segundo Bloco Convolucional

    # Terceiro Bloco Convolucional

    # Camadas Densas (Fully Connected)
    
    # Camada de saída
    layers.Dense(____, activation='____')  # Complete adequadamente
])

# TODO: Compile o modelo com optimizer, loss e metrics apropriados
model.compile(____)

# 6. Treinamento e Monitoramento

**Objetivo:** Treinar o modelo com callbacks apropriados.

**Tarefas:**

* Configure os callbacks para monitorar o treinamento
* Ajuste o número de épocas conforme necessário
* Monitore tanto loss quanto accuracy

In [None]:
# TODO: Implemente callbacks (EarlyStopping, ModelCheckpoint, ReduceLROnPlateau)
callbacks = [
    ____,
    ____,
    ____
]

# TODO: Execute o treinamento
history = model.fit(
    ____,
    epochs=____,
    validation_data=____,
    callbacks=____
)

# 7. Avaliação e Análise de Resultados

**Objetivo:** Avaliar o desempenho do modelo.

**Tarefas:**

* Identifique quais classes têm melhor/piro desempenho
* Analise os erros mais comuns na matriz de confusão
* Verifique se há overfitting

In [None]:
# TODO: Gere e mostre a matriz de confusão
# Dica: Use confusion_matrix e seaborn.heatmap()

# TODO: Mostre o classification report
# Dica: Use classification_report do sklearn

# TODO: Plote gráficos de accuracy e loss durante o treinamento