In [2]:
# For tips on running notebooks in Google Colab, see
# https://pytorch.org/tutorials/beginner/colab
%matplotlib inline

import torch
from torch import nn
from torch.utils.data import DataLoader
from torchvision import datasets
from torchvision.transforms import ToTensor

# Torch.utils.data.DataLoader
# Torch.utils.data.Dataset.Dataset : Armazenada amostrar e seus rótulos correspondentes

# Utilizar apenas o TorchVision para trabalhar no ramo de Vision
# O Vision possui dados sobre a visão do mundo real : FashionMNIST

# Baixar dados treinados de datasets livres
training_data = datasets.FashionMNIST(
    root="data",
    train=True,
    download=True,
    transform=ToTensor(),
)

# Baixar dados de teste de conjunto
test_data = datasets.FashionMNIST(
    root="data",
    train=False,
    download=True,
    transform=ToTensor(),
)

# Dataset(FashionMNIST) -> Argumento para DataLoader

"""
DataLoader:

* Carrega os dados em lotes (batch);
* Fazer amostragem aleatória ou sequencia dos dados;
* Reembaralhar os dados entre as épocas;
* Distribui o carramento entre múltiplos subprocessos;

"""

batch_size = 64 # Definimos que o modelo vai aprender com 64 exemplos por vez

# Criamos dois DataLoaders: Um para Treino e outro para Teste
train_dataloader = DataLoader(training_data, batch_size=batch_size)
test_dataloader = DataLoader(test_data, batch_size=batch_size)

# Iterar sobre o DataLoader como se fosse uma lista
for X, y in test_dataloader:
  print(f"Formato do X [N, C, H, W]: {X.shape}") #N=batch_size, C=Canais, H=altura, W=largura
  print(f"Formato do Y: {y.shape}, dtype: {y.dtype}")
  break

# 64: Numero de imagens (batch)
# 1: Numero de canais (1 = escala de cinza como imagens MNIST)
# 28 x 28: Dimensão da imagem (altura x largura)

# y.shape = [64]: há 64 rótulos (um para cada imagem)
# dtype=int64: os rótulos são inteiros, pois preresentam classes (0 a 9)


100%|██████████| 26.4M/26.4M [00:01<00:00, 15.4MB/s]
100%|██████████| 29.5k/29.5k [00:00<00:00, 230kB/s]
100%|██████████| 4.42M/4.42M [00:01<00:00, 4.27MB/s]
100%|██████████| 5.15k/5.15k [00:00<00:00, 6.64MB/s]

Formato do X [N, C, H, W]: torch.Size([64, 1, 28, 28])
Formato do Y: torch.Size([64]), dtype: torch.int64





In [None]:
# Criando o Modelo

# Uma rede neural é definida como uma classe em Python que herda de TORCH.NN.MODULE
# Esse modulo representa quantas camadas existem -> Como os dados fluemd e uma camada para outra e como são transformados

# Verificando quais dispositivos estão disponíveis
device = torch.accelerator.current_accelerator().type if torch.accelerator.is_available() else "cpu"
print(f"Usando {device} dispositivo")

# Definindo o modelo
import torch.nn.functional as F

# MLP - Multilayer Perceptron
class RedeNeural(nn.Module):
  def __init__(self):
    super().__init__()
    self.flatten = nn.Flatten()
    self.linear_relu_stack = nn.Sequential(
        nn.Linear(28*28, 512),
        nn.ReLu(),
        nn.Linear(512, 512),
        nn.ReLu(),
        nn.Linear(512, 10)
    )

def forward(self, x):
  x = self.flatten(x)
  logits = self.linear_relu_stack(x)
  return logits

model = RedeNeural().to(device)
print(model)

"""
# Parâmetros treinávei;
# Propagação direta (forward)
# Backpropagation automática;
# Salvamento e carregamento do modelo;
"""

"""
nn.Module : Classe base para todos os modelos no PyTorch
nn.Flatten() : Transforma imagens em vetores
nn.Linear(a, b) : camada densa totalmente conectada de a para b neurônios
nn.ReLu() : Função de ativação (max(0,x))
forward(x) : Define como os dados fluem pela rede
logits : Saída bruta antes da função de ativação final (ex: softmax)
model = NeuralNetwork() : Instancia o modelo
"""

"""
flatten pega os 28x28 faz virar um vetor de [784 números]
E cada um dos 512 neurônios recebe o 784 números como entrada
Output = soma(entrada[i] * peso[i] + viés)

ReLu: Liga ou Desliga neuronios: Caso apresnete valor negativo, zera, se for positivo
mantém. Isso traz NÃO LINEARIDADE importenta para a rede aprender padrões complexos

[28x28 imagem]
   ↓ flatten
[784] vetor
   ↓ Linear(784→512)
[512]
   ↓ ReLU
[512]
   ↓ Linear(512→512)
[512]
   ↓ ReLU
[512]
   ↓ Linear(512→10)
[10] logits (valores brutos de classificação)

"""



