<a href="https://colab.research.google.com/github/Ayrsz/learning_pytorch/blob/main/LearningTorch.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

In [None]:
import torch
import torch.nn as nn
import torch.nn.functional as F
from torch.utils.data import Dataset, DataLoader
import torchvision
import torchvision.transforms as transform
import numpy as np

In [None]:
from matplotlib import pyplot as plt

## Manipulando Tensores

In [None]:
#Inicializando tensores vazios
vazio = torch.empty((3,4))

#Preenche o vetor com valores aleatórios
print(vazio)
print(type(vazio))


**Criação de tensores básicos**

In [None]:
ones = torch.ones(3,4)
print(ones)

zeros = torch.zeros(3,4)
print(zeros)

#Set da set para números aleatórios na mão, não é necessário
torch.manual_seed(20)
random = torch.rand(1)
print(random)

**Criação de tensor com mesmo shape de outro**

In [None]:
print("Original:")
x = torch.tensor([[3, 4], [0, 1]])
print(x)

print("One_like:")
one_like = torch.ones_like(x)
print(one_like)

print("Zero_like:")
zero_like = torch.zeros_like(x)
print(zero_like)

**Operações matematicas**

In [None]:
torch.manual_seed(30)
tensor_a = torch.randn(3, 4)
sep = 50*'-' + '\n'
print(" Tensor:")
print(tensor_a)

print(sep,"Função teto:")
print(torch.ceil(tensor_a))

print(sep, "Clip:")
print(torch.clamp(tensor_a, -0.5, 0.5))

print(sep, "Comparação elemento a elemento")
tensor_a_clipado = torch.clamp(tensor_a, -0.5, 0.5)
print(torch.eq(tensor_a, tensor_a_clipado))

print(sep, "Maximos e minimos:")
print("Retornando um tensor:")
print(torch.max(tensor_a))
print("Retornando um valor:")
print(torch.max(tensor_a).item())

print(sep, "Elementos unicos:")
print(torch.unique(torch.tensor([[1,1,1,1],[2,2,2,2]]))) #Retorna um vetor dos valores únicos


**Alterando tensores por funções que fazem referência**

In [None]:
fibbonacci = torch.tensor([0, 1, 1, 2, 3, 5, 8, 13], dtype= torch.float32)
seno_fibbonacci = torch.sin(fibbonacci)
print("Original:\n", fibbonacci, "\nAplicado o seno:\n", seno_fibbonacci)

#Funções com "_" no final mudam o valor DA VARIÁVEL
seno_fibbonacci = torch.sin_(fibbonacci)
print("Original:\n", fibbonacci, "\nAplicado o seno:\n", seno_fibbonacci)

In [None]:
#Quando igualamos a = b, temos que b SOFRE todas as alterações que a sofrer
zeros = torch.zeros(3, 2, dtype=torch.int32)
copiador = zeros

zeros[0][0] = 30

print("Original\n", zeros, "\nCopiador:\n", copiador)
print(sep)
print("Com clone")
copiador = zeros.clone()
zeros[0][1] = 20
print("Original\n", zeros, "\nCopiador:\n", copiador)



**Mandando para a GPU**

In [None]:
if torch.cuda.is_available():
  print("Parabens, você tem uma GPU")
  imagem_otavio_o_gato = torch.rand((3, 100, 100), device = "cuda")
else:
  print("Desculpa, você tá pobre")
  imagem_otavio_o_gato = torch.rand((3, 100, 100), device = "cpu")


In [None]:
#Maneira análoga a fazer oq tem em cima, mais concisa
if torch.cuda.is_available():
  my_device = "cuda"
else:
  my_device = "cpu"
print(f"Device: {my_device}")
imagem_otavio_o_gato = torch.rand((3, 100, 100), device = my_device)
#obs -> Tensores precisam estar na mesma unidade de processamento para interagirem

In [None]:
#Mandar um tensor, já inicializado, para o device
imagem_otavio_o_gato = imagem_otavio_o_gato.to(my_device)

**Mudando o shape**

In [None]:
print("Antes do unsqueeze:")
tensor_aleatorio = torch.rand((3, 2, 4))
print(tensor_aleatorio.shape)
#Tensores são abstrações para vetores de 3 ou mais dimensões, ou seja... vetores de matrizes
#Porém, o "tensor aleatorio" é apenas uma matriz com três canais, queremos um vetor de imagens

#Insere uma nova dimensão na dimensão "0"
tensor_aleatorio.unsqueeze_(0)
print("Depois do unsqueeze:")
print(tensor_aleatorio.shape)

In [None]:
torch.manual_seed(10)
a = torch.rand((1,2, 1, 2))

#O vetor tem duas dimensões com tamanho "1", o método squeeze simplifica esses vetores
# (1, 2, 1,2) -> (2, 2)
#Fazendo uma comparação com uma imagem em tons de cinza...
#Se usamos squeeze, a imagem deixa de ser um "Canal" e vira uma matriz

print("Antes do squeeze:")
print(a.shape)

a.squeeze_()
print("Depois do squeeze:")
print(a.shape)

**Gerando um tensor apartir de um array numpy**

In [None]:
x = np.array([1, 2, 3, 4], dtype = np.int32)
y = torch.from_numpy(x)

print("Numpy Array:\n", x)
print("Tensor:\n", y)


## Auto-grad


Requires grad

In [None]:
#Guardar operações realizadas no tensor
a = torch.linspace(0, 2, steps = 20, dtype = torch.float32, requires_grad = True)
b = torch.ceil(a)

plt.plot(a.detach(), b.detach())

Regra da cadeia


In [None]:
#Perceba que o gradiente está sendo computado
print(b.grad_fn)
c = torch.sin(b)
print(c.grad_fn)
d = torch.cos(c)
print(d.grad_fn)
#Facilita a regra da cadeia!!!

In [None]:
print("Gradientes armazenados em caeda nivel de aplicação da funcao")
print("D:")
print(d.grad_fn)
print(d.grad_fn.next_functions)
print(d.grad_fn.next_functions[0][0].next_functions)
print(d.grad_fn.next_functions[0][0].next_functions[0][0].next_functions)
print(d.grad_fn.next_functions[0][0].next_functions[0][0].next_functions[0][0].next_functions)




Calcular o gradiente

In [None]:
#Beleza e a aplicação da regra da cadeia, onde que ocorre?
saida = d.sum()
print(saida)
#BACKWARD! Calcula o gradiente em si
saida.backward()
print(a.grad)

In [None]:
#O gradiente é calculado apenas para o input do modelo, no caso, o tensor "a"
print(a.grad)
print(b.grad)
print(c.grad)
print(d.grad)


Exemplo com um modelo

In [None]:
BATCH_SIZE = 16
DIM_IN = 1000
HIDDEN_SIZE = 100
DIM_OUT = 10

class TinyModel(torch.nn.Module):

    def __init__(self):
        super(TinyModel, self).__init__()

        # Entrada de mil, saida de 100, as funções de implementação de camadas já tem
        # autograd embutido!
        self.layer1 = torch.nn.Linear(1000, 100)
        self.relu = torch.nn.ReLU()

        #Entrada de 100, saida de 10
        self.layer2 = torch.nn.Linear(100, 10)

    def forward(self, x):
        x = self.layer1(x)
        x = self.relu(x)
        x = self.layer2(x)
        return x

entrada = torch.randn(BATCH_SIZE, DIM_IN, requires_grad=False)
saida_ideal = torch.randn(BATCH_SIZE, DIM_OUT, requires_grad=False)

model = TinyModel()

In [None]:
#Perceba que nas proprias camadas já temos o gradiente
print(model.layer1.weight[0][0:10])


In [None]:
otimizador = torch.optim.SGD(model.parameters(), lr = 0.001)

saida = model.forward(entrada)

loss = torch.sqrt((saida_ideal - saida).pow(2).sum())

#A loss tem um gradiente também, pelo fato da saida ter
print(loss)

In [None]:
#Agora que temos a forma dos gradientes setados e a função de perda, iremos realizar o CÁLCULO dessas correções do gradiente
#Depois desse passo, TODAS camadas terão um .grad, pois ela não apenas referenciam um "método" para cálculo e sim obtem valores
#Para ajustar os pesos do modelo
loss.backward()


In [None]:
parametros = model.layer1.weight.grad
print(parametros)

In [None]:
#Nesse ponto, os pesos não foram alterados, quem faz esse papel é o otimizador
otimizador.step()

#Etapa muito importante, pois o modelo precisa de um novo gradiente a cada entrada, se
# o gradiente NÃO FOR zerado, ira somar os valores antigos com os novos ...
otimizador.zero_grad()

In [None]:
tensor_gradiente = torch.linspace(0, 2, 50, requires_grad = True)
print(tensor_gradiente)

#Criar CÓPIA SEM gradiente
tensor_sem_gradiente = tensor_gradiente.detach()
print(tensor_sem_gradiente)


In [None]:
#Para realizar operações em funções sem ter o mapeamento do gradiente temos o dectorator
@torch.no_grad()
def add_tensor(x, y):
  return torch.add(x, y)

tensor_x = torch.rand((2, 5))
tensor_y = torch.rand((2, 5), requires_grad=True)

tensor_soma_sem_grad = add_tensor(tensor_x, tensor_y)
print(tensor_soma_sem_grad)

tensor_soma_com_grad = torch.add(tensor_x, tensor_y)
print(tensor_soma_com_grad)

In [None]:
#Tensores com autograd NÃO aceitam funções que alteram valores, as "funcao_"
tensor_grad = torch.rand(1, requires_grad=True)
torch.sin_(tensor_grad)

## Criando modelos

## AlexNet

In [None]:
class LeNet(nn.Module):
  def __init__(self):
    super(LeNet, self).__init__()
    #Estrutura da lenet, sem os polimentos
    #Imagem preto e branco (input) -> 6 Canais como mapas de caracteristicas
    self.c1 = nn.Conv2d(1, 6, 3)
    self.c2 = nn.Conv2d(6, 16, 3)
    self.l1 = nn.Linear(16*6*6, 120)
    self.l2 = nn.Linear(120, 84)
    self.l3 = nn.Linear(84, 10)

  def forward(self, x):
    #Duas camadas iguais de max_pool, porém se for um pool quadrádico n precisa especificar o shape
    x = F.max_pool2d(F.relu(self.c1(x)), (2,2))
    x = F.max_pool2d(F.relu(self.c2(x)), 2)
    #Agora para dar input na camada linear precisamos linearizar a saida da conv2
    x = x.view(-1, self.number_neurons(x))
    x = F.relu(self.l1(x))
    x = F.relu(self.l2(x))
    x = self.l3(x)
    return x

  def number_neurons(self, x):
    size = x.size()[1:] #Ignora a primeira dimensão, que é o tamanho do batch
    features = 1
    for s in size:
      features = features * s
    return features

model = LeNet()
input = torch.rand(1, 1, 32, 32)
print('\nImage batch shape:')
print(input.shape)
print(f"\noutput do modelo:\n{model.forward(input)}")

#Tensores consideram que você está trabalhando com várias imagens, por isso o tipo fica
# "(Num_imagens, Canais_cor, Altura, Largura)"

### Setting Dataset

In [None]:
transformation = transform.Compose([transform.ToTensor(), transform.Normalize(mean = (0.5, 0.5, 0.5), std = (0.5, 0.5, 0.5)), transform.Grayscale(num_output_channels = 1)]) # Normalize((Media_cada_canal_cor), (Desvio_padrao_cada_canal_cor))
#Adaptação das imagens para tensores e posteriormente normalizando os valores da matriz pois o gradiente funciona melhor com valores próximos de 0

In [None]:
dataset = torchvision.datasets.CIFAR10(root = "./dataset", train = True, transform = transformation, download=True)
#root -> Diretório onde será escrito o dataset
#Train -> Dados serão usados para treinamento e teste
#Transform -> Aplica a todo o dataset quando da load

In [None]:
dataloader = torch.utils.data.DataLoader(dataset, batch_size = 4, shuffle = True, num_workers = 2)
#O data loader não sabe nada sobre as informações, apenas separa os batches.

In [None]:

for i, (imagens,classes) in enumerate(dataloader):
  print("Imagens do batch especificado (4 por vez)")
  print(f"shape: {imagens.shape}\n")

  print("Classes das 4 imagens fornecidas:")
  print(f"{classes}")
  break

In [None]:

classes = {
    0: 'plane',
    1: 'car',
    2: 'bird',
    3: 'cat',
    4: 'deer',
    5: 'dog',
    6: 'frog',
    7: 'horse',
    8: 'ship',
    9: 'truck'
    }

def imshow(img):
    img = img / 2 + 0.5     # unnormalize
    npimg = img.numpy()
    plt.imshow(np.transpose(npimg, (1, 2, 0)))

def random_sampling(loader, num_amostras):
  size = len(loader)

  for i in range(num_amostras):
    idx = np.random.randint(0, size-1)
    imagem, label = loader[idx]
    imagem = torch.reshape(imagem, (32, 32, 1))
    plt.title(classes[label])
    plt.imshow(imagem, cmap='gray')

random_sampling(dataset, 1)