In [1]:
import torch

In [2]:
print(torch.__version__)

1.9.1+cpu


# Tensores PyTorch
Tensores são os tipos de dados fundamentais do PyTorch. Um tensor é uma matriz multidimensional semelhante aos ndarrays de NumPy:

* Um escalar pode ser representado como um tensor de dimensão zero.
* Um vetor pode ser representado como um tensor unidimensional.
* Uma matriz bidimensional pode ser representada como um tensor bidimensional.
* Uma matriz multidimensional pode ser representada como um tensor multidimensional.

In [3]:
# incializando um tensor
x = torch.tensor([[1,2]])
y = torch.tensor([[1],[2]])

In [5]:
# acessando a forma e o tipo do dado;
print(f'Dimensão de x: {x.shape}\nDimensão de y: {y.shape}\n')
print(f'Tipo de dado de x: {x.dtype}\nTipo de dado de y: {y.type}')

Dimensão de x: torch.Size([1, 2])
Dimensão de y: torch.Size([2, 1])

Tipo de dado de x: torch.int64
Tipo de dado de y: <built-in method type of Tensor object at 0x7f2ed6792140>


In [6]:
# verificando um tensor do tipo booleano
x = torch.tensor([False, True])
y = torch.tensor(([False, True, 1, 2.0]))
# se tivermos um tensor somente booleano teremos uma saida diferente se a lista conter outros
# tipos de dados, os valores serão convertidos em 0 -> False e 1 -> True
print(f'Somente booleanos: {x}')
print(f'Diversos tipos de dados: {y}')

Somente booleanos: tensor([False,  True])
Diversos tipos de dados: tensor([0., 1., 1., 2.])


In [7]:
# gerando um tensor de zeros 3 x 4
torch.zeros((3,4))

tensor([[0., 0., 0., 0.],
        [0., 0., 0., 0.],
        [0., 0., 0., 0.]])

In [8]:
# gerando um tensor de uns 3 x 4
torch.ones((3,4))

tensor([[1., 1., 1., 1.],
        [1., 1., 1., 1.],
        [1., 1., 1., 1.]])

In [9]:
# gerando um tensor aleatorio 3 x 4, com valor minimo 0 e maximo 10
torch.randint(low=0, high=10, size=(3,4))

tensor([[3, 7, 2, 0],
        [2, 4, 1, 6],
        [1, 1, 1, 3]])

In [10]:
# gerando numeros aleatorios entre 0 e 1
torch.rand(3,4)

tensor([[0.3348, 0.5092, 0.1224, 0.9948],
        [0.1736, 0.1740, 0.1960, 0.0311],
        [0.5823, 0.8016, 0.4792, 0.4072]])

In [11]:
# gerando numeros de uma distribuição normal
torch.randn((3,4))

tensor([[ 0.5156,  1.4579, -0.3109,  0.1952],
        [-0.6684, -1.1528,  0.3089, -0.2741],
        [ 0.4389, -0.5326, -1.0334, -0.9158]])

In [12]:
# convertendo uma matriz Numpy em um tensor
import numpy as np
x = np.array([[10,20,30],[2,3,4]])
y = torch.tensor(x)
print(f'Tipo de dado: {type(x)}, tipo anterior convertido {type(y)}')

Tipo de dado: <class 'numpy.ndarray'>, tipo anterior convertido <class 'torch.Tensor'>


# Operações com tensores

In [13]:
x = torch.tensor([[1,2,3,4], [5,6,7,8]])
print(f'Tensor com valores iniciais: {x}')
print(f'Tensor com valores multiplicados por 10: {x*10}')

Tensor com valores iniciais: tensor([[1, 2, 3, 4],
        [5, 6, 7, 8]])
Tensor com valores multiplicados por 10: tensor([[10, 20, 30, 40],
        [50, 60, 70, 80]])


In [15]:
# adicionando valor ao tensor
x.add(10)

tensor([[11, 12, 13, 14],
        [15, 16, 17, 18]])

In [16]:
# concatenando tensores
x = torch.randn(10,10,10)
z = torch.cat([x,x], axis=0)
print('Eixo cat axis 0: ', x.shape, z.shape)

z = torch.cat([x,x], axis=1)
print('Eixo cat axis 1: ', x.shape, z.shape)

z = torch.cat([x,x], axis=2)
print('Eixo cat axis 2: ', x.shape, z.shape)

Eixo cat axis 0:  torch.Size([10, 10, 10]) torch.Size([20, 10, 10])
Eixo cat axis 1:  torch.Size([10, 10, 10]) torch.Size([10, 20, 10])
Eixo cat axis 2:  torch.Size([10, 10, 10]) torch.Size([10, 10, 20])


In [17]:
x = torch.arange(25).reshape(5,5)
print(x)
print(f'Maior valor no tensor: {x.max()}')
print(f'Menor valor no tensor: {x.min()}')

tensor([[ 0,  1,  2,  3,  4],
        [ 5,  6,  7,  8,  9],
        [10, 11, 12, 13, 14],
        [15, 16, 17, 18, 19],
        [20, 21, 22, 23, 24]])
Maior valor no tensor: 24
Menor valor no tensor: 0


In [18]:
# extraindo os maiores valores do tensor e sua localização/indice (linha da matriz)
x.max(dim=0)

torch.return_types.max(
values=tensor([20, 21, 22, 23, 24]),
indices=tensor([4, 4, 4, 4, 4]))

É importante saber que você pode fazer quase todas as operações do NumPy no PyTorch com quase a mesma sintaxe do NumPy. Operações matemáticas padrão, tais como abs, add, argsort, ceil, floor, sin, cos, tan, cumsum, cumprod, diag, eig, exp, log, log2, log10, mean, median, mode, resize, round, sigmoid, softmax, square, sqrt, svd, e transpose, para citar alguns, pode ser diretamente chamado em qualquer tensor com ou sem eixos onde aplicável. Você sempre pode executar dir(torch.Tensor) para ver todos os métodos possíveis para um tensor de tocha ehelp(torch.Tensor.<method>) para consultar a ajuda e a documentação oficial desse método.

# Gradientes automáticos de objetos tensores

In [20]:
# definindo um gradiente e um tensor
x = torch.tensor([[2.,-1.],[1.,1.]], requires_grad=True)
print(x)

tensor([[ 2., -1.],
        [ 1.,  1.]], requires_grad=True)


No código anterior, o requires_grad parâmetro especifica que o gradiente deve ser calculado para o objeto tensor.

# Construindo uma rede neural usando PyTorch
No capítulo anterior, aprendemos como construir uma rede neural do zero, onde os componentes de uma rede neural são os seguintes:

* O número de camadas ocultas
* O número de unidades em uma camada oculta
* Funções de ativação realizadas nas várias camadas
* A função de perda que tentamos otimizar para
* A taxa de aprendizagem associada à rede neural
* O tamanho do lote de dados aproveitado para construir a rede neural
* O número de épocas de propagação para frente e para trás

In [21]:
import torch
x = torch.rand(1, 6400)
y = torch.rand(6400, 5000)

In [22]:
device = 'cuda' if torch.cuda.is_available() else 'cpu'

In [23]:
x, y = x.to(device), y.to(device)

In [24]:
%timeit z=(x@y)

7.48 ms ± 1.89 ms per loop (mean ± std. dev. of 7 runs, 100 loops each)


In [25]:
x, y = x.cpu(), y.cpu()
%timeit z=(x@y)

6.56 ms ± 50.9 µs per loop (mean ± std. dev. of 7 runs, 100 loops each)


In [26]:
import numpy as np
x = np.random.random((1, 6400))
y = np.random.random((6400, 5000))
%timeit z = np.matmul(x,y)

13.9 ms ± 155 µs per loop (mean ± std. dev. of 7 runs, 100 loops each)


In [27]:
# definindo valores de entrada e saida
x = [[1,2],[3,4],[5,6],[7,8]]
y = [[3],[7],[11],[15]]

Observe que na inicialização da variável de entrada e saída anterior, a entrada e a saída são uma lista de listas em que a soma dos valores na lista de entrada são os valores na lista de saída.

In [28]:
# realizando um cast nas entradas
X = torch.tensor(x).float()
Y = torch.tensor(y).float()

In [29]:
device = 'cuda' if torch.cuda.is_available() else 'cpu'
X = X.to(device)
Y = Y.to(device)

In [30]:
# definindo a arquitetura da rede neural
import torch.nn as nn

In [31]:
# criando uma classe para compor a arquitetura de modelo
class MyNeuralNet(nn.Module):
    def __init__(self):
        super().__init__() # chamamos o super para que a classe herde de nn
        self.input_to_hidden_layer = nn.Linear(2,8) # camada linear
        self.hidden_layer_activation = nn.ReLU() # camada de ativação
        self.hidden_to_output_layer = nn.Linear(8,1) # camada linear
        # print(nn.Linear)

In [32]:
print (nn.Linear ( 2 , 7 ))

Linear(in_features=2, out_features=7, bias=True)


In [33]:
def forward (self, x): 
    x = self.input_to_hidden_layer (x) 
    x = self.hidden_layer_activation (x) 
    x = self.hidden_to_output_layer (x) 
    return x

In [34]:
# criando uma instancia
mynet = MyNeuralNet().to(device)

In [35]:
mynet.input_to_hidden_layer.weight

Parameter containing:
tensor([[ 0.0598,  0.2959],
        [-0.2733,  0.5146],
        [ 0.5927, -0.2879],
        [-0.1242, -0.6149],
        [-0.3833,  0.1826],
        [-0.3827, -0.0704],
        [-0.1510, -0.3834],
        [ 0.0751, -0.4923]], requires_grad=True)

In [36]:
# Todos os parâmetros de uma rede neural podem ser obtidos usando o seguinte código:
mynet.parameters()

<generator object Module.parameters at 0x7f2ed67b26d0>

In [37]:
for i in mynet.parameters():
    print(i)

Parameter containing:
tensor([[ 0.0598,  0.2959],
        [-0.2733,  0.5146],
        [ 0.5927, -0.2879],
        [-0.1242, -0.6149],
        [-0.3833,  0.1826],
        [-0.3827, -0.0704],
        [-0.1510, -0.3834],
        [ 0.0751, -0.4923]], requires_grad=True)
Parameter containing:
tensor([ 0.2390,  0.1024, -0.5023,  0.2467, -0.2507, -0.1084, -0.3090, -0.3910],
       requires_grad=True)
Parameter containing:
tensor([[-0.0892,  0.1432, -0.1508,  0.2059,  0.1611, -0.2687,  0.3175,  0.1244]],
       requires_grad=True)
Parameter containing:
tensor([-0.2772], requires_grad=True)


# Conjunto de dados, DataLoader e tamanho do lote

In [38]:
from torch.utils.data import Dataset, DataLoader
import torch
import torch.nn as nn

In [39]:
x = [[1 , 2], [3 , 4], [5 , 6], [7 , 8]] 
y = [[ 3 ], [ 7 ], [ 11 ], [ 15 ]]

In [40]:
X = torch.tensor (x).float () 
Y = torch.tensor (y).float ()

In [41]:
device = 'cuda' if torch.cuda.is_available () else 'cpu'
X = X.to(device) 
Y = Y.to(device)  

In [43]:
# instanciando uma classe dataset
class Mydataset(Dataset):
    """Definindo metodo que pega pares de entrada e saida
    e converte em objetos flutuantes"""
    def __init__(self, x, y):
        self.x = torch.tensor(x).float()
        self.y = torch.tensor(y).float()

    """Especifica o comprimento do conjunto de entrada de dados"""
    def __len__(self):
        return len(self.x)

    """Método usado para buscar uma linha específica"""
    def __getitem__(self, ix):
        return self.x[ix], self.y[ix]

In [44]:
# criando uma instancia
ds = Mydataset(X, Y)

  self.x = torch.tensor(x).float()
  self.y = torch.tensor(y).float()


In [45]:
dl = DataLoader(ds, batch_size=2, shuffle=True)

In [46]:
# abaixo um codigo ilustrativo para impressao de lotes de entrada e saida de dados
for x, y in dl:
    print(x, y)

tensor([[3., 4.],
        [7., 8.]]) tensor([[ 7.],
        [15.]])
tensor([[5., 6.],
        [1., 2.]]) tensor([[11.],
        [ 3.]])


Observe que o código anterior resultou em dois conjuntos de pares de entrada-saída, pois havia um total de quatro pontos de dados no conjunto de dados original, enquanto o tamanho do lote especificado era 2.

In [47]:
# definindo uma classe de rede
class MyNeuralNet (nn.Module): 
    def __init__(self): 
        super().__init__() 
        self.input_to_hidden_layer = nn.Linear (2,8) 
        self.hidden_layer_activation = nn.ReLU () 
        self.hidden_to_output_layer = nn.Linear (8,1) 
    def forward (self, x): 
        x = self.input_to_hidden_layer (x) 
        x = self.hidden_layer_activation (x) 
        x = self.hidden_to_output_layer (x) 
        return x

In [48]:
# definindo o modelo do objeto
mynet = MyNeuralNet().to(device)
loss_func = nn.MSELoss()
from torch.optim import SGD
opt = SGD(mynet.parameters(), lr = 0.001)

In [49]:
# loop pelos lotes de pontos de dados para minimizar o valor de perda
import time
loss_history = []
start = time.time()
for _ in range(50):
    for data in dl:
        x, y = data
        opt.zero_grad()
        loss_value = loss_func(mynet(x), y)
        loss_value.backward()
        opt.step()
        loss_history.append(loss_value)
end = time.time()
print(end - start)

0.08872175216674805


# Previsão de novos pontos de dados

In [50]:
# criando novo ponto de dados para teste de modelo
val_x = [[10,11]]

In [51]:
# realizando um cast nos pontos de dados
val_x = torch.tensor(val_x).float().to(device)

In [52]:
# passando o objeto tensor pela rede neural treinada
mynet(val_x)

tensor([[20.4103]], grad_fn=<AddmmBackward>)

# Implementando uma função de perda personalizada
Em certos casos, podemos ter que implementar uma função de perda customizada para o problema que estamos resolvendo - especialmente em casos de uso complexos envolvendo detecção de objetos / redes adversas geradoras ( GANs ). O PyTorch fornece as funcionalidades para construirmos uma função de perda personalizada, escrevendo uma função nossa.

In [53]:
import torch.nn as nn
from torch.utils.data import Dataset, DataLoader
import torch.nn as nn
import torch

x = [[1,2],[3,4],[5,6],[7,8]]
y = [[3],[7],[11],[15]]

X = torch.tensor(x).float()
Y = torch.tensor(y).float()

device = 'cuda' if torch.cuda.is_available() else 'cpu'
X = X.to(device)
Y = Y.to(device) 

class MyDataset(Dataset):
    def __init__(self,x,y):
        self.x = torch.tensor(x).float()
        self.y = torch.tensor(y).float()

    def __len__(self):
        return len(self.x)

    def __getitem__(self, ix):
        return self.x[ix], self.y[ix]

class MyNeuralNet(nn.Module):
    def __init__(self):
        super().__init__()
        self.input_to_hidden_layer = nn.Linear(2,8)
        self.hidden_layer_activation = nn.ReLU()
        self.hidden_to_output_layer = nn.Linear(8,1)

    def foward(self, x):
        x = self.input_to_hidden_layer(x)
        x = self.hidden_layer_activation(x)
        x = self.hidden_to_output_layer(x)
        return x

In [54]:
ds = MyDataset(X, Y)
dl = DataLoader(ds, batch_size=2, shuffle=True)

  self.x = torch.tensor(x).float()
  self.y = torch.tensor(y).float()


In [55]:
mynet = MyNeuralNet().to(device)

In [56]:
def my_mean_squared_error(_y, y):
    loss = (_y-y)**2
    loss = loss.mean()
    return loss

In [57]:
loss_func = nn.MSELoss()
loss_value = loss_func(mynet(X),Y)
print(loss_value)

NotImplementedError: NotImplementedError: 

In [58]:
my_mean_squared_error(mynet(X),Y)

NotImplementedError: NotImplementedError: 

In [59]:
input_to_hidden = mynet.input_to_hidden_layer(X) 
hidden_activation = mynet.hidden_layer_activation (input_to_hidden) 
print(hidden_activation)

tensor([[0.3476, 0.2213, 0.7853, 0.1512, 0.0000, 0.0000, 1.5317, 0.0000],
        [1.2601, 0.0000, 0.7816, 0.8359, 0.0000, 0.0000, 3.4046, 0.0000],
        [2.1727, 0.0000, 0.7779, 1.5205, 0.0000, 0.0000, 5.2775, 0.0000],
        [3.0853, 0.0000, 0.7742, 2.2051, 0.0000, 0.0000, 7.1503, 0.0000]],
       grad_fn=<ReluBackward0>)


Observe que tivemos que chamar a input_to_hidden_layerativação antes de chamar, hidden_layer_activationpois a saída de input_to_hidden_layeré a entrada para a hidden_layer_activationcamada.

In [65]:
class Neuralnet(nn.Module):
    def __init__(self):
        super().__init__()
        self.input_to_hidden_layer = nn.Linear(2,8)
        self.hidden_layer_activation = nn.ReLU()
        self.hidden_to_output_layer = nn.Linear(8,1)


    def forward(self, x):
        hidden1 = self.input_to_hidden_layer(x)
        hidden2 = self.hidden_layer_activation(hidden1)
        output = self.hidden_to_output_layer(hidden2)
        return output, hidden2

# Usando um método sequencial para construir uma rede neural

In [76]:
x = [[ 1 , 2 ], [ 3 , 4 ], [ 5 , 6 ], [ 7 , 8 ]] 
y = [[ 3 ], [ 7 ], [ 11 ], [ 15 ]]

In [77]:
import torch
import torch.nn as nn
import numpy as np
from torch.utils.data import Dataset, DataLoader
device = 'cuda' if torch.cuda.is_available() else 'cpu'

In [78]:
class MyDataset(Dataset):
    def __init__(self, x, y):
        self.x = torch.tensor(x).float().to(device)
        self.y = torch.tensor(y).float().to(device)
    def __getitem__(self, ix):
        return self.x[ix], self.y[ix]
    def __len__(self): 
        return len(self.x)

In [79]:
ds = MyDataset(x, y)
dl = DataLoader(ds, batch_size=2, shuffle=True)

In [80]:
model = nn.Sequential(nn.Linear(2, 8), nn.ReLU(), nn.Linear(8, 1)).to(device)

In [81]:
# instalando o package torch_summary
# !pip install torch_summary

Collecting torch_summary
  Downloading torch_summary-1.4.5-py3-none-any.whl (16 kB)
Installing collected packages: torch-summary
Successfully installed torch-summary-1.4.5


In [84]:
from torchsummary import summary
summary(model, torch.zeros(1,2))

Layer (type:depth-idx)                   Output Shape              Param #
├─Linear: 1-1                            [-1, 8]                   24
├─ReLU: 1-2                              [-1, 8]                   --
├─Linear: 1-3                            [-1, 1]                   9
Total params: 33
Trainable params: 33
Non-trainable params: 0
Total mult-adds (M): 0.00
Input size (MB): 0.00
Forward/backward pass size (MB): 0.00
Params size (MB): 0.00
Estimated Total Size (MB): 0.00


Layer (type:depth-idx)                   Output Shape              Param #
├─Linear: 1-1                            [-1, 8]                   24
├─ReLU: 1-2                              [-1, 8]                   --
├─Linear: 1-3                            [-1, 1]                   9
Total params: 33
Trainable params: 33
Non-trainable params: 0
Total mult-adds (M): 0.00
Input size (MB): 0.00
Forward/backward pass size (MB): 0.00
Params size (MB): 0.00
Estimated Total Size (MB): 0.00

In [85]:
"""A seguir, definimos a função de perda ( loss_func) e o 
otimizador ( opt) e treinamos o modelo"""

loss_func = nn.MSELoss()
from torch.optim import SGD
opt = SGD(model.parameters(), lr = 0.001)
import time
loss_history = []
start = time.time()
for _ in range(50):
    for ix, iy in dl:
        opt.zero_grad()
        loss_value = loss_func(model(ix),iy)
        loss_value.backward()
        opt.step()
        loss_history.append(loss_value)
end = time.time()
print(end - start)

0.05539441108703613


In [90]:
# agora que o modelo está treinado podemos prever os valores
val = [[8 , 9], [10 ,11], [1.5, 2.5]]

In [88]:
model(torch.tensor(val).float().to(device))

tensor([[16.5568],
        [20.2641],
        [ 4.4850]], grad_fn=<AddmmBackward>)

Observe que a saída do código anterior, conforme mostrado no comentário, está próxima do esperado (que é a soma dos valores de entrada).

In [91]:
# salvando
torch.save(model.to('cpu').state_dict(), 'mymodel.pth')

In [92]:
# lendo o arquivo
state_dict = torch.load ('mymodel.pth')

In [93]:
model.load_state_dict (state_dict)

<All keys matched successfully>

Se todos os nomes de peso estiverem presentes no modelo, você receberá uma mensagem dizendo que todas as chaves foram combinadas. Isso significa que podemos carregar nosso modelo do disco, para todos os fins, em qualquer máquina do mundo.

# Attention
Every codes here are book's Moder Computer vision with PyTorch<br>
https://learning.oreilly.com/library/view/modern-computer-vision/9781839213472/f1d61b2c-dbb8-43ac-ac4e-75941daecc4c.xhtml#uuid-7b6ca1ba-20ea-4326-a10f-61c46baa7103 