In [1]:
import torch
import torch.nn as nn
import torch.nn.functional as F
import matplotlib.pyplot as plt

In [2]:
torch.cuda.is_available()

True

## Softmax

*So, what is softmax?*

Służy do przekształcenia wartości wyjściowych z modelu na prawdopodobieństwa. Wartości wyjściowe są przekształcane w taki sposób, że suma wszystkich wartości wynosi 1. Czyli normalizacja wartości wyjściowych, np. na końcu jakiejś sieci neuronowej.

In [3]:
class SimpleModel(nn.Module):
    def __init__(self, input_size, hidden_size, output_size):
        super(SimpleModel, self).__init__()
        self.fc1 = nn.Linear(input_size, hidden_size)
        self.fc2 = nn.Linear(hidden_size, output_size)

    def forward(self, x):
        x = torch.flatten(x)
        x = self.fc1(x)
        x = F.relu(x)
        x = self.fc2(x)
        return x

In [4]:
class SimpleModelWithSoftmax(SimpleModel):
    def __init__(self, input_size, hidden_size, output_size):
        super(SimpleModelWithSoftmax, self).__init__(
            input_size, hidden_size, output_size
        )
        self.softmax = nn.Softmax(dim=-1)

    def forward(self, x):
        x = super().forward(x)
        x = self.softmax(x)
        return x

In [5]:
input_tensor_shape = (24, 24)

input_size = 24 * 24
hidden_size = 100
output_size = 4

In [6]:
input_tensor = torch.randn(input_tensor_shape)
print(input_tensor.size())
# print(input_tensor)

torch.Size([24, 24])


In [7]:
# Create instances of the models
simple_model = SimpleModel(input_size, hidden_size, output_size)
softmax_model = SimpleModelWithSoftmax(input_size, hidden_size, output_size)

In [8]:
simple_output = simple_model.forward(input_tensor)
softmax_output = softmax_model.forward(input_tensor)

In [13]:
print("SimpleModel output:", simple_output)
print("SimpleModelWithSoftmax output:", softmax_output)
print("SimpleModelWithSoftmax output max:", torch.max(softmax_output))
print("SimpleModelWithSoftmax output argmax:", torch.argmax(softmax_output))

SimpleModel output: tensor([-0.0901,  0.1129,  0.0355,  0.0599], grad_fn=<ViewBackward0>)
SimpleModelWithSoftmax output: tensor([0.1688, 0.1793, 0.2887, 0.3632], grad_fn=<SoftmaxBackward0>)
SimpleModelWithSoftmax output max: tensor(0.3632, grad_fn=<MaxBackward1>)
SimpleModelWithSoftmax output argmax: tensor(3)


In [10]:
print("SimpleModel output sum:", torch.sum(simple_output))
print("SimpleModelWithSoftmax output sum:", torch.sum(softmax_output))

SimpleModel output sum: tensor(0.1182, grad_fn=<SumBackward0>)
SimpleModelWithSoftmax output sum: tensor(1., grad_fn=<SumBackward0>)


## Argmax

*So, what is argmax?*

Zbiór argumentów funkcji, dla których osiąga ona maksymalną wartość (wikipedia). Lub po prostu indeks wartości maksymalnej w tablicy (torch).


In [11]:
print("SimpleModel output max:", torch.max(simple_output))
print("SimpleModel output argmax:", torch.argmax(simple_output))
print()
print("SimpleModelWithSoftmax output max:", torch.max(softmax_output))
print("SimpleModelWithSoftmax output argmax:", torch.argmax(softmax_output))

SimpleModel output max: tensor(0.1129, grad_fn=<MaxBackward1>)
SimpleModel output argmax: tensor(1)

SimpleModelWithSoftmax output max: tensor(0.3632, grad_fn=<MaxBackward1>)
SimpleModelWithSoftmax output argmax: tensor(3)
