In [93]:
import numpy as np  
import matplotlib.pyplot as plt
import torch 
import torch.nn as nn
import torchvision
import torchvision.transforms as transforms

In [94]:
#Hyperparameters:

input_size = 784
num_classes = 10
num_epochs = 5
batch_size = 100
learning_rate = 0.05

In [95]:
#MNIST dataset (images and labels):

train_dataset = torchvision.datasets.MNIST(root='./data',
                                           train=True,
                                           transform=transforms.ToTensor(),
                                           download=True)

test_dataset = torchvision.datasets.MNIST(root='./data',
                                          train=False,
                                          transform=transforms.ToTensor())
#CONSIGLIO DI MOSTRARE SEMPRE LA DIMENSIONE DEI TENSORI CHE ABBIAMO CREATO.


In [96]:
#Data loader:

train_loader = torch.utils.data.DataLoader(dataset=train_dataset,
                                           batch_size=batch_size,
                                           shuffle=True)

test_dataset = torch.utils.data.DataLoader(dataset=test_dataset,
                                           batch_size=batch_size,
                                           shuffle=False)
#voglio vedere le dimensioni del tensore:
print(train_dataset[0][0].shape)


torch.Size([1, 28, 28])


In [97]:
#Logistic regression model:

model = nn.Linear(in_features=input_size, out_features=num_classes)
'''
praticamente rispetto a Linear regression non cambia nulla nella definzione del modello. 
Questo perchè non ci serve implementare la funzione softmaz, dato che verrà usata
nella loss nn.CrossEntropyLoss()

la finzione CrossEntropyLoss() applica la funzione softmax direttamente all'input che gli diamo.
Pertanto il semplice input che gli diamo è il dot product.
'''

"\npraticamente rispetto a Linear regression non cambia nulla nella definzione del modello. \nQuesto perchè non ci serve implementare la funzione softmaz, dato che verrà usata\nnella loss nn.CrossEntropyLoss()\n\nla finzione CrossEntropyLoss() applica la funzione softmax direttamente all'input che gli diamo.\nPertanto il semplice input che gli diamo è il dot product.\n"

In [98]:
#Loss and optimizer:

#Loss Functions:
loss_fn = nn.CrossEntropyLoss()

#optimizer
optimizer= torch.optim.SGD(model.parameters(), lr=learning_rate)

In [99]:
#Train The Model:

total_step = len(train_loader)
for epoch in range(num_epochs):
    for idx , (images , lables) in enumerate(train_loader):
        #reshape images to (batch_size, input_size) ???
        ''' La shape se non la tocchiamo è un tensore [100,1,28,28] che è: batch, canali , h , l
        quindi 100 immagini per bach, un canale (grey scale) , 28 h , 28 l
            Il Layer linear non è pensato per gestire tensori 4D, quello che si aspetta è un tensore 2D
        In cui la prima dimensione è la batch, e la seconda sono le Features (pixel)
            Quindi dovrò ottenere un tensore [100, 784]
        '''
        images = images.reshape(batch_size,input_size) #--> [100,784] 
        ''' Potevamo mettere -1 al posto di batch size, e il compilatore lo calcola da solo
            L'organizzazione è comunque a matrice, dobbiamo immaginarla come 100 righe e
            784 colonne, che sono i pixels (features)
        '''
        #print(images.shape)
        #print(type(images))


        #forward pass:
        predictions = model(images)
        loss = loss_fn(predictions,lables)

        #Backward:
        optimizer.zero_grad() #azzero i gradienti
        loss.backward() #calcolo i gradienti
        optimizer.step() #aggiorno i pesi

        # Print the log info
        if (idx+1) % 100 == 0:
            print ('Epoch [{}/{}], Step [{}/{}], Loss: {:.4f}'
                   .format(epoch+1, num_epochs, idx+1, total_step, loss.item()))

Epoch [1/5], Step [100/600], Loss: 0.7647
Epoch [1/5], Step [200/600], Loss: 0.6604
Epoch [1/5], Step [300/600], Loss: 0.5232
Epoch [1/5], Step [400/600], Loss: 0.5679
Epoch [1/5], Step [500/600], Loss: 0.5501
Epoch [1/5], Step [600/600], Loss: 0.3538
Epoch [2/5], Step [100/600], Loss: 0.4165
Epoch [2/5], Step [200/600], Loss: 0.4997
Epoch [2/5], Step [300/600], Loss: 0.3870
Epoch [2/5], Step [400/600], Loss: 0.2373
Epoch [2/5], Step [500/600], Loss: 0.4367
Epoch [2/5], Step [600/600], Loss: 0.3860
Epoch [3/5], Step [100/600], Loss: 0.4059
Epoch [3/5], Step [200/600], Loss: 0.3201
Epoch [3/5], Step [300/600], Loss: 0.3274
Epoch [3/5], Step [400/600], Loss: 0.4602
Epoch [3/5], Step [500/600], Loss: 0.3258
Epoch [3/5], Step [600/600], Loss: 0.4295
Epoch [4/5], Step [100/600], Loss: 0.3619
Epoch [4/5], Step [200/600], Loss: 0.2243
Epoch [4/5], Step [300/600], Loss: 0.2819
Epoch [4/5], Step [400/600], Loss: 0.4310
Epoch [4/5], Step [500/600], Loss: 0.2608
Epoch [4/5], Step [600/600], Loss:

In [100]:
#Test Model:

with torch.no_grad():
    correct=0
    total=0
    for images, lables in test_dataset:
        images = images.reshape(-1, 28*28)
        outputs = model(images)
        
        _, predicted = torch.max(outputs.data, 1) #Lui mi da il vettore di predizioni, e io prendo solo il massimo.
        total += lables.size(0)
        correct += (predicted == lables).sum()

        print('Accuracy of the model on the 10000 test images: {} %'.format(100 * correct / total))

    print(outputs.shape)
    print(outputs)

Accuracy of the model on the 10000 test images: 94.0 %
Accuracy of the model on the 10000 test images: 95.0 %
Accuracy of the model on the 10000 test images: 94.33333587646484 %
Accuracy of the model on the 10000 test images: 93.0 %
Accuracy of the model on the 10000 test images: 92.19999694824219 %
Accuracy of the model on the 10000 test images: 91.0 %
Accuracy of the model on the 10000 test images: 90.71428680419922 %
Accuracy of the model on the 10000 test images: 90.75 %
Accuracy of the model on the 10000 test images: 91.0 %
Accuracy of the model on the 10000 test images: 90.5999984741211 %
Accuracy of the model on the 10000 test images: 90.36363983154297 %
Accuracy of the model on the 10000 test images: 90.25 %
Accuracy of the model on the 10000 test images: 89.30769348144531 %
Accuracy of the model on the 10000 test images: 89.28571319580078 %
Accuracy of the model on the 10000 test images: 89.19999694824219 %
Accuracy of the model on the 10000 test images: 89.125 %
Accuracy of t

In [None]:
#save the code:
torch.save(model.state_dict(), 'Logistic.ckpt')