In [1]:
import torch
import torch.nn as nn
from torch.utils.data import Dataset, DataLoader, random_split

In [2]:
device = torch.device('cuda' if torch.cuda.is_available() else 'cpu')

In [3]:
y = torch.load("Objects/labels.pt")
X = torch.load("Objects/padded_glove_embeddings.pt")

FileNotFoundError: [Errno 2] No such file or directory: 'Objects/labels.pt'

In [4]:
class Data(Dataset):
    def __init__(self, x, y):
        self.x = x
        self.y = y
        self.n_samples = X.size(0)
        
    def __getitem__(self, idx):
        return self.x[idx], self.y[idx]
    
    def __len__(self):
        return self.n_samples
        

In [5]:
data = Data(X, y)

In [6]:
train_data, test_data = random_split(data, [4000, 846])

In [7]:
batch_size=5

In [8]:
train_loader = DataLoader(dataset=train_data, batch_size=batch_size, shuffle=True)
test_loader = DataLoader(dataset=test_data, batch_size=batch_size, shuffle=False)

In [162]:
# define model architechture
class CNN(nn.Module):
    def __init__(self):
        super(CNN, self).__init__()
        self.conv1 = nn.Conv2d(1,1,(1,300), stride=1)
        self.conv2 = nn.Conv2d(1,1,(2,1), stride=1)
        self.conv3 = nn.Conv1d(1,1,(3,300), stride=1)
        self.pool1 = nn.MaxPool2d((4,1))
        self.pool2 = nn.AvgPool2d((4,1))
        
        self.activation = nn.Tanh()
        
        self.flat = nn.Flatten()
        self.linear1 = nn.Linear(5, 3)
    def forward(self, x):
        #output = self.conv1(x)
        #output = self.conv2(output)
        output = self.activation(self.conv1(x))
        output = self.activation(self.pool2(output))
        output = self.activation(self.conv2(output))
        output = self.activation(self.pool2(output))
        output = self.flat(output)
        output = self.activation(self.linear1(output))
        
        return output

In [163]:
model = CNN()
learning_rate = 0.001
optimizer = torch.optim.SGD(model.parameters(), lr=learning_rate)
criterion = nn.CrossEntropyLoss()

In [164]:
# hypereparameters
num_epochs = 10
n_total_steps = len(train_loader)

In [165]:
for epoch in range(num_epochs):
    for i, (feature, label) in enumerate(train_loader):
        feature = feature.to(device)
        label = label.to(device)
        feature = feature.view(batch_size, 1, 88, 300)
        #forward pass
        outputs = model(feature.float())
        loss = criterion(outputs, label)
        
        #back prop
        optimizer.zero_grad()
        loss.backward()
        optimizer.step()
        
        if (i + 1) % 200 == 0:
            print(f'Loss: {loss} --- epoch: {epoch+1}, step: {i+1}/{n_total_steps}') 
            print(feature.size())

Loss: 1.0732002258300781 --- epoch: 1, step: 200/880
torch.Size([5, 1, 88, 300])
Loss: 1.1660754680633545 --- epoch: 1, step: 400/880
torch.Size([5, 1, 88, 300])
Loss: 1.0791847705841064 --- epoch: 1, step: 600/880
torch.Size([5, 1, 88, 300])
Loss: 0.9290782809257507 --- epoch: 1, step: 800/880
torch.Size([5, 1, 88, 300])
Loss: 1.0064963102340698 --- epoch: 2, step: 200/880
torch.Size([5, 1, 88, 300])
Loss: 1.0047452449798584 --- epoch: 2, step: 400/880
torch.Size([5, 1, 88, 300])
Loss: 1.1487127542495728 --- epoch: 2, step: 600/880
torch.Size([5, 1, 88, 300])
Loss: 1.0052978992462158 --- epoch: 2, step: 800/880
torch.Size([5, 1, 88, 300])
Loss: 1.1471436023712158 --- epoch: 3, step: 200/880
torch.Size([5, 1, 88, 300])
Loss: 0.8148767352104187 --- epoch: 3, step: 400/880
torch.Size([5, 1, 88, 300])
Loss: 0.9945775270462036 --- epoch: 3, step: 600/880
torch.Size([5, 1, 88, 300])
Loss: 0.9750156402587891 --- epoch: 3, step: 800/880
torch.Size([5, 1, 88, 300])
Loss: 1.0771434307098389 ---

In [166]:
with torch.no_grad():
    predictions = torch.tensor([])
    labels = torch.tensor([])
    for feature, label in test_loader:
        feature = feature.to(device)

        feature = feature.view(feature.size()[0],1,88,300)
        label = label.to(device)
        outputs = model(feature.float())
        _, predicted = torch.max(outputs, 1)
        
        predictions = torch.cat([predictions, predicted])
        labels = torch.cat([label, labels])

In [167]:
(predictions == labels).sum() / 446

tensor(0.5942)

In [168]:
predictions

tensor([1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1.,
        1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1.,
        1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1.,
        1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1.,
        1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1.,
        1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1.,
        1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1.,
        1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1.,
        1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1.,
        1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1.,
        1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1.,
        1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1.,
        1., 1., 1., 1., 1., 1., 1., 1., 

In [17]:
labels

tensor([1., 0., 1., 1., 1., 1., 1., 2., 1., 1., 0., 1., 2., 1., 0., 2., 1., 1.,
        2., 1., 2., 1., 1., 1., 2., 1., 2., 1., 1., 1., 2., 1., 1., 1., 1., 1.,
        1., 1., 2., 2., 0., 1., 0., 1., 0., 1., 1., 1., 1., 2., 0., 2., 0., 1.,
        1., 1., 1., 2., 1., 1., 2., 2., 1., 2., 0., 2., 1., 0., 0., 1., 2., 1.,
        1., 2., 2., 1., 2., 2., 0., 1., 1., 1., 2., 2., 2., 2., 2., 2., 2., 1.,
        1., 1., 1., 1., 2., 1., 1., 2., 0., 1., 1., 0., 1., 1., 2., 1., 2., 1.,
        1., 1., 2., 2., 1., 2., 2., 2., 2., 2., 1., 1., 0., 0., 1., 1., 1., 1.,
        1., 1., 2., 2., 1., 1., 2., 0., 1., 0., 1., 1., 2., 2., 0., 1., 1., 2.,
        1., 2., 1., 1., 1., 0., 1., 1., 2., 1., 1., 2., 1., 1., 1., 1., 1., 0.,
        1., 2., 0., 1., 1., 1., 0., 1., 0., 2., 1., 1., 1., 1., 1., 1., 0., 1.,
        2., 1., 1., 1., 1., 0., 1., 1., 1., 1., 2., 2., 2., 2., 2., 1., 1., 0.,
        1., 1., 0., 1., 1., 1., 1., 2., 1., 2., 2., 2., 0., 1., 1., 2., 1., 0.,
        1., 1., 1., 2., 1., 0., 1., 1., 