## MovieLens 100K Datensatz ohne Features 

Entnommen wurde der Datensatz aus https://grouplens.org/datasets/movielens/100k/. Dieser ist der **10-Core**
MovieLens Datensatz mit 100.000 Bewertungen. 

**Datensatz-Quelle:** <br />
F. Maxwell Harper and Joseph A. Konstan. 2015. The MovieLens Datasets:<br />
History and Context. ACM Transactions on Interactive Intelligent<br />
Systems (TiiS) 5, 4, Article 19 (December 2015), 19 pages.<br />
DOI=http://dx.doi.org/10.1145/2827872

Die Implementation des Mini-Batche-Samplings (<i>class MinibatchSampler</i>) und des GCMC-Modells wurde (<i>class GCMCConv, class GCMCLayer, GCMCRating </i>) von der DGL-Library für das MovieLens Datenset (mit Features) zur Verfügung gestellt. In diesem Notebook wurde die Implementation so geändert, dass Vorhersagen auch ohne die nötigen Features berechnet werden können.

**DGL:**<br />
Minjie Wang and Da Zheng and Zihao Ye and Quan Gan and Mufei Li and Xiang Song and Jinjing Zhou and Chao Ma and Lingfan Yu and Yu Gai and Tianjun Xiao and Tong He and George Karypis and Jinyang Li and Zheng Zhang (2019): <br />
Deep Graph Library: A Graph-Centric, Highly-Performant Package for Graph Neural Networks <br />
arXiv preprint arXiv = 1909.01315


**Implementation eines Collaborativen Recommender Systems:** <br />
Bei diesem Informationssystem handelt es sich um ein Collaborative Filtering Recommender System.
Hier werden also keine weitere Daten außer Ratings, User-IDs und Item-IDs verwendet.


In [1]:
# Import des Datensatzes und der nötigen Bibliotheken
import pandas as pd

import torch
from torch.utils.data import TensorDataset, DataLoader
from torch import nn
import torch.nn.functional as F

import dgl
import dgl.function as fn
import dgl.nn as dglnn

from timeit import default_timer as timer
from datetime import timedelta
import math

# Datensatzvorbereitung
users = pd.read_csv('u.user', sep='|', header = None, encoding='latin-1',
                    names=['userId','alter','geschlecht', 'beruf','PLZ']) # mit | trennen damit Spalten generiert werden

movies = pd.read_csv('u.item', sep='|', header = None,encoding='latin-1', 
                     names=['itemId','title','veröffentlichung', 'NaN',
                            'links', 'unknown','action', 'adventure', 'animation',
                            'childrens','comedy', 'crime', 'documentary',
                            'drama', 'fantasy', 'filmnoir', 'horror', 'musical',
                            'mystery', 'romance', 'scifi', 'thriller', 'war',
                            'western']) 

trainset = pd.read_csv('ua.base', sep='\t', header = None,
                       names=['userId', 'itemId', 'rating', 'timestamp']) # mit \t trennen damit Spalten generiert werden

testset = pd.read_csv('ua.test', sep='\t', header = None, 
                      names=['userId', 'itemId', 'rating', 'timestamp'])

Using backend: pytorch


In [2]:
# Entfernung von allen Features (sowohl demographisch als auch content-based)
del trainset['timestamp']
del testset['timestamp']
del users['PLZ']
del users['beruf']
del users['geschlecht']
del users['alter']
del movies['title']
del movies['veröffentlichung']
del movies['NaN']
del movies['links']
del movies['unknown']
del movies['action']
del movies['adventure']
del movies['animation']
del movies['childrens']
del movies['comedy']
del movies['crime']
del movies['documentary']
del movies['drama']
del movies['fantasy']
del movies['filmnoir']
del movies['horror']
del movies['musical']
del movies['mystery']
del movies['romance']
del movies['scifi']
del movies['thriller']
del movies['war']
del movies['western']

In [3]:
# Datensatzvorbereitung

# entferne Items von testset die nicht im trainset sind. 
ueberschussTests = list(set(testset['itemId']).difference(set(trainset['itemId']))) #speichere differenz der Menge
i = 0
while i< len(ueberschussTests):  
    index = list(testset['itemId']).index(ueberschussTests[i]) #speichere Index vom Ueberschuss
    testset = testset.drop([index]) #lösche Items die überschüssig sind. 
    i = i+1

# entferne Items von movies die nicht im trainset sind.
ueberschussMovies = list(set(movies['itemId']).difference(set(trainset['itemId']))) #speichere Differenz der Menge
i = 0
while i< len(ueberschussMovies):  
    index = list(movies['itemId']).index(ueberschussMovies[i])
    movies = movies.drop([index]) # lösche Items die überschüssig sind. 
    i = i+1

### Konstruiere bipartiten Graphen

In [4]:
# Erstellt einen Tensor aus einer Liste. Ordnet Werte der Liste
# zu Unique-Values zu, falls bool = True. Sonst nicht.
def buildTensor(list, bool): 

    if bool:
        list = torch.LongTensor(list.astype('category')
                                .cat.codes.values) # Konvertiere zu category damit cat.codes ausgeführt werden kann.
    else:
        list = torch.LongTensor(list.values)
    return list

In [5]:
# Bilde Tensoren User und Item für den Graphen
# Zuordnung der Ids, da diese bei 1 Anfangen und nicht bei 0.
userId = torch.LongTensor(trainset['userId'].astype('category').cat.codes.values) 
itemId = torch.LongTensor(trainset['itemId'].astype('category').cat.codes.values) 

# Bilde Tensoren User und Item zum Testen des Graphens
userIdTest = torch.LongTensor(testset['userId'].astype('category').cat.codes.values) 
itemIdTest = torch.LongTensor(testset['itemId'].astype('category').cat.codes.values) 

# Erstelle bipartiten Graphen
graph = dgl.heterograph({
    ('user', 'rated', 'item'): (userId, itemId),
    # In DGL exestieren nur gerichtete Graphen. Daher wird
    # dies über beide Richtungen definiert
    ('item', 'rated-by', 'user'): (itemId, userId)
})
 
print(graph) # Info über Graphen

Graph(num_nodes={'item': 1680, 'user': 943},
      num_edges={('item', 'rated-by', 'user'): 90570, ('user', 'rated', 'item'): 90570},
      metagraph=[('item', 'user', 'rated-by'), ('user', 'item', 'rated')])


  This is separate from the ipykernel package so we can avoid doing imports until


### Füge Ratings in die Kanten hinzu

In [6]:
bewertungen = buildTensor(trainset['rating'], False)
bewertungenTest = buildTensor(testset['rating'], False) # Für spätere Testzwecke
graph.edges['rated'].data['rating'] = bewertungen
graph.edges['rated-by'].data['rating'] = bewertungen

### Definiere Train und Testsets als Tensor für das Modell

In [7]:
# Definiere Test und Trainset für das Modell über Tensoren
tensorTrainset = TensorDataset(userId, itemId, bewertungen)
tensorTestset = TensorDataset(userIdTest, itemIdTest, bewertungenTest)

### Erstellung von Minibatches & Neighbor Sampling

In [8]:
# Ausführung des Mini-Batchings
class MinibatchSampler(object):

    def __init__(self, graph, num_layers):
        self.graph = graph
        self.num_layers = num_layers
        
    # Finde die nötigen Knoten und konstruiere den Pair Graphen
    def sample(self, batch):
        # Konvertiere die Liste des Batches (Trainset) in 3 verschiedenen Vektoren.
        users, items, ratings = zip(*batch)
        users = torch.stack(users)
        items = torch.stack(items)
        ratings = torch.stack(ratings)
        
        # Konstruiere Bipartiten-Graph auf Grundlage des Batches.
        pair_graph = dgl.heterograph(
            {('user', 'rated', 'item'): (users, items)},
            num_nodes_dict={'user': self.graph.number_of_nodes('user'), 'item': self.graph.number_of_nodes('item')})
        
        pair_graph = dgl.compact_graphs(pair_graph) # Löscht Knoten die für das Sampling nicht genutzt werden.
        pair_graph.edata['rating'] = ratings # Füge die Ratings in die Sampling-Edges hinzu.
        
        # Konstruiere Blocks
        seeds = {'user': pair_graph.nodes['user'].data[dgl.NID], # Bestimme Seed-nodes über NID (Note-ID)
                 'item': pair_graph.nodes['item'].data[dgl.NID]}
        blocks = self.construct_blocks(seeds, (users, items)) # Hier werden Blöcke für die Seed-nodes konstruiert.
        
        # Speichert Node-Features vom Input Graphen in die Samplings.
        for feature_name in self.graph.nodes['user'].data.keys():
            blocks[0].srcnodes['user'].data[feature_name] = \
                self.graph.nodes['user'].data[feature_name][blocks[0].srcnodes['user'].data[dgl.NID]] 
            
        for feature_name in self.graph.nodes['item'].data.keys():
            blocks[0].srcnodes['item'].data[feature_name] = \
                self.graph.nodes['item'].data[feature_name][blocks[0].srcnodes['item'].data[dgl.NID]]
        
        # Ergebnis ist ein Mini-Batch
        return pair_graph, blocks 
    
    
    # Berechne den Block
    def construct_blocks(self, seeds, user_item_pairs_to_remove):
        blocks = []
        users, items = user_item_pairs_to_remove
        for i in range(self.num_layers):
            
            # übernimmt alle Nachbarn von den Seed-Nodes
            sampled_graph = dgl.in_subgraph(self.graph, seeds) 
            # Sampling für beide Richtungen finden.
            sampled_eids = sampled_graph.edges['rated'].data[dgl.EID]
            sampled_eids_rev = sampled_graph.edges['rated-by'].data[dgl.EID]
            
            # Hier werden die Kanten entfernt die nicht im Training-Prozess benötigt werden. 
            _, _, edges_to_remove = sampled_graph.edge_ids(users, items, etype='rated', return_uv=True)  
            _, _, edges_to_remove_rev = sampled_graph.edge_ids(items, users, etype='rated-by', return_uv=True)
            
            sampled_with_edges_removed = sampled_graph
            if len(edges_to_remove) > 0:
                sampled_with_edges_removed = dgl.remove_edges(
                    sampled_with_edges_removed, edges_to_remove, 'rated')
                sampled_eids = sampled_eids[sampled_with_edges_removed.edges['rated'].data[dgl.EID]]
                
            if len(edges_to_remove_rev) > 0:
                sampled_with_edges_removed = dgl.remove_edges(
                    sampled_with_edges_removed, edges_to_remove_rev, 'rated-by')
                sampled_eids_rev = sampled_eids_rev[sampled_with_edges_removed.edges['rated-by'].data[dgl.EID]]
            
            # Konstruiere einen Block vom gesampelten Graphen
            block = dgl.to_block(sampled_with_edges_removed, seeds)
            blocks.insert(0, block)
            seeds = {'user': block.srcnodes['user'].data[dgl.NID],
                     'item': block.srcnodes['item'].data[dgl.NID]}
            
            # Kopiere die Bewertungen zu den Kanten der gesampelten Graphen
            block.edges['rated'].data['rating'] = \
                self.graph.edges['rated'].data['rating'][sampled_eids]
            block.edges['rated-by'].data['rating'] = \
                self.graph.edges['rated-by'].data['rating'][sampled_eids_rev]
            
        return blocks

### Definiere das GCMC-Modell


In [9]:
from torch import nn
import torch.nn.functional as F
import dgl.function as fn
import dgl.nn as dglnn

class GCMCConv(nn.Module): # Die Funktionen dieser Klasse beschreibt einen Encoder

    def __init__(self, hidden_dims, num_ratings):
        super().__init__()
        
        # Die Bewertungen sind von 1 bis 5 nummeriert, daher muss eine 1 addiert werden. 
        self.W_r = nn.Parameter(torch.randn(num_ratings + 1, hidden_dims, hidden_dims)) # Initialisierung der erlernbaren Gewichtsmatrix in der Messagefunktion
        self.W_i = nn.Linear(hidden_dims * 2, hidden_dims) # Die Gewichtsmatrix W_i in der Akkumulationsfunktion
        
    def compute_message(self, W, edges): 
        W_r = W[edges.data['rating']] # W_r als Edge Feature für das Rating r. 
        h = edges.src['h'] # h als die h-te Zwischenebene des Encoders im GCMC, sowohl für User und Item
        m = (W_r @ h.unsqueeze(-1)).squeeze(2) # m als die Berechnete Message μ
        return m

    def forward(self, graph, node_features):
        with graph.local_scope():
            src_features, dst_features = node_features
            
            # Anwendung von compute_message auf alle Edgefeatures des Inputs
            graph.srcdata['h'] = src_features 
            graph.dstdata['h'] = dst_features 
            
             # Die Aggregation, wobei dies über den Schnitt der Nachbarschaft erfolgt
            graph.apply_edges(lambda edges: {'m': self.compute_message(self.W_r, edges)})
            
            # Updates der Repräsentationen von Output Users und Items
            graph.update_all(fn.copy_e('m', 'm'), fn.mean('m', 'h_neigh'))  
            
            # Akkumulationsfunktion mit Konkatenation
            result = F.relu(self.W_i(torch.cat([graph.dstdata['h'], graph.dstdata['h_neigh']], 1))) 
            return result 

In [10]:
class GCMCLayer(nn.Module):

    def __init__(self, hidden_dims, num_ratings):
        super().__init__()
        
        # Hier werden die Ebenen h_ui und h_vj für beide Richtungen ausgerechnet.
        self.heteroconv = dglnn.HeteroGraphConv(
            {'rated': GCMCConv(hidden_dims, num_ratings), 'rated-by': GCMCConv(hidden_dims, num_ratings)},
            aggregate='sum')
                
    def forward(self, block, input_user_features, input_item_features):
        with block.local_scope():
            # Input-Vektoren für die h.te Ebene
            h_user = input_user_features 
            h_item = input_item_features
            
            # übernehme Features von vorherhiger Ebene für nächste Ebene
            src_features = {'user': h_user, 'item': h_item} 
            dst_features = {'user': h_user[:block.number_of_dst_nodes('user')],
                            # Analog, jedoch mit Beachtung der Samplings
                            'item': h_item[:block.number_of_dst_nodes('item')]} 
            
            result = self.heteroconv(block, (src_features, dst_features))
            return result['user'], result['item']

In [11]:
class GCMCRating(nn.Module):
    def __init__(self, num_users, num_items, hidden_dims, num_ratings, num_layers):
        super().__init__()
        
        # Embeddingvektor der Größe hidden_dims für User und Items
        self.user_embeddings = nn.Embedding(num_users, hidden_dims)  
        self.item_embeddings = nn.Embedding(num_items, hidden_dims)
        
        self.layers = nn.ModuleList([
            # Berechnung der Layers im Encoder.
            GCMCLayer(hidden_dims, num_ratings) for _ in range(num_layers)]) 
        
        # Trainierbarer Parameter für Items W_v und für Users W_u
        self.W_u = nn.Linear(hidden_dims, hidden_dims) # Linear() besteht aus x*W_u^T + b wobei b ein Bias ist.
        self.W_v = nn.Linear(hidden_dims, hidden_dims)
        
    def forward(self, blocks):
        # Beginne mit Embedding für jeden User und Item
        user_embeddings = self.user_embeddings(blocks[0].srcnodes['user'].data[dgl.NID])
        item_embeddings = self.item_embeddings(blocks[0].srcnodes['item'].data[dgl.NID])
        
        # Iteriere über die Encoder-Layers
        for block, layer in zip(blocks, self.layers):
            # Berechnung der Nachricht zwischen Item und User
            user_embeddings, item_embeddings = layer(block, user_embeddings, item_embeddings) 
        
        # Zusammensetzung des Embeddingvektors und dazugehörigen trainierbaren Gewichtung 
        z_u = self.W_u(user_embeddings) 
        z_v = self.W_v(item_embeddings)
        
        return z_u, z_v # Finale Repräsentation der Knoten als Embeddingvektoren z_u und z_v
        
        # Decoder über das Skalarprodukt  
    def compute_score(self, pair_graph, z_u, z_v):
        with pair_graph.local_scope():
            # Nutze für die Ebene h die Embeddings z_u und z_v
            pair_graph.nodes['user'].data['h'] = z_u 
            pair_graph.nodes['item'].data['h'] = z_v
            
            # Berechne Rating über Skalarpodukt über z_u und z_v  und update die Kantenfeatures
            pair_graph.apply_edges(fn.u_dot_v('h', 'h', 'r')) 
            
            return pair_graph.edata['r'] #Ende des Forward-Propagation vom GCMC-Modell

### RMSE zur Berechnung der Kostenfunktion

### Training des GCMC-Modells

In [16]:
import tqdm
from sklearn.metrics import mean_squared_error

def trainingLoop(NUM_LAYERS, BATCH_SIZE, NUM_EPOCHS, HIDDEN_DIMS, NUM_RATINGS, printing = True):
    sampler = MinibatchSampler(graph, NUM_LAYERS) # Erstellt ein Sampler Objekt basierend auf den Graphen
    
    # Sampelt und erstellt Trainset und Testset auf Basis des Samplers und Batchsize
    train_dataloader = DataLoader(tensorTrainset, batch_size=BATCH_SIZE, collate_fn=sampler.sample, shuffle=True)
    test_dataloader = DataLoader(tensorTestset, batch_size=BATCH_SIZE, collate_fn=sampler.sample, shuffle=False)
    
    # Übergabe der Hyper-Parameter und Konstruktion des Modells für das Datenset
    model = GCMCRating(graph.number_of_nodes('user'), graph.number_of_nodes('item'), HIDDEN_DIMS, NUM_RATINGS, NUM_LAYERS) 
    
    # SGD-Optimierungsverfahren für die Modell-Parameter mit Lernparameter = 0.01
    opt = torch.optim.SGD(model.parameters(), lr=0.001) 
    
    rmse = []
    
    for i in range(NUM_EPOCHS):
        
        model.train() # Modell wird nun in Trainzustand gesetzt.
    
        with tqdm.tqdm(train_dataloader) as t: # Training über Trainset
            for pair_graph, blocks in t:
                user_emb, item_emb = model(blocks)
                prediction = model.compute_score(pair_graph, user_emb, item_emb)
                loss = ((prediction - pair_graph.edata['rating']) ** 2).mean()
                opt.zero_grad() # setze Gradienten auf 0
                loss.backward() # Berechne Gradienten mittels Backpropagation
                opt.step() # update die Modell-Parameter

        model.eval() # Modell wird nun in Testzustand gesetzt.
       
        with tqdm.tqdm(test_dataloader) as t: # Evaluation über Testset
            with torch.no_grad():
                predictions = []
                ratings = []
                for pair_graph, blocks in t:
                    # Definiere die Embeddingvektoren von User und Item
                    user_emb, item_emb = model(blocks) 
                    # Berechnung der Vorhersage eines Ratings r
                    prediction = model.compute_score(pair_graph, user_emb, item_emb) 
                    predictions.append(prediction) # vorhergesagter wert von r
                    ratings.append(pair_graph.edata['rating']) # tatsächlicher Wert von r

                predictions = torch.cat(predictions, 0)
                ratings = torch.cat(ratings, 0)
        
        # Ausgabe des RMSE nach jedem SGD-Schritt
        if printing:
            print('RMSE:', mean_squared_error(predictions, ratings, squared=True).item() , ' - Nach',i+1,'. Epoch:')
        
        rmse.append(mean_squared_error(predictions, ratings, squared=True).item())
    
    # Gibt den endgültigen RMSE aus, falls printing = True
    if printing:
        print('\n\nAuswertung für folgende Hyper-Parameter: \n',
              'NUM_LAYERS','=', NUM_LAYERS, '\n',
              'BATCH_SIZE','=', BATCH_SIZE, '\n',
              'NUM_EPOCHS','=', NUM_EPOCHS, '\n',
              'HIDDEN_DIMS','=', HIDDEN_DIMS, '\n') 
        print('Endgültiger RMSE:', mean_squared_error(predictions, ratings, squared=True).item())
    
    return rmse

### Beispiel Hyper-Parameter für das Modell

In [17]:
# Hyper-Parameter des GCMC-Modells
NUM_LAYERS = 1 # Ebenen des Encoders
BATCH_SIZE = 500 # Batch-Size für das Sampling
NUM_EPOCHS = 40 # Anzahl der SGD Iterationen
HIDDEN_DIMS = 8 # Länge des Vektors für einen Knoten
NUM_RATINGS = len(set(trainset['rating'])) # Anzahl der Bewertungselemente der Bewertungsmenge

rmse = trainingLoop(NUM_LAYERS, BATCH_SIZE, NUM_EPOCHS, HIDDEN_DIMS, NUM_RATINGS) 


100%|████████████████████████████████████████████████████████████████████████████████| 182/182 [00:26<00:00,  6.95it/s]
100%|██████████████████████████████████████████████████████████████████████████████████| 19/19 [00:00<00:00, 21.82it/s]
  1%|▍                                                                                 | 1/182 [00:00<00:27,  6.62it/s]

RMSE: 2.7704715044802493  - Nach 1 . Epoch:


100%|████████████████████████████████████████████████████████████████████████████████| 182/182 [00:26<00:00,  6.90it/s]
100%|██████████████████████████████████████████████████████████████████████████████████| 19/19 [00:00<00:00, 19.46it/s]
  1%|▍                                                                                 | 1/182 [00:00<00:28,  6.37it/s]

RMSE: 1.664269193463  - Nach 2 . Epoch:


100%|████████████████████████████████████████████████████████████████████████████████| 182/182 [00:26<00:00,  6.93it/s]
100%|██████████████████████████████████████████████████████████████████████████████████| 19/19 [00:00<00:00, 21.09it/s]
  1%|▍                                                                                 | 1/182 [00:00<00:25,  7.11it/s]

RMSE: 1.4923584802979568  - Nach 3 . Epoch:


100%|████████████████████████████████████████████████████████████████████████████████| 182/182 [00:25<00:00,  7.12it/s]
100%|██████████████████████████████████████████████████████████████████████████████████| 19/19 [00:00<00:00, 20.56it/s]
  1%|▍                                                                                 | 1/182 [00:00<00:26,  6.71it/s]

RMSE: 1.415537609015267  - Nach 4 . Epoch:


100%|████████████████████████████████████████████████████████████████████████████████| 182/182 [00:25<00:00,  7.09it/s]
100%|██████████████████████████████████████████████████████████████████████████████████| 19/19 [00:00<00:00, 21.32it/s]
  1%|▍                                                                                 | 1/182 [00:00<00:26,  6.71it/s]

RMSE: 1.375839226121912  - Nach 5 . Epoch:


100%|████████████████████████████████████████████████████████████████████████████████| 182/182 [00:25<00:00,  7.07it/s]
100%|██████████████████████████████████████████████████████████████████████████████████| 19/19 [00:00<00:00, 21.15it/s]
  1%|▍                                                                                 | 1/182 [00:00<00:26,  6.94it/s]

RMSE: 1.3522105088768852  - Nach 6 . Epoch:


100%|████████████████████████████████████████████████████████████████████████████████| 182/182 [00:25<00:00,  7.08it/s]
100%|██████████████████████████████████████████████████████████████████████████████████| 19/19 [00:00<00:00, 19.71it/s]
  1%|▍                                                                                 | 1/182 [00:00<00:28,  6.45it/s]

RMSE: 1.3379949923084111  - Nach 7 . Epoch:


100%|████████████████████████████████████████████████████████████████████████████████| 182/182 [00:25<00:00,  7.12it/s]
100%|██████████████████████████████████████████████████████████████████████████████████| 19/19 [00:00<00:00, 20.99it/s]
  1%|▍                                                                                 | 1/182 [00:00<00:26,  6.80it/s]

RMSE: 1.327015538161231  - Nach 8 . Epoch:


100%|████████████████████████████████████████████████████████████████████████████████| 182/182 [00:25<00:00,  7.01it/s]
100%|██████████████████████████████████████████████████████████████████████████████████| 19/19 [00:00<00:00, 20.21it/s]
  1%|▍                                                                                 | 1/182 [00:00<00:25,  7.04it/s]

RMSE: 1.3182406383491487  - Nach 9 . Epoch:


100%|████████████████████████████████████████████████████████████████████████████████| 182/182 [00:25<00:00,  7.10it/s]
100%|██████████████████████████████████████████████████████████████████████████████████| 19/19 [00:00<00:00, 20.97it/s]
  1%|▍                                                                                 | 1/182 [00:00<00:26,  6.80it/s]

RMSE: 1.3118769450679741  - Nach 10 . Epoch:


100%|████████████████████████████████████████████████████████████████████████████████| 182/182 [00:25<00:00,  7.08it/s]
100%|██████████████████████████████████████████████████████████████████████████████████| 19/19 [00:00<00:00, 19.97it/s]
  1%|▍                                                                                 | 1/182 [00:00<00:27,  6.67it/s]

RMSE: 1.306397716760042  - Nach 11 . Epoch:


100%|████████████████████████████████████████████████████████████████████████████████| 182/182 [00:25<00:00,  7.05it/s]
100%|██████████████████████████████████████████████████████████████████████████████████| 19/19 [00:00<00:00, 20.94it/s]
  1%|▍                                                                                 | 1/182 [00:00<00:26,  6.76it/s]

RMSE: 1.3017920696750778  - Nach 12 . Epoch:


100%|████████████████████████████████████████████████████████████████████████████████| 182/182 [00:25<00:00,  7.10it/s]
100%|██████████████████████████████████████████████████████████████████████████████████| 19/19 [00:00<00:00, 21.40it/s]
  1%|▍                                                                                 | 1/182 [00:00<00:28,  6.41it/s]

RMSE: 1.299287282876087  - Nach 13 . Epoch:


100%|████████████████████████████████████████████████████████████████████████████████| 182/182 [00:25<00:00,  7.11it/s]
100%|██████████████████████████████████████████████████████████████████████████████████| 19/19 [00:00<00:00, 20.56it/s]
  1%|▍                                                                                 | 1/182 [00:00<00:25,  7.19it/s]

RMSE: 1.2952464661218914  - Nach 14 . Epoch:


100%|████████████████████████████████████████████████████████████████████████████████| 182/182 [00:26<00:00,  7.00it/s]
100%|██████████████████████████████████████████████████████████████████████████████████| 19/19 [00:00<00:00, 21.04it/s]
  1%|▍                                                                                 | 1/182 [00:00<00:26,  6.94it/s]

RMSE: 1.2934643519928233  - Nach 15 . Epoch:


100%|████████████████████████████████████████████████████████████████████████████████| 182/182 [00:26<00:00,  6.99it/s]
100%|██████████████████████████████████████████████████████████████████████████████████| 19/19 [00:01<00:00, 18.58it/s]
  1%|▍                                                                                 | 1/182 [00:00<00:27,  6.49it/s]

RMSE: 1.289492773997059  - Nach 16 . Epoch:


100%|████████████████████████████████████████████████████████████████████████████████| 182/182 [00:25<00:00,  7.01it/s]
100%|██████████████████████████████████████████████████████████████████████████████████| 19/19 [00:00<00:00, 20.72it/s]
  1%|▍                                                                                 | 1/182 [00:00<00:25,  7.09it/s]

RMSE: 1.2905133882962232  - Nach 17 . Epoch:


100%|████████████████████████████████████████████████████████████████████████████████| 182/182 [00:25<00:00,  7.06it/s]
100%|██████████████████████████████████████████████████████████████████████████████████| 19/19 [00:00<00:00, 19.63it/s]
  1%|▍                                                                                 | 1/182 [00:00<00:26,  6.85it/s]

RMSE: 1.2867422577946903  - Nach 18 . Epoch:


100%|████████████████████████████████████████████████████████████████████████████████| 182/182 [00:26<00:00,  7.00it/s]
100%|██████████████████████████████████████████████████████████████████████████████████| 19/19 [00:00<00:00, 21.13it/s]
  1%|▍                                                                                 | 1/182 [00:00<00:25,  7.04it/s]

RMSE: 1.2845804339540343  - Nach 19 . Epoch:


100%|████████████████████████████████████████████████████████████████████████████████| 182/182 [00:25<00:00,  7.07it/s]
100%|██████████████████████████████████████████████████████████████████████████████████| 19/19 [00:00<00:00, 20.78it/s]
  1%|▍                                                                                 | 1/182 [00:00<00:25,  7.03it/s]

RMSE: 1.2836258884019465  - Nach 20 . Epoch:


100%|████████████████████████████████████████████████████████████████████████████████| 182/182 [00:25<00:00,  7.10it/s]
100%|██████████████████████████████████████████████████████████████████████████████████| 19/19 [00:00<00:00, 20.94it/s]
  1%|▍                                                                                 | 1/182 [00:00<00:26,  6.76it/s]

RMSE: 1.2818127626864606  - Nach 21 . Epoch:


100%|████████████████████████████████████████████████████████████████████████████████| 182/182 [00:25<00:00,  7.02it/s]
100%|██████████████████████████████████████████████████████████████████████████████████| 19/19 [00:00<00:00, 21.11it/s]
  1%|▍                                                                                 | 1/182 [00:00<00:26,  6.71it/s]

RMSE: 1.2810190316120253  - Nach 22 . Epoch:


100%|████████████████████████████████████████████████████████████████████████████████| 182/182 [00:25<00:00,  7.01it/s]
100%|██████████████████████████████████████████████████████████████████████████████████| 19/19 [00:00<00:00, 20.81it/s]
  1%|▍                                                                                 | 1/182 [00:00<00:26,  6.80it/s]

RMSE: 1.2799851511044276  - Nach 23 . Epoch:


100%|████████████████████████████████████████████████████████████████████████████████| 182/182 [00:25<00:00,  7.03it/s]
100%|██████████████████████████████████████████████████████████████████████████████████| 19/19 [00:00<00:00, 20.29it/s]
  1%|▍                                                                                 | 1/182 [00:00<00:27,  6.67it/s]

RMSE: 1.27795160278842  - Nach 24 . Epoch:


100%|████████████████████████████████████████████████████████████████████████████████| 182/182 [00:25<00:00,  7.02it/s]
100%|██████████████████████████████████████████████████████████████████████████████████| 19/19 [00:00<00:00, 20.43it/s]
  1%|▍                                                                                 | 1/182 [00:00<00:28,  6.32it/s]

RMSE: 1.276432511645502  - Nach 25 . Epoch:


100%|████████████████████████████████████████████████████████████████████████████████| 182/182 [00:25<00:00,  7.07it/s]
100%|██████████████████████████████████████████████████████████████████████████████████| 19/19 [00:00<00:00, 20.10it/s]
  1%|▍                                                                                 | 1/182 [00:00<00:26,  6.85it/s]

RMSE: 1.2777975005253825  - Nach 26 . Epoch:


100%|████████████████████████████████████████████████████████████████████████████████| 182/182 [00:25<00:00,  7.05it/s]
100%|██████████████████████████████████████████████████████████████████████████████████| 19/19 [00:00<00:00, 20.32it/s]
  1%|▍                                                                                 | 1/182 [00:00<00:26,  6.85it/s]

RMSE: 1.2748856202802605  - Nach 27 . Epoch:


100%|████████████████████████████████████████████████████████████████████████████████| 182/182 [00:25<00:00,  7.03it/s]
100%|██████████████████████████████████████████████████████████████████████████████████| 19/19 [00:00<00:00, 20.96it/s]
  1%|▍                                                                                 | 1/182 [00:00<00:25,  6.99it/s]

RMSE: 1.2746926276648594  - Nach 28 . Epoch:


100%|████████████████████████████████████████████████████████████████████████████████| 182/182 [00:25<00:00,  7.10it/s]
100%|██████████████████████████████████████████████████████████████████████████████████| 19/19 [00:00<00:00, 20.99it/s]
  1%|▍                                                                                 | 1/182 [00:00<00:26,  6.80it/s]

RMSE: 1.27352530953574  - Nach 29 . Epoch:


100%|████████████████████████████████████████████████████████████████████████████████| 182/182 [00:25<00:00,  7.06it/s]
100%|██████████████████████████████████████████████████████████████████████████████████| 19/19 [00:01<00:00, 18.27it/s]
  1%|▍                                                                                 | 1/182 [00:00<00:26,  6.82it/s]

RMSE: 1.273011918372647  - Nach 30 . Epoch:


100%|████████████████████████████████████████████████████████████████████████████████| 182/182 [00:25<00:00,  7.02it/s]
100%|██████████████████████████████████████████████████████████████████████████████████| 19/19 [00:00<00:00, 20.08it/s]
  1%|▍                                                                                 | 1/182 [00:00<00:25,  6.99it/s]

RMSE: 1.2731286480169688  - Nach 31 . Epoch:


100%|████████████████████████████████████████████████████████████████████████████████| 182/182 [00:25<00:00,  7.06it/s]
100%|██████████████████████████████████████████████████████████████████████████████████| 19/19 [00:00<00:00, 20.67it/s]
  1%|▍                                                                                 | 1/182 [00:00<00:27,  6.58it/s]

RMSE: 1.271554113697579  - Nach 32 . Epoch:


100%|████████████████████████████████████████████████████████████████████████████████| 182/182 [00:26<00:00,  6.99it/s]
100%|██████████████████████████████████████████████████████████████████████████████████| 19/19 [00:00<00:00, 21.17it/s]
  1%|▍                                                                                 | 1/182 [00:00<00:25,  7.19it/s]

RMSE: 1.27132249567477  - Nach 33 . Epoch:


100%|████████████████████████████████████████████████████████████████████████████████| 182/182 [00:25<00:00,  7.11it/s]
100%|██████████████████████████████████████████████████████████████████████████████████| 19/19 [00:00<00:00, 20.69it/s]
  1%|▍                                                                                 | 1/182 [00:00<00:29,  6.10it/s]

RMSE: 1.2716852915116945  - Nach 34 . Epoch:


100%|████████████████████████████████████████████████████████████████████████████████| 182/182 [00:25<00:00,  7.00it/s]
100%|██████████████████████████████████████████████████████████████████████████████████| 19/19 [00:00<00:00, 20.76it/s]
  1%|▍                                                                                 | 1/182 [00:00<00:26,  6.80it/s]

RMSE: 1.2702129871139545  - Nach 35 . Epoch:


100%|████████████████████████████████████████████████████████████████████████████████| 182/182 [00:26<00:00,  6.96it/s]
100%|██████████████████████████████████████████████████████████████████████████████████| 19/19 [00:00<00:00, 20.97it/s]
  1%|▍                                                                                 | 1/182 [00:00<00:26,  6.94it/s]

RMSE: 1.269603062207193  - Nach 36 . Epoch:


100%|████████████████████████████████████████████████████████████████████████████████| 182/182 [00:25<00:00,  7.05it/s]
100%|██████████████████████████████████████████████████████████████████████████████████| 19/19 [00:00<00:00, 21.01it/s]
  1%|▍                                                                                 | 1/182 [00:00<00:26,  6.89it/s]

RMSE: 1.2695111574438853  - Nach 37 . Epoch:


100%|████████████████████████████████████████████████████████████████████████████████| 182/182 [00:25<00:00,  7.07it/s]
100%|██████████████████████████████████████████████████████████████████████████████████| 19/19 [00:00<00:00, 20.79it/s]
  1%|▍                                                                                 | 1/182 [00:00<00:25,  7.15it/s]

RMSE: 1.2691901644619636  - Nach 38 . Epoch:


100%|████████████████████████████████████████████████████████████████████████████████| 182/182 [00:25<00:00,  7.08it/s]
100%|██████████████████████████████████████████████████████████████████████████████████| 19/19 [00:00<00:00, 21.32it/s]
  1%|▍                                                                                 | 1/182 [00:00<00:24,  7.35it/s]

RMSE: 1.2692925663887178  - Nach 39 . Epoch:


100%|████████████████████████████████████████████████████████████████████████████████| 182/182 [00:25<00:00,  7.09it/s]
100%|██████████████████████████████████████████████████████████████████████████████████| 19/19 [00:00<00:00, 21.00it/s]

RMSE: 1.2683011676105997  - Nach 40 . Epoch:


Auswertung für folgende Hyper-Parameter: 
 NUM_LAYERS = 1 
 BATCH_SIZE = 500 
 NUM_EPOCHS = 40 
 HIDDEN_DIMS = 8 

Endgültiger RMSE: 1.2683011676105997





### Grid Search (für die Evaluation)

Für NUM_EPOCHS wird aufgrund des hohen Rechenaufwands der Wert auf 15 und die dazugehörige Lernrate auf 0.01 gesetzt.

In [13]:
layers = [1,2] # Ebenen des Encoders
batchsizes = [400, 600, 800] # Batch-Size für das Sampling
hiddendims = [4, 6, 8] # Länge des Vektors für einen Knoten
NUM_EPOCHS = 15
NUM_RATINGS = len(set(trainset['rating']))

evalDf = pd.DataFrame()

for layer in layers:
    for batchsize in batchsizes:
        for hiddendim in hiddendims:
            # Startzeit
            start = timer() 
            
            #definiere Trainingsloop anhand der momentanen Hyper-Parameter
            rmse = trainingLoop(layer, batchsize, NUM_EPOCHS, hiddendim, NUM_RATINGS, printing = False)
            
            # Berechnungszeit in Sekunden (mit 3 Nachkommastellen)
            end = timer() # Ende Stoppuhr
            timerSeconds = timedelta(seconds=end-start).total_seconds()  # Berechne Zeit
            time = math.ceil(timerSeconds*10)/10 # Runden
            
            # speichere RMSE der Hyper-Parameter und die Parameter selbst
            evalDf = evalDf.append([{'Ebenen' : layer,'Batchgroesse' : batchsize,
                                     'Hiddendims' : hiddendim,'Epochs' : NUM_EPOCHS,
                                     'RMSE' : rmse, 'Zeit (s)' : time}], ignore_index=True)
evalDf.to_csv(r'MovieLens+Feature-10.csv')

#Für die Ausgabe der 'besten' Hyper-Parameter          
bestRMSE = min(evalDf['RMSE']) # ermittle niedrigsten RMSE
zeile = list(evalDf['RMSE']).index(bestRMSE) # ermittle Zeile
print('Niedrigster RMSE-Wert  mit folgenden Hyper-Parametern: \n', evalDf.loc[[zeile]])

100%|████████████████████████████████████████████████████████████████████████████████| 227/227 [00:22<00:00,  9.93it/s]
100%|██████████████████████████████████████████████████████████████████████████████████| 24/24 [00:00<00:00, 25.96it/s]
100%|████████████████████████████████████████████████████████████████████████████████| 227/227 [00:22<00:00, 10.29it/s]
100%|██████████████████████████████████████████████████████████████████████████████████| 24/24 [00:00<00:00, 25.93it/s]
100%|████████████████████████████████████████████████████████████████████████████████| 227/227 [00:22<00:00, 10.17it/s]
100%|██████████████████████████████████████████████████████████████████████████████████| 24/24 [00:01<00:00, 23.90it/s]
100%|████████████████████████████████████████████████████████████████████████████████| 227/227 [00:22<00:00, 10.20it/s]
100%|██████████████████████████████████████████████████████████████████████████████████| 24/24 [00:00<00:00, 25.50it/s]
100%|███████████████████████████████████

100%|████████████████████████████████████████████████████████████████████████████████| 151/151 [00:21<00:00,  7.16it/s]
100%|██████████████████████████████████████████████████████████████████████████████████| 16/16 [00:00<00:00, 21.34it/s]
100%|████████████████████████████████████████████████████████████████████████████████| 151/151 [00:21<00:00,  7.12it/s]
100%|██████████████████████████████████████████████████████████████████████████████████| 16/16 [00:00<00:00, 21.31it/s]
100%|████████████████████████████████████████████████████████████████████████████████| 151/151 [00:20<00:00,  7.21it/s]
100%|██████████████████████████████████████████████████████████████████████████████████| 16/16 [00:00<00:00, 21.90it/s]
100%|████████████████████████████████████████████████████████████████████████████████| 151/151 [00:21<00:00,  7.17it/s]
100%|██████████████████████████████████████████████████████████████████████████████████| 16/16 [00:00<00:00, 21.77it/s]
100%|███████████████████████████████████

100%|████████████████████████████████████████████████████████████████████████████████| 227/227 [00:53<00:00,  4.25it/s]
100%|██████████████████████████████████████████████████████████████████████████████████| 24/24 [00:02<00:00, 10.61it/s]
100%|████████████████████████████████████████████████████████████████████████████████| 227/227 [00:53<00:00,  4.25it/s]
100%|██████████████████████████████████████████████████████████████████████████████████| 24/24 [00:02<00:00, 10.71it/s]
100%|████████████████████████████████████████████████████████████████████████████████| 227/227 [00:53<00:00,  4.25it/s]
100%|██████████████████████████████████████████████████████████████████████████████████| 24/24 [00:02<00:00, 10.52it/s]
100%|████████████████████████████████████████████████████████████████████████████████| 227/227 [00:52<00:00,  4.29it/s]
100%|██████████████████████████████████████████████████████████████████████████████████| 24/24 [00:02<00:00, 10.83it/s]
100%|███████████████████████████████████

100%|████████████████████████████████████████████████████████████████████████████████| 151/151 [00:46<00:00,  3.23it/s]
100%|██████████████████████████████████████████████████████████████████████████████████| 16/16 [00:01<00:00,  9.02it/s]
100%|████████████████████████████████████████████████████████████████████████████████| 151/151 [00:46<00:00,  3.25it/s]
100%|██████████████████████████████████████████████████████████████████████████████████| 16/16 [00:01<00:00,  8.98it/s]
100%|████████████████████████████████████████████████████████████████████████████████| 151/151 [00:46<00:00,  3.25it/s]
100%|██████████████████████████████████████████████████████████████████████████████████| 16/16 [00:01<00:00,  9.34it/s]
100%|████████████████████████████████████████████████████████████████████████████████| 151/151 [00:46<00:00,  3.24it/s]
100%|██████████████████████████████████████████████████████████████████████████████████| 16/16 [00:01<00:00,  9.36it/s]
100%|███████████████████████████████████