In [1]:
import os
import random
from tqdm import tqdm
import numpy as np
from PIL import Image
import pandas as pd
import torch
import torch.nn as nn
import torch.optim as optim
import torch.nn.functional as F
from torch.utils.data import DataLoader, TensorDataset, random_split, SubsetRandomSampler
from sklearn.metrics import accuracy_score, pairwise_distances
from sklearn.cluster import KMeans

torch.manual_seed(42)
random.seed(42)
np.random.seed(42)

## Data Loader

In [2]:
def load_and_preprocess_image(image_path, size=(64, 64)):
    """
    Lädt ein Bild von einem gegebenen Pfad, ändert dessen Größe und konvertiert es in Graustufen.
    """
    image = Image.open(image_path)
    image = image.resize(size).convert('L')
    image_array = np.array(image) / 255.0
    
    return image_array

def load_and_preprocess_images(directory, csv_path, size=(64, 64)):
    """
    Lädt und verarbeitet alle Bilder in einem Verzeichnis basierend auf einer CSV-Datei, die Labels enthält.
    """
    # CSV-Datei laden, die Labels und Bildpfade enthält
    labels_df = pd.read_csv(csv_path)
    
    images = []
    labels = []
    
    for filename in os.listdir(directory):
        file_path = os.path.join(directory, filename)
        
        if os.path.isfile(file_path) and filename.lower().endswith(('.png', '.jpg', '.jpeg')):

            image_array = load_and_preprocess_image(file_path, size)
            images.append(image_array)
            # Das Label aus der CSV-Datei extrahieren
            label = labels_df[labels_df['image'] == filename]['labels'].values[0]
            labels.append(label)
    
    return np.array(images), np.array(labels)


directory = 'dataset/cat_dog'
csv_path = 'dataset/cat_dog.csv'

images, labels = load_and_preprocess_images(directory, csv_path)

print(f"Anzahl geladener Bilder: {len(images)}")
print(f"Form eines Bildes: {images[0].shape}")
print(f"Erste 5 Labels: {labels[:5]}")

Anzahl geladener Bilder: 25000
Form eines Bildes: (64, 64)
Erste 5 Labels: [1 0 1 0 0]


## Model definition (simple cnn)

In [3]:
class SimpleCNN(nn.Module):
    def __init__(self):
        super(SimpleCNN, self).__init__()
        self.conv1 = nn.Conv2d(1, 16, 3, padding=1)  # 16 Filter, Kernel-Größe 3
        self.conv2 = nn.Conv2d(16, 32, 3, padding=1) # 32 Filter, Kernel-Größe 3
        self.fc1 = nn.Linear(32 * 16 * 16, 128)      # Vollverbundene Schicht
        self.fc2 = nn.Linear(128, 2)                 # Ausgangsschicht
        self.pool = nn.MaxPool2d(2, 2)               # Pooling-Schicht
        self.relu = nn.ReLU()                        # ReLU Aktivierungsfunktion

    def forward(self, x):
        x = self.pool(self.relu(self.conv1(x)))
        x = self.pool(self.relu(self.conv2(x)))
        x = x.view(-1, 32 * 16 * 16)
        x = self.relu(self.fc1(x))
        x = self.fc2(x)
        return x

model = SimpleCNN()
criterion = nn.CrossEntropyLoss()
optimizer = optim.Adam(model.parameters(), lr=0.001)

print(model)

SimpleCNN(
  (conv1): Conv2d(1, 16, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
  (conv2): Conv2d(16, 32, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
  (fc1): Linear(in_features=8192, out_features=128, bias=True)
  (fc2): Linear(in_features=128, out_features=2, bias=True)
  (pool): MaxPool2d(kernel_size=2, stride=2, padding=0, dilation=1, ceil_mode=False)
  (relu): ReLU()
)


## Aufteilung der Daten und Umwandlung in Tensoren

In [4]:
tensor_images = torch.tensor(images).float()
tensor_labels = torch.tensor(labels).long()

total_count = len(tensor_labels)

num_labeled = int(0.25 * total_count)
num_test = int(0.1 * num_labeled)

# Indizes mischen und aufteilen
indices = torch.randperm(total_count)
labeled_indices = indices[:num_labeled]
test_indices = labeled_indices[:num_test]  # Testindizes von den gelabelten Indizes nehmen
train_indices = labeled_indices[num_test:]  # Restliche gelabelte Daten für Training
unlabeled_indices = indices[num_labeled:]

# Erstellen von Datenladern
test_dataset = TensorDataset(tensor_images[test_indices], tensor_labels[test_indices])
train_dataset = TensorDataset(tensor_images[train_indices], tensor_labels[train_indices])
# unlabeled_dataset = TensorDataset(tensor_images[unlabeled_indices], torch.zeros(len(unlabeled_indices))) # Keine Labels für ungelabelte Daten -> für manuelles Labeln
unlabeled_dataset = TensorDataset(tensor_images[unlabeled_indices], tensor_labels[unlabeled_indices]) # Für simulation des human-in-the-loop

train_loader = DataLoader(train_dataset, batch_size=64, shuffle=True)
test_loader = DataLoader(test_dataset, batch_size=64, shuffle=True)
unlabeled_loader = DataLoader(unlabeled_dataset, batch_size=64, shuffle=True)

print(f"Anzahl Trainingsdaten: {len(train_loader.dataset)}")
print(f"Anzahl Testdaten: {len(test_loader.dataset)}")
print(f"Anzahl 'ungelabelter' Daten: {len(unlabeled_loader.dataset)}")

Anzahl Trainingsdaten: 5625
Anzahl Testdaten: 625
Anzahl 'ungelabelter' Daten: 18750


## Initiales Training als Vergleichsbasis

In [5]:
def train(model, data_loader, criterion, optimizer, epochs):
    model.train()
    for epoch in range(epochs):
        progress_bar = tqdm(data_loader, desc=f"Epoch {epoch+1}")
        for images, labels in progress_bar:
            # Format (batch_size, channels, width, height)
            images = images.unsqueeze(1)  # Dimension für den Kanal
            
            # Feed Forward
            outputs = model(images)
            loss = criterion(outputs, labels)
            
            # Backprop.
            optimizer.zero_grad()
            loss.backward()
            optimizer.step()
            
            progress_bar.set_postfix(loss=loss.item())

train(model, train_loader, criterion, optimizer, epochs=20)
torch.save(model.state_dict(), 'init_model.pth')

Epoch 1: 100%|██████████| 88/88 [00:06<00:00, 14.08it/s, loss=0.691]
Epoch 2: 100%|██████████| 88/88 [00:06<00:00, 14.28it/s, loss=0.668]
Epoch 3: 100%|██████████| 88/88 [00:06<00:00, 13.54it/s, loss=0.586]
Epoch 4: 100%|██████████| 88/88 [00:06<00:00, 13.64it/s, loss=0.609]
Epoch 5: 100%|██████████| 88/88 [00:07<00:00, 12.13it/s, loss=0.59] 
Epoch 6: 100%|██████████| 88/88 [00:07<00:00, 11.73it/s, loss=0.562]
Epoch 7: 100%|██████████| 88/88 [00:06<00:00, 12.86it/s, loss=0.556]
Epoch 8: 100%|██████████| 88/88 [00:06<00:00, 13.05it/s, loss=0.632]
Epoch 9: 100%|██████████| 88/88 [00:06<00:00, 13.67it/s, loss=0.566]
Epoch 10: 100%|██████████| 88/88 [00:06<00:00, 13.80it/s, loss=0.406]
Epoch 11: 100%|██████████| 88/88 [00:06<00:00, 13.44it/s, loss=0.301]
Epoch 12: 100%|██████████| 88/88 [00:06<00:00, 13.05it/s, loss=0.405]
Epoch 13: 100%|██████████| 88/88 [00:06<00:00, 13.39it/s, loss=0.29] 
Epoch 14: 100%|██████████| 88/88 [00:06<00:00, 13.77it/s, loss=0.146]
Epoch 15: 100%|██████████| 88

In [6]:
def evaluate(model, data_loader):
    model.eval()
    predictions, true_labels = [], []
    
    with torch.no_grad():
        for images, labels in data_loader:
            images = images.unsqueeze(1)  # Dimension für den Kanal hinzufügen
            outputs = model(images)
            _, predicted = torch.max(outputs.data, 1)
            predictions.extend(predicted.numpy())
            true_labels.extend(labels.numpy())

    accuracy = accuracy_score(true_labels, predictions)
    return accuracy

test_accuracy = evaluate(model, test_loader)
print(f"Genauigkeit auf Testdaten: {test_accuracy}")

Genauigkeit auf Testdaten: 0.6928


## Uncertainty Sampling

gewählte Methoden 

1. Entropie 
2. Lowest Confidence.

In [7]:
def predict_uncertainty(model, data_loader):
    model.eval()
    uncertainties = []
    with torch.no_grad():
        for images, _ in data_loader:
            images = images.unsqueeze(1)  # Dimension für den Kanal hinzufügen
            outputs = model(images)
            probabilities = F.softmax(outputs, dim=1)
            entropy = -torch.sum(probabilities * torch.log(probabilities), dim=1)
            uncertainties.extend(entropy.tolist())
    return uncertainties

def predict_confidence(model, data_loader):
    model.eval()
    confidences = []
    with torch.no_grad():
        for images, _ in data_loader:
            images = images.unsqueeze(1)  # Dimension für den Kanal hinzufügen
            outputs = model(images)
            probabilities = F.softmax(outputs, dim=1)
            max_confidence, _ = torch.max(probabilities, dim=1)
            confidences.extend((1 - max_confidence).tolist())
    return confidences

def active_learning_cycle(unlabeled_loader_setting, train_loader, test_loader, criterion, optimizer, num_iterations=10, num_to_label=50, uncertainty_method="entropy"):

    model = SimpleCNN()
    criterion = nn.CrossEntropyLoss()
    optimizer = optim.Adam(model.parameters(), lr=0.001)
    
    for iteration in range(num_iterations):
        
        # Berechne Unsicherheiten
        if uncertainty_method == "entropy":
            uncertainties = predict_uncertainty(model, unlabeled_loader_setting)
        elif uncertainty_method == "confidence":
            uncertainties = predict_confidence(model, unlabeled_loader_setting)
        else:
            raise ValueError("Ungültige Uncertainty-Methode")
        
        uncertain_indices = sorted(range(len(uncertainties)), key=lambda i: uncertainties[i], reverse=True)[:num_to_label]
        
        # Trainingsdaten mit gesampelten Daten kombinieren
        new_images = torch.stack([unlabeled_loader_setting.dataset[i][0] for i in uncertain_indices])
        new_labels = torch.tensor([unlabeled_loader_setting.dataset[i][1] for i in uncertain_indices])
        combined_images = torch.cat((train_loader.dataset.tensors[0], new_images), dim=0)
        combined_labels = torch.cat((train_loader.dataset.tensors[1], new_labels), dim=0)
        combined_dataset = TensorDataset(combined_images, combined_labels)
        combined_loader = DataLoader(combined_dataset, batch_size=64, shuffle=True)
        
        # Training
        train(model, combined_loader, criterion, optimizer, epochs=2)
        
        # Eval.
        test_accuracy = evaluate(model, test_loader)
        print(f"Iteration {iteration + 1}, Genauigkeit auf Testdaten: {test_accuracy:.2f}")
    
    return model

# Uncertainty Sampling mit Entropie
model_entropy = active_learning_cycle(unlabeled_loader, train_loader, test_loader, criterion, optimizer, uncertainty_method="entropy")
torch.save(model_entropy.state_dict(), 'uncertain_entropy_model.pth')

# Uncertainty Sampling mit Konfidenzwerten
model_confidence = active_learning_cycle(unlabeled_loader, train_loader, test_loader, criterion, optimizer, uncertainty_method="confidence")
torch.save(model_confidence.state_dict(), 'uncertain_confidence_model.pth')

# Vergleich
accuracy_entropy = evaluate(model_entropy, test_loader)
accuracy_confidence = evaluate(model_confidence, test_loader)

print(f"Genauigkeit mit Entropie-Unsicherheit: {accuracy_entropy:.2f}")
print(f"Genauigkeit mit Konfidenz-Unsicherheit: {accuracy_confidence:.2f}")

Epoch 1: 100%|██████████| 89/89 [00:07<00:00, 12.54it/s, loss=0.601]
Epoch 2: 100%|██████████| 89/89 [00:07<00:00, 12.44it/s, loss=0.681]


Iteration 1, Genauigkeit auf Testdaten: 0.63


Epoch 1: 100%|██████████| 89/89 [00:06<00:00, 12.77it/s, loss=0.645]
Epoch 2: 100%|██████████| 89/89 [00:06<00:00, 13.86it/s, loss=0.616]


Iteration 2, Genauigkeit auf Testdaten: 0.71


Epoch 1: 100%|██████████| 89/89 [00:06<00:00, 13.82it/s, loss=0.47] 
Epoch 2: 100%|██████████| 89/89 [00:06<00:00, 13.93it/s, loss=0.521]


Iteration 3, Genauigkeit auf Testdaten: 0.72


Epoch 1: 100%|██████████| 89/89 [00:06<00:00, 14.28it/s, loss=0.465]
Epoch 2: 100%|██████████| 89/89 [00:06<00:00, 14.52it/s, loss=0.647]


Iteration 4, Genauigkeit auf Testdaten: 0.72


Epoch 1: 100%|██████████| 89/89 [00:06<00:00, 14.09it/s, loss=0.403]
Epoch 2: 100%|██████████| 89/89 [00:06<00:00, 14.05it/s, loss=0.435]


Iteration 5, Genauigkeit auf Testdaten: 0.72


Epoch 1: 100%|██████████| 89/89 [00:06<00:00, 13.35it/s, loss=0.465]
Epoch 2: 100%|██████████| 89/89 [00:06<00:00, 13.01it/s, loss=0.312]


Iteration 6, Genauigkeit auf Testdaten: 0.73


Epoch 1: 100%|██████████| 89/89 [00:06<00:00, 13.67it/s, loss=0.25] 
Epoch 2: 100%|██████████| 89/89 [00:06<00:00, 14.03it/s, loss=0.27] 


Iteration 7, Genauigkeit auf Testdaten: 0.72


Epoch 1: 100%|██████████| 89/89 [00:06<00:00, 14.05it/s, loss=0.316]
Epoch 2: 100%|██████████| 89/89 [00:06<00:00, 13.84it/s, loss=0.2]  


Iteration 8, Genauigkeit auf Testdaten: 0.71


Epoch 1: 100%|██████████| 89/89 [00:06<00:00, 13.35it/s, loss=0.161]
Epoch 2: 100%|██████████| 89/89 [00:06<00:00, 13.54it/s, loss=0.206] 


Iteration 9, Genauigkeit auf Testdaten: 0.72


Epoch 1: 100%|██████████| 89/89 [00:06<00:00, 13.53it/s, loss=0.123] 
Epoch 2: 100%|██████████| 89/89 [00:06<00:00, 14.00it/s, loss=0.0934]


Iteration 10, Genauigkeit auf Testdaten: 0.72


Epoch 1: 100%|██████████| 89/89 [00:06<00:00, 14.05it/s, loss=0.693]
Epoch 2: 100%|██████████| 89/89 [00:06<00:00, 13.71it/s, loss=0.637]


Iteration 1, Genauigkeit auf Testdaten: 0.62


Epoch 1: 100%|██████████| 89/89 [00:06<00:00, 14.64it/s, loss=0.579]
Epoch 2: 100%|██████████| 89/89 [00:06<00:00, 13.37it/s, loss=0.45] 


Iteration 2, Genauigkeit auf Testdaten: 0.69


Epoch 1: 100%|██████████| 89/89 [00:06<00:00, 13.06it/s, loss=0.569]
Epoch 2: 100%|██████████| 89/89 [00:06<00:00, 13.69it/s, loss=0.478]


Iteration 3, Genauigkeit auf Testdaten: 0.72


Epoch 1: 100%|██████████| 89/89 [00:06<00:00, 13.63it/s, loss=0.41] 
Epoch 2: 100%|██████████| 89/89 [00:06<00:00, 13.91it/s, loss=0.446]


Iteration 4, Genauigkeit auf Testdaten: 0.73


Epoch 1: 100%|██████████| 89/89 [00:06<00:00, 12.85it/s, loss=0.321]
Epoch 2: 100%|██████████| 89/89 [00:06<00:00, 13.16it/s, loss=0.26] 


Iteration 5, Genauigkeit auf Testdaten: 0.73


Epoch 1: 100%|██████████| 89/89 [00:06<00:00, 14.25it/s, loss=0.213]
Epoch 2: 100%|██████████| 89/89 [00:06<00:00, 13.97it/s, loss=0.0678]


Iteration 6, Genauigkeit auf Testdaten: 0.72


Epoch 1: 100%|██████████| 89/89 [00:06<00:00, 14.07it/s, loss=0.153] 
Epoch 2: 100%|██████████| 89/89 [00:06<00:00, 14.14it/s, loss=0.0685]


Iteration 7, Genauigkeit auf Testdaten: 0.72


Epoch 1: 100%|██████████| 89/89 [00:06<00:00, 14.11it/s, loss=0.0473]
Epoch 2: 100%|██████████| 89/89 [00:06<00:00, 14.13it/s, loss=0.021] 


Iteration 8, Genauigkeit auf Testdaten: 0.71


Epoch 1: 100%|██████████| 89/89 [00:06<00:00, 14.06it/s, loss=0.0767] 
Epoch 2: 100%|██████████| 89/89 [00:06<00:00, 14.07it/s, loss=0.0147] 


Iteration 9, Genauigkeit auf Testdaten: 0.70


Epoch 1: 100%|██████████| 89/89 [00:06<00:00, 14.02it/s, loss=0.00974]
Epoch 2: 100%|██████████| 89/89 [00:06<00:00, 13.98it/s, loss=0.0106] 


Iteration 10, Genauigkeit auf Testdaten: 0.71
Genauigkeit mit Entropie-Unsicherheit: 0.72
Genauigkeit mit Konfidenz-Unsicherheit: 0.71


## diversity sampling

Methoden implementiert:

1. Cluster-based Sampling

2. Farthest-first Traversal (größter Abstand zwischen Merkmalen, berechnet mithilfe von `pairwise_distances`)

In [8]:
def diversity_sampling_cluster(model, unlabelled_loader, num_to_label):
    model.eval()
    features = []
    with torch.no_grad():
        for images, _ in unlabelled_loader:
            images = images.unsqueeze(1)  # Dimension für den Kanal hinzufügen
            outputs = model(images)
            features.extend(outputs.tolist())
    
    kmeans = KMeans(n_clusters=num_to_label, random_state=0).fit(features)
    cluster_centers = kmeans.cluster_centers_
    
    diverse_indices = []
    for center in cluster_centers:
        distances = pairwise_distances([center], features)[0]
        closest_index = distances.argmin()
        diverse_indices.append(closest_index)
    
    return diverse_indices

def diversity_sampling_farthest(model, unlabelled_loader, num_to_label):
    model.eval()
    features = []
    with torch.no_grad():
        for images, _ in unlabelled_loader:
            images = images.unsqueeze(1)  # Dimension für den Kanal hinzufügen
            outputs = model(images)
            features.extend(outputs.tolist())
    
    diverse_indices = [0]  # Startpunkt f. berechnung der distanzen
    for _ in range(num_to_label - 1):
        distances = pairwise_distances([features[diverse_indices[-1]]], features)[0]
        farthest_index = distances.argmax()
        diverse_indices.append(farthest_index)
    
    return diverse_indices

def active_learning_cycle(unlabeled_loader_setting, train_loader, test_loader, criterion, optimizer, num_iterations=10, num_to_label=50, diversity_method="cluster"):

    model = SimpleCNN()
    criterion = nn.CrossEntropyLoss()
    optimizer = optim.Adam(model.parameters(), lr=0.001)
    
    for iteration in range(num_iterations):
        
        # Berechne Diversität
        if diversity_method == "cluster":
            diverse_indices = diversity_sampling_cluster(model, unlabeled_loader_setting, num_to_label)
        elif diversity_method == "farthest":
            diverse_indices = diversity_sampling_farthest(model, unlabeled_loader_setting, num_to_label)
        else:
            raise ValueError("Ungültige Diversity-Methode")
        
        # Trainingsdaten mit gesampelten Daten kombinieren
        new_images = torch.stack([unlabeled_loader_setting.dataset[i][0] for i in diverse_indices])
        new_labels = torch.tensor([unlabeled_loader_setting.dataset[i][1] for i in diverse_indices])
        
        combined_images = torch.cat((train_loader.dataset.tensors[0], new_images), dim=0)
        combined_labels = torch.cat((train_loader.dataset.tensors[1], new_labels), dim=0)
        combined_dataset = TensorDataset(combined_images, combined_labels)
        combined_loader = DataLoader(combined_dataset, batch_size=64, shuffle=True)
        
        # Training
        train(model, combined_loader, criterion, optimizer, epochs=2)
        
        # Eval.
        test_accuracy = evaluate(model, test_loader)
        print(f"Iteration {iteration + 1}, Genauigkeit auf Testdaten: {test_accuracy}")
    
    return model

# Diversity Sampling mit Cluster-based Sampling
model_cluster = active_learning_cycle(unlabeled_loader, train_loader, test_loader, criterion, optimizer, diversity_method="cluster")
torch.save(model_cluster.state_dict(), 'diversity_cluster_model.pth')

# Diversity Sampling mit Farthest-first Traversal
model_farthest = active_learning_cycle(unlabeled_loader, train_loader, test_loader, criterion, optimizer, diversity_method="farthest")
torch.save(model_farthest.state_dict(), 'diversity_farthest_model.pth')

# Vergleich
accuracy_cluster = evaluate(model_cluster, test_loader)
accuracy_farthest = evaluate(model_farthest, test_loader)

print(f"Genauigkeit mit Cluster-based Sampling: {accuracy_cluster}")
print(f"Genauigkeit mit Farthest-first Traversal: {accuracy_farthest}")

Epoch 1: 100%|██████████| 89/89 [00:06<00:00, 13.55it/s, loss=0.692]
Epoch 2: 100%|██████████| 89/89 [00:06<00:00, 14.16it/s, loss=0.591]


Iteration 1, Genauigkeit auf Testdaten: 0.6704


Epoch 1: 100%|██████████| 89/89 [00:06<00:00, 13.86it/s, loss=0.543]
Epoch 2: 100%|██████████| 89/89 [00:06<00:00, 14.23it/s, loss=0.63] 


Iteration 2, Genauigkeit auf Testdaten: 0.6704


Epoch 1: 100%|██████████| 89/89 [00:06<00:00, 13.74it/s, loss=0.506]
Epoch 2: 100%|██████████| 89/89 [00:06<00:00, 14.17it/s, loss=0.472]


Iteration 3, Genauigkeit auf Testdaten: 0.7008


Epoch 1: 100%|██████████| 89/89 [00:07<00:00, 12.55it/s, loss=0.558]
Epoch 2: 100%|██████████| 89/89 [00:06<00:00, 13.25it/s, loss=0.537]


Iteration 4, Genauigkeit auf Testdaten: 0.6928


Epoch 1: 100%|██████████| 89/89 [00:06<00:00, 13.68it/s, loss=0.474]
Epoch 2: 100%|██████████| 89/89 [00:06<00:00, 14.23it/s, loss=0.327]


Iteration 5, Genauigkeit auf Testdaten: 0.696


Epoch 1: 100%|██████████| 89/89 [00:06<00:00, 13.84it/s, loss=0.351]
Epoch 2: 100%|██████████| 89/89 [00:06<00:00, 14.13it/s, loss=0.277]


Iteration 6, Genauigkeit auf Testdaten: 0.7344


Epoch 1: 100%|██████████| 89/89 [00:06<00:00, 13.77it/s, loss=0.391]
Epoch 2: 100%|██████████| 89/89 [00:06<00:00, 14.25it/s, loss=0.335]


Iteration 7, Genauigkeit auf Testdaten: 0.6992


Epoch 1: 100%|██████████| 89/89 [00:06<00:00, 13.79it/s, loss=0.414]
Epoch 2: 100%|██████████| 89/89 [00:06<00:00, 14.25it/s, loss=0.151] 


Iteration 8, Genauigkeit auf Testdaten: 0.6992


Epoch 1: 100%|██████████| 89/89 [00:06<00:00, 13.00it/s, loss=0.242] 
Epoch 2: 100%|██████████| 89/89 [00:06<00:00, 14.19it/s, loss=0.137] 


Iteration 9, Genauigkeit auf Testdaten: 0.6976


Epoch 1: 100%|██████████| 89/89 [00:06<00:00, 13.77it/s, loss=0.174] 
Epoch 2: 100%|██████████| 89/89 [00:06<00:00, 14.05it/s, loss=0.102] 


Iteration 10, Genauigkeit auf Testdaten: 0.7024


Epoch 1: 100%|██████████| 89/89 [00:06<00:00, 13.98it/s, loss=0.655]
Epoch 2: 100%|██████████| 89/89 [00:06<00:00, 14.29it/s, loss=0.645]


Iteration 1, Genauigkeit auf Testdaten: 0.672


Epoch 1: 100%|██████████| 89/89 [00:06<00:00, 13.63it/s, loss=0.512]
Epoch 2: 100%|██████████| 89/89 [00:06<00:00, 14.41it/s, loss=0.584]


Iteration 2, Genauigkeit auf Testdaten: 0.6848


Epoch 1: 100%|██████████| 89/89 [00:06<00:00, 13.50it/s, loss=0.549]
Epoch 2: 100%|██████████| 89/89 [00:06<00:00, 13.50it/s, loss=0.486]


Iteration 3, Genauigkeit auf Testdaten: 0.7056


Epoch 1: 100%|██████████| 89/89 [00:06<00:00, 13.07it/s, loss=0.364]
Epoch 2: 100%|██████████| 89/89 [00:06<00:00, 13.34it/s, loss=0.402]


Iteration 4, Genauigkeit auf Testdaten: 0.72


Epoch 1: 100%|██████████| 89/89 [00:06<00:00, 13.78it/s, loss=0.374]
Epoch 2: 100%|██████████| 89/89 [00:06<00:00, 13.96it/s, loss=0.328]


Iteration 5, Genauigkeit auf Testdaten: 0.7136


Epoch 1: 100%|██████████| 89/89 [00:07<00:00, 12.47it/s, loss=0.302]
Epoch 2: 100%|██████████| 89/89 [00:06<00:00, 13.84it/s, loss=0.192]


Iteration 6, Genauigkeit auf Testdaten: 0.7104


Epoch 1: 100%|██████████| 89/89 [00:06<00:00, 13.81it/s, loss=0.141] 
Epoch 2: 100%|██████████| 89/89 [00:06<00:00, 14.30it/s, loss=0.126] 


Iteration 7, Genauigkeit auf Testdaten: 0.696


Epoch 1: 100%|██████████| 89/89 [00:06<00:00, 13.16it/s, loss=0.078] 
Epoch 2: 100%|██████████| 89/89 [00:06<00:00, 14.64it/s, loss=0.021] 


Iteration 8, Genauigkeit auf Testdaten: 0.7168


Epoch 1: 100%|██████████| 89/89 [00:06<00:00, 14.36it/s, loss=0.0339]
Epoch 2: 100%|██████████| 89/89 [00:06<00:00, 14.82it/s, loss=0.0402]


Iteration 9, Genauigkeit auf Testdaten: 0.7088


Epoch 1: 100%|██████████| 89/89 [00:06<00:00, 13.79it/s, loss=0.00911]
Epoch 2: 100%|██████████| 89/89 [00:06<00:00, 14.32it/s, loss=0.0201] 


Iteration 10, Genauigkeit auf Testdaten: 0.7232
Genauigkeit mit Cluster-based Sampling: 0.7024
Genauigkeit mit Farthest-first Traversal: 0.7232


## Vergleiche die Genauigkeiten aller Methoden

In [9]:
print(f"Genauigkeit ohne Active Learning: {test_accuracy}")
print(f"Genauigkeit mit Entropie-Unsicherheit: {accuracy_entropy}")
print(f"Genauigkeit mit Konfidenz-Unsicherheit: {accuracy_confidence}")
print(f"Genauigkeit mit Cluster-based Sampling: {accuracy_cluster}")
print(f"Genauigkeit mit Farthest-first Traversal: {accuracy_farthest}")

Genauigkeit ohne Active Learning: 0.6928
Genauigkeit mit Entropie-Unsicherheit: 0.7184
Genauigkeit mit Konfidenz-Unsicherheit: 0.712
Genauigkeit mit Cluster-based Sampling: 0.7024
Genauigkeit mit Farthest-first Traversal: 0.7232


## Conclusio

Beide Ansätze, Uncertainty Sampling und Diversity Sampling, haben die Genauigkeit im Vergleich zum Modell ohne Active Learning verbessert. Das ist schon mal ein gutes Zeichen und zeigt, dass das samplen der Trainingsdaten während des Trainings zumindest irgendwas bewirkt hat. Bei den Uncertainty-Sampling-Methoden hat die Entropie-basierte Methode eine etwas höhere Genauigkeit erreicht als die Konfidenz-basierte Methode - ist aber in Anbetracht der wenigen Epochen und des generell sehr minimal gehaltenen Experimentes nicht unbedingt aussagekräftig. Das könnte aber bedeuten, dass es in diesem Fall besser war, die Unsicherheit über alle Vorhersagen (Entropie) zu berücksichtigen, anstatt nur die Konfidenz der am wahrscheinlichsten vorhergesagten Klasse zu verwenden. Wenn wir uns die Diversity-Sampling-Methoden anschauen, sehen wir, dass die Farthest-first Traversal-Methode besser abgeschnitten hat als die Cluster-based Sampling-Methode. Das erklär ich mir so, dass es in diesem Fall vorteilhafter war, Beispiele auszuwählen, die sich stark von den bereits Ausgewählten unterscheiden, anstatt Clustering zur Identifizierung von Ausreißern zu verwenden.
Insgesamt hat die Farthest-first Traversal-Methode von allen getesteten Methoden die höchste Genauigkeit erzielt. I guess, dass die Erkundung des "Merkmalsraums" durch die Auswahl stärker unterschiedlicher Beispiele bei dem Klassifizierungsproblem (Katze vs. Hund) effektiv war. Nur eine Vermutung, aber ich kann mir vorstellen das grad bei Bilders eine größere Vielfalt mehr Sinn macht als Ausreißer, da viel generalisiert werden muss (?).

**Vor- und Nachteilen der beiden Ansätze:**


*Uncertainty Sampling:*

Vorteil: Es konzentriert sich auf Beispiele, bei denen das Modell unsicher ist, was dazu beitragen kann, die Entscheidungsgrenzen des Modells zu verfeinern.
Nachteil: Es besteht die Gefahr, sich auf schwierige oder sogar fehlerhafte Beispiele zu konzentrieren, was zu Overfitting führen kann.

*Diversity Sampling:*

Vorteil: Es fördert die Auswahl vielfältiger Beispiele, was dazu beitragen kann, eine breitere Abdeckung des "Merkmalsraums" zu erreichen und die Generalisierungsfähigkeit des Modells zu verbessern.
Nachteil: Die Leistung hängt von der Qualität der verwendeten Methode zur Messung der Vielfalt ab (z. B. Clustering oder Abstandsmetriken).

Für mich hat sich herausgestellt, dass beim Active Learning, insbesondere mit Farthest-first Traversal, eine Verbesserung der Klassifizierungsleistung bei diesem Problem zu erreichen ist. Beide Varianten miteinander zu verbinden wäre natürlich auch noch interessant :)

## manuelle daten labelung 
.. aus dem ersten Versuch - hab dann bestehende labels genutzt weil Zeit :)

In [10]:
# from PIL import Image, ImageOps
# import torch
# from torch.utils.data import DataLoader, Subset
# import pandas as pd
# from torchvision import transforms
# from IPython.display import display, clear_output
# 
# # Funktion zur manuellen Beschriftung der Bilder mit größerer Bildanzeige
# def manual_labeling(data_loader, indices):
#     # Leeres DataFrame für gelabelte Daten
#     labeled_data = pd.DataFrame(columns=['label'])
# 
#     for i, (images, _) in enumerate(data_loader):
#         img = transforms.ToPILImage()(images.squeeze(0))
#         img = img.resize((256, 256), Image.Resampling.LANCZOS)
#         display(img)  # Verwende display anstatt img.show()
#         label = input("Label eingeben (0 für Katze, 1 für Hund): ")
#         clear_output(wait=True)
#         labeled_data.loc[i] = [int(label)]
# 
#     return labeled_data
# 
# # Bereite den DataLoader vor, der nur die unsicheren Daten enthält
# uncertain_data_loader = Subset(ungelabeled_loader.dataset, uncertain_indices)
# uncertain_loader = DataLoader(uncertain_data_loader, batch_size=1, shuffle=False)
# 
# # Labeln der unsicheren Daten manuell
# labeled_uncertain_data = manual_labeling(uncertain_loader, uncertain_indices)
# labeled_uncertain_data.to_csv('labeled_uncertain_data.csv', index=False)