# LineMood Dataset esplorazione
Questo notebook serve ad esplorare il dataset linemod, per farlo ci si avvale di un custom data dataloader

## 1. Import delle librerie necessarie

In [2]:
import sys
import matplotlib.pyplot as plt
from pathlib import Path
import torch
import os
import yaml
import random
from matplotlib.patches import Rectangle

# Importa il config per usare path e file in altre cartelle
sys.path.insert(0, str(Path.cwd().parent))  # Aggiungi parent al path
from config import Config
from utils.download_dataset import download_linemod_dataset
from dataset.custom_dataset import CustomDataset, create_dataloaders

# Usa PROJECT_ROOT dal config
project_root = Config.PROJECT_ROOT
if str(project_root) not in sys.path:
    sys.path.insert(0, str(project_root))

print(f"üìÇ Project root: {project_root}")


üìÇ Project root: /Users/nicolotermine/zMellow/GitHub-Poli/Polito/polito-aml-6D_pose_estimation


In [None]:
# Test device detection
print("=" * 60)
print("üîç DEVICE DETECTION TEST")
print("=" * 60)

# Check CUDA
print(f"\nüìä CUDA (NVIDIA GPU):")
print(f"   Available: {torch.cuda.is_available()}")
if torch.cuda.is_available():
    print(f"   Device count: {torch.cuda.device_count()}")
    print(f"   Device name: {torch.cuda.get_device_name(0)}")

# Check MPS (Apple Silicon)
print(f"\nüìä MPS (Apple Silicon GPU):")
has_mps = hasattr(torch.backends, 'mps')
print(f"   MPS backend available: {has_mps}")
if has_mps:
    print(f"   MPS is_available: {torch.backends.mps.is_available()}")
    if torch.backends.mps.is_available():
        try:
            # Test MPS
            test_tensor = torch.zeros(1).to('mps')
            print(f"   MPS test: ‚úÖ Working!")
        except Exception as e:
            print(f"   MPS test: ‚ùå Error - {e}")

# Show selected device
print(f"\nüéØ SELECTED DEVICE:")
print(f"   Config.DEVICE = '{Config.DEVICE}'")

if Config.DEVICE == 'mps':
    print(f"   ‚úÖ Apple Silicon GPU will be used for training")
    print(f"   ‚ö° This provides ~5-10x speedup vs CPU")
elif Config.DEVICE == 'cuda':
    print(f"   ‚úÖ NVIDIA GPU will be used for training")
    print(f"   ‚ö° This provides major speedup vs CPU")
else:
    print(f"   ‚ö†Ô∏è  CPU will be used (slower)")
    print(f"   üí° Consider using a GPU for faster training")

print(f"\n" + "=" * 60)

## 2. Scarica il Dataset

Usa questa cella per scaricare il dataset LineMOD preprocessato.

**Nota:** Il download pu√≤ richiedere alcuni minuti.

In [None]:
# Definisci la directory di output
output_dir = Config.DATASETS_DIR

# Verifica se il dataset √® gi√† presente
dataset_path = Config.LINEMOD_ROOT
if os.path.exists(dataset_path) and os.path.isdir(dataset_path):
    # Verifica che non sia una cartella vuota
    if len(os.listdir(dataset_path)) > 0:
        print(f"Dataset gi√† presente in {dataset_path}. Download saltato.")
    else:
        print(f"Cartella {dataset_path} vuota. Avvio download...")
        download_linemod_dataset(output_dir=output_dir)
else:
    print(f"Dataset non trovato. Avvio download in {output_dir}...")
    download_linemod_dataset(output_dir=output_dir)

## 3. Esplora la struttura del dataset

In [None]:
# Verifica la struttura del dataset
data_dir = Config.DATASETS_DIR

if data_dir.exists():
    print("üìÅ Dataset structure:")
    for item in sorted(data_dir.rglob('*')):
        if item.is_dir():
            level = len(item.relative_to(data_dir).parts)
            if level <= 3:  # Mostra solo i primi 3 livelli
                indent = '  ' * level
                print(f"{indent}üìÅ {item.name}/")
        elif item.is_file() and len(item.relative_to(data_dir).parts) <= 3:
            level = len(item.relative_to(data_dir).parts)
            indent = '  ' * level
            print(f"{indent}üìÑ {item.name}")
else:
    print("‚ùå Dataset directory not found! Please run the download cell first.")

## 4. Carica il Dataset con CustomDataset

Questo codice crea oggetti Dataset (CustomDataset):

- Restituisce oggetti che rappresentano la collezione di dati

- Puoi accedere ai singoli sample con train_dataset[0]

- NON fornisce batching automatico, shuffling, o parallelizzazione

- Utile per ispezione, debugging, o quando hai bisogno di controllo manuale


Usa quando:

- Vuoi esplorare i dati singolarmente

- Hai bisogno di flessibilit√† nel processing

- Debugging o visualizzazione


In [None]:
# Percorso al dataset
dataset_root = Config.LINEMOD_ROOT

# Crea i dataset train e test
train_dataset = CustomDataset(dataset_root, split='train', train_ratio=Config.TRAIN_TEST_RATIO, seed=42)
test_dataset = CustomDataset(dataset_root, split='test', train_ratio=Config.TRAIN_TEST_RATIO, seed=42)

print(f"\nüìä Dataset info:")
print(f"   Training samples: {len(train_dataset)}")
print(f"   Test samples: {len(test_dataset)}")

## üîß Test Fix: Verifica caricamento multipli oggetti per sample_id

In [None]:
# Test per verificare che il dataset carichi correttamente tutti gli oggetti
print("=" * 80)
print("üß™ Test del Dataset - Verifica caricamento multipli oggetti")
print("=" * 80)

# Test su oggetto 02 che ha multipli oggetti per immagine
print("\nüì¶ Test su folder 02 (dovrebbe avere MULTIPLI oggetti per immagine):")

# Trova i primi 3 sample del folder 02
folder_02_samples = [(i, s) for i, s in enumerate(train_dataset.samples) if s[0] == 2]

if folder_02_samples:
    # Testa i primi 3 samples
    for test_idx in range(min(3, len(folder_02_samples))):
        idx, (folder_id, sample_id) = folder_02_samples[test_idx]
        print(f"\n   Sample #{test_idx+1}: idx={idx}, folder_id={folder_id}, sample_id={sample_id}")
        
        sample = train_dataset[idx]
        print(f"   ‚úÖ Numero di oggetti trovati: {sample['num_objects']}")
        
        if sample['num_objects'] > 1:
            print(f"   üéâ CORRETTO! Trovati {sample['num_objects']} oggetti!")
            for i, obj in enumerate(sample['objects'][:3]):  # Mostra max 3
                bbox = obj['bbox'].numpy()
                print(f"      Oggetto {i+1}: obj_id={obj['obj_id']}, bbox=[{bbox[0]:.0f}, {bbox[1]:.0f}, {bbox[2]:.0f}, {bbox[3]:.0f}]")
        else:
            print(f"   ‚ö†Ô∏è WARNING: Solo {sample['num_objects']} oggetto trovato")
else:
    print("   ‚ùå Nessun sample trovato per folder 02")

# Test su oggetto 01 che ha un solo oggetto per immagine
print("\n\nüì¶ Test su folder 01 (dovrebbe avere 1 SOLO oggetto per immagine):")
folder_01_samples = [(i, s) for i, s in enumerate(train_dataset.samples) if s[0] == 1]

if folder_01_samples:
    idx, (folder_id, sample_id) = folder_01_samples[0]
    print(f"   Sample: idx={idx}, folder_id={folder_id}, sample_id={sample_id}")
    
    sample = train_dataset[idx]
    print(f"   ‚úÖ Numero di oggetti trovati: {sample['num_objects']}")
    
    if sample['num_objects'] == 1:
        print("   üéâ CORRETTO! Trovato 1 oggetto come previsto")
        obj = sample['objects'][0]
        bbox = obj['bbox'].numpy()
        print(f"      Oggetto: obj_id={obj['obj_id']}, bbox=[{bbox[0]:.0f}, {bbox[1]:.0f}, {bbox[2]:.0f}, {bbox[3]:.0f}]")
    else:
        print(f"   ‚ö†Ô∏è WARNING: {sample['num_objects']} oggetti trovati, dovrebbe essere 1")

print("\n" + "=" * 80)

## 5. Visualizza campioni del dataset

In [None]:
def visualize_sample(sample):
    """
    Visualizza un campione del dataset con TUTTI i bounding box.
    
    Args:
        sample: Un dizionario contenente i dati del campione
    """
    fig, axes = plt.subplots(1, 3, figsize=(15, 5))
    
    # RGB Image
    rgb = sample['rgb'].permute(1, 2, 0).numpy()
    axes[0].imshow(rgb)
    axes[0].set_title(f"RGB Image (Objects: {sample['num_objects']})\nFolder: {sample['folder_id']:02d}, Sample: {sample['sample_id']:04d}")
    axes[0].axis('off')
    
    # Draw ALL bounding boxes with different colors
    colors = ['r', 'g', 'b', 'y', 'c', 'm', 'orange', 'purple']
    if sample['num_objects'] > 0:
        for i, obj in enumerate(sample['objects']):
            bbox = obj['bbox'].numpy()
            x, y, w, h = bbox
            color = colors[i % len(colors)]
            rect = Rectangle((x, y), w, h, linewidth=2, edgecolor=color, facecolor='none')
            axes[0].add_patch(rect)
            # Add object ID label
            obj_id = obj['obj_id']
            axes[0].text(x, y-5, f"ID:{obj_id}", color=color, fontsize=10, 
                        bbox=dict(boxstyle='round,pad=0.3', facecolor='white', alpha=0.7))
    
    # Depth Map
    if sample['depth'] is not None:
        depth = sample['depth'].numpy()
        axes[1].imshow(depth, cmap='viridis')
        axes[1].set_title("Depth Map")
        axes[1].axis('off')
    
    # Mask
    if sample['mask'] is not None:
        mask = sample['mask'].numpy()
        axes[2].imshow(mask, cmap='gray')
        axes[2].set_title("Segmentation Mask")
        axes[2].axis('off')
    
    plt.tight_layout()
    plt.show()
    
    # Stampa informazioni su TUTTI gli oggetti
    print(f"\nüéØ Found {sample['num_objects']} object(s) in this image:")
    for i, obj in enumerate(sample['objects']):
        print(f"\n  Object #{i+1} (ID: {obj['obj_id']}):")
        print(f"    Rotation matrix:\n{obj['rotation'].numpy()}")
        print(f"    Translation vector: {obj['translation'].numpy()}")
        print(f"    Bounding Box [x, y, w, h]: {obj['bbox'].numpy()}")
    
    if sample['cam_K'] is not None:
        print("\nüì∑ Camera Intrinsics:")
        print(f"{sample['cam_K'].numpy()}")

# Visualizza 3 campioni casuali
indices = random.sample(range(len(train_dataset)), min(3, len(train_dataset)))

for idx in indices:
    print(f"\n{'='*80}")
    print(f"Sample #{idx}")
    print(f"{'='*80}")
    sample = train_dataset[idx]
    visualize_sample(sample)

## 6. Crea DataLoaders per il training

Questo codice crea oggetti DataLoader che wrappano i dataset:

- Internamente chiama probabilmente CustomDataset (come il primo blocco)

- Poi li wrappa in torch.utils.data.DataLoader

- Fornisce funzionalit√† aggiuntive:

- Batching automatico (batch_size=4)

- Shuffling del training set

- Parallelizzazione con num_workers

- Iterazione efficiente per il training

Usa quando:

- Stai facendo training/testing con PyTorch

- Hai bisogno di batching automatico

- Vuoi codice pi√π conciso e standard

In [None]:
# Crea train e test loaders
train_loader, test_loader = create_dataloaders(
    dataset_root=dataset_root,
    batch_size=4,
    num_workers=Config.NUM_WORKERS,
    train_ratio=Config.TRAIN_TEST_RATIO,
    seed=42
)

# Test di un batch
print("\nüîç Testing a batch from train_loader...")
for batch in train_loader:
    print(f"   RGB batch shape: {batch['rgb'].shape}")
    if batch['depth'] is not None:
        print(f"   Depth batch shape: {batch['depth'].shape}")
    if batch['mask'] is not None:
        print(f"   Mask batch shape: {batch['mask'].shape}")
    print(f"   Batch contains {len(batch['folder_id'])} samples")
    break

## 7. Esplora il contenuto di gt.yml e info.yml

In [None]:
# Trova il primo gt.yml disponibile
gt_file = next(Config.LINEMOD_ROOT.rglob('gt.yml'), None)
info_file = next(Config.LINEMOD_ROOT.rglob('info.yml'), None)

if gt_file:
    print("üìÑ Ground Truth (gt.yml) content:")
    with open(gt_file, 'r') as f:
        gt_data = yaml.safe_load(f)
        # Il file YAML ha struttura: {sample_id: [list of objects]}
        if isinstance(gt_data, dict):
            first_key = list(gt_data.keys())[0]
            print(f"Sample ID: {first_key}")
            if isinstance(gt_data[first_key], list):
                print(yaml.dump(gt_data[first_key][0], default_flow_style=False))
            else:
                print(yaml.dump(gt_data[first_key], default_flow_style=False))
        else:
            print(yaml.dump(gt_data[0], default_flow_style=False))

if info_file:
    print("\nüìÑ Info (info.yml) content:")
    with open(info_file, 'r') as f:
        info_data = yaml.safe_load(f)
        # Il file YAML ha struttura: {sample_id: [list of objects]}
        if isinstance(info_data, dict):
            first_key = list(info_data.keys())[0]
            print(f"Sample ID: {first_key}")
            # Controlla se la chiave esiste e che tipo di dato √®
            if first_key in info_data:
                if isinstance(info_data[first_key], list) and len(info_data[first_key]) > 0:
                    print(yaml.dump(info_data[first_key][0], default_flow_style=False))
                else:
                    print(yaml.dump(info_data[first_key], default_flow_style=False))
            else:
                print("Struttura non standard, mostra tutto:")
                print(yaml.dump(info_data, default_flow_style=False))
        else:
            print(yaml.dump(info_data[0] if isinstance(info_data, list) else info_data, default_flow_style=False))