In [1]:
import torch
import numpy as np
import matplotlib.pyplot as plt
from sklearn.datasets import make_moons
from types import SimpleNamespace

# Importy z Twojej paczki
# Upewnij się, że jesteś w środowisku poetry (kernel) lub dodałeś src do path
from tabdce.model.denoise_fn import TabularEpsModel
from tabdce.model.diffusion import MixedTabularDiffusion
from tabdce.utils.utils import DiffusionSchedule

# ==========================================
# 1. KONFIGURACJA I ŁADOWANIE
# ==========================================
CHECKPOINT_PATH = "../checkpoints/twomoons_diffusion_model.pt"  # Sprawdź czy nazwa pliku się zgadza!
DEVICE = "cuda" if torch.cuda.is_available() else "cpu"
NUM_CF_TO_GENERATE = 20  # Ile kontrfaktów wygenerować dla jednego punktu

print(f"Loading model from {CHECKPOINT_PATH} on {DEVICE}...")
checkpoint = torch.load(CHECKPOINT_PATH, map_location=DEVICE)

# Odtwarzamy konfigurację i obiekty transformacji
cfg = checkpoint['config']
qt = checkpoint['dataset_qt']
ohe = checkpoint['dataset_ohe'] # Dla TwoMoons będzie None, ale obsłużymy to ogólnie

# Parametry wymiarów (odtwarzamy z zapisanego configu lub transformerów)
# Dla TwoMoons: num_numerical=2, cat_dims=[]
num_numerical = qt.n_features_in_ if qt else 0
cat_dims = [len(c) for c in ohe.categories_] if ohe else []
xdim = num_numerical + sum(cat_dims)
y_classes = 2  # TwoMoons ma 2 klasy

# Inicjalizacja modelu
denoise_model = TabularEpsModel(
    xdim=xdim,
    cat_dims=cat_dims,
    y_classes=y_classes,
    hidden=cfg.model.hidden_dim, # Upewnij się, że nazwy pól w cfg pasują
).to(DEVICE)

diffusion = MixedTabularDiffusion(
    denoise_fn=denoise_model,
    num_numerical=num_numerical,
    num_classes=cat_dims,
    T=cfg.diffusion.T,
    device=DEVICE
).to(DEVICE)

# Wczytanie wag
diffusion.load_state_dict(checkpoint['model_state_dict'])
diffusion.eval()
print("Model loaded successfully!")

# ==========================================
# 2. PRZYGOTOWANIE DANYCH (TŁO + QUERY)
# ==========================================
# Generujemy świeże TwoMoons, żeby mieć tło do wykresu
X_bg, y_bg = make_moons(n_samples=1000, noise=0.1, random_state=42)

# Wybieramy PUNKT ZAPYTANIA (Query Point)
# Weźmy punkt z klasy 0 (górny księżyc), żeby zrobić CF do klasy 1 (dolny)
query_idx = 0
while y_bg[query_idx] != 0: # Szukamy pierwszego z klasy 0
    query_idx += 1

x_orig_raw = X_bg[query_idx].reshape(1, -1) # [1, 2]
y_orig = y_bg[query_idx]
y_target_cls = 1 # Celujemy w klasę przeciwną

print(f"Query point: {x_orig_raw}, Class: {y_orig} -> Target: {y_target_cls}")

# Transformacja punktu query do przestrzeni modelu (QT)
if qt:
    x_orig_model = qt.transform(x_orig_raw).astype(np.float32)
else:
    x_orig_model = x_orig_raw.astype(np.float32)

x_orig_tensor = torch.from_numpy(x_orig_model).to(DEVICE)
y_target_tensor = torch.tensor([y_target_cls], device=DEVICE).long()

# ==========================================
# 3. GENEROWANIE KONTRAFAKTÓW
# ==========================================
# Aby wygenerować N sztuk naraz, powielamy x_orig_tensor N razy (batching)
x_orig_batch = x_orig_tensor.repeat(NUM_CF_TO_GENERATE, 1)
y_target_batch = y_target_tensor.repeat(NUM_CF_TO_GENERATE)

print(f"Generating {NUM_CF_TO_GENERATE} counterfactuals...")
with torch.no_grad():
    # sample_counterfactual zwraca tensor [N, D_model]
    cf_model_tensor = diffusion.sample_counterfactual(x_orig_batch, y_target_batch)

# Powrót do przestrzeni oryginalnej (Inverse Transform)
cf_model_np = cf_model_tensor.cpu().numpy()

if qt:
    # Przycinamy wartości, żeby inverse transform nie oszalał przy outlierach z dyfuzji
    cf_model_np = np.clip(cf_model_np, -5.0, 5.0)
    cf_final = qt.inverse_transform(cf_model_np)
else:
    cf_final = cf_model_np

# ==========================================
# 4. WIZUALIZACJA MATPLOTLIB
# ==========================================
plt.figure(figsize=(10, 7))
plt.title(f"Counterfactuals via Diffusion: Class {y_orig} -> {y_target_cls}")

# 1. Rysujemy tło (Two Moons)
plt.scatter(X_bg[y_bg==0, 0], X_bg[y_bg==0, 1], c='skyblue', alpha=0.3, label='Class 0 (Background)')
plt.scatter(X_bg[y_bg==1, 0], X_bg[y_bg==1, 1], c='salmon', alpha=0.3, label='Class 1 (Background)')

# 2. Rysujemy wygenerowane CF (zielone krzyżyki)
plt.scatter(cf_final[:, 0], cf_final[:, 1], c='green', marker='x', s=50, linewidth=2, label='Generated CFs')

# 3. Rysujemy punkt oryginalny (duża czarna gwiazda)
plt.scatter(x_orig_raw[:, 0], x_orig_raw[:, 1], c='black', marker='*', s=300, edgecolors='white', label='Query Point x')

# Dodatki
plt.legend()
plt.grid(True, linestyle='--', alpha=0.5)
plt.xlabel("Feature 1")
plt.ylabel("Feature 2")

# Opcjonalnie: strzałki od oryginału do CF (dla kilku pierwszych)
for i in range(min(5, NUM_CF_TO_GENERATE)):
    plt.arrow(x_orig_raw[0,0], x_orig_raw[0,1], 
              cf_final[i,0] - x_orig_raw[0,0], cf_final[i,1] - x_orig_raw[0,1],
              color='gray', alpha=0.5, width=0.005, head_width=0.05)

plt.show()

Loading model from checkpoints/twomoons_diffusion_model.pt on cpu...


FileNotFoundError: [Errno 2] No such file or directory: 'checkpoints/twomoons_diffusion_model.pt'