Przepuszczamy wszystkie obrazki z binary_dataset_pelican przez pipeline z pliku initial_pipeline_sae.ipynb a wstawiamy reprezentacje wyrzucone przez sae do jednego datasetu wraz z labelami (y oznacza 1 jeśli na zdjęciu jest pelican i 0 jeśli nie ma).

In [29]:
import torch
import clip
from PIL import Image
import torchvision.transforms as transforms
from pathlib import Path
from sparse_autoencoder import SparseAutoencoder
import pandas as pd
import numpy as np


def process_image_pipeline(image_path, sae_model_path):
    """
    Przetwarza obraz przez model CLIP i SAE, a następnie zapisuje wynik.
    :param image_path: Ścieżka do obrazu wejściowego.
    :param sae_model_path: Ścieżka do wytrenowanego modelu SAE.
    :param output_path: Ścieżka do zapisu przetworzonych cech.
    """

    # Wybór urządzenia
    device = "cuda" if torch.cuda.is_available() else ('mps' if torch.backends.mps.is_available() else "cpu")
    print(f"Używane urządzenie: {device}")

    # CLIP
    model, preprocess = clip.load("ViT-L/14", device=device)
    # Załaduj i przetwórz obraz
    image = preprocess(Image.open(image_path)).unsqueeze(0).to(device)
    # Przetwarzanie obrazu przez CLIP
    with torch.no_grad():
        image_features = model.encode_image(image)

    # SAE
    def load_sae_model(sae_checkpoint_path):
        state_dict = torch.load(sae_checkpoint_path, map_location=device)
        autoencoder_input_dim = 768  # CLIP ViT-L/14
        expansion_factor = 8
        n_learned_features = int(autoencoder_input_dim * expansion_factor)
        len_hook_points = 1  

        sae = SparseAutoencoder(
            n_input_features=autoencoder_input_dim,
            n_learned_features=n_learned_features,
            n_components=len_hook_points
        ).to(device)

        sae.load_state_dict(state_dict)
        sae.eval()
        return sae  

    # Przepuszczanie CLIP features przez SAE
    @torch.no_grad()
    def get_sae_representation(clip_features, sae_model):
        concepts, _ = sae_model(clip_features)
        return concepts.squeeze()


    sae = load_sae_model(sae_model_path)
    sae_repr = get_sae_representation(image_features, sae)

    return sae_repr.cpu().squeeze(0)

In [30]:
from tqdm import tqdm

Zróbmy (przynajmniej na razie) modele tylko na 100 zdjęciach z konceptem i 100 bez bo za długo to się wykonuje.

In [31]:
def create_concept_dataset(dataset_path, sae_model_path, concept_name, max_per_class=100):
    X = []
    y = []

    for label_dir in ["0_other", f"1_{concept_name}"]:
        label = 0 if label_dir == "0_other" else 1
        dir_path = Path(dataset_path) / label_dir
        image_paths = list(dir_path.glob("*.jpg")) + list(dir_path.glob("*.png")) + list(dir_path.glob("*.JPEG"))
        
        # Bierzemy tylko do max_per_class przykładów
        image_paths = image_paths[:max_per_class]
        for img_path in tqdm(image_paths, desc=f"Processing {label_dir}"):
            try:
                vec = process_image_pipeline(img_path, sae_model_path) 
                X.append(vec.squeeze().numpy())
                y.append(label)
            except Exception as e:
                print(f"Error processing {img_path}: {e}")

    # Konwersja do tensora
    X_tensor = torch.tensor(X, dtype=torch.float32)
    y_tensor = torch.tensor(y, dtype=torch.int64)

    # Zapis
    torch.save(X_tensor, "X_concepts.pt")
    torch.save(y_tensor, "y_labels.pt")

    return X_tensor, y_tensor


In [32]:
import os

biezacy_katalog = os.getcwd()
print(f"Aktualny katalog roboczy to: {biezacy_katalog}")

Aktualny katalog roboczy to: /Users/fantasy2fry/Documents/informatyczne/iadstudia/wb2/wb-sae-cbm/src


In [33]:
X, y = create_concept_dataset("/Users/fantasy2fry/Documents/informatyczne/iadstudia/wb2/wb-sae-cbm//concept_datasets/binary_dataset_pelican", "clip_ViT-L_14sparse_autoencoder_final.pt", "pelican", max_per_class=20)

Processing 0_other:   0%|          | 0/20 [00:00<?, ?it/s]

Używane urządzenie: mps


Processing 0_other:   5%|▌         | 1/20 [00:20<06:30, 20.56s/it]

Używane urządzenie: mps


Processing 0_other:  10%|█         | 2/20 [00:34<05:01, 16.72s/it]

Używane urządzenie: mps


Processing 0_other:  15%|█▌        | 3/20 [00:44<03:54, 13.79s/it]

Używane urządzenie: mps


Processing 0_other:  20%|██        | 4/20 [00:56<03:29, 13.10s/it]

Używane urządzenie: mps


Processing 0_other:  25%|██▌       | 5/20 [01:08<03:06, 12.42s/it]

Używane urządzenie: mps


Processing 0_other:  30%|███       | 6/20 [01:24<03:10, 13.64s/it]

Używane urządzenie: mps


Processing 0_other:  35%|███▌      | 7/20 [01:34<02:44, 12.67s/it]

Używane urządzenie: mps


Processing 0_other:  40%|████      | 8/20 [01:44<02:22, 11.86s/it]

Używane urządzenie: mps


Processing 0_other:  45%|████▌     | 9/20 [01:55<02:05, 11.45s/it]

Używane urządzenie: mps


Processing 0_other:  50%|█████     | 10/20 [02:06<01:52, 11.26s/it]

Używane urządzenie: mps


Processing 0_other:  55%|█████▌    | 11/20 [02:18<01:43, 11.48s/it]

Używane urządzenie: mps


Processing 0_other:  60%|██████    | 12/20 [02:29<01:31, 11.38s/it]

Używane urządzenie: mps


Processing 0_other:  65%|██████▌   | 13/20 [02:41<01:21, 11.64s/it]

Używane urządzenie: mps


Processing 0_other:  70%|███████   | 14/20 [02:53<01:09, 11.64s/it]

Używane urządzenie: mps


Processing 0_other:  75%|███████▌  | 15/20 [03:07<01:01, 12.39s/it]

Używane urządzenie: mps


Processing 0_other:  80%|████████  | 16/20 [03:19<00:48, 12.21s/it]

Używane urządzenie: mps


Processing 0_other:  85%|████████▌ | 17/20 [03:33<00:38, 12.90s/it]

Używane urządzenie: mps


Processing 0_other:  90%|█████████ | 18/20 [03:44<00:24, 12.38s/it]

Używane urządzenie: mps


Processing 0_other:  95%|█████████▌| 19/20 [03:53<00:11, 11.27s/it]

Używane urządzenie: mps


Processing 0_other: 100%|██████████| 20/20 [04:06<00:00, 12.31s/it]
Processing 1_pelican:   0%|          | 0/20 [00:00<?, ?it/s]

Używane urządzenie: mps


Processing 1_pelican:   5%|▌         | 1/20 [00:09<02:59,  9.46s/it]

Używane urządzenie: mps


Processing 1_pelican:  10%|█         | 2/20 [00:20<03:06, 10.37s/it]

Używane urządzenie: mps


Processing 1_pelican:  15%|█▌        | 3/20 [00:29<02:48,  9.90s/it]

Używane urządzenie: mps


Processing 1_pelican:  20%|██        | 4/20 [00:39<02:38,  9.91s/it]

Używane urządzenie: mps


Processing 1_pelican:  25%|██▌       | 5/20 [00:49<02:25,  9.71s/it]

Używane urządzenie: mps


Processing 1_pelican:  30%|███       | 6/20 [00:59<02:19, 10.00s/it]

Używane urządzenie: mps


Processing 1_pelican:  35%|███▌      | 7/20 [01:09<02:09,  9.99s/it]

Używane urządzenie: mps


Processing 1_pelican:  40%|████      | 8/20 [01:29<02:38, 13.24s/it]

Używane urządzenie: mps


Processing 1_pelican:  45%|████▌     | 9/20 [01:40<02:16, 12.43s/it]

Używane urządzenie: mps


Processing 1_pelican:  50%|█████     | 10/20 [01:51<01:59, 11.96s/it]

Używane urządzenie: mps


Processing 1_pelican:  55%|█████▌    | 11/20 [02:02<01:46, 11.86s/it]

Używane urządzenie: mps


Processing 1_pelican:  60%|██████    | 12/20 [02:13<01:32, 11.60s/it]

Używane urządzenie: mps


Processing 1_pelican:  65%|██████▌   | 13/20 [02:24<01:18, 11.24s/it]

Używane urządzenie: mps


Processing 1_pelican:  70%|███████   | 14/20 [02:37<01:10, 11.72s/it]

Używane urządzenie: mps


Processing 1_pelican:  75%|███████▌  | 15/20 [02:49<00:59, 11.84s/it]

Używane urządzenie: mps


Processing 1_pelican:  80%|████████  | 16/20 [03:02<00:48, 12.11s/it]

Używane urządzenie: mps


Processing 1_pelican:  85%|████████▌ | 17/20 [03:13<00:35, 11.76s/it]

Używane urządzenie: mps


Processing 1_pelican:  90%|█████████ | 18/20 [03:25<00:23, 11.93s/it]

Używane urządzenie: mps


Processing 1_pelican:  95%|█████████▌| 19/20 [03:37<00:11, 11.97s/it]

Używane urządzenie: mps


Processing 1_pelican: 100%|██████████| 20/20 [03:49<00:00, 11.48s/it]


Model liniowy na neuronie odpowiadającym za koncept pelikana:

In [34]:
from sklearn.linear_model import LogisticRegression
from sklearn.model_selection import train_test_split
from sklearn.metrics import accuracy_score, roc_auc_score

In [35]:
# Podział danych
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, stratify=y, random_state=42)
#random shuffle data
np.random.seed(42)
train_permutation = np.random.permutation(len(X_train))
X_train = X_train[train_permutation]
y_train = y_train[train_permutation]

test_permutation = np.random.permutation(len(X_test))
X_test = X_test[test_permutation]
y_test = y_test[test_permutation]


# neuron dla "pelican" 
pelican_neuron = 1085

# Model
X_train_single = X_train[:, pelican_neuron].reshape(-1, 1)
X_test_single = X_test[:, pelican_neuron].reshape(-1, 1)
clf_single = LogisticRegression().fit(X_train_single, y_train)
preds_single = clf_single.predict(X_test_single)
acc_single = accuracy_score(y_test, preds_single)
roc_single = roc_auc_score(y_test, clf_single.predict_proba(X_test_single)[:, 1])

Regresja logistyczna dla wszystkich neuronów:

In [36]:
# model
clf_full = LogisticRegression(max_iter=1000).fit(X_train, y_train)
preds_full = clf_full.predict(X_test)
acc_full = accuracy_score(y_test, preds_full)
roc_full = roc_auc_score(y_test, clf_full.predict_proba(X_test)[:, 1])

Wyniki: 

In [37]:
pelican_results = {
    "naming_neuron": {"accuracy": acc_single, "roc_auc": roc_single},
    "logistic_regression_full": {"accuracy": acc_full, "roc_auc": roc_full}
}

In [38]:
print(f"Pelican results: {pelican_results}")

Pelican results: {'naming_neuron': {'accuracy': 0.5, 'roc_auc': 0.5}, 'logistic_regression_full': {'accuracy': 1.0, 'roc_auc': 1.0}}


To samo dla 2 pozostałych konceptów: flamingi i gęsi.

Flamingi:

In [39]:
X_flamingo, y_flamingo = create_concept_dataset("../concept_datasets/binary_dataset_flamingos", "clip_ViT-L_14sparse_autoencoder_final.pt", "flamingo", max_per_class=20)

Processing 0_other:   0%|          | 0/20 [00:00<?, ?it/s]

Używane urządzenie: mps


Processing 0_other:   5%|▌         | 1/20 [00:13<04:14, 13.41s/it]

Używane urządzenie: mps


Processing 0_other:  10%|█         | 2/20 [00:26<03:59, 13.29s/it]

Używane urządzenie: mps


Processing 0_other:  15%|█▌        | 3/20 [00:43<04:16, 15.08s/it]

Używane urządzenie: mps


Processing 0_other:  20%|██        | 4/20 [01:00<04:09, 15.59s/it]

Używane urządzenie: mps


Processing 0_other:  25%|██▌       | 5/20 [01:17<04:04, 16.27s/it]

Używane urządzenie: mps


Processing 0_other:  30%|███       | 6/20 [01:29<03:24, 14.60s/it]

Używane urządzenie: mps


Processing 0_other:  35%|███▌      | 7/20 [01:40<02:55, 13.48s/it]

Używane urządzenie: mps


Processing 0_other:  40%|████      | 8/20 [01:50<02:28, 12.38s/it]

Używane urządzenie: mps


Processing 0_other:  45%|████▌     | 9/20 [02:01<02:13, 12.15s/it]

Używane urządzenie: mps


Processing 0_other:  50%|█████     | 10/20 [02:12<01:57, 11.76s/it]

Używane urządzenie: mps


Processing 0_other:  55%|█████▌    | 11/20 [02:22<01:40, 11.14s/it]

Używane urządzenie: mps


Processing 0_other:  60%|██████    | 12/20 [02:32<01:27, 10.94s/it]

Używane urządzenie: mps


Processing 0_other:  65%|██████▌   | 13/20 [02:42<01:14, 10.58s/it]

Używane urządzenie: mps


Processing 0_other:  70%|███████   | 14/20 [02:53<01:03, 10.53s/it]

Używane urządzenie: mps


Processing 0_other:  75%|███████▌  | 15/20 [03:04<00:53, 10.66s/it]

Używane urządzenie: mps


Processing 0_other:  80%|████████  | 16/20 [03:14<00:42, 10.61s/it]

Używane urządzenie: mps


Processing 0_other:  85%|████████▌ | 17/20 [03:26<00:32, 10.89s/it]

Używane urządzenie: mps


Processing 0_other:  90%|█████████ | 18/20 [03:38<00:22, 11.41s/it]

Używane urządzenie: mps


Processing 0_other:  95%|█████████▌| 19/20 [03:49<00:11, 11.06s/it]

Używane urządzenie: mps


Processing 0_other: 100%|██████████| 20/20 [04:02<00:00, 12.13s/it]
Processing 1_flamingo:   0%|          | 0/20 [00:00<?, ?it/s]

Używane urządzenie: mps


Processing 1_flamingo:   5%|▌         | 1/20 [00:11<03:35, 11.33s/it]

Używane urządzenie: mps


Processing 1_flamingo:  10%|█         | 2/20 [00:23<03:34, 11.91s/it]

Używane urządzenie: mps


Processing 1_flamingo:  15%|█▌        | 3/20 [00:34<03:17, 11.60s/it]

Używane urządzenie: mps


Processing 1_flamingo:  20%|██        | 4/20 [00:46<03:02, 11.41s/it]

Używane urządzenie: mps


Processing 1_flamingo:  25%|██▌       | 5/20 [00:56<02:44, 10.96s/it]

Używane urządzenie: mps


Processing 1_flamingo:  30%|███       | 6/20 [01:07<02:35, 11.14s/it]

Używane urządzenie: mps


Processing 1_flamingo:  35%|███▌      | 7/20 [01:19<02:27, 11.36s/it]

Używane urządzenie: mps


Processing 1_flamingo:  40%|████      | 8/20 [01:31<02:18, 11.51s/it]

Używane urządzenie: mps


Processing 1_flamingo:  45%|████▌     | 9/20 [01:43<02:10, 11.83s/it]

Używane urządzenie: mps


Processing 1_flamingo:  50%|█████     | 10/20 [01:54<01:55, 11.54s/it]

Używane urządzenie: mps


Processing 1_flamingo:  55%|█████▌    | 11/20 [02:07<01:48, 12.00s/it]

Używane urządzenie: mps


Processing 1_flamingo:  60%|██████    | 12/20 [02:18<01:33, 11.67s/it]

Używane urządzenie: mps


Processing 1_flamingo:  65%|██████▌   | 13/20 [02:33<01:28, 12.71s/it]

Używane urządzenie: mps


Processing 1_flamingo:  70%|███████   | 14/20 [02:45<01:14, 12.47s/it]

Używane urządzenie: mps


Processing 1_flamingo:  75%|███████▌  | 15/20 [02:56<00:59, 11.95s/it]

Używane urządzenie: mps


Processing 1_flamingo:  80%|████████  | 16/20 [03:05<00:44, 11.20s/it]

Używane urządzenie: mps


Processing 1_flamingo:  85%|████████▌ | 17/20 [03:15<00:32, 10.85s/it]

Używane urządzenie: mps


Processing 1_flamingo:  90%|█████████ | 18/20 [03:26<00:21, 10.88s/it]

Używane urządzenie: mps


Processing 1_flamingo:  95%|█████████▌| 19/20 [03:37<00:10, 10.66s/it]

Używane urządzenie: mps


Processing 1_flamingo: 100%|██████████| 20/20 [03:48<00:00, 11.42s/it]


In [40]:
# Podział danych
X_train, X_test, y_train, y_test = train_test_split(X_flamingo, y_flamingo, test_size=0.2, stratify=y, random_state=42)

# neuron dla "flamingo" 
flamingo_neuron = 2347

# Model na pojedynczym neuronie
X_train_single = X_train[:, flamingo_neuron].reshape(-1, 1)
X_test_single = X_test[:, flamingo_neuron].reshape(-1, 1)
clf_single = LogisticRegression().fit(X_train_single, y_train)
preds_single = clf_single.predict(X_test_single)
acc_single = accuracy_score(y_test, preds_single)
roc_single = roc_auc_score(y_test, clf_single.predict_proba(X_test_single)[:, 1])

# Model na pełnym wektorze
clf_full = LogisticRegression(max_iter=1000).fit(X_train, y_train)
preds_full = clf_full.predict(X_test)
acc_full = accuracy_score(y_test, preds_full)
roc_full = roc_auc_score(y_test, clf_full.predict_proba(X_test)[:, 1])



In [41]:
results_flamingo = {
    "naming_neuron": {"accuracy": acc_single, "roc_auc": roc_single},
    "logistic_regression_full": {"accuracy": acc_full, "roc_auc": roc_full}
}

In [42]:
print(f"Flamingo results: {results_flamingo}")

Flamingo results: {'naming_neuron': {'accuracy': 0.5, 'roc_auc': 0.5}, 'logistic_regression_full': {'accuracy': 1.0, 'roc_auc': 1.0}}


Gęsi:

In [43]:
X_geese, y_geese = create_concept_dataset("../concept_datasets/binary_dataset_geese", "clip_ViT-L_14sparse_autoencoder_final.pt", "goose", max_per_class=20)

Processing 0_other:   0%|          | 0/20 [00:00<?, ?it/s]

Używane urządzenie: mps


Processing 0_other:   5%|▌         | 1/20 [00:13<04:24, 13.92s/it]

Używane urządzenie: mps


Processing 0_other:  10%|█         | 2/20 [00:25<03:40, 12.25s/it]

Używane urządzenie: mps


Processing 0_other:  15%|█▌        | 3/20 [00:37<03:28, 12.25s/it]

Używane urządzenie: mps


Processing 0_other:  20%|██        | 4/20 [00:47<03:04, 11.54s/it]

Używane urządzenie: mps


Processing 0_other:  25%|██▌       | 5/20 [00:59<02:54, 11.63s/it]

Używane urządzenie: mps


Processing 0_other:  30%|███       | 6/20 [01:09<02:34, 11.06s/it]

Używane urządzenie: mps


Processing 0_other:  35%|███▌      | 7/20 [01:21<02:30, 11.54s/it]

Używane urządzenie: mps


Processing 0_other:  40%|████      | 8/20 [01:37<02:32, 12.72s/it]

Używane urządzenie: mps


Processing 0_other:  45%|████▌     | 9/20 [01:48<02:13, 12.14s/it]

Używane urządzenie: mps


Processing 0_other:  50%|█████     | 10/20 [02:01<02:06, 12.62s/it]

Używane urządzenie: mps


Processing 0_other:  55%|█████▌    | 11/20 [02:13<01:50, 12.32s/it]

Używane urządzenie: mps


Processing 0_other:  60%|██████    | 12/20 [02:41<02:17, 17.16s/it]

Używane urządzenie: mps


Processing 0_other:  65%|██████▌   | 13/20 [02:55<01:52, 16.06s/it]

Używane urządzenie: mps


Processing 0_other:  70%|███████   | 14/20 [03:10<01:34, 15.75s/it]

Używane urządzenie: mps


Processing 0_other:  75%|███████▌  | 15/20 [03:23<01:14, 14.97s/it]

Używane urządzenie: mps


Processing 0_other:  80%|████████  | 16/20 [03:36<00:58, 14.51s/it]

Używane urządzenie: mps


Processing 0_other:  85%|████████▌ | 17/20 [03:47<00:40, 13.35s/it]

Używane urządzenie: mps


Processing 0_other:  90%|█████████ | 18/20 [04:02<00:27, 13.90s/it]

Używane urządzenie: mps


Processing 0_other:  95%|█████████▌| 19/20 [04:14<00:13, 13.28s/it]

Używane urządzenie: mps


Processing 0_other: 100%|██████████| 20/20 [04:25<00:00, 13.27s/it]
Processing 1_goose:   0%|          | 0/20 [00:00<?, ?it/s]

Używane urządzenie: mps


Processing 1_goose:   5%|▌         | 1/20 [00:12<04:02, 12.75s/it]

Używane urządzenie: mps


Processing 1_goose:  10%|█         | 2/20 [00:25<03:49, 12.73s/it]

Używane urządzenie: mps


Processing 1_goose:  15%|█▌        | 3/20 [00:34<03:05, 10.93s/it]

Używane urządzenie: mps


Processing 1_goose:  20%|██        | 4/20 [00:45<02:58, 11.14s/it]

Używane urządzenie: mps


Processing 1_goose:  25%|██▌       | 5/20 [00:56<02:42, 10.84s/it]

Używane urządzenie: mps


Processing 1_goose:  30%|███       | 6/20 [01:05<02:26, 10.46s/it]

Używane urządzenie: mps


Processing 1_goose:  35%|███▌      | 7/20 [01:13<02:05,  9.66s/it]

Używane urządzenie: mps


Processing 1_goose:  40%|████      | 8/20 [01:23<01:55,  9.64s/it]

Używane urządzenie: mps


Processing 1_goose:  45%|████▌     | 9/20 [01:32<01:44,  9.48s/it]

Używane urządzenie: mps


Processing 1_goose:  50%|█████     | 10/20 [01:41<01:34,  9.46s/it]

Używane urządzenie: mps


Processing 1_goose:  55%|█████▌    | 11/20 [01:52<01:27,  9.72s/it]

Używane urządzenie: mps


Processing 1_goose:  60%|██████    | 12/20 [02:01<01:16,  9.54s/it]

Używane urządzenie: mps


Processing 1_goose:  65%|██████▌   | 13/20 [02:11<01:07,  9.69s/it]

Używane urządzenie: mps


Processing 1_goose:  70%|███████   | 14/20 [02:20<00:57,  9.63s/it]

Używane urządzenie: mps


Processing 1_goose:  75%|███████▌  | 15/20 [02:31<00:49,  9.98s/it]

Używane urządzenie: mps


Processing 1_goose:  80%|████████  | 16/20 [02:41<00:39,  9.81s/it]

Używane urządzenie: mps


Processing 1_goose:  85%|████████▌ | 17/20 [02:55<00:33, 11.18s/it]

Używane urządzenie: mps


Processing 1_goose:  90%|█████████ | 18/20 [03:04<00:21, 10.66s/it]

Używane urządzenie: mps


Processing 1_goose:  95%|█████████▌| 19/20 [03:14<00:10, 10.39s/it]

Używane urządzenie: mps


Processing 1_goose: 100%|██████████| 20/20 [03:25<00:00, 10.27s/it]


In [44]:
# Podział danych
X_train, X_test, y_train, y_test = train_test_split(X_geese, y_geese, test_size=0.2, stratify=y, random_state=42)

# neuron dla "goose" 
goose_neuron = 3426

# Model na pojedynczym neuronie
X_train_single = X_train[:, goose_neuron].reshape(-1, 1)
X_test_single = X_test[:, goose_neuron].reshape(-1, 1)
clf_single = LogisticRegression().fit(X_train_single, y_train)
preds_single = clf_single.predict(X_test_single)
acc_single = accuracy_score(y_test, preds_single)
roc_single = roc_auc_score(y_test, clf_single.predict_proba(X_test_single)[:, 1])

# Model na pełnym wektorze
clf_full = LogisticRegression(max_iter=1000).fit(X_train, y_train)
preds_full = clf_full.predict(X_test)
acc_full = accuracy_score(y_test, preds_full)
roc_full = roc_auc_score(y_test, clf_full.predict_proba(X_test)[:, 1])



In [45]:
results_goose = {
    "naming_neuron": {"accuracy": acc_single, "roc_auc": roc_single},
    "logistic_regression_full": {"accuracy": acc_full, "roc_auc": roc_full}
}

In [46]:
print(f"Goose results: {results_goose}")

Goose results: {'naming_neuron': {'accuracy': 0.5, 'roc_auc': 0.5}, 'logistic_regression_full': {'accuracy': 0.875, 'roc_auc': 1.0}}
