# Progetto XAI

## Generazione DataSet attraverso stable diffusion

Spiegare come abbiamo scelto i soggetti e gli sfondi. Trattazione simile a quella che si ha in un paper.Motivazioni spiegate su one note, spiegare cosa sono gli indizi spuri e perché utile analizzarli nel nostro contesto.

Inizialmente scelti questi sfondi e contesti:
🧱 10 Oggetti "Neutri" (neutral-looking)
    1. Cuscino
    2. Sedia semplice
    3. Bottiglia trasparente
    4. Ciotola vuota
    5. Cubo grigio (oggetto geometrico astratto)
    6. Lampadina spenta
    7. Libro chiuso
    8. Tazza vuota
    9. Scatola di cartone anonima
    10. Persona in t-shirt neutra

🌍 10 Contesti “Ad alto bias”
    1. Interno ufficio moderno (scrivania, laptop, lampada)
    2. Cucina con elettrodomestici
    3. Prato verde all'aperto (ambiente naturale)
    4. Ambiente militare (uniformi, elmetti)
    5. Pubblicità con colori vivaci (rosso/blu, banner)
    6. Sala conferenze con palco
    7. Bagno domestico (piastrelle, lavabo)
    8. Laboratorio scientifico (tubi, beute, microscopi)
    9. Garage / officina (attrezzi, macchinari)
Corridoio scolastico con banchi

troppo complessi da generare per i motori di stable diffusion che abbiamo a disposizione.

quindi abbiamo delinato



In [82]:
#ESEGUIRE SU KAGGLE O IN UN AMBIENTE CON GPU IN CUI SONO INSTALLATI DIFFUSERS E TORCH
import os
import re
import csv
import zipfile
from pathlib import Path
import torch
from tqdm.auto import tqdm
from diffusers import StableDiffusionPipeline

# --- Configurazione ---
objects = [
    "ceramic coffee mug", "hardcover book (closed)", "plain cardboard box",
    "simple wooden chair", "soft couch pillow", "opaque metal water bottle",
    "table lamp with shade (off)", "apple", "notebook with kraft cover", "matte gray sphere"
]
contexts = [
    "plain white studio background", "minimalist living-room corner", "modern office desk",
    "kitchen countertop daylight", "green park lawn afternoon light",
    "science lab bench", "garage workshop tools on pegboard",
    "hotel room desk area", "bathroom vanity matte tiles", "classroom row of desks daylight"
]

# --- Output Directory ---
base_dir = Path("/kaggle/working/dataset")
img_dir = base_dir / "images"
img_dir.mkdir(parents=True, exist_ok=True)
csv_meta = base_dir / "dataset_metadata.csv"

# --- Inizializza pipeline Stable Diffusion ---
pipe = StableDiffusionPipeline.from_pretrained(
    "runwayml/stable-diffusion-v1-5",
    torch_dtype=torch.float16,
    use_safetensors=True,
    low_cpu_mem_usage=True
).to("cuda")
pipe.enable_attention_slicing()

# --- CSV setup ---
csvfile = open(csv_meta, "w", newline="")
writer = csv.DictWriter(csvfile, fieldnames=["file_name", "prompt", "seed", "background"])
writer.writeheader()

# --- Generazione immagini + metadati ---
img_counter = 1
for obj in objects:
    for ctx in contexts:
        prompt = f"A neutral {obj} in a {ctx} background"
        obj_short = obj.replace(" ", "").replace("(", "").replace(")", "").lower()
        ctx_short = ctx.split()[0].lower()  # solo la prima parola del contesto

        for i in range(2):  # Numero immagini per combinazione
            filename = f"{obj_short}__{ctx_short}__{i+1:03}.png"
            file_path = img_dir / filename

            # Generazione immagine
            img = pipe(prompt, num_inference_steps=30, guidance_scale=11).images[0]
            img.save(file_path)

            # Scrittura riga CSV
            writer.writerow({
                "file_name": f"images/{filename}",
                "prompt": prompt,
                "seed": i + 1,
                "background": ctx
            })
            img_counter += 1

csvfile.close()
print("✅ Immagini e metadati generati!")

# --- Creazione ZIP finale ---
zip_path = "/kaggle/working/dataset.zip"
with zipfile.ZipFile(zip_path, "w", zipfile.ZIP_DEFLATED) as zipf:
    for file_path in base_dir.rglob("*"):
        zipf.write(file_path, arcname=file_path.relative_to(base_dir.parent))

print("✅ ZIP pronto per il download:", zip_path)

ModuleNotFoundError: No module named 'diffusers'

In [None]:
! pip install -q openai pandas pyarrow pillow tqdm urllib3

zsh:1: command not found: pip


In [None]:
import os, pandas as pd, urllib.request, zipfile, csv
from pathlib import Path
from PIL import Image
from tqdm.auto import tqdm
import numpy as np
import openai
from numpy.linalg import norm

# --- CONFIGURAZIONE ---
openai.api_key = os.getenv("OPENAI_API_KEY")

OBJ_CTX_PAIRS = [("apple", "studio")]
CLIP_THRESH = 0.30
COSINE_THRESH = 0.30
MAX_IMAGES = 50
MAX_PARTS = 5

BASE = Path("./dataset_diffdb")
IMG_DIR = BASE / "images"; IMG_DIR.mkdir(parents=True, exist_ok=True)
CSV_META = BASE / "dataset_metadata.csv"
META_URL = "https://huggingface.co/datasets/poloclub/diffusiondb/resolve/main/metadata.parquet"
META_FILE = BASE / "metadata.parquet"

# --- Funzione generazione prompt coerente ---
def make_prompt(obj, ctx):
    return (
        f"A product shot photo of a red {obj}, close-up, "
        f"on a clean {ctx} background, soft natural lighting, minimalistic composition"
    )

# --- Scarica metadata.parquet se necessario ---
if not META_FILE.exists():
    print("⬇️ Scarico metadata.parquet…")
    urllib.request.urlretrieve(META_URL, META_FILE)

# --- Carica metadata e filtra per presenza oggetto/contesto + CLIP ---
cols = ["image_name", "prompt", "part_id", "cfg", "seed", "clip", "sampler"]
df = pd.read_parquet(META_FILE, columns=cols)
df["prompt"] = df.prompt.str.lower()

# Applica filtro testuale
mask = df.prompt.apply(lambda t: any(o in t and ctx in t for o, ctx in OBJ_CTX_PAIRS)) & (df.clip >= CLIP_THRESH)
df_f = df[mask].reset_index(drop=True)

# Limita per numero parti e immagini
parts = df_f.part_id.unique().tolist()[:MAX_PARTS]
df_f = df_f[df_f.part_id.isin(parts)].head(MAX_IMAGES).reset_index(drop=True)

# --- Embedding prompt migliorati ---
print("🔍 Calcolo embedding dei prompt con OpenAI")
prompt_map = {make_prompt(o, c): (o, c) for o, c in OBJ_CTX_PAIRS}
prompt_embeds = {p: np.array(openai.Embeddings.create(model="text-embedding-3-small", input=p).data[0].embedding)
                 for p in prompt_map.keys()}

# --- Scarica immagini e confronta embedding ---
to_keep = []
parts_done = set()

for _, r in tqdm(df_f.iterrows(), total=len(df_f), desc="Verifica embedding"):
    # Trova il prompt strutturato associato a questo record
    matched = next((p for p, (o, c) in prompt_map.items() if o in r.prompt and c in r.prompt), None)
    if matched is None:
        continue

    # Scarica il part.zip se necessario
    if r.part_id not in parts_done:
        zip_n = f"part-{int(r.part_id):06}.zip"
        urllib.request.urlretrieve(f"https://huggingface.co/datasets/poloclub/diffusiondb/resolve/main/images/{zip_n}", zip_n)
        zipfile.ZipFile(zip_n).extractall(f"part-{int(r.part_id):06}")
        parts_done.add(r.part_id)

    # Embedding immagine
    img = Image.open(Path(f"part-{int(r.part_id):06}") / r.image_name)
    img_bytes = open(img.fp.name, "rb").read()
    resp = openai.Embeddings.create(model="text-embedding-ada-002", input=img_bytes)
    img_emb = np.array(resp.data[0].embedding)

    # Confronto cosine
    cosine = np.dot(prompt_embeds[matched], img_emb) / (norm(prompt_embeds[matched]) * norm(img_emb))
    if cosine >= COSINE_THRESH:
        r["prompt_structured"] = matched
        r["cosine"] = cosine
        to_keep.append(r)

df_sel = pd.DataFrame(to_keep)

# --- Salva immagini selezionate e CSV ---
with open(CSV_META, "w", newline="", encoding="utf-8") as f:
    writer = csv.DictWriter(f, fieldnames=["file", "prompt", "prompt_structured", "cfg", "seed", "sampler", "clip", "cosine"])
    writer.writeheader()
    for _, r in df_sel.iterrows():
        src = Path(f"part-{int(r.part_id):06}") / r.image_name
        Image.open(src).save(IMG_DIR / r.image_name)
        writer.writerow({
            "file": f"images/{r.image_name}",
            "prompt": r.prompt,
            "prompt_structured": r.prompt_structured,
            "cfg": float(r.cfg),
            "seed": int(r.seed),
            "sampler": int(r.sampler),
            "clip": float(r.clip),
            "cosine": round(float(r.cosine), 4)
        })

print("✅ Dataset finale creato:", len(df_sel), "immagini.")

ArrowInvalid: No match for FieldRef.Name(clip) in image_name: string
prompt: string
part_id: uint16
seed: uint32
step: uint16
cfg: float
sampler: uint8
width: uint16
height: uint16
user_name: string
timestamp: timestamp[us, tz=UTC]
image_nsfw: float
prompt_nsfw: float
__fragment_index: int32
__batch_index: int32
__last_in_fragment: bool
__filename: string

In [None]:
import re
import csv
from pathlib import Path

# Cartelle
base_dir = Path("/dataset")
img_dir = base_dir / "images"
csv_meta = base_dir / "dataset_metadata.csv"

# Reverse-mapping semantico per oggetti e contesti
objects = [
    "ceramic coffee mug", "hardcover book (closed)", "plain cardboard box",
    "simple wooden chair", "soft couch pillow", "opaque metal water bottle",
    "table lamp with shade (off)", "apple", "notebook with kraft cover", "matte gray sphere"
]
contexts = [
    "plain white studio background", "minimalist living-room corner", "modern office desk",
    "kitchen countertop daylight", "green park lawn afternoon light",
    "science lab bench", "garage workshop tools on pegboard",
    "hotel room desk area", "bathroom vanity matte tiles", "classroom row of desks daylight"
]

# Short name maps
obj_map = {o.replace(" ", "").replace("(", "").replace(")", "").lower(): o for o in objects}
ctx_map = {c.split()[0].lower(): c for c in contexts}

# Scrivi nuovo CSV
with open(csv_meta, "w", newline="") as csvfile:
    writer = csv.DictWriter(csvfile, fieldnames=["file_name", "prompt", "seed", "background"])
    writer.writeheader()

    for img_path in sorted(img_dir.glob("*.png")):
        fname = img_path.name
        m = re.match(r"([a-z0-9]+)__([a-z0-9]+)__([0-9]+)\\.png", fname)
        if not m:
            print(f"⚠️ Nome file non riconosciuto: {fname}")
            continue

        obj_key, ctx_key, seed = m.groups()
        obj_full = obj_map.get(obj_key, "unknown object")
        ctx_full = ctx_map.get(ctx_key, "unknown background")
        prompt = f"A neutral {obj_full} in a {ctx_full} background"

        writer.writerow({
            "file_name": f"images/{fname}",
            "prompt": prompt,
            "seed": int(seed),
            "background": ctx_full
        })

print("✅ Ricostruito con successo: dataset_metadata.csv")

In [89]:
! pip3 install pycocotools requests pillow pandas tqdm

Defaulting to user installation because normal site-packages is not writeable
You should consider upgrading via the '/Library/Developer/CommandLineTools/usr/bin/python3 -m pip install --upgrade pip' command.[0m


In [91]:
import os
import zipfile
import requests
from pathlib import Path

# Percorsi e URL
ANNOT_DIR = Path("annotations")
ANNOT_DIR.mkdir(exist_ok=True)
url = "http://images.cocodataset.org/annotations/annotations_trainval2017.zip"
zip_path = ANNOT_DIR / "annotations_trainval2017.zip"

# Scarica lo zip se manca
if not (ANNOT_DIR / "captions_val2017.json").exists():
    print("⬇️ Sto scaricando le annotazioni COCO 2017…")
    resp = requests.get(url, stream=True)
    with open(zip_path, "wb") as f:
        for chunk in resp.iter_content(1024*1024):
            f.write(chunk)
    # Estrai solo i file di interesse
    with zipfile.ZipFile(zip_path, "r") as z:
        for fname in ["annotations/captions_val2017.json"]:
            print("  🗃️ Estraggo", fname)
            z.extract(fname, ".")
    os.remove(zip_path)
    print("✅ Annotations pronte in", ANNOT_DIR / "captions_val2017.json")
else:
    print("✅ File annotations/captions_val2017.json già presente, non scarico.")

⬇️ Sto scaricando le annotazioni COCO 2017…
  🗃️ Estraggo annotations/captions_val2017.json
✅ Annotations pronte in annotations/captions_val2017.json


In [92]:
import json
import random
import requests
import pandas as pd
from pathlib import Path
from tqdm import tqdm
from pycocotools.coco import COCO
from PIL import Image

# --- CONFIGURAZIONE ---
BASE = Path("./dataset_coco")
ANNOT_DIR = Path("./annotations")
ANNOT_FILE = ANNOT_DIR / "captions_val2017.json"
IMG_DIR = BASE / "images"; IMG_DIR.mkdir(parents=True, exist_ok=True)
CSV_META = BASE / "dataset_metadata.csv"

# Controlla presenza file JSON
if not ANNOT_FILE.exists():
    raise FileNotFoundError(f"File annotazioni mancante: {ANNOT_FILE}")

# Carica annotazioni COCO
coco = COCO(str(ANNOT_FILE))

# Seleziona 50 immagini casuali
img_ids = coco.getImgIds()
sel_ids = random.sample(img_ids, 50)

rows = []
for img_id in tqdm(sel_ids, desc="Scarico immagini"):
    info = coco.loadImgs(img_id)[0]
    url = info["coco_url"]
    fname = info["file_name"]

    # Scarica l'immagine
    resp = requests.get(url, timeout=10)
    img_path = IMG_DIR / fname
    img_path.write_bytes(resp.content)

    # Carica didascalie
    ann_ids = coco.getAnnIds(imgIds=[img_id])
    anns = coco.loadAnns(ann_ids)
    captions = [ann["caption"] for ann in anns]
    prompt = captions[0] if captions else ""

    rows.append({
        "file": f"images/{fname}",
        "prompt": prompt
    })

# Salva CSV finale
pd.DataFrame(rows).to_csv(CSV_META, index=False, encoding="utf-8")
print(f"✅ Fatto! 50 immagini salvate in {IMG_DIR} e metadata in {CSV_META}")

loading annotations into memory...
Done (t=0.02s)
creating index...
index created!


Scarico immagini: 100%|██████████| 50/50 [00:35<00:00,  1.40it/s]

✅ Fatto! 50 immagini salvate in dataset_coco/images e metadata in dataset_coco/dataset_metadata.csv





In [None]:
# Cell 1: Installazione pacchetti (esegui una volta)
! pip3 install -q torch torchvision openai python-dotenv pillow tqdm

You should consider upgrading via the '/Library/Developer/CommandLineTools/usr/bin/python3 -m pip install --upgrade pip' command.[0m


📁 Configurazione

In [96]:
# Cell 2: Configurazione variabili e caricamento ambiente
import os
from pathlib import Path
from dotenv import load_dotenv

# Carica da file .env se presente
load_dotenv(override=True)

# Variabili configurabili
VISION_MODEL = os.getenv("VISION_MODEL", "alexnet")
LLM_MODEL = os.getenv("LLM_MODEL", "gpt-4o-mini")
OPENAI_API_KEY = os.getenv("OPENAI_API_KEY")
IMG_DIR = Path(os.getenv("IMG_DIR", "dataset_/images"))
META_CSV = Path(os.getenv("META_CSV", "dataset_/dataset_metadata.csv"))
OUTPUT_DIR = Path(os.getenv("OUTPUT_DIR", "analysis_out_"))
OUTPUT_DIR.mkdir(parents=True, exist_ok=True)
COHERENCE_THRESHOLD = float(os.getenv("COHERENCE_TH", 0.5))

print(f"VISION_MODEL: {VISION_MODEL}")
print(f"LLM_MODEL: {LLM_MODEL}")
print(f"OPENAI_API_KEY: {OPENAI_API_KEY}")
print(f"IMG_DIR: {IMG_DIR}")
print(f"META_CSV: {META_CSV}")
print(f"OUTPUT_DIR: {OUTPUT_DIR}")
print(f"COHERENCE_THRESHOLD: {COHERENCE_THRESHOLD}")

VISION_MODEL: alexnet
LLM_MODEL: gpt-4o-mini
OPENAI_API_KEY: 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
IMG_DIR: dataset_coco/images
META_CSV: dataset_coco/dataset_metadata.csv
OUTPUT_DIR: analysis_out_coco
COHERENCE_THRESHOLD: 0.6


🧠 Caricamento modello visivo

In [101]:
# Cell 3: Carica modello vision e classi ImageNet
import torch
import torchvision.models as models
import torchvision.transforms as T

from PIL import Image

device = torch.device("cuda" if torch.cuda.is_available() else "cpu")

# Caricamento modello dinamico
model = getattr(models, VISION_MODEL)(pretrained=True).eval().to(device)

# Etichette ImageNet
import urllib.request
labels_url = "https://raw.githubusercontent.com/pytorch/hub/master/imagenet_classes.txt"
imagenet_labels = urllib.request.urlopen(labels_url).read().decode().splitlines()
idx2label = {i: l for i, l in enumerate(imagenet_labels)}

# Trasformazioni immagine
transform = T.Compose([
    T.Resize(256),
    T.CenterCrop(224),
    T.ToTensor(),
    T.Normalize(mean=[0.485, 0.456, 0.406],
                std=[0.229, 0.224, 0.225]),
])

📊 Estrazione top-10 logits

In [120]:
# Cell 4: Funzione per estrazione logits
import csv
import json
from tqdm.auto import tqdm

def get_topk(logits, k=10):
    probs = torch.softmax(logits, dim=-1)
    top_p, top_i = torch.topk(probs, k)
    return [(int(i), (idx2label[int(i)], float(p))) for p, i in zip(top_p.cpu(), top_i.cpu())]

# Carica prompt da CSV
prompts = {}
with open(META_CSV, newline='') as f:
    reader = csv.DictReader(f)
    for row in reader:
        prompts[Path(row["file"]).name] = row["prompt"]#attenzione file_name 

# Analisi immagini
results = []
for img_path in tqdm(sorted(IMG_DIR.glob("*.jpg"))):
    prompt = prompts.get(img_path.name)
    if not prompt:
        continue

    image = Image.open(img_path).convert("RGB")
    with torch.no_grad():
        logits = model(transform(image).unsqueeze(0).to(device))

    top_logits = get_topk(logits[0])
    results.append({
        "file_name": str(img_path),
        "prompt": prompt,
        "top_logits": top_logits
    })
for r in results:
    print(f"\nFile: {r['file_name']}")
    print(f"Prompt: {r['prompt']}")
    print("Top-10 logits:")
    for logit_idx, (label, prob) in r["top_logits"]:
        print(f"  logit {logit_idx}: {label} ({prob:.4f})")

100%|██████████| 50/50 [00:00<00:00, 84.52it/s]


File: dataset_coco/images/000000010764.jpg
Prompt: A catches crouches on a patch of dirt.
Top-10 logits:
  logit 429: baseball (0.5124)
  logit 981: ballplayer (0.4875)
  logit 518: crash helmet (0.0000)
  logit 560: football helmet (0.0000)
  logit 665: moped (0.0000)
  logit 671: mountain bike (0.0000)
  logit 615: knee pad (0.0000)
  logit 758: reel (0.0000)
  logit 763: revolver (0.0000)
  logit 752: racket (0.0000)

File: dataset_coco/images/000000017178.jpg
Prompt: Horses communing with each other on a shady street.
Top-10 logits:
  logit 385: Indian elephant (0.3155)
  logit 690: oxcart (0.2008)
  logit 346: water buffalo (0.1914)
  logit 345: ox (0.0985)
  logit 386: African elephant (0.0720)
  logit 603: horse cart (0.0673)
  logit 101: tusker (0.0154)
  logit 347: bison (0.0060)
  logit 343: warthog (0.0020)
  logit 349: bighorn (0.0018)

File: dataset_coco/images/000000025393.jpg
Prompt: a couple of men in ties are outside
Top-10 logits:
  logit 457: bow tie (0.0984)
  logi




In [112]:
import pprint

for r in results:
    print(f"\nFile: {r['file_name']}")
    print(f"Prompt: {r['prompt']}")
    print("Top-10 logits:")
    for idx, (label, prob) in enumerate(r["top_logits"]):
        print(f"  {idx}: {label} ({prob:.4f})")


File: dataset_coco/images/000000010764.jpg
Prompt: A catches crouches on a patch of dirt.
Top-10 logits:
  0: baseball (0.5124)
  1: ballplayer (0.4875)
  2: crash helmet (0.0000)
  3: football helmet (0.0000)
  4: moped (0.0000)
  5: mountain bike (0.0000)
  6: knee pad (0.0000)
  7: reel (0.0000)
  8: revolver (0.0000)
  9: racket (0.0000)

File: dataset_coco/images/000000017178.jpg
Prompt: Horses communing with each other on a shady street.
Top-10 logits:
  0: Indian elephant (0.3155)
  1: oxcart (0.2008)
  2: water buffalo (0.1914)
  3: ox (0.0985)
  4: African elephant (0.0720)
  5: horse cart (0.0673)
  6: tusker (0.0154)
  7: bison (0.0060)
  8: warthog (0.0020)
  9: bighorn (0.0018)

File: dataset_coco/images/000000025393.jpg
Prompt: a couple of men in ties are outside
Top-10 logits:
  0: bow tie (0.0984)
  1: lab coat (0.0975)
  2: Windsor tie (0.0688)
  3: suit (0.0445)
  4: plunger (0.0385)
  5: stole (0.0314)
  6: basketball (0.0252)
  7: sweatshirt (0.0225)
  8: crutch (0

🤖 Valutazione coerenza con LLM

In [111]:
# Cell 5: Chiamata LLM OpenAI per valutazione coerenza
import openai
import json
import re
openai.api_key = OPENAI_API_KEY

incoherent = []

def extract_json_from_text(text):
    """
    Estrae il primo blocco JSON da testo anche se è dentro blocchi markdown o formattato male.
    """
    try:
        match = re.search(r'\{.*?\}', text, re.DOTALL)
        if match:
            return json.loads(match.group(0))
    except json.JSONDecodeError as e:
        print("⚠️ Errore JSON:", e)
    raise ValueError("⚠️ Nessun JSON valido trovato nella risposta LLM.")

def query_llm(prompt, top_logits):
    top_str = "; ".join([f"{lbl}: {prob:.3f}" for lbl, prob in top_logits])
    user_msg = f"""
    Prompt: "{prompt}"
    Top-10 labels ({VISION_MODEL}): {top_str}
    
    1. Sono queste label coerenti con il prompt? (yes/no)
    2. Dai un punteggio di coerenza [0-1]
    3. Spiega eventuali incoerenze o bias
    
    Rispondi solo con questo JSON (senza testo extra):
    {{
      "coherent": "yes" or "no",
      "score": float tra 0 e 1,
      "explanation": "stringa"
    }}
    """

    res = openai.chat.completions.create(
        model=LLM_MODEL,
        messages=[
            {"role": "system", "content": "Sei un esperto di coerenza visivo-testuale."},
            {"role": "user", "content": user_msg}
        ],
        temperature=0.2
    )

    response_text = res.choices[0].message.content.strip()
    print("RAW LLM output:\n", response_text, "\n")  # debug

    return extract_json_from_text(response_text)

with open(logits_path, "w") as fout:
    for r in tqdm(results, desc="LLM Analysis"):
        llm_data = query_llm(r["prompt"], r["top_logits"])
        record = {**r, **llm_data}
        fout.write(json.dumps(record) + "\n")
        if llm_data["score"] < COHERENCE_THRESHOLD:
            incoherent.append(record)

LLM Analysis:   2%|▏         | 1/50 [00:03<02:46,  3.40s/it]

RAW LLM output:
 {
  "coherent": "yes",
  "score": 0.8,
  "explanation": "Le label 'baseball' e 'ballplayer' sono coerenti con il prompt, che suggerisce un contesto sportivo. Tuttavia, la mancanza di riferimenti diretti a elementi specifici come 'guanti' o 'battitore' potrebbe indicare una certa ambiguità."
} 



LLM Analysis:   4%|▍         | 2/50 [00:04<01:52,  2.33s/it]

RAW LLM output:
 {
  "coherent": "no",
  "score": 0.1,
  "explanation": "Le label fornite si riferiscono principalmente a elefanti e animali da lavoro, mentre il prompt parla di cavalli. Non ci sono riferimenti diretti ai cavalli, il che indica una mancanza di coerenza con il contenuto del prompt."
} 



LLM Analysis:   6%|▌         | 3/50 [00:08<02:15,  2.88s/it]

RAW LLM output:
 {
  "coherent": "no",
  "score": 0.4,
  "explanation": "Le etichette suggeriscono una varietà di abbigliamento che non è strettamente correlata al prompt. Ad esempio, 'bow tie' e 'Windsor tie' sono specifici tipi di cravatte, ma non rappresentano l'idea di 'uomini in cravatte' in modo generale. Inoltre, la presenza di etichette come 'lab coat' e 'plunger' è completamente fuori tema rispetto al contesto di uomini in cravatta all'aperto."
} 



LLM Analysis:   8%|▊         | 4/50 [00:10<01:53,  2.47s/it]

RAW LLM output:
 {
  "coherent": "no",
  "score": 0.2,
  "explanation": "Le etichette si riferiscono principalmente a strumenti e oggetti legati alla musica e alla preparazione di bevande diverse dal vino, come il 'beer glass' e il 'cocktail shaker'. Non ci sono riferimenti diretti al vino o al processo di apertura di una bottiglia di vino, il che rende le etichette incoerenti con il prompt."
} 



LLM Analysis:  10%|█         | 5/50 [00:12<01:42,  2.28s/it]

RAW LLM output:
 {
  "coherent": "no",
  "score": 0.2,
  "explanation": "Le label fornite non sono coerenti con il prompt, in quanto la maggior parte di esse si riferisce a oggetti che non hanno alcuna relazione con un segnale di stop. 'Street sign' è l'unica label pertinente, ma le altre etichette come 'radio telescope', 'airship' e 'planetarium' non hanno alcuna connessione logica con un segnale di stop su un palo in una strada pubblica."
} 



LLM Analysis:  12%|█▏        | 6/50 [00:15<01:47,  2.45s/it]

RAW LLM output:
 {
  "coherent": "yes",
  "score": 0.8,
  "explanation": "Le etichette 'baseball' e 'ballplayer' sono direttamente correlate al prompt, che descrive un ragazzo che colpisce una palla da baseball. Tuttavia, le altre etichette come 'racket', 'lawn mower', e 'soccer ball' non sono pertinenti e possono indicare un bias nel modello, suggerendo che potrebbe confondere oggetti o attività non correlati al baseball."
} 



LLM Analysis:  14%|█▍        | 7/50 [00:17<01:46,  2.48s/it]

RAW LLM output:
 {
  "coherent": "no",
  "score": 0.3,
  "explanation": "Le label fornite non sono coerenti con il prompt. Mentre 'patio' è pertinente, le altre label come 'obelisk', 'rocking chair', e 'sliding door' non si collegano direttamente a un'area deck con un tavolo e un laptop. Inoltre, la presenza di oggetti come 'limousine' e 'guillotine' è completamente fuori tema."
} 



LLM Analysis:  16%|█▌        | 8/50 [00:19<01:35,  2.26s/it]

RAW LLM output:
 {
  "coherent": "yes",
  "score": 1.0,
  "explanation": "Le etichette sono coerenti con il prompt, poiché 'ballplayer' è direttamente correlato al concetto di un batter in una partita di baseball. Anche se 'baseball' ha un punteggio molto basso, è comunque pertinente al contesto. Non ci sono incoerenze significative o bias evidenti."
} 



LLM Analysis:  18%|█▊        | 9/50 [00:21<01:32,  2.24s/it]

RAW LLM output:
 {
  "coherent": "no",
  "score": 0.1,
  "explanation": "Il prompt menziona un 'hadron', che è un termine scientifico legato alla fisica delle particelle, mentre le etichette fornite si riferiscono a oggetti comuni come contenitori, uccelli e strutture. Non c'è alcuna connessione evidente tra il prompt e le etichette, suggerendo una mancanza di coerenza tematica."
} 



LLM Analysis:  20%|██        | 10/50 [00:24<01:40,  2.52s/it]

RAW LLM output:
 {
  "coherent": "yes",
  "score": 0.8,
  "explanation": "Le etichette suggerite, come 'church', 'palace', 'castle' e 'monastery', sono tipiche di molte città europee e si adattano bene a un contesto di una giornata soleggiata. Tuttavia, la presenza di etichette come 'stupa' e 'mosque' potrebbe suggerire una certa ambiguità culturale, poiché non sono elementi predominanti in tutte le città europee. Questo potrebbe indicare un bias verso la rappresentazione di diverse architetture, ma nel complesso le etichette rimangono coerenti con l'immagine di una città europea." 
} 



LLM Analysis:  22%|██▏       | 11/50 [00:26<01:30,  2.32s/it]

RAW LLM output:
 {
  "coherent": "no",
  "score": 0.3,
  "explanation": "Le etichette fornite non sono coerenti con il prompt. Sebbene 'ski' sia pertinente, le altre etichette come 'shopping cart', 'snowplow', e 'parallel bars' non hanno alcuna relazione diretta con un uomo che scia sulla neve. Questo suggerisce un bias nel modello, che potrebbe non aver riconosciuto correttamente il contesto dello sci."
} 



LLM Analysis:  24%|██▍       | 12/50 [00:29<01:28,  2.34s/it]

RAW LLM output:
 {
  "coherent": "no",
  "score": 0.2,
  "explanation": "Le label fornite non sono coerenti con il prompt, poiché la maggior parte delle etichette si riferisce a cibi diversi, come cheeseburger e burrito, che non sono presenti nel prompt. Solo 'plate' è vagamente pertinente, ma non rappresenta il contenuto specifico richiesto. Inoltre, non ci sono riferimenti a 'cheese bread', 'bread sticks' o 'wine', che sono gli elementi principali del prompt."
} 



LLM Analysis:  26%|██▌       | 13/50 [00:31<01:30,  2.45s/it]

RAW LLM output:
 {
  "coherent": "no",
  "score": 0.2,
  "explanation": "Le label fornite non sono coerenti con il prompt, poiché si riferiscono a oggetti e animali che non hanno attinenza con i teddy bears o i DVD. Ad esempio, 'ocarina', 'African grey', e 'Samoyed' non sono rilevanti per l'immagine descritta. Solo 'toyshop' ha una connessione debole, ma non è sufficiente per considerare l'insieme delle label coerente."
} 



LLM Analysis:  28%|██▊       | 14/50 [00:33<01:24,  2.36s/it]

RAW LLM output:
 {
  "coherent": "no",
  "score": 0.2,
  "explanation": "Le label fornite non sono coerenti con il prompt, poiché si riferiscono principalmente a elementi acquatici e strutture che non sono direttamente correlati a un treno o a una stazione ferroviaria. La presenza di 'steam locomotive' è l'unica label pertinente, ma le altre non contribuiscono a rappresentare il contesto di un treno accanto a una stazione con una città sullo sfondo."
} 



LLM Analysis:  30%|███       | 15/50 [00:37<01:32,  2.65s/it]

RAW LLM output:
 {
  "coherent": "yes",
  "score": 0.8,
  "explanation": "Le label sono in gran parte coerenti con il prompt, poiché fanno riferimento a diversi tipi di treni e veicoli ferroviari. Tuttavia, la presenza di etichette come 'cinema', 'vending machine', 'tobacco shop' e 'barbershop' non è direttamente pertinente al contesto di un treno giallo fermo alla stazione, suggerendo una certa confusione o bias nel modello."
} 



LLM Analysis:  32%|███▏      | 16/50 [00:39<01:25,  2.51s/it]

RAW LLM output:
 {
  "coherent": "no",
  "score": 0.2,
  "explanation": "Le label fornite si concentrano su veicoli a motore che non sono motociclette, come go-kart, motor scooter e moped, mentre il prompt specifica un gruppo di motociclisti su motociclette. Inoltre, le altre label come crash helmet e lifeboat non sono direttamente correlate al contesto del gruppo di bikers. Questo suggerisce una mancanza di coerenza tra le label e il prompt."
} 



LLM Analysis:  34%|███▍      | 17/50 [00:42<01:32,  2.81s/it]

RAW LLM output:
 {
  "coherent": "no",
  "score": 0.4,
  "explanation": "Le etichette fornite non sono completamente coerenti con il prompt. Sebbene 'park bench' sia pertinente, le altre etichette come 'worm fence' e 'maze' non si riferiscono direttamente a una panchina di legno accanto a un campo erboso. Inoltre, la presenza di elementi come 'lakeside' e 'barn' suggerisce un contesto diverso rispetto a quello descritto nel prompt."
} 



LLM Analysis:  36%|███▌      | 18/50 [00:45<01:24,  2.63s/it]

RAW LLM output:
 {
  "coherent": "no",
  "score": 0.2,
  "explanation": "Le etichette si riferiscono principalmente a orologi e strumenti di misurazione del tempo, mentre il prompt menziona un blocco di legno con numeri romani, che non è necessariamente un orologio. La presenza di numeri romani potrebbe suggerire un orologio, ma non è sufficiente per giustificare la maggior parte delle etichette fornite."
} 



LLM Analysis:  38%|███▊      | 19/50 [00:46<01:12,  2.33s/it]

RAW LLM output:
 {
  "coherent": "no",
  "score": 0.1,
  "explanation": "Le etichette fornite non sono coerenti con il prompt, poiché nessuna di esse rappresenta un idrante antincendio o elementi correlati come i pali. Le etichette si riferiscono a oggetti completamente diversi, suggerendo un bias nel riconoscimento degli oggetti."
} 



LLM Analysis:  40%|████      | 20/50 [00:48<01:08,  2.27s/it]

RAW LLM output:
 {
  "coherent": "no",
  "score": 0.2,
  "explanation": "Le label fornite non sono coerenti con il prompt, poiché si riferiscono a elementi specifici come megaliti, yurta e stupa, che non hanno una connessione diretta con un campo o una strada. Le uniche label che potrebbero avere una certa rilevanza sono 'valley' e 'hay', ma non rappresentano l'idea principale del prompt."
} 



LLM Analysis:  42%|████▏     | 21/50 [00:51<01:04,  2.24s/it]

RAW LLM output:
 {
  "coherent": "no",
  "score": 0.1,
  "explanation": "Le etichette fornite non sono coerenti con il prompt, poiché menzionano oggetti come granchio, strumenti musicali e cibo diverso da una banana, mentre il prompt si concentra su un uomo che mangia una banana. Non c'è alcuna correlazione tra le etichette e la descrizione del soggetto."
} 



LLM Analysis:  44%|████▍     | 22/50 [00:54<01:09,  2.49s/it]

RAW LLM output:
 {
  "coherent": "no",
  "score": 0.2,
  "explanation": "Le label fornite si riferiscono principalmente a razze di cani e animali diversi dall'elefante, con solo una menzione dell'elefante africano. Questo suggerisce una mancanza di coerenza con il prompt, che si concentra specificamente su un elefante e una nuvola di polvere, non su cani o altri animali."
} 



LLM Analysis:  46%|████▌     | 23/50 [00:56<01:07,  2.51s/it]

RAW LLM output:
 {
  "coherent": "yes",
  "score": 0.9,
  "explanation": "Le label fornite si riferiscono a diversi tipi di veicoli, ma la label 'steam locomotive' è altamente coerente con il prompt che menziona un treno parcheggiato. Le altre label, sebbene meno rilevanti, non sono completamente incoerenti, poiché possono rappresentare veicoli associati al contesto ferroviario. Tuttavia, la presenza di veicoli non ferroviari come 'tow truck' e 'forklift' potrebbe indicare un leggero bias verso veicoli industriali, ma non compromette significativamente la coerenza generale."
} 



LLM Analysis:  48%|████▊     | 24/50 [00:59<01:08,  2.62s/it]

RAW LLM output:
 {
  "coherent": "yes",
  "score": 0.85,
  "explanation": "Le label sono coerenti con il prompt, poiché la presenza di un 'home theater' e 'television' si allinea bene con l'immagine di una TV a schermo piatto in un soggiorno. Tuttavia, le label come 'desktop computer' e 'mouse' non sono pertinenti al contesto, il che riduce leggermente la coerenza complessiva."
} 



LLM Analysis:  48%|████▊     | 24/50 [00:59<01:04,  2.49s/it]


KeyboardInterrupt: 

📝 Generazione report

In [109]:
# 📊 Cell 6: Generazione report di bias e giudizio sul modello

summary_prompt = """
Sei un analista che deve valutare i bias sistematici di un modello di
riconoscimento immagini.

Il JSON che segue (array) contiene per ogni immagine:
- file_name: percorso dell'immagine
- prompt: testo con cui è stata generata l'immagine
- top_logits: lista di (label, prob) restituite dal modello vision
- coherent: yes/no
- score: coerenza [0-1]
- explanation: commento LLM sul singolo caso

**Obiettivi:**

1. **Statistiche aggregate**  
   - totale immagini analizzate  
   - media, mediana, deviazione standard degli score  
   - percentuale di immagini incoerenti (score < {COHERENCE_THRESHOLD})

2. **Pattern ricorrenti di incoerenza**  
   - individua le categorie di errori più frequenti (es. confusione sfondo/oggetto principale, dominanza colore, ecc.)  
   - collega ogni pattern a possibili bias insiti nel modello (dataset, architettura, pre-training)

3. **Elenco dettagliato delle immagini incoerenti**  
   Per ciascuna immagine con score < {COHERENCE_THRESHOLD} mostra:  
   - file_name  
   - prompt sintetizzato (≤ 15 parole)  
   - tre label più problematiche con le loro probabilità  
   - explanation (max 2 frasi)

4. **Bias principali del modello**  
   Deduci almeno 3 bias sistematici complessivi, citando esempi rappresentativi dal dataset.

5. **Giudizio finale**  
   - Valuta punti di forza e debolezza del modello di visione.  
   - Assegna un punteggio complessivo di affidabilità **(1 = molto scarso, 5 = ottimo)**.  
   - Nessun suggerimento di mitigazione: limita-ti all’analisi critica.

Rispondi in **Markdown** con sezioni titolate (##).
"""

# Serializza i casi incoerenti (indent 2 per stringa più compatta)
user_data = json.dumps(incoherent, indent=5)

response = openai.chat.completions.create(
    model=LLM_MODEL,
    messages=[
        {"role": "system",
         "content": "Sei un esperto di auditing sui bias di modelli AI."},
        {"role": "user",
         "content": summary_prompt + "\n```json\n" + user_data + "\n```"}
    ],
    temperature=0.3
)

report_md = response.choices[0].message.content
(OUTPUT_DIR / "report.md").write_text(report_md, encoding="utf-8")

print("✅ Report generato in:", OUTPUT_DIR / "report.md")

✅ Report generato in: analysis_out_coco/report.md


📺 Visualizzazione

In [110]:
# Cell 7: Output finale
from IPython.display import Markdown, display

print("Report salvato in:", OUTPUT_DIR / "report.md")
display(Markdown(report_md))

Report salvato in: analysis_out_coco/report.md


## 1. Statistiche Aggregate

- **Totale immagini analizzate**: 100
- **Media degli score**: 0.22
- **Mediana degli score**: 0.2
- **Deviazione standard degli score**: 0.12
- **Percentuale di immagini incoerenti (score < 0.3)**: 80%

## 2. Pattern Ricorrenti di Incoerenza

### Categorie di errori più frequenti:
1. **Confusione tra oggetti e animali**: Molte immagini che richiedevano specifici animali (es. giraffe, cavalli) hanno ricevuto etichette relative ad altri animali (es. elefanti, cani).
2. **Dominanza di oggetti non pertinenti**: Le etichette spesso includevano oggetti che non avevano attinenza con il prompt, come strumenti musicali o oggetti di uso quotidiano in contesti inappropriati (es. 'toilet tissue' in una scena familiare).
3. **Riferimenti a contesti sbagliati**: Immagini di ambienti specifici (es. soggiorni, ristoranti) hanno ricevuto etichette relative a negozi o oggetti non correlati.

### Possibili bias insiti nel modello:
- **Bias del dataset**: Potrebbe esserci una sovrabbondanza di immagini di alcuni oggetti o animali nel dataset di addestramento, portando il modello a confondere categorie simili.
- **Architettura del modello**: La rete neurale potrebbe non essere sufficientemente profonda o complessa per catturare le relazioni tra oggetti e contesti in modo efficace.
- **Pre-training**: Se il modello è stato addestrato su dati non bilanciati, potrebbe avere una comprensione distorta di alcune categorie.

## 3. Elenco Dettagliato delle Immagini Incoerenti

| file_name | prompt sintetizzato | tre label problematiche | explanation |
|-----------|---------------------|------------------------|-------------|
| 000000017178.jpg | Cavalli in una strada ombreggiata | Indian elephant (0.32), oxcart (0.20), water buffalo (0.19) | Le label si riferiscono a elefanti e animali da lavoro, mentre il prompt parla di cavalli. |
| 000000025394.jpg | Bartender apre una bottiglia di vino | steel drum (0.11), beer glass (0.08), cocktail shaker (0.07) | Le etichette non sono coerenti con il prompt, riferendosi a oggetti legati alla musica. |
| 000000025593.jpg | Segnale di stop in strada | radio telescope (0.25), street sign (0.22), airship (0.21) | Confusione tra oggetti, con etichette non pertinenti al segnale di stop. |
| 000000060449.jpg | Area deck con tavolo e laptop | patio (0.35), obelisk (0.13), rocking chair (0.05) | Le label non menzionano elementi chiave come tavolo e laptop. |
| 000000087875.jpg | Hadron in un lotto | milk can (0.19), indigo bunting (0.17), birdhouse (0.11) | Nessuna connessione tra il prompt e le etichette fornite. |
| 000000107094.jpg | Uomo che scia sulla neve | shopping cart (0.15), snowplow (0.10), parallel bars (0.08) | La maggior parte delle label non rappresenta un uomo che scia. |
| 000000108253.jpg | Piatto di pane di formaggio | cheeseburger (0.68), burrito (0.10), hotdog (0.06) | Le label non sono coerenti con il prompt, riferendosi a cibi diversi. |
| 000000125062.jpg | Orsi di peluche su uno scaffale | ocarina (0.26), toyshop (0.09), African grey (0.06) | Le etichette non si riferiscono a orsi di peluche o DVD. |
| 000000127624.jpg | Treno accanto a stazione | lakeside (0.25), dock (0.10), castle (0.06) | Le label non sono coerenti con il contesto ferroviario. |
| 000000143556.jpg | Gruppo di motociclisti su un ponte | go-kart (0.53), motor scooter (0.10), moped (0.07) | Le etichette non rappresentano motociclisti. |

*(Elenco abbreviato per motivi di spazio)*

## 4. Bias Principali del Modello

1. **Bias di categoria**: Il modello tende a confondere animali e oggetti, come dimostrato da immagini di giraffe classificate come elefanti.
2. **Bias di contesto**: Le etichette spesso non corrispondono al contesto del prompt, suggerendo che il modello non comprende bene le relazioni spaziali e contestuali.
3. **Bias di oggetto**: Il modello mostra una preferenza per oggetti comuni e facilmente riconoscibili, ignorando elementi più specifici o meno comuni.

## 5. Giudizio Finale

### Punti di forza:
- Il modello è in grado di riconoscere correttamente alcune categorie di oggetti comuni.
- Ha una buona capacità di identificare elementi visivi in contesti semplici.

### Punti di debolezza:
- Alta percentuale di incoerenza nelle etichette fornite.
- Tendenza a confondere categorie simili e a non comprendere il contesto visivo.
- Scarsa rilevanza delle etichette rispetto ai prompt.

### Punteggio complessivo di affidabilità: **2** (scarso)