<a href="https://colab.research.google.com/github/AlessandroCeriani/Analista_SOC/blob/main/framework1.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

#1. Installazione delle dipendenze
**Scopo**: Installa le librerie necessarie per caricare e usare un modello linguistico ottimizzato (Unsloth) e per la gestione di modelli di trasformatori (Hugging Face).

**Dettagli**:
- *unsloth* : Libreria per caricare modelli linguistici grandi in modo efficiente (quantizzazione a 4 bit).
- *transformers* e *trl* : Per la gestione e il fine-tuning di modelli linguistici.
- *bitsandbytes*, *xformers*, *peft* : Ottimizzazioni per l‚Äôinferenza e il training su GPU.
- La logica di installazione cambia se il codice gira su Google Colab o meno.






In [None]:
%%capture
import os, re
if "COLAB_" not in "".join(os.environ.keys()):
    !pip install unsloth
else:
    import torch
    v = re.match(r"[0-9\.]{3,}", str(torch.__version__)).group(0)
    xformers = "xformers==" + ("0.0.32.post2" if v == "2.8.0" else "0.0.29.post3")
    !pip install --no-deps bitsandbytes accelerate {xformers} peft trl triton cut_cross_entropy unsloth_zoo
    !pip install sentencepiece protobuf "datasets>=3.4.1,<4.0.0" "huggingface_hub>=0.34.0" hf_transfer
    !pip install --no-deps unsloth
!pip install transformers==4.56.2
!pip install --no-deps trl==0.22.2

#2. Caricamento del modello linguistico


- **Scopo**: Carica un modello linguistico pre-addestrato (Llama-3.2-3B) in modalit√† inferenza, ottimizzato per l‚Äôuso di memoria (4 bit).

- **Dettagli**:
Il modello √® pronto per generare risposte a prompt di testo.
Viene usato per simulare le decisioni di un analista SOC.

In [None]:

from unsloth import FastLanguageModel
import torch

model, tokenizer = FastLanguageModel.from_pretrained(
    model_name = "unsloth/Llama-3.2-3B-Instruct-bnb-4bit",
    max_seq_length = 2048,
    dtype = None,
    load_in_4bit = True,
)

ü¶• Unsloth: Will patch your computer to enable 2x faster free finetuning.
ü¶• Unsloth Zoo will now patch everything to make training faster!
==((====))==  Unsloth 2025.12.6: Fast Llama patching. Transformers: 4.56.2.
   \\   /|    Tesla T4. Num GPUs = 1. Max memory: 14.741 GB. Platform: Linux.
O^O/ \_/ \    Torch: 2.9.0+cu126. CUDA: 7.5. CUDA Toolkit: 12.6. Triton: 3.5.0
\        /    Bfloat16 = FALSE. FA [Xformers = None. FA2 = False]
 "-____-"     Free license: http://github.com/unslothai/unsloth
Unsloth: Fast downloading is enabled - ignore downloading bars which are red colored!


model.safetensors:   0%|          | 0.00/2.24G [00:00<?, ?B/s]

generation_config.json:   0%|          | 0.00/234 [00:00<?, ?B/s]

tokenizer_config.json: 0.00B [00:00, ?B/s]

special_tokens_map.json:   0%|          | 0.00/454 [00:00<?, ?B/s]

tokenizer.json:   0%|          | 0.00/17.2M [00:00<?, ?B/s]

chat_template.jinja: 0.00B [00:00, ?B/s]

In [None]:
%%capture
# 1. Pulizia e preparazione ambiente
import os
if "COLAB_" in "".join(os.environ.keys()):
    # Disinstalla eventuali versioni conflittuali
    !pip uninstall -y unsloth transformers trl peft bitsandbytes accelerate xformers
    # Installa solo unsloth (che gestisce automaticamente le dipendenze corrette)
    !pip install "unsloth[colab-new] @ git+https://github.com/unslothai/unsloth.git"
    # Riavvia la runtime dopo questa cella (su Colab: Runtime > Restart runtime)
else:
    # Per ambienti non-Colab (locale, Kaggle, etc.)
    !pip install unsloth

# 2. Dopo il riavvio, esegui solo da qui in poi
from unsloth import FastLanguageModel
import torch

# 3. Caricamento modello
model, tokenizer = FastLanguageModel.from_pretrained(
    model_name="unsloth/Llama-3.2-3B-Instruct-bnb-4bit",
    max_seq_length=2048,
    dtype=None,
    load_in_4bit=True,
)

print("Modello caricato con successo!")


#3. Definizione della Catena di Markov (Stati e Azioni)

- **Scopo**: Definisce uno spazio di stati che rappresentano le fasi di un attacco APT e le possibili azioni dell‚Äôanalista.

- **Struttura**:

  - Ogni stato ha:

    - *desc* : Descrizione della situazione corrente.
    - *actions* : Liste di azioni possibili.
    - *next* : Mappatura tra indice dell‚Äôazione scelta e il prossimo stato.


  - Gli stati terminali (end_success, end_fail, etc.) indicano l‚Äôesito della simulazione.


- **Esempio**: Da *step0* (traffico anomalo), l‚Äôagente pu√≤ scegliere tra 3 azioni, ognuna delle quali porta a un nuovo stato (es. step1_ip o step1_scan).

In [None]:
states = {
    "step0": {
        "desc": "Rilevato traffico anomalo verso un IP in Russia (185.143.223.42) dalle workstation del reparto ingegneria. Nessun allarme dai sistemi antivirus, ma il traffico √® cifrato e persistente da 3 giorni.",
        "actions": [
            "Richiedi dettagli sull‚ÄôIP e sul tipo di traffico.",
            "Esegui una scansione approfondita sulle workstation coinvolte.",
            "Fai un rapporto: sospetto attacco APT in corso."
        ],
        "next": {0: "step1_ip", 1: "step1_scan", 2: "end_fail"}
    },
    "step1_ip": {
        "desc": "L‚ÄôIP 185.143.223.42 √® associato a un server C2 noto, precedentemente utilizzato dal gruppo APT29 (Cozy Bear). Il traffico √® compatibile con il protocollo di comando e controllo di malware custom.",
        "actions": [
            "Richiedi informazioni su APT29 e le loro TTP (Tactics, Techniques, Procedures).",
            "Analizza i log delle workstation per trovare file sospetti.",
            "Fai un rapporto: attacco APT29 confermato."
        ],
        "next": {0: "step2_ttp", 1: "step2_logs", 2: "end_success"}
    },
    "step1_scan": {
        "desc": "Trovato un file sospetto: energyschedule.exe (firmato digitalmente, ma con hash sconosciuto). Il file comunica con l‚ÄôIP russo e ha creato una backdoor.",
        "actions": [
            "Richiedi analisi statica e dinamica del file.",
            "Isola le workstation e blocca il traffico verso l‚ÄôIP.",
            "Fai un rapporto: malware custom, probabilmente APT."
        ],
        "next": {0: "step2_file_analysis", 1: "end_partial", 2: "end_success"}
    },
    "step2_ttp": {
        "desc": "APT29 usa spear-phishing, malware custom (es. CozyBear), e persistenza tramite task scheduler. Recenti report indicano che stanno prendendo di mira il settore energetico in Europa.",
        "actions": [
            "Verifica se ci sono email di phishing recenti nel sistema.",
            "Cerca altri IOC (Indicators of Compromise) noti di APT29.",
            "Fai un rapporto: attacco APT29, obiettivo spionaggio industriale."
        ],
        "next": {0: "step3_phish", 1: "end_partial", 2: "end_success"}
    },
    "step2_file_analysis": {
        "desc": "Il file energyschedule.exe √® un dropper che installa un RAT (Remote Access Trojan). Il codice √® simile a campioni attribuiti a APT29. Il file √® stato scaricato da una email con mittente hr@company-energy.com (spoofed).",
        "actions": [
            "Analizza la email e il server di posta.",
            "Cerca altri host infetti nella rete.",
            "Fai un rapporto: attacco APT29, vettore phishing, obiettivo accesso remoto."
        ],
        "next": {0: "step3_phish", 1: "step4_other_hosts", 2: "end_success"}
    },
    "step3_phish": {
        "desc": "Trovata email con oggetto Nuovo piano energetico 2025 e allegato energy_plan_2025.docm. L‚Äôallegato contiene macro che scaricano il dropper. L‚Äôemail √® stata inviata a 5 dipendenti del reparto ingegneria.",
        "actions": [
            "Verifica se altri dipendenti hanno aperto l‚Äôallegato.",
            "Analizza il documento per trovare altri IOC.",
            "Fai un rapporto: campagna di phishing mirata, gruppo APT29, obiettivo spionaggio."
        ],
        "next": {0: "step4_other_users", 1: "end_partial", 2: "end_success"}
    },
    "step4_other_users": {
        "desc": "Altri 2 dipendenti hanno aperto l‚Äôallegato. Le loro workstation mostrano lo stesso traffico verso l‚ÄôIP russo. Una workstation ha tentato di accedere a dati riservati sulla rete interna.",
        "actions": [
            "Isola tutte le workstation compromesse.",
            "Analizza i dati a cui hanno tentato di accedere.",
            "Fai un rapporto: attacco APT29 in corso, obiettivo esfiltrazione dati."
        ],
        "next": {0: "step5_win", 1: "step5_win", 2: "step5_win"}
    },
    "step5_win": {
        "desc": "L‚Äôagente ha identificato correttamente l‚Äôattacco APT29, il vettore (phishing), l‚Äôobiettivo (spionaggio industriale) e ha suggerito le azioni di contenimento. Partita vinta!",
        "actions": [],
        "next": {}
    },
    "end_success": {"desc": "Rapporto corretto. Minaccia identificata.", "actions": [], "next": {}},
    "end_partial": {"desc": "Risposta incompleta. Rischio residuo.", "actions": [], "next": {}},
    "end_fail": {"desc": "Rapporto prematuro. Attacco non rilevato.", "actions": [], "next": {}},
}

#4. Funzione agent_choose_action

- **Scopo**: L‚Äôagente (modello linguistico) sceglie l‚Äôazione migliore in base alla descrizione dello stato.

- **Funzionamento**:
  - Costruisce un prompt che descrive la situazione e le azioni possibili.
  - Passa il prompt al modello, che genera una risposta (un numero tra 1, 2 o 3).
  - Estrae il numero dalla risposta e lo converte in indice dell‚Äôazione.
  - Se la risposta non √® valida, torna l‚Äôindice 0 (fallback sicuro).

In [None]:
def agent_choose_action(state_desc: str, actions: list) -> int:
    if not actions:
        return -1

    options_text = "\n".join([f"{i+1}. {act}" for i, act in enumerate(actions)])
    prompt = f"""<|begin_of_text|><|start_header_id|>system<|end_header_id|>
Sei un analista SOC esperto. Data la situazione e le azioni possibili, scegli la MIGLIORE opzione per identificare un attacco APT.
Rispondi SOLO con il numero dell'azione (es. 1, 2 o 3).

Situazione:
{state_desc}

Azioni:
{options_text}
<|eot_id|><|start_header_id|>assistant<|end_header_id|>"""

    inputs = tokenizer(prompt, return_tensors="pt").to("cuda")
    outputs = model.generate(
        **inputs,
        max_new_tokens=5,
        temperature=0.3,  # leggermente stocastico per evitare loop
        do_sample=True,
        pad_token_id=tokenizer.eos_token_id,
    )
    response = tokenizer.decode(outputs[0], skip_special_tokens=True)
    import re
    match = re.search(r'\b([123])\b', response)
    if match:
        idx = int(match.group(1)) - 1
        if 0 <= idx < len(actions):
            return idx
    return 0  # fallback sicuro

#5. Motore di gioco automatico (play_game)

- **Scopo**: Esegue una partita, simulando le scelte dell‚Äôagente fino a raggiungere uno stato terminale.

- **Logica**:
  - Parte da step0.
  - Ad ogni passo, l‚Äôagente sceglie un‚Äôazione, si passa allo stato successivo, e si aggiorna la storia.
  - Se si raggiunge step5_win, la partita √® vinta; altrimenti, si perde.
  - Il punteggio √® inversamente proporzionale al numero di mosse (pi√π veloce = punteggio pi√π alto).

In [None]:
def play_game(max_steps=10):
    current = "step0"
    steps = 0
    history = []

    while steps < max_steps:
        state = states[current]
        history.append(state["desc"])

        if current == "step5_win":
            score = max(0, 10 - steps)
            return {"status": "win", "steps": steps, "score": score, "history": history}

        if not state["actions"]:
            # Terminale non vincente
            return {"status": "loss", "steps": steps, "score": 0, "history": history, "reason": current}

        # Agente sceglie
        action_idx = agent_choose_action(state["desc"], state["actions"])
        chosen_action = state["actions"][action_idx]
        next_state = state["next"][action_idx]

        # Debug opzionale
        # print(f"[Step {steps}] Scelto: {chosen_action[:50]}... -> {next_state}")

        current = next_state
        steps += 1

    return {"status": "loss", "steps": steps, "score": 0, "history": history, "reason": "timeout"}


#6. Esecuzione e Output

- **Scopo**: Esegue una partita e stampa il risultato.
- **Output esempio**:

  üéÆ RISULTATO PARTITA
  Stato: WIN

  Mosse: 5

  Punteggio: 5/10
  
  üèÜ Partita vinta! APT29 identificato correttamente.

In [None]:
if __name__ == "__main__":
    result = play_game()
    print("\n" + "="*60)
    print(f"üéÆ RISULTATO PARTITA")
    print(f"Stato: {result['status'].upper()}")
    print(f"Mosse: {result['steps']}")
    print(f"Punteggio: {result['score']}/10")
    if result["status"] == "win":
        print("üèÜ Partita vinta! APT29 identificato correttamente.")
    else:
        print(f"‚ùå Persa: {result.get('reason', 'sconosciuto')}")


üéÆ RISULTATO PARTITA
Stato: WIN
Mosse: 5
Punteggio: 5/10
üèÜ Partita vinta! APT29 identificato correttamente.


#Riepilogo e Obiettivo del Codice

- **Obiettivo**: Simulare il processo decisionale di un analista SOC di fronte a un attacco APT, usando un modello linguistico per scegliere le azioni migliori.

- **Meccanismo**:
  - Catena di Markov per modellare le fasi dell‚Äôattacco.
  - Modello linguistico come "agente" che prende decisioni.
  - Valutazione dell‚Äôefficacia delle scelte (punteggio).


- **Applicazione pratica**: Pu√≤ essere usato per addestrare o testare la capacit√† di un modello di riconoscere e rispondere a minacce informatiche avanzate.

#Ragionamento esplicito

In [None]:
# ---------------------------------------------------------
# 1. Funzione: Agente con ragionamento esplicito (Chain-of-Thought)
# ---------------------------------------------------------
def agent_choose_action_with_reasoning(state_desc: str, actions: list):
    if not actions:
        return -1, "Nessuna azione disponibile."

    options_text = "\n".join([f"{i+1}. {act}" for i, act in enumerate(actions)])
    prompt = f"""<|begin_of_text|><|start_header_id|>system<|end_header_id|>
Sei un analista SOC esperto. Dato un incidente in corso, devi:
1. Analizzare la situazione;
2. Valutare le opzioni;
3. Scegliere la MIGLIORE azione per identificare un attacco APT (es. APT29);
4. Spiegare il tuo ragionamento;
5. Concludere con: "Scelta: X" dove X √® il numero dell'azione (1, 2 o 3).

Situazione:
{state_desc}

Azioni disponibili:
{options_text}
<|eot_id|><|start_header_id|>assistant<|end_header_id|>"""

    inputs = tokenizer(prompt, return_tensors="pt").to("cuda")
    outputs = model.generate(
        **inputs,
        max_new_tokens=256,  # abbastanza per ragionamento + scelta
        temperature=0.3,
        do_sample=True,
        pad_token_id=tokenizer.eos_token_id,
    )
    full_response = tokenizer.decode(outputs[0], skip_special_tokens=True)
    # Estrai solo la parte dopo l'ultimo <|start_header_id|>assistant<|end_header_id|>
    reasoning = full_response.split("<|start_header_id|>assistant<|end_header_id|>")[-1].strip()

    # Estrai la scelta finale
    import re
    choice_match = re.search(r"Scelta:\s*([123])", reasoning, re.IGNORECASE)
    if choice_match:
        idx = int(choice_match.group(1)) - 1
        if 0 <= idx < len(actions):
            return idx, reasoning
    # Fallback: cerca qualsiasi numero
    num_match = re.search(r"\b([123])\b", reasoning)
    if num_match:
        idx = int(num_match.group(1)) - 1
        if 0 <= idx < len(actions):
            return idx, reasoning
    return 0, reasoning + "\n‚ö†Ô∏è Scelta non chiara: fallback all'azione 1."

# ---------------------------------------------------------
# 2. Motore di gioco con output trasparente
# ---------------------------------------------------------
def play_game_transparent(max_steps=10):
    current = "step0"
    steps = 0
    history = []

    print("="*80)
    print("üïµÔ∏è  SIMULAZIONE: Threat Hunting con APT29")
    print("Obiettivo: Identificare APT29, il vettore (phishing) e l'obiettivo (spionaggio) nel minor tempo possibile.")
    print("="*80)

    while steps < max_steps:
        state = states[current]
        history.append(state["desc"])

        print(f"\nüîπ STEP {steps}")
        print(f"üìå CONTESTO:\n{state['desc']}\n")

        if current == "step5_win":
            score = max(0, 10 - steps)
            print("üéâ RISULTATO: Partita vinta!")
            print(f"‚úÖ Punteggio: {score}/10 ({steps} mosse)")
            return {"status": "win", "steps": steps, "score": score}

        if not state["actions"]:
            print(f"üíÄ TERMINALE NON VINCENTE: {current}")
            return {"status": "loss", "steps": steps, "score": 0, "terminal": current}

        print("üîç AZIONI POSSIBILI:")
        for i, act in enumerate(state["actions"], 1):
            print(f"  {i}. {act}")

        # L'agente "pensa" e decide
        action_idx, reasoning = agent_choose_action_with_reasoning(state["desc"], state["actions"])
        chosen_action = state["actions"][action_idx]
        next_state = state["next"][action_idx]

        print("\nüß† RAGIONAMENTO DELL'AGENTE:")
        print("-" * 50)
        print(reasoning)
        print("-" * 50)
        print(f"\n‚úÖ AZIONE SCELTA: {chosen_action}")
        print(f"‚û°Ô∏è  Prossimo stato: {next_state}")

        current = next_state
        steps += 1

    print("\n‚è∞ TIMEOUT: La partita non √® stata completata in tempo.")
    return {"status": "loss", "steps": steps, "score": 0, "terminal": "timeout"}

# ---------------------------------------------------------
# 3. Avvia simulazione trasparente
# ---------------------------------------------------------
if __name__ == "__main__":
    result = play_game_transparent()

üïµÔ∏è  SIMULAZIONE: Threat Hunting con APT29
Obiettivo: Identificare APT29, il vettore (phishing) e l'obiettivo (spionaggio) nel minor tempo possibile.

üîπ STEP 0
üìå CONTESTO:
Rilevato traffico anomalo verso un IP in Russia (185.143.223.42) dalle workstation del reparto ingegneria. Nessun allarme dai sistemi antivirus, ma il traffico √® cifrato e persistente da 3 giorni.

üîç AZIONI POSSIBILI:
  1. Richiedi dettagli sull‚ÄôIP e sul tipo di traffico.
  2. Esegui una scansione approfondita sulle workstation coinvolte.
  3. Fai un rapporto: sospetto attacco APT in corso.

üß† RAGIONAMENTO DELL'AGENTE:
--------------------------------------------------
system
Sei un analista SOC esperto. Dato un incidente in corso, devi:
1. Analizzare la situazione;
2. Valutare le opzioni;
3. Scegliere la MIGLIORE azione per identificare un attacco APT (es. APT29);
4. Spiegare il tuo ragionamento;
5. Concludere con: "Scelta: X" dove X √® il numero dell'azione (1, 2 o 3).

Situazione:
Rilevato traff

#1. Funzione agent_choose_action_with_reasoning
- **Scopo**:
Questa funzione estende la versione precedente, chiedendo al modello linguistico non solo di scegliere un‚Äôazione, ma anche di spiegare il ragionamento dietro la scelta (Chain-of-Thought, CoT). Questo rende il processo decisionale trasparente e interpretabile.

- **Dettagli tecnici**
```
def agent_choose_action_with_reasoning(state_desc: str, actions: list):
    if not actions:
        return -1, "Nessuna azione disponibile."
    options_text = "\n".join([f"{i+1}. {act}" for i, act in enumerate(actions)])
    prompt = f"""<|begin_of_text|><|start_header_id|>system<|end_header_id|>
    Sei un analista SOC esperto. Dato un incidente in corso, devi:
    1. Analizzare la situazione;
    2. Valutare le opzioni;
    3. Scegliere la MIGLIORE azione per identificare un attacco APT (es. APT29);
    4. Spiegare il tuo ragionamento;
    5. Concludere con: "Scelta: X" dove X √® il numero dell'azione (1, 2 o 3).
    Situazione:
    {state_desc}
    Azioni disponibili:
    {options_text}
    <|eot_id|><|start_header_id|>assistant<|end_header_id|>"""
```
- **Prompt strutturato**: Il prompt guida il modello a seguire un processo logico in 5 passaggi, chiedendo esplicitamente una spiegazione del ragionamento e una scelta finale formattata come "Scelta: X".


- **Generazione della risposta**:
```
outputs = model.generate(
    **inputs,
    max_new_tokens=256,  # abbastanza per ragionamento + scelta
    temperature=0.3,
    do_sample=True,
    pad_token_id=tokenizer.eos_token_id,
)
```
- *max_new_tokens=256*: Permette al modello di generare una risposta dettagliata, non solo un numero.
- *temperature=0.3*: Mantiene una certa variabilit√†, ma con una buona coerenza.

#*Estrazione della scelta e del ragionamento*:
```
full_response = tokenizer.decode(outputs[0], skip_special_tokens=True)
reasoning = full_response.split("<|start_header_id|>assistant<|end_header_id|>")[-1].strip()
choice_match = re.search(r"Scelta:\s*([123])", reasoning, re.IGNORECASE)
```
- Estrae il testo generato dal modello.
- Cerca la stringa "Scelta: X" per determinare l‚Äôazione scelta.
- Se non trova "Scelta: X", cerca un numero tra 1, 2 o 3 nel testo.
- Fallback: Se non riesce a estrarre una scelta valida, torna l‚Äôindice 0 e aggiunge un avviso.


#2. Motore di gioco trasparente (play_game_transparent)

- **Scopo**: Questa funzione esegue la simulazione, ma stampa a video ogni passo, mostrando il contesto, le azioni possibili, il ragionamento dell‚Äôagente e la scelta finale. Questo rende il processo completamente trasparente e comprensibile all‚Äôutente.

```
def play_game_transparent(max_steps=10):
    current = "step0"
    steps = 0
    history = []
    print("="*80)
    print("üïµÔ∏è  SIMULAZIONE: Threat Hunting con APT29")
    print("Obiettivo: Identificare APT29, il vettore (phishing) e l'obiettivo (spionaggio) nel minor tempo possibile.")
    print("="*80)
```

- **Stampa iniziale**: Spiega lo scopo della simulazione.

```
while steps < max_steps:
    state = states[current]
    history.append(state["desc"])
    print(f"\nüîπ STEP {steps}")
    print(f"üìå CONTESTO:\n{state['desc']}\n")
    if current == "step5_win":
        score = max(0, 10 - steps)
        print("üéâ RISULTATO: Partita vinta!")
        print(f"‚úÖ Punteggio: {score}/10 ({steps} mosse)")
        return {"status": "win", "steps": steps, "score": score}
    if not state["actions"]:
        print(f"üíÄ TERMINALE NON VINCENTE: {current}")
        return {"status": "loss", "steps": steps, "score": 0, "terminal": current}
    print("üîç AZIONI POSSIBILI:")
    for i, act in enumerate(state["actions"], 1):
        print(f"  {i}. {act}")
```
- **Stampa del contesto e delle azioni**: Mostra all‚Äôutente la situazione attuale e le opzioni disponibili.

```
action_idx, reasoning = agent_choose_action_with_reasoning(state["desc"], state["actions"])
chosen_action = state["actions"][action_idx]
next_state = state["next"][action_idx]
print("\nüß† RAGIONAMENTO DELL'AGENTE:")
print("-" * 50)
print(reasoning)
print("-" * 50)
print(f"\n‚úÖ AZIONE SCELTA: {chosen_action}")
print(f"‚û°Ô∏è  Prossimo stato: {next_state}")
current = next_state
steps += 1
```
- **Stampa del ragionamento e della scelta**: Mostra il processo decisionale dell‚Äôagente, l‚Äôazione scelta e il prossimo stato.



```
print("\n‚è∞ TIMEOUT: La partita non √® stata completata in tempo.")
return {"status": "loss", "steps": steps, "score": 0, "terminal": "timeout"}
```

- **Timeout**: Se il numero massimo di passi viene raggiunto, la partita termina con un timeout.

#3. Esecuzione della simulazione

```
if __name__ == "__main__":
    result = play_game_transparent()
```

Avvia la simulazione trasparente, mostrando tutti i passaggi e il ragionamento dell‚Äôagente.