# üèõÔ∏è POC Gestione Provvedimento

## üìù Obiettivo
Questo notebook ti guida step-by-step attraverso il POC per eseguire i vari task del processo di gestione di un provvedimento, come segue:
1. ricezione Istanza di parte
2. estrazione del testo e classificazione del procedimento amministrativo
3. verifica completezza documenti allegati in base al procedimento
4. creazione del fascicolo
5. recupero fonti normative
6. compilazione automatica delle sezioni del provvedimento

## üéØ Cosa imparerai
1. **Come funziona** il sistema
2. **Come testarlo** rapidamente
3. **Come usarlo** praticamente
4. **Come risolve i problemi** comuni

## ‚ö° Quick Start
Esegui le celle una alla volta. Ogni cella fa una cosa specifica e semplice.

## üóÇÔ∏è Step 0: Configurazione Dataset Procedimenti

Prima di iniziare il workflow, definiamo un dataset di riferimento con i principali procedimenti amministrativi gestiti dal sistema, insieme ai documenti necessari per ciascuno di essi.

In [1]:
# Dataset Mock: Procedimenti Amministrativi
# Definizione di 3 tipologie di procedimenti con relative specifiche

procedimenti_dataset = {
    "autorizzazione_scarico_acque": {
        "nome": "Autorizzazione allo Scarico delle Acque",
        "codice": "ENV_001",
        "descrizione": "Procedimento per il rilascio dell'autorizzazione allo scarico di acque reflue in corpi idrici superficiali o nel suolo, ai sensi del D.Lgs. 152/2006.",
        "area_competenza": "Ambiente e Territorio",
        "tempi_procedimento": "90 giorni",
        "documenti_richiesti": [
            "Istanza di autorizzazione firmata dal legale rappresentante",
            "Documento di identit√† del richiedente",
            "Visura camerale (se impresa) o codice fiscale (se privato)",
            "Relazione tecnica descrittiva dell'impianto di scarico",
            "Planimetria con ubicazione dei punti di scarico",
            "Caratteristiche qualitative e quantitative delle acque reflue",
            "Sistema di depurazione previsto",
            "Documentazione fotografica dell'area interessata",
            "Nulla osta degli enti competenti (se richiesto)"
        ],
        "normative_riferimento": [
            "D.Lgs. 152/2006 - Codice dell'Ambiente",
            "D.P.R. 227/2011 - Regolamento semplificazione scarichi",
            "Regolamento comunale per gli scarichi"
        ],
        "provvedimento": {
            "nome": "Autorizzazione",
            "sezioni": [
                "intestazione_dati_ente",
                "oggetto_richiesta",
                "riferimenti_normativi",
                "istruttoria_valutazioni",
                "prescrizioni_condizioni",
                "dispositivo",
                "durata_validita",
                "responsabile_procedimento",
                "modalita_ricorso",
                "firma_data",
                "destinatari",
                "controlli",
                "pubblicazione",
                "pareri",
                "efficacia",
                "allegati"
            ]
        }
    },
    
    "autorizzazione_manomissione_suolo": {
        "nome": "Autorizzazione alla Manomissione del Suolo Pubblico",
        "codice": "URB_002", 
        "descrizione": "Procedimento per il rilascio dell'autorizzazione alla manomissione del suolo pubblico per lavori di scavo, posa di sottoservizi o altre opere che interessano il sedime stradale.",
        "area_competenza": "Lavori Pubblici e Viabilit√†",
        "tempi_procedimento": "30 giorni",
        "documenti_richiesti": [
            "Istanza di autorizzazione con indicazione dei lavori da eseguire",
            "Documento di identit√† del richiedente",
            "Progetto tecnico dei lavori con sezioni e particolari costruttivi",
            "Planimetria dell'area interessata dalla manomissione",
            "Cronoprogramma dei lavori",
            "Polizza assicurativa per danni a terzi",
            "Cauzione per il ripristino del suolo pubblico", 
            "Nulla osta delle societ√† di servizi (gas, telefonia, ecc.)",
            "Permesso di costruire (se collegato a nuove costruzioni)"
        ],
        "normative_riferimento": [
            "Codice della Strada - D.Lgs. 285/1992",
            "D.P.R. 495/1992 - Regolamento di esecuzione",
            "Regolamento comunale per l'occupazione del suolo pubblico"
        ],
        "provvedimento": {
            "nome": "Autorizzazione",
            "sezioni": [
                "intestazione_dati_ente",
                "oggetto_richiesta",
                "riferimenti_normativi",
                "istruttoria_valutazioni",
                "prescrizioni_condizioni",
                "dispositivo",
                "durata_validita",
                "responsabile_procedimento",
                "modalita_ricorso",
                "firma_data",
                "destinatari",
                "controlli",
                "pubblicazione",
                "pareri",
                "efficacia",
                "allegati"
            ]
        }
    },
    
    "richiesta_contributo_sociale": {
        "nome": "Richiesta di Contributo per Assistenza Sociale",
        "codice": "SOC_003",
        "descrizione": "Procedimento per la richiesta di contributi economici per situazioni di disagio sociale, sostegno al reddito o per esigenze assistenziali specifiche.",
        "area_competenza": "Servizi Sociali",
        "tempi_procedimento": "60 giorni",
        "documenti_richiesti": [
            "Domanda di contributo compilata su modulo comunale",
            "Documento di identit√† del richiedente",
            "Codice fiscale di tutti i componenti del nucleo familiare",
            "Certificazione ISEE in corso di validit√†",
            "Autocertificazione della composizione del nucleo familiare",
            "Dichiarazione dei redditi o CUD dell'ultimo anno",
            "Certificato di disoccupazione (se disoccupato)",
            "Documentazione sanitaria (se richiesta per motivi di salute)",
            "Contratto di locazione o mutuo (per spese abitative)",
            "Fatture o preventivi delle spese per cui si richiede il contributo"
        ],
        "normative_riferimento": [
            "Legge 328/2000 - Legge quadro per la realizzazione del sistema integrato di interventi e servizi sociali",
            "D.Lgs. 109/1998 - Indicatore della Situazione Economica Equivalente",
            "Regolamento comunale per l'erogazione di contributi sociali"
        ],
        "provvedimento": {
            "nome": "Determina",
            "sezioni": [
                "intestazione_dati_ente",
                "oggetto_richiesta",
                "riferimenti_normativi",
                "istruttoria_valutazioni",
                "dispositivo",
                "responsabile_procedimento",
                "modalita_ricorso",
                "firma_data",
                "controlli",
                "pubblicazione",
                "efficacia",
                "allegati"
            ]
        }
    }
}

print("üìã DATASET PROCEDIMENTI AMMINISTRATIVI CONFIGURATO")
print("="*60)
for codice, proc in procedimenti_dataset.items():
    print(f"\nüèõÔ∏è {proc['nome']} ({proc['codice']})")
    print(f"   üìù {proc['descrizione'][:100]}...")
    print(f"   üè¢ Area: {proc['area_competenza']}")
    print(f"   ‚è±Ô∏è Tempi: {proc['tempi_procedimento']}")
    print(f"   üìÑ Documenti richiesti: {len(proc['documenti_richiesti'])} tipologie")
    print(f"   üìÑ Provvedimento: {proc['provvedimento']['nome']} con {len(proc['provvedimento']['sezioni'])} sezioni")

print(f"\n‚úÖ Dataset pronto per l'uso con {len(procedimenti_dataset)} procedimenti configurati")

üìã DATASET PROCEDIMENTI AMMINISTRATIVI CONFIGURATO

üèõÔ∏è Autorizzazione allo Scarico delle Acque (ENV_001)
   üìù Procedimento per il rilascio dell'autorizzazione allo scarico di acque reflue in corpi idrici superf...
   üè¢ Area: Ambiente e Territorio
   ‚è±Ô∏è Tempi: 90 giorni
   üìÑ Documenti richiesti: 9 tipologie
   üìÑ Provvedimento: Autorizzazione con 16 sezioni

üèõÔ∏è Autorizzazione alla Manomissione del Suolo Pubblico (URB_002)
   üìù Procedimento per il rilascio dell'autorizzazione alla manomissione del suolo pubblico per lavori di ...
   üè¢ Area: Lavori Pubblici e Viabilit√†
   ‚è±Ô∏è Tempi: 30 giorni
   üìÑ Documenti richiesti: 9 tipologie
   üìÑ Provvedimento: Autorizzazione con 16 sezioni

üèõÔ∏è Richiesta di Contributo per Assistenza Sociale (SOC_003)
   üìù Procedimento per la richiesta di contributi economici per situazioni di disagio sociale, sostegno al...
   üè¢ Area: Servizi Sociali
   ‚è±Ô∏è Tempi: 60 giorni
   üìÑ Documenti richiesti: 10 tipol

## üìÑ Step 1: Caricamento Documento di Input

In questo passaggio caricheremo e leggeremo il contenuto dell'istanza di parte (documento PDF) che rappresenta la richiesta del cittadino/ente. 

Il sistema:
- üîç **Localizza** il documento PDF nella cartella `tests`
- üìñ **Estrae** tutto il testo dal documento
- üíæ **Memorizza** il contenuto nella variabile `documento_pdf_content` per le elaborazioni successive

Questo √® il punto di partenza del nostro workflow di gestione del provvedimento.

In [2]:
# Lettura del documento PDF dalla cartella tests
import PyPDF2
import os
from pathlib import Path

# Percorso del file PDF
pdf_path = Path("../tests/Istanza per Autorizzazione Scarico Acque.pdf")

# Verifica che il file esista
if pdf_path.exists():
    print(f"File trovato: {pdf_path}")
    
    # Lettura del contenuto del PDF
    with open(pdf_path, 'rb') as file:
        pdf_reader = PyPDF2.PdfReader(file)
        
        print(f"Numero di pagine: {len(pdf_reader.pages)}")
        print("\n" + "="*50)
        print("CONTENUTO DEL DOCUMENTO:")
        print("="*50)
        
        # Estrai il testo da tutte le pagine
        full_text = ""
        for page_num, page in enumerate(pdf_reader.pages, 1):
            text = page.extract_text()
            full_text += text
            print(f"\n--- PAGINA {page_num} ---")
            print(text)
        
        print("\n" + "="*50)
        print(f"Lunghezza totale del testo: {len(full_text)} caratteri")
        
        # Salva il testo estratto in una variabile per uso futuro
        documento_pdf_content = full_text
        
else:
    print(f"File non trovato: {pdf_path}")
    documento_pdf_content = ""

File trovato: ..\tests\Istanza per Autorizzazione Scarico Acque.pdf
Numero di pagine: 3

CONTENUTO DEL DOCUMENTO:

--- PAGINA 1 ---
ISTANZA PER AUTORIZZAZIONE ALLO SCARICO DI ACQUE
REFLUE
Al Sindaco del Comune di Roma
Dipartimento Tutela Ambientale
Ufficio Autorizzazioni Ambientali
Via del Tritone, 173
00187 Roma (RM)
OGGETTO: Richiesta di autorizzazione allo scarico di acque reflue industriali ai sensi del D.Lgs. 152/2006 -
Parte III
DATI DEL RICHIEDENTE
Ragione Sociale: Industrie Alimentari Rossi S.r.l.
Codice Fiscale/P.IVA: 12345678901
Sede Legale: Via Giuseppe Verdi, 45 - 00185 Roma (RM)
Telefono: 06-12345678
Email: info@industrierossi.it
PEC: industrierossi@pec.it
Legale Rappresentante: Dott. Marco Bianchi
Codice Fiscale: BNCMRC75H15H501Z
Nato a: Roma, il 15 giugno 1975
Residente in: Via delle Rose, 23 - 00186 Roma (RM)
DATI DELL'IMPIANTO
Ubicazione: Via dell'Industria, 78 - 00143 Roma (RM)
Foglio: 125 - Particella: 456 - Sub: 12
Coordinate UTM: E 291.245 - N 4.620.789
Superficie 

## ü§ñ Step 2: Configurazione AI Locale per Classificazione

In questo step configuriamo il sistema di AI locale usando **Ollama con llama3.2:1b** per classificare automaticamente il documento in input e determinare a quale procedimento amministrativo appartiene.

### üéØ Obiettivi:
- **Classificazione automatica** del tipo di procedimento
- **Scoring di confidenza** per valutare l'accuratezza della classificazione  
- **Gestione di casi ambigui** con suggerimenti multipli
- **Performance ottimizzata** per elaborazione locale

### üõ†Ô∏è Tecnologie utilizzate:
- **Ollama** per l'inferenza locale del modello LLM
- **Sentence Transformers** per embedding semantici
- **Scikit-learn** per similarity matching
- **Prompt Engineering** ottimizzato per task di classificazione

In [3]:
# Installazione e import delle librerie necessarie
import subprocess
import sys
import json
import requests
from typing import Dict, List, Tuple, Optional
import numpy as np
from sklearn.feature_extraction.text import TfidfVectorizer
from sklearn.metrics.pairwise import cosine_similarity
import re

# Installa le librerie se non sono gi√† presenti
def install_package(package):
    try:
        subprocess.check_call([sys.executable, "-m", "pip", "install", package])
        print(f"‚úÖ {package} installato con successo")
    except subprocess.CalledProcessError:
        print(f"‚ùå Errore nell'installazione di {package}")

# Lista dei pacchetti necessari
required_packages = [
    "requests",
    "scikit-learn", 
    "sentence-transformers",
    "numpy"
]

print("üì¶ INSTALLAZIONE DIPENDENZE")
print("="*40)
print("‚ÑπÔ∏è Nota: Utilizzo di 'scikit-learn' (raccomandato) invece di 'sklearn' (deprecato)")

for package in required_packages:
    try:
        # Per scikit-learn, l'import usa 'sklearn'
        import_name = "sklearn" if package == "scikit-learn" else package.replace("-", "_")
        __import__(import_name)
        print(f"‚úÖ {package} gi√† installato")
    except ImportError:
        print(f"üì• Installazione di {package}...")
        install_package(package)

print("\nüéØ Setup completato - Pronto per la classificazione AI")
print("\nüí° Ricorda: Attiva il venv su Windows con:")
print("   source .venv/Scripts/activate.ps1")

üì¶ INSTALLAZIONE DIPENDENZE
‚ÑπÔ∏è Nota: Utilizzo di 'scikit-learn' (raccomandato) invece di 'sklearn' (deprecato)
‚úÖ requests gi√† installato
‚úÖ scikit-learn gi√† installato
‚úÖ sentence-transformers gi√† installato
‚úÖ numpy gi√† installato

üéØ Setup completato - Pronto per la classificazione AI

üí° Ricorda: Attiva il venv su Windows con:
   source .venv/Scripts/activate.ps1


## üîß Step 3: Configurazione Ollama e Modello

Configuriamo la connessione con Ollama e verifichiamo che il modello `llama3.2:1b` sia disponibile. Se non √® presente, il sistema fornir√† istruzioni per l'installazione.

In [5]:
# Configurazione connessione Ollama
class OllamaClient:
    def __init__(self, base_url="http://localhost:11434", max_prompt_chars: int = 15000):
        self.base_url = base_url
        self.model = "llama3.2:1b"
        self.max_prompt_chars = max_prompt_chars
    
    def _shorten_prompt(self, prompt: str) -> str:
        """Riduce dimensione del prompt preservando inizio e indicazione di truncamento."""
        if len(prompt) <= self.max_prompt_chars:
            return prompt
        keep = self.max_prompt_chars - 1000
        # preserva inizio e aggiunge nota di truncamento
        return prompt[:keep] + "\n\n[...PROMPT TRONCATO PER RIDURRE LA LUNGHEZZA...]"
    
    def check_connection(self):
        """Verifica la connessione con Ollama"""
        try:
            response = requests.get(f"{self.base_url}/api/tags")
            if response.status_code == 200:
                models = response.json()
                available_models = [model['name'] for model in models.get('models', [])]
                
                print(f"üîó Ollama connesso correttamente")
                print(f"üìã Modelli disponibili: {available_models}")
                
                if self.model in available_models:
                    print(f"‚úÖ Modello {self.model} trovato e pronto")
                    return True
                else:
                    print(f"‚ö†Ô∏è Modello {self.model} non trovato")
                    print(f"üí° Esegui: ollama pull {self.model}")
                    return False
            else:
                print(f"‚ùå Errore connessione Ollama: {response.status_code}")
                return False
        except requests.exceptions.ConnectionError:
            print("‚ùå Ollama non raggiungibile")
            print("üí° Assicurati che Ollama sia avviato: ollama serve")
            return False
    
    def generate(self, prompt: str, temperature=0.3, retries: int = 1) -> str:
        """Genera una risposta usando il modello locale con parsing error dettagliato e retry su 400 dopo troncamento."""
        # Protezione lunghezza prompt
        if len(prompt) > self.max_prompt_chars:
            prompt = self._shorten_prompt(prompt)
        
        payload = {
            "model": self.model,
            "prompt": prompt,
            "stream": False,
            "options": {
                "temperature": temperature,
                "top_p": 0.9,
                "top_k": 40
            }
        }
        
        headers = {"Content-Type": "application/json"}
        attempt = 0
        while True:
            try:
                resp = requests.post(f"{self.base_url}/api/generate", json=payload, headers=headers, timeout=300)
                # Success
                if resp.status_code == 200:
                    try:
                        return resp.json().get('response', '')
                    except Exception:
                        return resp.text or ''
                
                # Bad request -> try to extract detailed error and possibly retry after shortening
                try:
                    body = resp.json()
                except Exception:
                    body = resp.text

                err_msg = f"Errore nella generazione: {resp.status_code} - {body}"

                # If 400 and we still can retry, shorten prompt and retry once
                attempt += 1
                if resp.status_code == 400 and attempt <= retries:
                    # shorten more aggressively and retry
                    payload['prompt'] = self._shorten_prompt(payload['prompt'])
                    print(f"‚ö†Ô∏è Ollama 400 ricevuto, ritento con prompt troncato (attempt {attempt})...")
                    continue

                return err_msg

            except requests.exceptions.Timeout:
                attempt += 1
                if attempt <= retries:
                    print(f"‚ö†Ô∏è Timeout durante la chiamata a Ollama, ritento (attempt {attempt})...")
                    continue
                return "Errore: timeout nella richiesta a Ollama"
            except Exception as e:
                return f"Errore: {str(e)}"

# Inizializza il client Ollama
ollama_client = OllamaClient()

print("ü§ñ VERIFICA CONFIGURAZIONE OLLAMA")
print("="*40)
connection_ok = ollama_client.check_connection()

if connection_ok:
    print("\nüéâ Sistema AI locale pronto per la classificazione!")
else:
    print("\n‚ö†Ô∏è Configurazione necessaria prima di procedere")

ü§ñ VERIFICA CONFIGURAZIONE OLLAMA
üîó Ollama connesso correttamente
üìã Modelli disponibili: ['llama3.2:1b']
‚úÖ Modello llama3.2:1b trovato e pronto

üéâ Sistema AI locale pronto per la classificazione!


## üéØ Step 4: Sistema di Classificazione Intelligente

Implementiamo un sistema avanzato di classificazione che combina:
1. **Analisi semantica** con il modello LLM locale
2. **Similarity matching** basato su TF-IDF e cosine similarity  
3. **Scoring composito** che considera multiple metriche
4. **Validazione incrociata** per massimizzare l'accuratezza

In [6]:
class ProcedimentoClassifier:
    def __init__(self, procedimenti_dataset: Dict, ollama_client: OllamaClient):
        self.procedimenti = procedimenti_dataset
        self.ollama = ollama_client
        self.vectorizer = TfidfVectorizer(
            max_features=1000,
            stop_words=None,  # Manteniamo le stop words per l'italiano
            ngram_range=(1, 3),
            lowercase=True
        )
        self._prepare_embeddings()
    
    def _prepare_embeddings(self):
        """Prepara gli embedding TF-IDF per tutti i procedimenti"""
        # Crea testi di riferimento per ogni procedimento
        self.procedimento_texts = []
        self.procedimento_keys = []
        
        for key, proc in self.procedimenti.items():
            # Combina tutte le informazioni testuali del procedimento
            combined_text = f"""
            {proc['nome']} {proc['descrizione']} 
            {' '.join(proc['documenti_richiesti'])}
            {proc['area_competenza']}
            """
            self.procedimento_texts.append(combined_text.lower())
            self.procedimento_keys.append(key)
        
        # Fit del vectorizer sui testi dei procedimenti
        self.procedimento_vectors = self.vectorizer.fit_transform(self.procedimento_texts)
        print(f"üìä Embeddings creati per {len(self.procedimento_texts)} procedimenti")
    
    def _extract_keywords(self, text: str) -> List[str]:
        """Estrae keywords chiave dal testo usando pattern comuni"""
        keywords = []
        
        # Pattern per autorizzazioni
        if re.search(r'autorizzazione\w*\s*(scarico|acque|reflue)', text, re.IGNORECASE):
            keywords.append("autorizzazione_scarico")
        
        if re.search(r'(manomission|scavo|suolo|pubblico|strada)', text, re.IGNORECASE):
            keywords.append("manomissione_suolo")
            
        if re.search(r'(contributo|sociale|assistenza|ISEE|disagio)', text, re.IGNORECASE):
            keywords.append("contributo_sociale")
            
        # Pattern per settori
        if re.search(r'(ambiente|acqua|reflue|depurazione)', text, re.IGNORECASE):
            keywords.append("ambientale")
            
        if re.search(r'(lavori|pubblici|strada|viabilit√†)', text, re.IGNORECASE):
            keywords.append("lavori_pubblici")
            
        if re.search(r'(sociale|famiglia|reddito|disoccupazione)', text, re.IGNORECASE):
            keywords.append("sociale")
        
        return keywords
    
    def _similarity_score(self, document_text: str) -> Dict[str, float]:
        """Calcola similarity score usando TF-IDF"""
        doc_vector = self.vectorizer.transform([document_text.lower()])
        similarities = cosine_similarity(doc_vector, self.procedimento_vectors)[0]
        
        scores = {}
        for i, key in enumerate(self.procedimento_keys):
            scores[key] = float(similarities[i])
        
        return scores
    
    def _ai_classification(self, document_text: str) -> Dict[str, any]:
        """Classificazione usando LLM locale"""
        
        # Crea una descrizione concisa dei procedimenti per il prompt
        proc_descriptions = "\n".join([
            f"- {key}: {proc['nome']} - {proc['descrizione'][:100]}..."
            for key, proc in self.procedimenti.items()
        ])
        
        prompt = f"""
Analizza il seguente documento e classifica il tipo di procedimento amministrativo.

PROCEDIMENTI DISPONIBILI:
{proc_descriptions}

DOCUMENTO DA ANALIZZARE:
{document_text[:1500]}...

Rispondi SOLO con un JSON nel seguente formato:
{{
    "procedimento_principale": "codice_procedimento",
    "confidenza": 0.85,
    "motivazione": "breve spiegazione della scelta",
    "parole_chiave_trovate": ["parola1", "parola2"]
}}

Scegli il procedimento pi√π appropriato basandoti sul contenuto del documento.
"""
        
        try:
            response = self.ollama.generate(prompt, temperature=0.1)
            
            # Estrai JSON dalla risposta
            json_match = re.search(r'\{.*\}', response, re.DOTALL)
            if json_match:
                result = json.loads(json_match.group())
                return result
            else:
                return {
                    "procedimento_principale": "unknown",
                    "confidenza": 0.0,
                    "motivazione": "Formato risposta non valido",
                    "parole_chiave_trovate": []
                }
        except Exception as e:
            return {
                "procedimento_principale": "error",
                "confidenza": 0.0,
                "motivazione": f"Errore AI: {str(e)}",
                "parole_chiave_trovate": []
            }
    
    def classify(self, document_text: str) -> Dict[str, any]:
        """Classificazione completa del documento"""
        print("üîç AVVIO CLASSIFICAZIONE PROCEDIMENTO")
        print("="*50)
        
        # 1. Estrazione keywords
        keywords = self._extract_keywords(document_text)
        print(f"üîë Keywords estratte: {keywords}")
        
        # 2. Similarity scoring
        similarity_scores = self._similarity_score(document_text)
        print(f"üìä Similarity scores: {similarity_scores}")
        
        # 3. Classificazione AI
        print("ü§ñ Elaborazione con AI locale...")
        ai_result = self._ai_classification(document_text)
        print(f"üéØ Risultato AI: {ai_result}")
        
        # 4. Combinazione dei risultati
        final_scores = {}
        for proc_key in self.procedimenti.keys():
            score = 0.0
            
            # Weight similarity score (40%)
            score += similarity_scores.get(proc_key, 0) * 0.4
            
            # Weight AI confidence if matches (50%)
            if ai_result['procedimento_principale'] == proc_key:
                score += ai_result['confidenza'] * 0.5
            
            # Bonus for keyword matches (10%)
            keyword_bonus = sum(0.1 for kw in keywords if kw in proc_key) 
            score += min(keyword_bonus, 0.1)
            
            final_scores[proc_key] = score
        
        # Trova il procedimento con score pi√π alto
        best_procedure = max(final_scores, key=final_scores.get)
        confidence = final_scores[best_procedure]
        
        result = {
            "procedimento_classificato": best_procedure,
            "procedimento_nome": self.procedimenti[best_procedure]['nome'],
            "confidenza_finale": round(confidence, 3),
            "dettagli_scoring": {
                "similarity_scores": similarity_scores,
                "ai_classification": ai_result,
                "keywords_found": keywords,
                "final_scores": final_scores
            },
            "raccomandazione": "ALTA" if confidence > 0.7 else "MEDIA" if confidence > 0.4 else "BASSA"
        }
        
        return result

# Inizializza il classificatore
if connection_ok:
    classifier = ProcedimentoClassifier(procedimenti_dataset, ollama_client)
    print("‚úÖ Classificatore inizializzato e pronto")
else:
    print("‚ö†Ô∏è Classificatore non disponibile - Configurare Ollama prima")

üìä Embeddings creati per 3 procedimenti
‚úÖ Classificatore inizializzato e pronto


## üéØ Step 5: Esecuzione Classificazione del Documento

Ora eseguiamo la classificazione del documento PDF caricato nel Step 1, utilizzando il nostro sistema di AI ibrido per determinare automaticamente il tipo di procedimento amministrativo.

In [7]:
# Esecuzione della classificazione sul documento caricato
if 'documento_pdf_content' in locals() and documento_pdf_content and connection_ok:
    print("üöÄ CLASSIFICAZIONE DOCUMENTO IN CORSO...")
    print("="*60)
    
    # Esegui la classificazione
    risultato_classificazione = classifier.classify(documento_pdf_content)
    
    print("\nüìã RISULTATO CLASSIFICAZIONE")
    print("="*40)
    print(f"üéØ Procedimento identificato: {risultato_classificazione['procedimento_nome']}")
    print(f"üéöÔ∏è Confidenza: {risultato_classificazione['confidenza_finale']:.1%}")
    print(f"üèÜ Raccomandazione: {risultato_classificazione['raccomandazione']}")
    
    print(f"\nüìä DETTAGLI TECNICI")
    print("="*30)
    ai_details = risultato_classificazione['dettagli_scoring']['ai_classification']
    print(f"ü§ñ AI Principale: {ai_details.get('procedimento_principale', 'N/A')}")
    print(f"üí≠ Motivazione AI: {ai_details.get('motivazione', 'N/A')}")
    print(f"üîë Keywords AI: {ai_details.get('parole_chiave_trovate', [])}")
    
    similarity = risultato_classificazione['dettagli_scoring']['similarity_scores']
    print(f"\nüìà SIMILARITY SCORES:")
    for proc, score in similarity.items():
        proc_name = procedimenti_dataset[proc]['nome']
        print(f"  ‚Ä¢ {proc_name}: {score:.3f}")
    
    print(f"\nüéØ FINAL SCORES:")
    final = risultato_classificazione['dettagli_scoring']['final_scores']
    for proc, score in sorted(final.items(), key=lambda x: x[1], reverse=True):
        proc_name = procedimenti_dataset[proc]['nome']
        print(f"  ‚Ä¢ {proc_name}: {score:.3f}")
    
    # Salva il risultato per step successivi
    procedimento_identificato = risultato_classificazione['procedimento_classificato']
    procedimento_dati = procedimenti_dataset[procedimento_identificato]
    
    print(f"\n‚úÖ Classificazione completata - Procedimento: {procedimento_dati['codice']}")
    
elif not connection_ok:
    print("‚ö†Ô∏è Impossibile eseguire classificazione - Ollama non configurato")
elif 'documento_pdf_content' not in locals() or not documento_pdf_content:
    print("‚ö†Ô∏è Nessun documento caricato - Eseguire prima il Step 1")
else:
    print("‚ùå Errore sconosciuto nella classificazione")

üöÄ CLASSIFICAZIONE DOCUMENTO IN CORSO...
üîç AVVIO CLASSIFICAZIONE PROCEDIMENTO
üîë Keywords estratte: ['contributo_sociale', 'ambientale', 'sociale']
üìä Similarity scores: {'autorizzazione_scarico_acque': 0.6168559379692266, 'autorizzazione_manomissione_suolo': 0.1981837012453043, 'richiesta_contributo_sociale': 0.2663161272279759}
ü§ñ Elaborazione con AI locale...
üéØ Risultato AI: {'procedimento_principale': 'autorizzazione_scarico_acque', 'confidenza': 0.85, 'motivazione': "Autorizzazione allo scarico delle Acque - Procedimento per il rilascio dell'autorizzazione allo scarico di acque reflue in corpi idrici superfici", 'parole_chiave_trovate': ['autorizzazione_scarico_acque', 'scarico_di_acque']}

üìã RISULTATO CLASSIFICAZIONE
üéØ Procedimento identificato: Autorizzazione allo Scarico delle Acque
üéöÔ∏è Confidenza: 67.2%
üèÜ Raccomandazione: MEDIA

üìä DETTAGLI TECNICI
ü§ñ AI Principale: autorizzazione_scarico_acque
üí≠ Motivazione AI: Autorizzazione allo scarico del

## üìä Step 6: Analisi e Validazione del Risultato

Analizziamo in dettaglio il risultato della classificazione e forniamo suggerimenti per la validazione manuale se necessario. Questo step √® fondamentale per garantire l'accuratezza prima di procedere con i passi successivi del workflow.

In [8]:
# Analisi dettagliata del risultato di classificazione
if 'risultato_classificazione' in locals():
    print("üîç ANALISI DETTAGLIATA CLASSIFICAZIONE")
    print("="*50)
    
    confidenza = risultato_classificazione['confidenza_finale']
    raccomandazione = risultato_classificazione['raccomandazione']
    
    # Analisi della confidenza
    if confidenza >= 0.8:
        status_icon = "üü¢"
        status_text = "ECCELLENTE - Classificazione molto affidabile"
        action_needed = "Procedi automaticamente"
    elif confidenza >= 0.6:
        status_icon = "üü°" 
        status_text = "BUONA - Classificazione probabilmente corretta"
        action_needed = "Verifica consigliata"
    elif confidenza >= 0.4:
        status_icon = "üü†"
        status_text = "MEDIA - Classificazione incerta"  
        action_needed = "Verifica necessaria"
    else:
        status_icon = "üî¥"
        status_text = "BASSA - Classificazione dubbia"
        action_needed = "Verifica manuale obbligatoria"
    
    print(f"{status_icon} STATUS: {status_text}")
    print(f"‚ö° AZIONE: {action_needed}")
    
    print(f"\nüìã PROCEDIMENTO SELEZIONATO")
    print("-" * 30)
    print(f"Nome: {procedimento_dati['nome']}")
    print(f"Codice: {procedimento_dati['codice']}")
    print(f"Area: {procedimento_dati['area_competenza']}")
    print(f"Tempi: {procedimento_dati['tempi_procedimento']}")
    
    print(f"\nüìÑ DOCUMENTI RICHIESTI ({len(procedimento_dati['documenti_richiesti'])} tipologie):")
    for i, doc in enumerate(procedimento_dati['documenti_richiesti'], 1):
        print(f"  {i}. {doc}")
    
    print(f"\n‚öñÔ∏è NORMATIVE DI RIFERIMENTO:")
    for norma in procedimento_dati['normative_riferimento']:
        print(f"  ‚Ä¢ {norma}")
    
    # Suggerimenti per migliorare la classificazione
    print(f"\nüí° SUGGERIMENTI PER OTTIMIZZAZIONE")
    print("-" * 40)
    
    if confidenza < 0.7:
        print("üîç Elementi da verificare manualmente:")
        print("  ‚Ä¢ Presenza di termini tecnici specifici nel documento")
        print("  ‚Ä¢ Corrispondenza tra oggetto della richiesta e procedimento")
        print("  ‚Ä¢ Verifica dell'ente/ufficio di destinazione")
        
        # Mostra procedimenti alternativi con score alto
        final_scores = risultato_classificazione['dettagli_scoring']['final_scores']
        sorted_scores = sorted(final_scores.items(), key=lambda x: x[1], reverse=True)
        
        if len(sorted_scores) > 1:
            second_best = sorted_scores[1]
            if second_best[1] > 0.3:  # Se il secondo ha uno score decente
                second_proc = procedimenti_dataset[second_best[0]]
                print(f"\nü§î ALTERNATIVA POSSIBILE:")
                print(f"   {second_proc['nome']} (Score: {second_best[1]:.3f})")
                print(f"   Considera se il documento potrebbe riferirsi a questo procedimento")
    
    print(f"\n‚úÖ Analisi completata - Sistema pronto per il prossimo step")
    
else:
    print("‚ö†Ô∏è Nessun risultato di classificazione disponibile")
    print("üí° Eseguire prima il Step 5 per ottenere la classificazione")

üîç ANALISI DETTAGLIATA CLASSIFICAZIONE
üü° STATUS: BUONA - Classificazione probabilmente corretta
‚ö° AZIONE: Verifica consigliata

üìã PROCEDIMENTO SELEZIONATO
------------------------------
Nome: Autorizzazione allo Scarico delle Acque
Codice: ENV_001
Area: Ambiente e Territorio
Tempi: 90 giorni

üìÑ DOCUMENTI RICHIESTI (9 tipologie):
  1. Istanza di autorizzazione firmata dal legale rappresentante
  2. Documento di identit√† del richiedente
  3. Visura camerale (se impresa) o codice fiscale (se privato)
  4. Relazione tecnica descrittiva dell'impianto di scarico
  5. Planimetria con ubicazione dei punti di scarico
  6. Caratteristiche qualitative e quantitative delle acque reflue
  7. Sistema di depurazione previsto
  8. Documentazione fotografica dell'area interessata
  9. Nulla osta degli enti competenti (se richiesto)

‚öñÔ∏è NORMATIVE DI RIFERIMENTO:
  ‚Ä¢ D.Lgs. 152/2006 - Codice dell'Ambiente
  ‚Ä¢ D.P.R. 227/2011 - Regolamento semplificazione scarichi
  ‚Ä¢ Regolamento c

## üîß Step 3.1: Configurazione MCP Tools per Scalabilit√†

Implementiamo un sistema **MCP (Model Context Protocol)** per gestire efficientemente la crescita del numero di procedimenti. Questo approccio risolve i limiti del prompt quando i procedimenti diventano numerosi.

### üéØ Vantaggi dell'approccio MCP:
- **Ricerca intelligente** dei procedimenti pi√π rilevanti
- **Riduzione del token usage** nel prompt LLM
- **Scalabilit√†** per centinaia di procedimenti
- **Performance ottimizzate** con pre-filtering
- **Architettura modulare** per estensioni future

### üõ†Ô∏è Componenti implementati:
- **ProcedimentoMCPServer**: Server MCP per gestione procedimenti
- **Tool di ricerca semantica** per trovare i migliori match
- **Sistema di ranking** basato su multiple metriche
- **Cache intelligente** per performance ottimali

In [9]:
# Implementazione MCP Server per gestione scalabile dei procedimenti amministrativi
import json
import asyncio
from typing import Any, Dict, List, Optional, Tuple
from dataclasses import dataclass, asdict
from datetime import datetime
import hashlib

# Installa mcp se necessario
try:
    import mcp
    print("‚úÖ MCP gi√† disponibile")
except ImportError:
    print("üì• Installazione MCP...")
    subprocess.check_call([sys.executable, "-m", "pip", "install", "mcp"])
    import mcp

from mcp import ClientSession, StdioServerParameters
from mcp.client.stdio import stdio_client

@dataclass
class ProcedimentoResource:
    """Risorsa MCP per un singolo procedimento"""
    uri: str
    name: str
    description: str
    mimeType: str = "application/json"
    
    def to_dict(self) -> Dict[str, Any]:
        return asdict(self)

class ProcedimentoMCPServer:
    """Server MCP per gestione scalabile dei procedimenti amministrativi"""
    
    def __init__(self, procedimenti_dataset: Dict):
        self.procedimenti = procedimenti_dataset
        self.vectorizer = TfidfVectorizer(
            max_features=500,  # Ridotto per performance
            ngram_range=(1, 2),
            lowercase=True
        )
        self._initialize_embeddings()
        self._setup_cache()
    
    def _initialize_embeddings(self):
        """Inizializza embeddings per ricerca semantica veloce"""
        print("üîß Inizializzazione embeddings MCP...")
        
        # Crea testi condensati per embedding
        self.proc_texts = []
        self.proc_keys = []
        
        for key, proc in self.procedimenti.items():
            # Testo pi√π conciso per efficienza
            condensed_text = f"{proc['nome']} {proc['area_competenza']} {proc['descrizione'][:200]}"
            self.proc_texts.append(condensed_text.lower())
            self.proc_keys.append(key)
        
        # Fit vectorizer
        self.embeddings = self.vectorizer.fit_transform(self.proc_texts)
        print(f"‚úÖ Embeddings pronti per {len(self.proc_keys)} procedimenti")
    
    def _setup_cache(self):
        """Setup cache per query frequenti"""
        self.query_cache = {}
        self.cache_hits = 0
        self.cache_misses = 0
    
    def _get_cache_key(self, query: str, top_k: int) -> str:
        """Genera chiave cache per una query"""
        content = f"{query.lower().strip()}{top_k}"
        return hashlib.md5(content.encode()).hexdigest()
    
    def find_relevant_procedures(self, query_text: str, top_k: int = 3) -> List[Tuple[str, float, Dict]]:
        """Tool MCP: Trova i procedimenti pi√π rilevanti per una query"""
        
        # Check cache
        cache_key = self._get_cache_key(query_text, top_k)
        if cache_key in self.query_cache:
            self.cache_hits += 1
            return self.query_cache[cache_key]
        
        self.cache_misses += 1
        
        # Calcola similarity con tutti i procedimenti
        query_vector = self.vectorizer.transform([query_text.lower()])
        similarities = cosine_similarity(query_vector, self.embeddings)[0]
        
        # Ottieni top_k risultati
        top_indices = np.argsort(similarities)[-top_k:][::-1]
        
        results = []
        for idx in top_indices:
            proc_key = self.proc_keys[idx]
            score = float(similarities[idx])
            proc_data = self.procedimenti[proc_key]
            
            results.append((proc_key, score, proc_data))
        
        # Cache result
        self.query_cache[cache_key] = results
        
        return results
    
    def get_procedure_details(self, procedure_key: str) -> Optional[Dict]:
        """Tool MCP: Ottieni dettagli completi di un procedimento"""
        return self.procedimenti.get(procedure_key)
    
    def search_by_keywords(self, keywords: List[str], threshold: float = 0.1) -> List[Tuple[str, float, Dict]]:
        """Tool MCP: Ricerca per keywords specifiche"""
        results = []
        
        for key, proc in self.procedimenti.items():
            score = 0.0
            
            # Cerca keywords nei campi principali
            searchable_text = f"{proc['nome']} {proc['descrizione']} {proc['area_competenza']}".lower()
            
            for keyword in keywords:
                if keyword.lower() in searchable_text:
                    score += 0.3
                
                # Bonus per match esatti nei documenti richiesti
                for doc in proc['documenti_richiesti']:
                    if keyword.lower() in doc.lower():
                        score += 0.1
            
            if score >= threshold:
                results.append((key, score, proc))
        
        # Ordina per score decrescente
        results.sort(key=lambda x: x[1], reverse=True)
        return results
    
    def get_statistics(self) -> Dict[str, Any]:
        """Tool MCP: Statistiche del server"""
        return {
            "total_procedures": len(self.procedimenti),
            "cache_hits": self.cache_hits,
            "cache_misses": self.cache_misses,
            "cache_hit_rate": self.cache_hits / (self.cache_hits + self.cache_misses) if (self.cache_hits + self.cache_misses) > 0 else 0,
            "cached_queries": len(self.query_cache)
        }

# Inizializza MCP Server
mcp_server = ProcedimentoMCPServer(procedimenti_dataset)

print("üöÄ MCP SERVER INIZIALIZZATO")
print("="*40)
print(f"üìä Procedimenti caricati: {len(procedimenti_dataset)}")
print(f"üß† Embeddings dimensioni: {mcp_server.embeddings.shape}")
print(f"üíæ Cache inizializzata")
print("\nüõ†Ô∏è Tool MCP disponibili:")
print("  ‚Ä¢ find_relevant_procedures(query, top_k)")
print("  ‚Ä¢ get_procedure_details(procedure_key)")  
print("  ‚Ä¢ search_by_keywords(keywords, threshold)")
print("  ‚Ä¢ get_statistics()")

‚úÖ MCP gi√† disponibile
üîß Inizializzazione embeddings MCP...
‚úÖ Embeddings pronti per 3 procedimenti
üöÄ MCP SERVER INIZIALIZZATO
üìä Procedimenti caricati: 3
üß† Embeddings dimensioni: (3, 132)
üíæ Cache inizializzata

üõ†Ô∏è Tool MCP disponibili:
  ‚Ä¢ find_relevant_procedures(query, top_k)
  ‚Ä¢ get_procedure_details(procedure_key)
  ‚Ä¢ search_by_keywords(keywords, threshold)
  ‚Ä¢ get_statistics()


## üéØ Step 3.2: Classificatore Ottimizzato con MCP

Reimplementiamo il classificatore utilizzando i tool MCP per gestire efficacemente procedimenti in crescita. Il nuovo sistema riduce significativamente i token nel prompt LLM mantenendo alta accuratezza.

In [10]:
class OptimizedProcedimentoClassifier:
    """Classificatore ottimizzato che utilizza MCP per scalabilit√†"""
    
    def __init__(self, mcp_server: ProcedimentoMCPServer, ollama_client: OllamaClient):
        self.mcp_server = mcp_server
        self.ollama = ollama_client
        self.max_procedures_in_prompt = 3  # Limite per il prompt LLM
        
    def _extract_enhanced_keywords(self, text: str) -> List[str]:
        """Estrazione keywords migliorata per MCP search"""
        keywords = []
        
        # Keywords primarie (pi√π specifiche)
        keyword_patterns = {
            'scarico': r'(scarico|reflue|acque|depurazione|fognature)',
            'manomissione': r'(manomission|scavo|suolo|pubblico|strada|viabilit√†|sottoservizi)',
            'sociale': r'(contributo|sociale|assistenza|ISEE|disagio|famiglia|reddito)',
            'ambiente': r'(ambiente|ambientale|ecologia|sostenibilit√†)',
            'urbanistica': r'(urbanistic|edilizia|costruzione|permesso|autorizzazione)',
            'commercio': r'(commerc|attivit√†|licenza|SCIA|DIA)',
            'trasporti': r'(trasport|mobilit√†|parcheggio|ZTL)',
            'turismo': r'(turismo|ricettiv|B&B|affittacamere)'
        }
        
        for category, pattern in keyword_patterns.items():
            if re.search(pattern, text, re.IGNORECASE):
                keywords.append(category)
        
        # Keywords aggiuntive dal testo libero
        important_words = re.findall(r'\b(?:autorizzazione|permesso|licenza|contributo|richiesta|domanda|istanza)\b', 
                                   text, re.IGNORECASE)
        keywords.extend([word.lower() for word in important_words])
        
        return list(set(keywords))  # Rimuovi duplicati
    
    def _get_relevant_procedures_via_mcp(self, document_text: str) -> List[Tuple[str, float, Dict]]:
        """Utilizza MCP per ottenere procedimenti rilevanti"""
        
        # Estrai query condensata dal documento
        query_parts = []
        
        # Primi 300 caratteri del documento
        query_parts.append(document_text[:300])
        
        # Keywords estratte
        keywords = self._extract_enhanced_keywords(document_text)
        if keywords:
            query_parts.append(" ".join(keywords))
        
        query = " ".join(query_parts)
        
        # 1. Ricerca semantica via MCP
        semantic_results = self.mcp_server.find_relevant_procedures(
            query, top_k=self.max_procedures_in_prompt
        )
        
        # 2. Ricerca per keywords via MCP (se abbiamo keywords)
        keyword_results = []
        if keywords:
            keyword_results = self.mcp_server.search_by_keywords(
                keywords, threshold=0.1
            )[:2]  # Max 2 risultati da keyword search
        
        # 3. Combina e de-duplica risultati
        all_results = {}
        
        # Aggiungi risultati semantici (peso maggiore)
        for proc_key, score, proc_data in semantic_results:
            all_results[proc_key] = (score * 1.0, proc_data)
        
        # Aggiungi risultati keywords (boost se gi√† presenti)
        for proc_key, score, proc_data in keyword_results:
            if proc_key in all_results:
                # Boost score esistente
                existing_score = all_results[proc_key][0]
                all_results[proc_key] = (existing_score + score * 0.3, proc_data)
            else:
                all_results[proc_key] = (score * 0.7, proc_data)
        
        # Converti in lista ordinata
        final_results = [
            (key, score, data) 
            for key, (score, data) in all_results.items()
        ]
        final_results.sort(key=lambda x: x[1], reverse=True)
        
        return final_results[:self.max_procedures_in_prompt]
    
    def _ai_classification_optimized(self, document_text: str, relevant_procedures: List[Tuple[str, float, Dict]]) -> Dict[str, any]:
        """Classificazione AI ottimizzata con procedimenti filtrati"""
        
        if not relevant_procedures:
            return {
                "procedimento_principale": "unknown",
                "confidenza": 0.0,
                "motivazione": "Nessun procedimento rilevante trovato",
                "parole_chiave_trovate": []
            }
        
        # Crea descrizioni concise solo per i procedimenti rilevanti
        proc_descriptions = []
        for proc_key, mcp_score, proc_data in relevant_procedures:
            desc = f"- {proc_key}: {proc_data['nome']} (Score MCP: {mcp_score:.2f})\n  Area: {proc_data['area_competenza']}\n  Descrizione: {proc_data['descrizione'][:150]}..."
            proc_descriptions.append(desc)
        
        prompt = f"""
Analizza il documento e scegli il procedimento amministrativo pi√π appropriato tra quelli PRE-SELEZIONATI dal sistema MCP.

PROCEDIMENTI PRE-SELEZIONATI (ordinati per rilevanza):
{chr(10).join(proc_descriptions)}

DOCUMENTO DA ANALIZZARE:
{document_text[:1000]}...

Il sistema MCP ha gi√† filtrato i procedimenti pi√π rilevanti. Analizza il documento e scegli quello pi√π appropriato.

Rispondi SOLO con un JSON:
{{
    "procedimento_principale": "codice_procedimento",
    "confidenza": 0.85,
    "motivazione": "spiegazione della scelta tra i pre-selezionati",
    "parole_chiave_trovate": ["parola1", "parola2"]
}}
"""
        
        try:
            response = self.ollama.generate(prompt, temperature=0.1)
            
            # Estrai JSON dalla risposta
            json_match = re.search(r'\{.*\}', response, re.DOTALL)
            if json_match:
                result = json.loads(json_match.group())
                
                # Valida che il procedimento scelto sia tra quelli pre-selezionati
                valid_keys = [proc_key for proc_key, _, _ in relevant_procedures]
                if result.get('procedimento_principale') not in valid_keys:
                    # Fallback al primo della lista MCP
                    result['procedimento_principale'] = relevant_procedures[0][0]
                    result['motivazione'] += " (corretto a miglior match MCP)"
                
                return result
            else:
                # Fallback al primo risultato MCP
                return {
                    "procedimento_principale": relevant_procedures[0][0],
                    "confidenza": relevant_procedures[0][1],
                    "motivazione": "Fallback a miglior match MCP per errore parsing",
                    "parole_chiave_trovate": []
                }
        except Exception as e:
            # Fallback al primo risultato MCP
            return {
                "procedimento_principale": relevant_procedures[0][0],
                "confidenza": relevant_procedures[0][1] * 0.8,
                "motivazione": f"Fallback a miglior match MCP per errore: {str(e)}",
                "parole_chiave_trovate": []
            }
    
    def classify(self, document_text: str) -> Dict[str, any]:
        """Classificazione ottimizzata con MCP"""
        print("üîç CLASSIFICAZIONE OTTIMIZZATA CON MCP")
        print("="*50)
        
        # 1. Ottieni procedimenti rilevanti via MCP
        print("üîß Ricerca procedimenti rilevanti via MCP...")
        relevant_procedures = self._get_relevant_procedures_via_mcp(document_text)
        
        print(f"üìã Procedimenti pre-selezionati: {len(relevant_procedures)}")
        for i, (key, score, proc) in enumerate(relevant_procedures, 1):
            print(f"  {i}. {proc['nome']} (Score: {score:.3f})")
        
        # 2. Classificazione AI ottimizzata
        print("ü§ñ Classificazione AI sui procedimenti pre-selezionati...")
        ai_result = self._ai_classification_optimized(document_text, relevant_procedures)
        
        # 3. Risultato finale
        best_procedure = ai_result['procedimento_principale']
        
        # Trova i dati del procedimento selezionato
        proc_data = None
        mcp_score = 0.0
        for key, score, data in relevant_procedures:
            if key == best_procedure:
                proc_data = data
                mcp_score = score
                break
        
        if not proc_data:
            # Fallback se non trovato
            proc_data = self.mcp_server.get_procedure_details(best_procedure)
            mcp_score = 0.0
        
        # Calcola confidenza finale combinando AI e MCP
        ai_confidence = ai_result.get('confidenza', 0.0)
        final_confidence = (ai_confidence * 0.7) + (mcp_score * 0.3)
        
        result = {
            "procedimento_classificato": best_procedure,
            "procedimento_nome": proc_data['nome'] if proc_data else "Unknown",
            "confidenza_finale": round(final_confidence, 3),
            "dettagli_scoring": {
                "mcp_preselection": {
                    "total_procedures_analyzed": len(procedimenti_dataset),
                    "procedures_sent_to_llm": len(relevant_procedures),
                    "token_reduction": f"{((len(procedimenti_dataset) - len(relevant_procedures)) / len(procedimenti_dataset) * 100):.1f}%"
                },
                "relevant_procedures": [
                    {"key": key, "name": proc['nome'], "mcp_score": score}
                    for key, score, proc in relevant_procedures
                ],
                "ai_classification": ai_result,
                "mcp_statistics": self.mcp_server.get_statistics()
            },
            "raccomandazione": "ALTA" if final_confidence > 0.7 else "MEDIA" if final_confidence > 0.4 else "BASSA"
        }
        
        return result

# Inizializza il nuovo classificatore ottimizzato
if connection_ok:
    optimized_classifier = OptimizedProcedimentoClassifier(mcp_server, ollama_client)
    print("‚úÖ Classificatore ottimizzato MCP inizializzato")
    print(f"üéØ Limite procedimenti per prompt: {optimized_classifier.max_procedures_in_prompt}")
    print(f"üìä Riduzione token stimata: ~{((len(procedimenti_dataset) - 3) / len(procedimenti_dataset) * 100):.0f}%")
else:
    print("‚ö†Ô∏è Classificatore ottimizzato non disponibile - Configurare Ollama prima")

‚úÖ Classificatore ottimizzato MCP inizializzato
üéØ Limite procedimenti per prompt: 3
üìä Riduzione token stimata: ~0%


In [11]:
# Test del classificatore ottimizzato con MCP
if 'documento_pdf_content' in locals() and documento_pdf_content and connection_ok:
    print("üöÄ TEST CLASSIFICAZIONE OTTIMIZZATA MCP")
    print("="*60)
    
    # Statistiche iniziali MCP
    initial_stats = mcp_server.get_statistics()
    print(f"üìä Statistiche MCP iniziali:")
    print(f"   ‚Ä¢ Procedimenti totali: {initial_stats['total_procedures']}")
    print(f"   ‚Ä¢ Cache queries: {initial_stats['cached_queries']}")
    
    # Esegui classificazione ottimizzata
    print(f"\nüîß Avvio classificazione ottimizzata...")
    risultato_ottimizzato = optimized_classifier.classify(documento_pdf_content)
    
    print(f"\nüìã RISULTATO CLASSIFICAZIONE OTTIMIZZATA")
    print("="*45)
    print(f"üéØ Procedimento: {risultato_ottimizzato['procedimento_nome']}")
    print(f"üéöÔ∏è Confidenza: {risultato_ottimizzato['confidenza_finale']:.1%}")
    print(f"üèÜ Raccomandazione: {risultato_ottimizzato['raccomandazione']}")
    
    # Dettagli ottimizzazione MCP
    mcp_details = risultato_ottimizzato['dettagli_scoring']['mcp_preselection']
    print(f"\n‚ö° OTTIMIZZAZIONE MCP")
    print("="*25)
    print(f"üìä Procedimenti totali analizzati: {mcp_details['total_procedures_analyzed']}")
    print(f"üéØ Procedimenti inviati al LLM: {mcp_details['procedures_sent_to_llm']}")
    print(f"üî• Riduzione token: {mcp_details['token_reduction']}")
    
    # Procedimenti pre-selezionati
    relevant_procs = risultato_ottimizzato['dettagli_scoring']['relevant_procedures']
    print(f"\nüéØ PROCEDIMENTI PRE-SELEZIONATI DA MCP:")
    for i, proc in enumerate(relevant_procs, 1):
        print(f"  {i}. {proc['name']} (Score MCP: {proc['mcp_score']:.3f})")
    
    # Risultato AI finale
    ai_result = risultato_ottimizzato['dettagli_scoring']['ai_classification']
    print(f"\nü§ñ DECISIONE AI FINALE:")
    print(f"   ‚Ä¢ Procedimento scelto: {ai_result.get('procedimento_principale', 'N/A')}")
    print(f"   ‚Ä¢ Confidenza AI: {ai_result.get('confidenza', 0):.1%}")
    print(f"   ‚Ä¢ Motivazione: {ai_result.get('motivazione', 'N/A')}")
    
    # Statistiche finali MCP
    final_stats = risultato_ottimizzato['dettagli_scoring']['mcp_statistics']
    print(f"\nüìà STATISTICHE MCP FINALI:")
    print(f"   ‚Ä¢ Cache hits: {final_stats['cache_hits']}")
    print(f"   ‚Ä¢ Cache misses: {final_stats['cache_misses']}")
    print(f"   ‚Ä¢ Hit rate: {final_stats['cache_hit_rate']:.1%}")
    
    # Confronto con approccio tradizionale
    print(f"\nüìä CONFRONTO PRESTAZIONI")
    print("="*30)
    traditional_tokens = len(procedimenti_dataset) * 100  # Stima token per procedimento
    optimized_tokens = len(relevant_procs) * 100
    
    print(f"üî¥ Approccio tradizionale: ~{traditional_tokens} token nel prompt")
    print(f"üü¢ Approccio MCP: ~{optimized_tokens} token nel prompt")
    print(f"üíö Risparmio: {traditional_tokens - optimized_tokens} token ({((traditional_tokens - optimized_tokens) / traditional_tokens * 100):.1f}%)")
    
    # Salva risultato per step successivi
    procedimento_identificato_opt = risultato_ottimizzato['procedimento_classificato']
    procedimento_dati_opt = procedimenti_dataset[procedimento_identificato_opt]
    
    print(f"\n‚úÖ Classificazione ottimizzata completata - Procedimento: {procedimento_dati_opt['codice']}")
    
elif not connection_ok:
    print("‚ö†Ô∏è Impossibile testare - Ollama non configurato")
elif 'documento_pdf_content' not in locals() or not documento_pdf_content:
    print("‚ö†Ô∏è Nessun documento caricato - Eseguire prima il Step 1")
else:
    print("‚ùå Errore nel test di classificazione ottimizzata")

üöÄ TEST CLASSIFICAZIONE OTTIMIZZATA MCP
üìä Statistiche MCP iniziali:
   ‚Ä¢ Procedimenti totali: 3
   ‚Ä¢ Cache queries: 0

üîß Avvio classificazione ottimizzata...
üîç CLASSIFICAZIONE OTTIMIZZATA CON MCP
üîß Ricerca procedimenti rilevanti via MCP...
üìã Procedimenti pre-selezionati: 3
  1. Autorizzazione allo Scarico delle Acque (Score: 1.086)
  2. Richiesta di Contributo per Assistenza Sociale (Score: 0.428)
  3. Autorizzazione alla Manomissione del Suolo Pubblico (Score: 0.133)
ü§ñ Classificazione AI sui procedimenti pre-selezionati...

üìã RISULTATO CLASSIFICAZIONE OTTIMIZZATA
üéØ Procedimento: Autorizzazione allo Scarico delle Acque
üéöÔ∏è Confidenza: 92.1%
üèÜ Raccomandazione: ALTA

‚ö° OTTIMIZZAZIONE MCP
üìä Procedimenti totali analizzati: 3
üéØ Procedimenti inviati al LLM: 3
üî• Riduzione token: 0.0%

üéØ PROCEDIMENTI PRE-SELEZIONATI DA MCP:
  1. Autorizzazione allo Scarico delle Acque (Score MCP: 1.086)
  2. Richiesta di Contributo per Assistenza Sociale (Scor

## üìä Step 5.2: Benchmark e Confronto Prestazioni

Confrontiamo le prestazioni tra l'approccio tradizionale e quello ottimizzato con MCP per dimostrare i vantaggi in termini di scalabilit√†, velocit√† e riduzione dei costi computazionali.

In [12]:
# Benchmark tra approccio tradizionale vs MCP ottimizzato
import time
from typing import Callable

def benchmark_classification_approaches():
    """Confronta prestazioni tra metodi di classificazione"""
    
    # Diagnostica dettagliata dei prerequisiti
    print("üîç VERIFICA PREREQUISITI BENCHMARK")
    print("="*40)
    
    # Check 1: Connessione Ollama
    if 'connection_ok' not in locals() and 'connection_ok' not in globals():
        print("‚ùå Variabile 'connection_ok' non definita")
        return None
    
    conn_status = connection_ok if 'connection_ok' in locals() else globals().get('connection_ok', False)
    print(f"üîó Connessione Ollama: {'‚úÖ OK' if conn_status else '‚ùå NON OK'}")
    
    # Check 2: Documento PDF
    doc_available = 'documento_pdf_content' in locals() or 'documento_pdf_content' in globals()
    doc_content = None
    if doc_available:
        doc_content = documento_pdf_content if 'documento_pdf_content' in locals() else globals().get('documento_pdf_content', '')
        doc_valid = doc_content and len(doc_content.strip()) > 0
        print(f"üìÑ Documento PDF: {'‚úÖ Caricato' if doc_valid else '‚ùå Vuoto/Non valido'}")
        print(f"   Lunghezza contenuto: {len(doc_content) if doc_content else 0} caratteri")
    else:
        print("üìÑ Documento PDF: ‚ùå Non caricato")
        doc_valid = False
    
    # Check 3: Dataset procedimenti
    dataset_available = 'procedimenti_dataset' in locals() or 'procedimenti_dataset' in globals()
    if dataset_available:
        dataset = procedimenti_dataset if 'procedimenti_dataset' in locals() else globals().get('procedimenti_dataset', {})
        print(f"üóÇÔ∏è Dataset procedimenti: ‚úÖ Disponibile ({len(dataset)} procedimenti)")
    else:
        print("üóÇÔ∏è Dataset procedimenti: ‚ùå Non disponibile")
        return None
    
    # Check 4: MCP Server
    mcp_available = 'mcp_server' in locals() or 'mcp_server' in globals()
    if mcp_available:
        print("üîß MCP Server: ‚úÖ Disponibile")
    else:
        print("üîß MCP Server: ‚ùå Non disponibile")
        return None
    
    # Verifica finale
    prerequisites_ok = conn_status and doc_valid and dataset_available and mcp_available
    
    if not prerequisites_ok:
        print(f"\n‚ö†Ô∏è PREREQUISITI NON SODDISFATTI")
        print("üí° Assicurati di aver eseguito in ordine:")
        print("   1. Step 1: Caricamento documento PDF")
        print("   2. Step 3: Configurazione Ollama")
        print("   3. Step 3.1: Configurazione MCP Server")
        print("   4. Step 3.2: Classificatore ottimizzato")
        return None
    
    print(f"\n‚úÖ TUTTI I PREREQUISITI SODDISFATTI - Avvio benchmark...")
    print("="*60)
    
    # Simula crescita del dataset
    test_sizes = [3, 10, 25, 50, 100]  # Numero di procedimenti simulati
    results = []
    
    for size in test_sizes:
        print(f"\nüìä Test con {size} procedimenti")
        print("-" * 30)
        
        # Simula dataset pi√π grande duplicando procedimenti esistenti
        extended_dataset = {}
        base_keys = list(dataset.keys())
        
        for i in range(size):
            base_key = base_keys[i % len(base_keys)]
            base_proc = dataset[base_key].copy()
            
            new_key = f"{base_key}_v{i//len(base_keys) + 1}" if i >= len(base_keys) else base_key
            
            # Modifica leggermente per variety
            if i >= len(base_keys):
                base_proc['nome'] += f" - Variante {i//len(base_keys) + 1}"
                base_proc['codice'] = base_proc['codice'].replace("_", f"_{i//len(base_keys) + 1}_")
            
            extended_dataset[new_key] = base_proc
        
        # Test 1: Approccio tradizionale (simulato)
        start_time = time.time()
        
        # Simula il tempo per processare tutti i procedimenti nel prompt
        traditional_prompt_size = len(extended_dataset) * 150  # ~150 char per procedimento
        traditional_processing_time = len(extended_dataset) * 0.001  # Simula overhead
        
        time.sleep(traditional_processing_time)  # Simula processing
        traditional_time = time.time() - start_time
        
        # Test 2: Approccio MCP
        start_time = time.time()
        
        try:
            # Crea MCP server temporaneo con dataset esteso
            temp_mcp = ProcedimentoMCPServer(extended_dataset)
            temp_classifier = OptimizedProcedimentoClassifier(temp_mcp, ollama_client)
            
            # Esegui classificazione MCP (solo ricerca, no LLM per benchmark)
            relevant_procs = temp_classifier._get_relevant_procedures_via_mcp(doc_content)
            mcp_prompt_size = len(relevant_procs) * 150
            
            mcp_time = time.time() - start_time
            
            # Calcola metriche
            token_reduction = ((traditional_prompt_size - mcp_prompt_size) / traditional_prompt_size) * 100
            speed_improvement = ((traditional_time - mcp_time) / traditional_time) * 100 if traditional_time > 0 else 0
            
            result = {
                'dataset_size': size,
                'traditional_time': traditional_time,
                'mcp_time': mcp_time,
                'traditional_prompt_tokens': traditional_prompt_size,
                'mcp_prompt_tokens': mcp_prompt_size,
                'token_reduction_pct': token_reduction,
                'speed_improvement_pct': speed_improvement,
                'procedures_selected': len(relevant_procs)
            }
            
            results.append(result)
            
            print(f"‚è±Ô∏è  Tempo tradizionale: {traditional_time:.3f}s")
            print(f"‚ö° Tempo MCP: {mcp_time:.3f}s")
            print(f"üî• Riduzione token: {token_reduction:.1f}%")
            print(f"üöÄ Miglioramento velocit√†: {speed_improvement:.1f}%")
            print(f"üéØ Procedimenti selezionati: {len(relevant_procs)}/{size}")
            
        except Exception as e:
            print(f"‚ùå Errore durante il test MCP per {size} procedimenti: {str(e)}")
            continue
    
    if not results:
        print("‚ùå Nessun risultato di benchmark disponibile")
        return None
    
    # Riepilogo finale
    print(f"\nüìà RIEPILOGO BENCHMARK")
    print("="*40)
    print(f"{'Size':<6} {'Trad(s)':<8} {'MCP(s)':<8} {'Token‚Üì':<8} {'Speed‚Üë':<8} {'Selected':<8}")
    print("-" * 50)
    
    for r in results:
        print(f"{r['dataset_size']:<6} {r['traditional_time']:<8.3f} {r['mcp_time']:<8.3f} "
              f"{r['token_reduction_pct']:<8.1f}% {r['speed_improvement_pct']:<8.1f}% {r['procedures_selected']:<8}")
    
    # Proiezioni per grandi dataset
    print(f"\nüîÆ PROIEZIONI PER GRANDI DATASET")
    print("="*35)
    large_sizes = [500, 1000, 5000]
    
    for size in large_sizes:
        # Stima lineare basata sui risultati
        est_traditional_tokens = size * 150
        est_mcp_tokens = 3 * 150  # MCP mantiene ~3 procedimenti
        est_reduction = ((est_traditional_tokens - est_mcp_tokens) / est_traditional_tokens) * 100
        
        print(f"üìä {size} procedimenti:")
        print(f"   ‚Ä¢ Token tradizionali: ~{est_traditional_tokens:,}")
        print(f"   ‚Ä¢ Token MCP: ~{est_mcp_tokens}")
        print(f"   ‚Ä¢ Riduzione: {est_reduction:.1f}%")
    
    print(f"\nüí° CONCLUSIONI:")
    print("‚Ä¢ MCP mantiene prestazioni costanti al crescere dei procedimenti")
    print("‚Ä¢ Riduzione drastica dei token nel prompt LLM")
    print("‚Ä¢ Velocit√† di ricerca ottimizzata con caching")
    print("‚Ä¢ Scalabilit√† lineare vs crescita esponenziale tradizionale")
    
    return results

# Esegui benchmark con diagnostica migliorata
print("üöÄ AVVIO BENCHMARK CON DIAGNOSTICA")
benchmark_results = benchmark_classification_approaches()

if benchmark_results:
    print(f"\n‚úÖ Benchmark completato con {len(benchmark_results)} risultati")
else:
    print(f"\n‚ùå Benchmark fallito - Controlla i prerequisiti sopra")

üöÄ AVVIO BENCHMARK CON DIAGNOSTICA
üîç VERIFICA PREREQUISITI BENCHMARK
üîó Connessione Ollama: ‚úÖ OK
üìÑ Documento PDF: ‚úÖ Caricato
   Lunghezza contenuto: 3412 caratteri
üóÇÔ∏è Dataset procedimenti: ‚úÖ Disponibile (3 procedimenti)
üîß MCP Server: ‚úÖ Disponibile

‚úÖ TUTTI I PREREQUISITI SODDISFATTI - Avvio benchmark...

üìä Test con 3 procedimenti
------------------------------
üîß Inizializzazione embeddings MCP...
‚úÖ Embeddings pronti per 3 procedimenti
‚è±Ô∏è  Tempo tradizionale: 0.004s
‚ö° Tempo MCP: 0.006s
üî• Riduzione token: 0.0%
üöÄ Miglioramento velocit√†: -65.7%
üéØ Procedimenti selezionati: 3/3

üìä Test con 10 procedimenti
------------------------------
üîß Inizializzazione embeddings MCP...
‚úÖ Embeddings pronti per 10 procedimenti
‚è±Ô∏è  Tempo tradizionale: 0.011s
‚ö° Tempo MCP: 0.006s
üî• Riduzione token: 70.0%
üöÄ Miglioramento velocit√†: 40.2%
üéØ Procedimenti selezionati: 3/10

üìä Test con 25 procedimenti
------------------------------
üîß I

## üèóÔ∏è Step 7: Composizione assistita del Provvedimento

In questo step generiamo automaticamente le singole sezioni del provvedimento (intestazione, oggetto, riferimenti normativi, dispositivo, prescrizioni, firma, allegati, ecc.) basandoci sul procedimento identificato. Se Ollama √® disponibile useremo il modello LLM per testi formali; altrimenti verr√† usato un template di fallback.

In [13]:
# Funzioni per generare le sezioni del provvedimento
from pathlib import Path
import json

def _load_example_sections(example_path: Path):
    """Legge headings e blocchi testuali da un file markdown di esempio se presente."""
    if not example_path.exists():
        return []
    txt = example_path.read_text(encoding='utf-8')
    lines = txt.splitlines()
    headers = []
    for line in lines:
        if line.strip().startswith('#'):
            h = line.lstrip('#').strip()
            if h:
                headers.append(h)
    # Se il primo header √® il titolo principale (es. nome documento) rimuovilo
    if len(headers) > 1 and headers[0].lower().startswith('autorizzazione'):
        headers = headers[1:]
    return headers

def _generate_section_prompt(proc_key, proc_data, section_name, example_content=None):
    """Crea un prompt (UNICA stringa) per generare una singola sezione del provvedimento."""
    descr = proc_data.get('descrizione', '').replace('\n', ' ').strip()[:800]
    normative = '\n'.join(proc_data.get('normative_riferimento', []))
    example_block = f"ESEMPIO (dal file):\n{example_content}" if example_content else ''

    parts = [
        f"Genera la sezione '{section_name}' del provvedimento amministrativo.",
        "",
        "Informazioni procedimento:",
        f"Nome: {proc_data.get('nome','')}",
        f"Codice: {proc_data.get('codice','')}",
        f"Area: {proc_data.get('area_competenza','')}",
        "",
        "Descrizione breve:",
        f"{descr}",
        "",
        "Normative principali:",
        f"{normative}",
    ]

    if example_block:
        parts.extend(["", example_block])

    parts.extend([
        "",
        "Istruzioni:",
        "- Testo formale e amministrativo, conciso (max ~250-350 parole).",
        "- Se applicabile inserire i riferimenti normativi principali.",
        "- Se la sezione non √® applicabile scrivere 'Non applicabile'.",
        "- Rispondi SOLO con il testo della sezione, niente JSON.",
    ])

    prompt = "\n".join(parts)
    return prompt

def generate_provvedimento_sections(procedure_key: str = None, save_to_tests: bool = True):
    """Genera tutte le sezioni del provvedimento per il procedimento specificato.
       Usa il file di esempio (se presente) per determinare intestazioni/ordine e fornire contenuti di riferimento."""

    # Determina il procedimento da usare (preferenza: ottimizzato poi tradizionale poi argomento)
    key = procedure_key
    if not key:
        key = globals().get('procedimento_identificato_opt') or globals().get('procedimento_identificato')

    if not key:
        print("‚ö†Ô∏è Procedimento non trovato. Esegui prima la classificazione o passa procedure_key.")
        return None

    proc = procedimenti_dataset.get(key)
    if not proc:
        print(f"‚ö†Ô∏è Chiave procedimento '{key}' non presente nel dataset")
        return None

    # Prova a caricare il file di esempio per ottenere sezioni e blocchi di riferimento
    example_path = Path('../tests/autorizzazione_scarico_acque.md')
    example_sections = _load_example_sections(example_path)
    if example_sections:
        print(f"‚ÑπÔ∏è Esempio sezioni caricato da: {example_path}")
        sections = example_sections
    else:
        sections = proc.get('provvedimento', {}).get('sezioni', [
            'intestazione_dati_ente', 'oggetto_richiesta', 'riferimenti_normativi',
            'istruttoria_valutazioni', 'prescrizioni_condizioni', 'dispositivo',
            'durata_validita', 'responsabile_procedimento', 'modalita_ricorso',
            'firma_data', 'destinatari', 'controlli', 'pubblicazione', 'pareri',
            'efficacia', 'allegati'
        ])

    generated = {}
    prompts_log = {}

    # Se esiste il file di esempio, estrai anche i contenuti sotto ogni header per usarli come esempio
    example_content_map = {}
    if example_path.exists():
        txt = example_path.read_text(encoding='utf-8')
        lines = txt.splitlines()
        current = None
        buf = []
        for line in lines:
            if line.strip().startswith('#'):
                if current:
                    example_content_map[current] = '\n'.join(buf).strip()
                current = line.lstrip('#').strip()
                buf = []
            else:
                if current is not None:
                    buf.append(line)
        if current:
            example_content_map[current] = '\n'.join(buf).strip()

    for sec in sections:
        # formattazione leggibile se proviene da key dataset (snake_case)
        sec_display = sec
        if '_' in sec and sec.islower():
            sec_display = sec.replace('_',' ').capitalize()

        print(f"\n‚è≥ Generazione sezione: {sec_display}...")

        # prova a trovare il blocco di esempio corrispondente (cerca per titolo esatto o titolo normalizzato)
        example_block = example_content_map.get(sec_display) or example_content_map.get(sec) or None

        prompt = _generate_section_prompt(key, proc, sec_display, example_content=example_block)

        # Mostra il prompt che verr√† inviato ad Ollama (per rendere l'attesa pi√π confortevole)
        print("\n--- PROMPT INVIATO A OLLAMA ---")
        print(prompt)
        print("--- FINE PROMPT ---\n")

        content = None
        try:
            if globals().get('connection_ok') and globals().get('ollama_client'):
                resp = ollama_client.generate(prompt, temperature=0.0)
                # Garantisce che content sia sempre str (evita None)
                content = resp.strip() if isinstance(resp, str) else str(resp)
                # Mostra la risposta ricevuta per ogni sezione
                print("--- RISPOSTA DI OLLAMA ---")
                print(content)
                print("--- FINE RISPOSTA ---\n")
            else:
                # fallback semplicistico
                norm = ', '.join(proc.get('normative_riferimento', []))
                content = f"{sec_display}: Testo generico per '{proc.get('nome')}'. Riferimenti: {norm if norm else 'N/A'}."
                print("--- RISPOSTA FALLOUT ---")
                print(content)
                print("--- FINE RISPOSTA ---\n")
        except Exception as e:
            content = f"Errore generazione sezione ({sec_display}): {str(e)} - uso fallback generico."
            print(content)

        # Assicura stringa non-None prima di salvare
        if content is None:
            content = ""

        generated[sec] = content
        prompts_log[sec] = {'prompt': prompt, 'response': generated[sec]}

    # Riepilogo
    print("\n‚úÖ Generazione completata. Sezioni generate:")
    for s in sections:
        snippet = (generated[s][:200] + '...') if len(generated[s]) > 200 else generated[s]
        print(f"  ‚Ä¢ {s}: {snippet}")

    # Salva il provvedimento generato in tests (JSON) se richiesto
    if save_to_tests:
        out_dir = Path('../tests')
        out_dir.mkdir(parents=True, exist_ok=True)
        out_file = out_dir / f"provvedimento_{key}.json"
        with open(out_file, 'w', encoding='utf-8') as f:
            json.dump({
                'procedimento_key': key,
                'procedimento_nome': proc.get('nome'),
                'sezioni': generated,
                'prompts': prompts_log
            }, f, ensure_ascii=False, indent=2)
        print(f"\nüíæ Provvedimento salvato in: {out_file}")

    return {'procedimento_key': key, 'procedimento_nome': proc.get('nome'), 'sezioni': generated, 'prompts': prompts_log}

# Esempio di esecuzione: genera usando il procedimento gi√† identificato
result_provvedimento = generate_provvedimento_sections()
if result_provvedimento:
    print(f"\nüìå Provvedimento generato per: {result_provvedimento['procedimento_nome']} ({result_provvedimento['procedimento_key']})")

‚ÑπÔ∏è Esempio sezioni caricato da: ..\tests\autorizzazione_scarico_acque.md

‚è≥ Generazione sezione: **[SEZIONE 1: INTESTAZIONE E DATI DELL'ENTE]**...

--- PROMPT INVIATO A OLLAMA ---
Genera la sezione '**[SEZIONE 1: INTESTAZIONE E DATI DELL'ENTE]**' del provvedimento amministrativo.

Informazioni procedimento:
Nome: Autorizzazione allo Scarico delle Acque
Codice: ENV_001
Area: Ambiente e Territorio

Descrizione breve:
Procedimento per il rilascio dell'autorizzazione allo scarico di acque reflue in corpi idrici superficiali o nel suolo, ai sensi del D.Lgs. 152/2006.

Normative principali:
D.Lgs. 152/2006 - Codice dell'Ambiente
D.P.R. 227/2011 - Regolamento semplificazione scarichi
Regolamento comunale per gli scarichi

ESEMPIO (dal file):
**REGIONE LOMBARDIA**  
**PROVINCIA DI BRESCIA**  
**COMUNE DI BRESCIA**  
*Settore Ambiente e Territorio*  
*Servizio Tutela delle Acque*  

Via Musei, 32 - 25121 Brescia  
Tel. 030.2977111 - PEC: protocollo@pec.comune.brescia.it  
Codice Fiscale: 