# Modulo 7 – Semantic Search & RAG semplice

In questo notebook implementiamo una ricerca semantica "artigianale" e un mini-RAG:

- Creazione di embedding con SentenceTransformers
- Calcolo della similarità coseno
- Recupero dei top-k documenti come contesto


In [None]:
from sentence_transformers import SentenceTransformer
import numpy as np

model = SentenceTransformer('./hf/all-MiniLM-L6-v2')  # percorso locale

documenti = [
    'La regressione lineare è un modello semplice ma potente.',
    'Le reti neurali convoluzionali sono usate in computer vision.',
    'Random Forest è un ensemble di alberi decisionali.',
]

doc_emb = model.encode(documenti)

def cerca(query, top_k=2):
    q_emb = model.encode([query])[0]
    scores = []
    for e in doc_emb:
        sim = float(np.dot(q_emb, e) / ((np.linalg.norm(q_emb)+1e-9)*(np.linalg.norm(e)+1e-9)))
        scores.append(sim)
    idx = np.argsort(scores)[::-1][:top_k]
    return [(documenti[i], scores[i]) for i in idx]

risultati = cerca('Come funziona una Random Forest?')
for testo, score in risultati:
    print(f'{score:.3f} -> {testo}')
