## **Introduzione ai Database Vettoriali**


I database vettoriali sono progettati per archiviare e gestire dati rappresentati come vettori. Questi sono comunemente utilizzati per lavorare con dati non strutturati come testo, immagini, video e audio, trasformati in rappresentazioni numeriche chiamate vector embeddings.

Un database vettoriale permette di:

- Archiviare vettori (vector embeddings) in modo efficiente.
- Eseguire ricerche rapide basate su somiglianze tra i vettori.
- Eeguire query basate su linguaggio naturale.


### **Vector Embedding**

Un vector embedding è una rappresentazione numerica di un dato non strutturato in uno spazio multidimensionale.

- I vettori catturano caratteristiche salienti dei dati, come il significato semantico nel testo o dettagli visivi in un'immagine.
- Sono generati da modelli di machine learning come BERT per il testo o ResNet per immagini.

Esempio:
La frase "Il gatto dorme" può essere trasformata in un vettore numerico, come 
[0.3,0.8,0.2,...], che rappresenta il suo significato.

![image](./3dplot-500x381.jpg)

### **Ricerca semantica**

La ricerca semantica trova i vettori più simili a un dato vettore di input. Questo processo è basato sul calcolo della similarità o della distanza tra vettori. Le metriche più comuni includono:

- Cosine Similarity: Misura l'angolo tra due vettori, ignorando la lunghezza. Due vettori sono più simili quando l'angolo è piccolo.
 
- Euclidean Distance: Misura la distanza lineare tra due vettori. Minore è la distanza, maggiore è la somiglianza.

 
 
La ricerca restituisce gli elementi più vicini al vettore di input, ordinati in base alla loro similarità.

Esempio:
Se cerchi un documento simile a una frase, il sistema troverà documenti che hanno vettori vicini al vettore della frase.

![image](./cosine_sim-500x426.jpg)

### **Vector Indexing**


Il vector indexing organizza i vettori per ottimizzare la ricerca. 
Senza un indice, il confronto diretto di ogni vettore con milioni di altri richiederebbe troppo tempo.


La Nearest Neighbor Search (ricerca del vicino più prossimo) è il cuore della vector search. Si tratta di trovare i vettori che si trovano a distanza minima da un vettore di input.
La ricerca utilizza appunto l'indice per identificare i vicini più prossimi in base a una metrica di distanza.




![image](./vector-indexing.jpg)

## **Chunking**

Nell'ambito dei database vettoriali, il chunking è una tecnica essenziale che consente di suddividere grandi quantità di dati in blocchi più piccoli, facilitando l'elaborazione e il recupero delle informazioni.


### [ChromaDb](https://www.trychroma.com/)

![image](./hrm4.svg)

In [2]:
import chromadb
from sentence_transformers import SentenceTransformer

# Initialize a sentence transformer model for generating embeddings
model = SentenceTransformer('all-MiniLM-L6-v2')

# Set up ChromaDB
client = chromadb.Client()

# Create a collection in memory
collection = client.get_or_create_collection(name="test_collection")

# Sample data
documents = [
    "Artificial intelligence is transforming the world.",
    "Machine learning is a subset of artificial intelligence.",
    "Deep learning models are powerful for image and text data.",
    "ChromaDB is a vector database for efficient similarity search."
]

# Generate embeddings for the documents
embeddings = model.encode(documents).tolist()

# Add documents and embeddings to the collection
ids: list[str] = []
for i in range(len(embeddings)):
    ids.append(f"doc{i + 1}")
collection.add(
    documents=documents,
    embeddings=embeddings,
    ids=ids
)

# Query the database
query = "What is artificial intelligence?"
query_embedding = model.encode([query]).tolist()

# Perform similarity search
results = collection.query(
    query_embeddings=query_embedding,
    n_results=2  # Number of similar documents to retrieve
)

# Display results
print("Query:", query)
for doc, score in zip(results["documents"][0], results["distances"][0]):
    print(f"Document: {doc}, Score: {score}")

  from .autonotebook import tqdm as notebook_tqdm


Query: What is artificial intelligence?
Document: Machine learning is a subset of artificial intelligence., Score: 0.681416392326355
Document: Artificial intelligence is transforming the world., Score: 0.7204954624176025


## **Retrieval-Augmented Generation (RAG)**

Il Retrieval-Augmented Generation (RAG) è un approccio innovativo nell'ambito dei modelli di intelligenza artificiale, che combina recupero di informazioni e generazione di linguaggio naturale per produrre risposte più accurate e contestuali.

### **Come funziona RAG?**

1. Fase di Recupero (Retrieval): l'applicazione ricerca le informazioni richieste nel databae vettoriale, attraverso la ricerca semantica

2. Fase di Generazione (Generation): Le informazioni recuperate vengono inserite direttamente nel prompt, per generare un certo tipo di risposta.

![image](./how-rag-works.jpg)