# Creazione di Vettori Embedded con OpenAI

## **1. Cos'è un vettore embedded?**

Un **embedding** è una rappresentazione numerica di un oggetto (testo, immagine, codice, ecc.) in uno spazio vettoriale ad alta dimensione.

🔹 **Esempio**:
- Parole simili come **"gatto"** e **"felino"** avranno vettori numerici vicini nello spazio.
- Parole opposte come **"notte"** e **"giorno"** saranno più distanti.

## **2. Perché usare embedding con OpenAI?**

Gli embedding OpenAI trasformano il testo in rappresentazioni numeriche avanzate, utili per:

- **Ricerca semantica** (trova documenti con significati simili).
- **Chatbot intelligenti** (miglioramento delle risposte con retrieval di informazioni).
- **Raccomandazioni personalizzate** (contenuti simili per utenti).
- **Clustering e classificazione del testo**.

## **3. Installare OpenAI SDK**

In [1]:
%pip install openai faiss-cpu

Collecting faiss-cpu
  Downloading faiss_cpu-1.10.0-cp312-cp312-win_amd64.whl.metadata (4.5 kB)
Downloading faiss_cpu-1.10.0-cp312-cp312-win_amd64.whl (13.7 MB)
   ---------------------------------------- 0.0/13.7 MB ? eta -:--:--
   -- ------------------------------------- 0.8/13.7 MB 8.3 MB/s eta 0:00:02
   -------- ------------------------------- 2.9/13.7 MB 9.9 MB/s eta 0:00:02
   ----------------- ---------------------- 6.0/13.7 MB 11.9 MB/s eta 0:00:01
   -------------------------- ------------- 8.9/13.7 MB 12.6 MB/s eta 0:00:01
   ---------------------------- ----------- 9.7/13.7 MB 11.8 MB/s eta 0:00:01
   ---------------------------- ----------- 9.7/13.7 MB 11.8 MB/s eta 0:00:01
   ----------------------------- ---------- 10.0/13.7 MB 7.7 MB/s eta 0:00:01
   ----------------------------- ---------- 10.0/13.7 MB 7.7 MB/s eta 0:00:01
   ----------------------------- ---------- 10.2/13.7 MB 6.4 MB/s eta 0:00:01
   ------------------------------ --------- 10.5/13.7 MB 5.7 MB/s eta

In [2]:

import os
from openai import OpenAI
from dotenv import load_dotenv

load_dotenv()

client = OpenAI(api_key=os.getenv('OPENAI_API_KEY')) # Imposta la chiave come variabile d'ambiente per sicurezza

## **4. Generare un embedding per un testo**

In [4]:

import openai

# Testo da convertire in embedding
testo = "L'intelligenza artificiale sta rivoluzionando il mondo."

response = client.embeddings.create(
    model="text-embedding-3-large",
    input=testo
)

print(response)


CreateEmbeddingResponse(data=[Embedding(embedding=[0.008176720701158047, -0.015036315657198429, -0.0060429759323596954, 0.0072178528644144535, 0.0016161141684278846, 0.011516953818500042, 0.007244195323437452, 0.012886764481663704, -0.03470891714096069, 0.018492454662919044, 0.021916983649134636, -0.00481014559045434, 0.01836601085960865, 9.623255027690902e-05, -0.044213298708200455, 0.01774432696402073, 0.032327551394701004, -0.005663643591105938, -0.04509840905666351, -0.03871297836303711, -0.018924472853541374, 0.020715763792395592, -0.048343807458877563, -0.009478041902184486, -0.012138636782765388, 0.004865465220063925, 0.007065066136419773, 0.002543371170759201, -0.022654574364423752, 0.02613178826868534, -0.053485870361328125, -0.027564821764826775, 0.020462876185774803, -0.020715763792395592, 0.006232642102986574, 0.05972377955913544, -0.018545139580965042, 0.002258871914818883, 0.01122191734611988, 0.013213411904871464, 0.04337034001946449, 0.00033636114676482975, 0.0440025590

## **5. Memorizzare embedding in un database vettoriale**

Gli embedding possono essere **indicizzati e cercati rapidamente** in database specializzati come FAISS, Pinecone o Weaviate.

### **Esempio con FAISS**

In [8]:
import faiss
import numpy as np

# Estrai il vettore embedding dalla risposta
vector = response.data[0].embedding

# Creare un indice FAISS
dimension = len(vector)
index = faiss.IndexFlatL2(dimension)

# Aggiungere il vettore all'indice
index.add(np.array([vector]).astype("float32"))

print("Vettore aggiunto al database vettoriale!")


Vettore aggiunto al database vettoriale!


## **📌 Riassunto**

- **Gli embedding OpenAI trasformano il testo in rappresentazioni numeriche avanzate.**
- **Sono utili per ricerca semantica, chatbot, raccomandazioni e clustering.**
- **Possono essere memorizzati in database vettoriali per ricerche rapide.**
- **Facili da generare con Python usando OpenAI e librerie come FAISS o Pinecone.**