In [4]:
from dotenv import load_dotenv
load_dotenv()

True

In [8]:
from openai import OpenAI
client = OpenAI()

In [6]:
import numpy as np

def cosine_similarity(vec1, vec2):
    """
    Calculate the cosine similarity between two vectors.

    Parameters:
        vec1 (numpy array): First vector
        vec2 (numpy array): Second vector

    Returns:
        float: Cosine similarity between vec1 and vec2
    """
    dot_product = np.dot(vec1, vec2)
    norm_vec1 = np.linalg.norm(vec1)
    norm_vec2 = np.linalg.norm(vec2)

    if norm_vec1 == 0 or norm_vec2 == 0:
        return 0.0

    return dot_product / (norm_vec1 * norm_vec2)


In [9]:
# 'king' 텍스트에 대한 임베딩 생성
king_embedding_response = client.embeddings.create(
    input="king",
    model="text-embedding-3-large"
)

# 생성된 embedding 값을 numpy array로 변환
king_vector = np.array(king_embedding_response.data[0].embedding)

In [10]:
# 'queen' 텍스트에 대한 임베딩 생성
queen_embedding_response = client.embeddings.create(
    input="queen",
    model="text-embedding-3-large"
)

# 생성된 embedding 값을 numpy array로 변환
queen_vector = np.array(queen_embedding_response.data[0].embedding)

#### ✅Embedding API 응답 구조 (단순화)
```
{
  "data": [
    {
      "embedding": [0.12, -0.03, 0.55, ...]   // 실제 임베딩 벡터
    }
  ]
}
```
여기서 data는 리스트(list)이고,
그 안에 첫 번째 요소(data[0])가 embedding을 가지고 있음.

그래서 Python에서는 이렇게 꺼냄:
```
response.data[0].embedding
```
#### ✅왜 data가 리스트일까?
OpenAI Embedding API는 여러 개의 텍스트를 한 번에 입력받을 수 있기 때문임.

예:
```
client.embeddings.create(
    input=["king", "queen", "man", "woman"],
    model="text-embedding-3-large"
)
```

그러면 응답은 이렇게 온다:
```
data: [
  { embedding: [...] },  // king
  { embedding: [...] },  // queen
  { embedding: [...] },  // man
  { embedding: [...] }   // woman
]
```

그래서 단일 텍스트일 때도 구조를 맞추려고 항상 리스트 형태로 반환

In [None]:
# king_vector, queen_vector의 유사도를 보자
king_queen_similarity = cosine_similarity(king_vector, queen_vector)
print(king_queen_similarity)

TypeError: unsupported operand type(s) for *: 'CreateEmbeddingResponse' and 'CreateEmbeddingResponse'