In [3]:
from sentence_transformers import SentenceTransformer
import numpy as np

# 문장 임베딩
model = SentenceTransformer('all-MiniLM-L6-v2')
sentences = [
    "나는 매일 아침 창문을 열어 환기를 한다.",
    "아침마다 거실에 햇빛이 들어오도록 커튼을 걷는다.",
    "저녁엔 유튜브를 보면서 쉬는 편이다."
]
embeddings = model.encode(sentences)

# 첫 번째 문장을 Query로, 나머지를 Key로 설정
query = embeddings[0].reshape(1, -1)
keys = np.vstack(embeddings)

# dot product 기반 유사도 계산
scores = query @ keys.T
print("Dot product 유사도:", scores)


Dot product 유사도: [[1.0000001  0.6683733  0.54748034]]


In [4]:
from sentence_transformers import SentenceTransformer
import numpy as np

# 문장 리스트
sentences = [
    "나는 매일 아침 창문을 열어 환기를 한다.",
    "눈 뜨자마자 창문부터 열어 바람을 쐰다.",
    "저녁엔 유튜브를 보면서 쉬는 편이다."
]

# 모델 로딩 및 임베딩 계산
model = SentenceTransformer('all-MiniLM-L6-v2')
embeddings = model.encode(sentences)

# 각 문장의 벡터 출력
print("=== 문장별 임베딩 벡터 (앞 5개 값만 출력) ===\n")
for i, vec in enumerate(embeddings):
    print(f"[문장 {i+1}] {sentences[i]}")
    print("벡터 앞 5개:", vec[:5], "\n")

# 각 문장을 Query로 사용하여 dot product 유사도 계산
print("\n=== Query 변경하면서 dot product 유사도 계산 ===\n")
for i, query in enumerate(embeddings):
    query = query.reshape(1, -1)
    scores = query @ embeddings.T
    print(f"[Query 문장 {i+1}] \"{sentences[i]}\"")
    for j, score in enumerate(scores.flatten()):
        print(f"  → Key 문장 {j+1} ({sentences[j]}): dot product = {score:.4f}")
    print()


=== 문장별 임베딩 벡터 (앞 5개 값만 출력) ===

[문장 1] 나는 매일 아침 창문을 열어 환기를 한다.
벡터 앞 5개: [-0.02521603  0.07694715  0.05943875 -0.03766325 -0.01934122] 

[문장 2] 눈 뜨자마자 창문부터 열어 바람을 쐰다.
벡터 앞 5개: [ 0.00293377  0.05486312  0.00895771 -0.04840666  0.01342242] 

[문장 3] 저녁엔 유튜브를 보면서 쉬는 편이다.
벡터 앞 5개: [-0.01764801  0.07804921 -0.00203974 -0.09296696 -0.07419367] 


=== Query 변경하면서 dot product 유사도 계산 ===

[Query 문장 1] "나는 매일 아침 창문을 열어 환기를 한다."
  → Key 문장 1 (나는 매일 아침 창문을 열어 환기를 한다.): dot product = 1.0000
  → Key 문장 2 (눈 뜨자마자 창문부터 열어 바람을 쐰다.): dot product = 0.7031
  → Key 문장 3 (저녁엔 유튜브를 보면서 쉬는 편이다.): dot product = 0.5475

[Query 문장 2] "눈 뜨자마자 창문부터 열어 바람을 쐰다."
  → Key 문장 1 (나는 매일 아침 창문을 열어 환기를 한다.): dot product = 0.7031
  → Key 문장 2 (눈 뜨자마자 창문부터 열어 바람을 쐰다.): dot product = 1.0000
  → Key 문장 3 (저녁엔 유튜브를 보면서 쉬는 편이다.): dot product = 0.7706

[Query 문장 3] "저녁엔 유튜브를 보면서 쉬는 편이다."
  → Key 문장 1 (나는 매일 아침 창문을 열어 환기를 한다.): dot product = 0.5475
  → Key 문장 2 (눈 뜨자마자 창문부터 열어 바람을 쐰다.): dot product = 0.7706
  → Key 문장 3 (저녁엔 유튜브를 보