## 코드 아래에 벤치마크 보고서 있습니다.

In [11]:
from sentence_transformers import SentenceTransformer
import numpy as np
import openai

# API 키 입력 받기
api_key = input("OpenAI API 키를 입력해주세요: ")
openai.api_key = api_key

faq_variations = [
    {"questions": ["제품을 반품하고 싶어요. 어떻게 시작하죠?"], "answer": "저희 반품 정책은..."},
    {"questions": ["지난주에 물건을 샀는데, 기대했던 것과 좀 달라서 혹시 반품할 수 있을까 해서요, 온라인에서 보니 정책이 30일이라고 하던데 6개월 전에 웹사이트가 업데이트되어서 오래된 것 같아요. 그래서 정확히 현재 정책이 어떻게 되는지 궁금해요."], "answer": "저희 반품 정책은..."},
    {"questions": ["Reddit에서 이렇게 고객 서비스에 연락하는 게 답변을 가장 빨리 받는 방법이라고 하던데 맞나 모르겠네요! 재킷 반품 기간이 어떻게 되나요?"], "answer": "저희 반품 정책은..."},
    {"questions": ["반품정책이모에여"], "answer": "저희 반품 정책은..."},
    {"questions": ["반품"], "answer": "저희 반품 정책은..."}
]

def get_completion(prompt: str):
    response = openai.ChatCompletion.create(
        model="gpt-4o",
        messages=[
            {"role": "user", "content": prompt}
        ]
    )
    return response['choices'][0]['message']['content']

def evaluate_cosine_similarity(outputs):
    model = SentenceTransformer('all-MiniLM-L6-v2')
    embeddings = np.array([model.encode(output) for output in outputs])

    # 코사인 유사도 계산
    cosine_similarities = np.dot(embeddings, embeddings.T) / (np.linalg.norm(embeddings, axis=1)[:, None] * np.linalg.norm(embeddings, axis=1))
    return cosine_similarities

# GPT-4o 답변들 저장
all_answers = []

for faq in faq_variations:
    print(f"질문: {faq['questions'][0]}")
    output = get_completion(faq['questions'][0])
    all_answers.append(output)
    print(f"답변: {output}\n")

# 답변들 간의 코사인 유사도 계산
if len(all_answers) > 1:
    cosine_similarities = evaluate_cosine_similarity(all_answers)
    print("GPT-4 답변들 간의 코사인 유사도 행렬:")
    print(cosine_similarities)
else:
    print("답변이 하나뿐이어서 코사인 유사도를 계산할 수 없습니다.")




질문: 제품을 반품하고 싶어요. 어떻게 시작하죠?
답변: 제품을 반품하려면 보통 다음의 단계를 따르시면 됩니다. 다만, 구체적인 절차는 구매하신 곳의 정책에 따라 다를 수 있으니, 해당 매장 또는 온라인 쇼핑몰의 반품 정책을 먼저 확인하는 것이 중요합니다.

1. **반품 정책 확인**: 먼저, 구매하신 곳의 반품 및 환불 정책을 확인하세요. 반품 가능한 기간, 필요한 조건, 반품비 부담 여부 등을 파악하세요.

2. **영수증 또는 주문 번호 준비**: 반품을 위해서는 구매 증빙이 필요할 수 있으니 영수증이나 주문 번호를 준비해 주세요.

3. **제품 상태 확인**: 제품이 반품 가능한 상태인지 확인하세요. 일반적으로 사용하지 않은 상태여야 하며, 원래 포장과 태그가 손상되지 않아야 합니다.

4. **반품 요청 접수**: 해당 판매처의 고객 서비스나 웹사이트를 통해 반품 요청을 접수하세요. 경우에 따라 온라인에서 반품 라벨을 인쇄해야 할 수도 있습니다.

5. **제품 포장 및 발송**: 원래 포장으로 제품을 잘 포장하고, 발송 주소로 발송합니다. 반품 라벨이 필요한 경우 이를 상자에 부착해 주세요.

6. **배송 추적**: 반품한 제품이 잘 도착했는지 추적하세요. 이 과정에서 배송 추적 번호가 유용할 수 있습니다.

7. **환불 확인**: 반품이 완료된 후 환불이 정상적으로 처리됐는지 확인하세요. 환불은 보통 원래 결제 수단으로 이루어지며, 1~2주 정도 소요될 수 있습니다.

혹시 더 구체적인 질문이 있거나 도움이 필요하시면 구매처의 고객 서비스에 문의하시는 것이 좋습니다.

질문: 지난주에 물건을 샀는데, 기대했던 것과 좀 달라서 혹시 반품할 수 있을까 해서요, 온라인에서 보니 정책이 30일이라고 하던데 6개월 전에 웹사이트가 업데이트되어서 오래된 것 같아요. 그래서 정확히 현재 정책이 어떻게 되는지 궁금해요.
답변: 물건을 반품하려고 하시는군요. 일반적으로 반품 정책은 30일인 경우가 많지만, 웹사이트가 업데이트되었다면 실제 정책이 변경되었을 


```
GPT-4 답변들 간의 코사인 유사도 행렬:
[[1.         0.9395283  0.9237866  0.897209   0.6183682 ]
 [0.9395283  1.         0.9588645  0.92267543 0.629481  ]
 [0.9237866  0.9588645  1.         0.9077653  0.6463569 ]
 [0.897209   0.92267543 0.9077653  0.99999994 0.5827918 ]
 [0.6183682  0.629481   0.6463569  0.5827918  1.        ]]
```

분석 방법:
유사도 임계값 설정: 일반적으로 코사인 유사도에서 값이 0.8 이상이면 두 텍스트가 매우 유사하고, 0.6~0.8은 어느 정도 유사, 0.6 미만은 유사도가 낮다고 판단했습니다.

- 0.9 이상: 매우 유사한 답변
- 0.7 ~ 0.9: 적당히 유사한 답변
- 0.6 ~ 0.7: 약간 유사한 답변
- 0.6 미만: 유사하지 않은 답변

각 쌍의 유사도 분석:

1번째 답변과 나머지:

1번째와 2번째: 0.9395 (매우 유사)
1번째와 3번째: 0.9238 (매우 유사)
1번째와 4번째: 0.8972 (매우 유사)
1번째와 5번째: 0.6184 (약간 유사)

2번째 답변과 나머지:

2번째와 3번째: 0.9588 (매우 유사)
2번째와 4번째: 0.9227 (매우 유사)
2번째와 5번째: 0.6295 (약간 유사)

3번째 답변과 나머지:

3번째와 4번째: 0.9078 (매우 유사)
3번째와 5번째: 0.6464 (약간 유사)

4번째와 5번째:

4번째와 5번째: 0.5828 (유사하지 않음)

결과 해석:

1~4번째 답변: 대부분 0.9 이상의 유사도를 가지므로 매우 유사한 답변들입니다. 답변을 일관되게 제공했다고 볼 수 있습니다.
5번째 답변: 다른 답변들과의 유사도가 0.6 미만이거나 낮은 편(최대 0.6464)이므로, 다른 답변들과는 비교적 유사하지 않습니다. 따라서 이 답변은 주제가 조금 다를 가능성이 있거나, 다른 방식으로 답변이 제공된 것으로 분석할 수 있습니다. 또는 너무 난해한 질문이 주어졌을 가능성이 있습니다.

결론:
일관성 판단: 1~4번째 답변은 높은 유사도를 보이므로, GPT-4o가 이 질문들에 대해 일관된 답변을 제공했다고 볼 수 있습니다.
다른 답변: 5번째 답변은 다른 답변들과 유사도가 낮으므로, 질문이 조금 다르거나 답변이 명확히 구분되는 것으로 볼 수 있습니다.
다른 질문에 대한 답변은 잘 하는 것으로 보아, 모델의 성능보다는 구체적인 질문이 요구될 것으로 보입니다.
