In [1]:
import pandas as pd

In [2]:
dt = pd.read_csv('data/filtered_booksummaries.csv')

In [8]:
from openai import OpenAI
import os

# OpenAI API 키 로드
openai_client = OpenAI(api_key=os.getenv("OPENAI_API_KEY"))

# LLM을 이용하여 가장 유사한 책 제목 찾기
def correct_book_title(user_input):
    book_titles = dt['Book title'].tolist()  # 데이터셋의 모든 책 제목 리스트

    # 프롬프트 생성
    prompt = (
        f"사용자가 '{user_input}'이라는 책 제목을 입력했으나, 이 제목은 데이터에 존재하지 않습니다.\n"
        f"사용자가 원래 입력하려고 했던 가장 유사한 책 제목을 하나 찾아 반환해 주세요. "
        f"단, 철자가 약간 틀린 경우에만 수정하고, 전혀 다른 제목으로 변경하지 마세요. "
        f"정확한 일치가 없으면 'NO_MATCH'를 반환하세요."
    )

    try:
        response = openai_client.chat.completions.create(
            model="gpt-4o-mini",  # 사용할 모델
            messages=[{"role": "user", "content": prompt}]
        )
        corrected_title = response.choices[0].message.content.strip()
        
        return corrected_title if corrected_title != "NO_MATCH" else None
    except Exception as e:
        print(f"Error in title correction: {e}")
        return None


In [9]:
user_input = "animar farm"  # 철자가 틀린 입력값
corrected_title = correct_book_title(user_input)

if corrected_title:
    print(f"Did you mean '{corrected_title}'?")
else:
    print(f"No similar book found for '{user_input}'.")


Did you mean '사용자가 입력한 책 제목 'animar farm'은 'Animal Farm'과 유사한 제목입니다. 따라서 수정된 제목은 'Animal Farm'입니다.'?


In [10]:
user_input = "1983"  # 철자가 틀린 입력값
corrected_title = correct_book_title(user_input)

if corrected_title:
    print(f"Did you mean '{corrected_title}'?")
else:
    print(f"No similar book found for '{user_input}'.")


Did you mean ''1983'이라는 제목은 데이터에 존재하지 않으므로, 유사한 책 제목이 없습니다. 따라서 결과는 'NO_MATCH'입니다.'?


In [11]:
user_input = "Brove new world"  # 철자가 틀린 입력값
corrected_title = correct_book_title(user_input)

if corrected_title:
    print(f"Did you mean '{corrected_title}'?")
else:
    print(f"No similar book found for '{user_input}'.")


Did you mean '"Brave New World"가 사용자가 입력하려고 했던 제목일 것으로 추정됩니다.'?
