In [8]:
import numpy as np
import pandas as pd
from sklearn.feature_extraction.text import TfidfVectorizer
from sklearn.metrics.pairwise import cosine_similarity

In [9]:
dir_path = './data/'

In [15]:
def load_books_data(file_path):
    books_df = pd.read_excel(file_path, engine='openpyxl')
    return books_df

def create_tfidf_matrix(books_df):
    vectorizer = TfidfVectorizer(stop_words='english')
    tfidf_matrix = vectorizer.fit_transform(books_df['description'])
    return tfidf_matrix

def calculate_similarity_matrix(tfidf_matrix):
    similarity_matrix = cosine_similarity(tfidf_matrix, tfidf_matrix)
    return similarity_matrix

def recommend_books(book_isbn, books_df, similarity_matrix, top_n=5):
    indices = pd.Series(books_df.index, index=books_df['isbn'])
    book_index = indices[book_isbn]

    similarity_scores = list(enumerate(similarity_matrix[book_index]))
    similarity_scores = sorted(similarity_scores, key=lambda x: x[1], reverse=True)
    top_similar_books_indices = [i[0] for i in similarity_scores[1:top_n+1]]

    return books_df.iloc[top_similar_books_indices]

if __name__ == '__main__':
    books_data_path = dir_path+'aladin_20230515_final.xlsx'
    books_df = load_books_data(books_data_path)
    tfidf_matrix = create_tfidf_matrix(books_df)
    similarity_matrix = calculate_similarity_matrix(tfidf_matrix)

    book_isbn = '9791190299770' # The book title you want to get recommendations for
    recommendations = recommend_books(book_isbn, books_df, similarity_matrix)

In [16]:
recommendations

Unnamed: 0,isbn,title,description,author,cover
951,9791190299886,모든 삶은 흐른다,2022년 프랑스 최고의 철학과 교수로 꼽힌 로랑스 드빌레르의 인문에세이로 출간 후...,"로랑스 드빌레르 (지은이), 이주영 (옮긴이)",https://image.aladin.co.kr/product/31554/58/co...
594,9788937443848,이방인,"'민음사 세계문학전집' 266권. 20세기의 지성이자 실존주의 문학의 대표 작가, ...","알베르 카뮈 (지은이), 김화영 (옮긴이)",https://image.aladin.co.kr/product/21224/66/co...
1344,9788937495663,이방인,"'민음사 세계문학전집' 266권. 20세기의 지성이자 실존주의 문학의 대표 작가, ...","알베르 카뮈 (지은이), 김화영 (옮긴이)",https://image.aladin.co.kr/product/1809/47/cov...
1873,9791157846580,"만화로 보는 결정적 세계사 - 제2차 세계대전부터 21세기까지, 지정학으로 본 국제정치사","제2차 세계대전 이후부터 21세기 초반까지, 세계사에 한 획을 긋고 국제정세를 바꾼...","파스칼 보니파스 (지은이), 토미 (그림), 이수진 (옮긴이), 김준형 (감수)",https://image.aladin.co.kr/product/31489/64/co...
1520,9788930041256,야만의 시대 - 14세기 프랑스 자크리 농민전쟁의 회고,중세 프랑스 자크리 농민전쟁에 가담한 농노가 자신의 인생사와 당대의 사회상을 사실적...,"마르셀 (지은이), 김용채 (옮긴이), 자크 콜랭 드 플랑시 (편역)",https://image.aladin.co.kr/product/31642/76/co...
