In [3]:
# routes.py
import pandas as pd
from flask import Blueprint, jsonify, request
from sqlalchemy import create_engine
from sklearn.feature_extraction.text import TfidfVectorizer
from sklearn.metrics.pairwise import cosine_similarity
from konlpy.tag import Okt

recommend_bp = Blueprint('recommend_bp', __name__)

# SQLAlchemy 엔진 생성
engine = create_engine('oracle+cx_oracle://kyb:1111@localhost:1521/xe')

# 데이터 가져오기
query_zero = "SELECT id, info, hash_tags, name FROM zero"
query_zero_re = "SELECT id, review, review2, review3, review4, review5, review6 FROM zero_re"

df_zero = pd.read_sql(query_zero, con=engine)
df_zero_re = pd.read_sql(query_zero_re, con=engine)

# 리뷰 데이터 병합
df_zero_re['combined_reviews'] = df_zero_re.apply(lambda row: ' '.join(row[['review', 'review2', 'review3', 'review4', 'review5', 'review6']].values.astype(str)), axis=1)

# zero 테이블과 zero_re 테이블 병합
df_merged = pd.merge(df_zero, df_zero_re, on='id')

# 형태소 분석기 초기화
okt = Okt()

# 한국어 텍스트 전처리 함수
def preprocess_korean_text(text):
    tokens = okt.morphs(text)
    return ' '.join(tokens)

# 정보, 해시태그, 리뷰 데이터 병합 (None 값을 빈 문자열로 처리)
df_merged['combined_text'] = df_merged.apply(lambda row: ' '.join([str(row['info']) if row['info'] else '', 
                                                                   str(row['hash_tags']) if row['hash_tags'] else '', 
                                                                   str(row['combined_reviews']) if row['combined_reviews'] else '']), axis=1)

# 병합된 텍스트 데이터 전처리
df_merged['processed_text'] = df_merged['combined_text'].apply(preprocess_korean_text)

# TF-IDF 벡터화
tfidf_vectorizer = TfidfVectorizer()
tfidf_matrix = tfidf_vectorizer.fit_transform(df_merged['processed_text'])

# 코사인 유사도 계산
cosine_sim = cosine_similarity(tfidf_matrix, tfidf_matrix)

# 추천 함수 정의
def get_recommendations(index, cosine_sim=cosine_sim):
    sim_scores = list(enumerate(cosine_sim[index]))
    sim_scores = sorted(sim_scores, key=lambda x: x[1], reverse=True)
    sim_scores = sim_scores[1:6]  # 상위 5개의 유사한 리뷰 선택
    review_indices = [i[0] for i in sim_scores]
    return df_merged.iloc[review_indices]

@recommend_bp.route('/recommend/<int:index>', methods=['GET'])
def recommend(index):
    recommendations = get_recommendations(index)
    return jsonify(recommendations[['id', 'name', 'info', 'hash_tags', 'review', 'review2', 'review3', 'review4', 'review5', 'review6']].to_dict(orient='records'))


   id                                               info  \
0  51  남양주 덕소 최초의 제로웨이스트샵\n'용기내 담아가게' 입니다.\n\n저희 매장은 ...   
1  52  제로웨이스트 친환경 소분샵 입니다.\n친환경세탁세제 , 섬유유연제, 섬유탈취제,진드...   
2  53  제로웨이스트 바람가게입니다.\n 제로웨이스트란 생활 속에서 배출되는 쓰레기를 최소화...   
3  58  2021년 7월 10일 오픈한 제로웨이스트 오프라인 플랫폼 입니다. 쓰레기 배출을 ...   
4  59  가치가게는 세류동에 위치한 복합문화공간으로 카페와 제로웨이스트 상점을 겸하고 있습니...   

                                   hash_tags          name  
0                                          #  남양주_용기내 담아가게  
1          #소분샵, #리필스테이션, #배달, #천연세제, #천연탈취제      남양주_친한가게  
2        #제로웨이스트, #부천소품샵, #친환경, #리필스테이션, #역곡       부천_바람가게  
3    #성남제로웨이스트샵, #분당제로웨이스트샵, #리필샵, #친환경, #비건     성남_슬기로운생활  
4  #공정무역커피, #제로웨이스트상점, #유기농과일청, #공간대여, #자원순환       수원_가치상점  
   id                                             review  \
0  30  제로웨이스트 매장이에요. 여러 샤워 비누와 다양한 친환경 제품이 있어요. 구경하기 ...   
1  32             제로웨이스트 소품샵~\n가격 부담스럽지 않아서 어쩌다 보니 하나 겟~   
2  34  제로웨이스트, 친환경 제품 등등 다양한 물품이 가득한곳. 특히 차(옥수수, 작두콩)...   
3  36  인테리어 예뻐서 들어갔다가 쇼핑하고 온 곳 \n