## 전체 코드

In [4]:
import torch
import numpy
import re
import pickle
import random
import pandas as pd
from sklearn.metrics.pairwise import cosine_similarity

# transformers, genai 임포트
from transformers import BertForSequenceClassification, AutoTokenizer, AutoModel
import genai
#from genai.schemas import GenerateParams
#from genai.models import GenerativeModel
import sys
import os
sys.path.append(os.path.abspath(".."))  # 현재 디렉터리의 상위 경로 추가

from config.api_keys import gemini_key
import google.generativeai as genai


# -------------------------------
#  첫 번째 감정 분류 (KoBERT)
# -------------------------------
class EmotionClassifier:
    def __init__(self, model_path="monologg/kobert", num_labels=7, device=None):
        self.device = device if device else ("cuda" if torch.cuda.is_available() else "cpu")
        self.model = BertForSequenceClassification.from_pretrained(model_path, num_labels=num_labels)
        self.tokenizer = AutoTokenizer.from_pretrained(model_path, trust_remote_code=True)
        self.model.to(self.device)

        self.label_to_emotion = {
            0: "중립",
            1: "놀람",
            2: "분노",
            3: "슬픔",
            4: "행복",
            5: "혐오",
            6: "공포"
        }

    def load_model(self, model_file):
        """학습된 .pth 파라미터를 로드"""
        self.model.load_state_dict(torch.load(model_file, map_location=self.device))

    def preprocess_text(self, text):
        """간단한 전처리: 특수문자 제거"""
        return re.sub("[^0-9a-zA-Z가-힣\s+]", "", text)

    def predict_emotion(self, text):
        """문장 -> 감정 레이블"""
        cleaned_text = self.preprocess_text(text)
        encoded_input = self.tokenizer(
            cleaned_text,
            return_tensors="pt",
            truncation=True,
            padding="max_length",
            max_length=128
        )
        encoded_input = {key: val.to(self.device) for key, val in encoded_input.items()}

        self.model.eval()
        with torch.no_grad():
            outputs = self.model(**encoded_input)
            predicted_label = outputs.logits.argmax(dim=1).item()

        return self.label_to_emotion[predicted_label]

# -----------------------------
#  E5 임베딩 클래스
# -----------------------------
class E5Embedder:
    def __init__(self):
        # E5 모델 (intfloat/e5-large) 불러오기
        self.tokenizer = AutoTokenizer.from_pretrained("intfloat/e5-large")
        self.model = AutoModel.from_pretrained("intfloat/e5-large")

    def get_embedding(self, text):
        """텍스트를 E5 임베딩 벡터로 변환"""
        # 원하는 전처리 규칙(예: 'query: ', 'passage: ') 등을 적용할 수도 있음
        inputs = self.tokenizer(text, return_tensors="pt", truncation=True)
        with torch.no_grad():
            outputs = self.model(**inputs)
        
        embedding = outputs.last_hidden_state.mean(dim=1).detach()
        return embedding  # shape: [1, hidden_dim]

# -----------------------------
#  노래 추천(코사인 유사도)
# -----------------------------
class SongRecommender:
    """
    df: 노래 정보 DataFrame (['title','artist','cleaned_lyrics','emotion','embedding'])
        - embedding: E5Embedder로 미리 구한 텐서
    """
    def __init__(self, df):
        self.df = df

    def recommend_song(self, diary_embedding, emotion):
        """
        일기 임베딩(diary_embedding), 감정(emotion)을 받아
        동일 감정의 곡 중 코사인 유사도가 가장 높은 노래 추천
        """
        # 감정이 동일한 노래만 필터링
        filtered_df = self.df[self.df['emotion'] == emotion]

        similarities = []
        # diary_embedding이 torch.Tensor라면 numpy 변환
        if isinstance(diary_embedding, torch.Tensor):
            diary_emb_np = diary_embedding.numpy()
        else:
            diary_emb_np = diary_embedding

        for _, row in filtered_df.iterrows():
            # 곡 임베딩
            song_emb = row['embedding']
            # 만약 song_emb도 torch.Tensor라면 numpy 변환
            if isinstance(song_emb, torch.Tensor):
                song_emb = song_emb.numpy()

            sim = cosine_similarity(diary_emb_np, song_emb)
            # sim.shape: (1, 1)
            similarities.append((
                row['title'],
                row['artist'],
                row['cleaned_lyrics'],
                sim[0][0]  # 유사도 값
            ))

        if similarities:
            # 유사도 내림차순 정렬
            best_match = sorted(similarities, key=lambda x: x[3], reverse=True)[0]
            return best_match  # (title, artist, lyrics, similarity)
        else:
            return None

# -----------------------------
#  Gemini 설정 & 일기 초안 
# -----------------------------

# Gemini API 설정
genai.configure(api_key=gemini_key)

# Gemini 모델 선택
gemini_model = genai.GenerativeModel('gemini-2.0-flash')

chat_history = []

def ask_gemini(user_response, emotion, max_history_length=5):
    """
    사용자 입력 + 감정 → 프롬프트 구성 → Gemini 대화
    """
    global chat_history

    conversation_history = "\n".join(chat_history)
    
    full_prompt = (
        f"{conversation_history}"
        f"\nUser (감정: {emotion}): {user_response}\n\n"
        "사용자는 일기를 꾸준히 쓰고 싶어하는 사람입니다. "
        "한 번 써보고 끝이 아니라, 매일 재미를 느끼며 계속 작성할 수 있도록 동기를 부여해주세요. "
        "친근하고 공감하는 어조로, 사용자의 감정을 이해하고, 감정을 조금 더 탐색할 수 있는 질문을 한 개만 만들어주세요. "
        "답변은 2~3문장으로 간결하게 유지하고, 예시는 1개 정도만 들어주세요. "
        "이전 대화 내용도 반영해주세요."
    )

    response = gemini_model.generate_content(full_prompt)

    # 대화 기록 저장
    chat_history.append(f"User (감정: {emotion}): {user_response}")
    chat_history.append(f"Gemini: {response.text}")

    # 너무 길어지면 초기 기록 삭제
    if len(chat_history) > max_history_length * 2:
        chat_history = chat_history[-(max_history_length * 2):]

    return response.text

def generate_diary_draft(chat_history):
    """
    전체 대화 내용을 요약하여 '일기 초안' 작성
    """
    full_conversation = "\n".join(chat_history)
    
    prompt = f"""
    아래 대화 내용을 바탕으로, 사용자의 감정과 상황이 잘 드러나는 일기 초안을 작성해 주세요.
    문맥이 자연스럽고 핵심 내용이 잘 담기도록 정리하되, 
    '앞으로도 매일 일기를 쓰고 싶어지는' 동기가 될 만한 따뜻하고 희망적인 문장들을 포함해주세요.
    간결하면서도, 사용자가 자신을 돌아볼 수 있는 한두 문장과
    내일 혹은 다음 일기를 위한 작은 다짐이나 기대감이 느껴지도록 작성해 주세요.

    대화 내용:
    "{full_conversation}"
    """

    response = gemini_model.generate_content(prompt)
    return response.text

# -----------------------------
#  기분 전환 활동 & 상품 추천
# -----------------------------
def suggest_activities_and_products(diary_text, emotion):
    """
    일기 초안을 바탕으로,
    - 기분전환 활동 (2~3개)
    - 상품(책, 소품, 음식 등) 추천
    을 Gemini에게 요청.
    """
    prompt = f"""
    당신은 일기를 작성하는 사람을 돕는 조력자입니다.
    아래는 사용자의 일기 초안과 감정 상태입니다.
    
    일기: "{diary_text}"
    감정: {emotion}
    
    이 사용자에게 적합한 기분전환 활동을 두세 가지 정도 제안하고,
    도움이 될 만한 상품이나 서비스를 하나 이상 추천해주세요.
    답변은 간결하게, 핵심만 정리해 주세요.사용자 입장에서 어렵지 않게 시도해볼 수 있는 활동을 알려주세요.
    """
    response = gemini_model.generate_content(prompt)
    return response.text

# -----------------------------
#  메인 실행부
# -----------------------------
if __name__ == "__main__":
    #  KoBERT 감정 분류 모델
    emotion_classifier = EmotionClassifier(model_path="monologg/kobert", num_labels=7)
    emotion_classifier.load_model("./new_data_test.pth")  # 실제 .pth 경로

    # E5 임베더(일기 초안 등 임베딩용)
    e5_embedder = E5Embedder()

    # 노래 데이터 로드 (E5 임베딩이 저장된 DataFrame)
    df = pd.read_pickle("./trot_embeddings_emotion.pkl")
    # df 컬럼: ['title','artist','cleaned_lyrics','emotion','embedding']
    recommender = SongRecommender(df)

    print("대화를 시작합니다. 종료하려면 'exit'를 입력하세요.")

    # 대화 루프
    while True:
        user_response = input("User: ")
        if user_response.lower() == "exit":
            print("대화를 종료합니다.")
            break
        
        #  사용자 입력 감정 분석
        emotion = emotion_classifier.predict_emotion(user_response)

        #  Gemini 질의
        follow_up_question = ask_gemini(user_response, emotion)
        print("Gemini:", follow_up_question)
        
        # (옵션) 대화 기록 모니터링
        print("\n[대화 기록 확인]")
        for chat in chat_history:
            print(chat)
        print("\n----------------------")

    #  전체 대화 요약 -> 일기 초안
    print("\n==== 전체 대화 요약 -> 일기 초안 생성 ====")
    diary_draft = generate_diary_draft(chat_history)
    print("일기 초안:\n", diary_draft)

    #  일기 초안의 감정 (동일 KoBERT로 재분류 )
    final_emotion = emotion_classifier.predict_emotion(diary_draft)
    print(f"\n일기 초안 감정: {final_emotion}")

    #  일기 초안을 E5 임베딩
    diary_emb = e5_embedder.get_embedding(diary_draft)

    #  노래 추천
    recommended_song = recommender.recommend_song(diary_emb, final_emotion)

    print("\n==== 노래 추천 ====")
    if recommended_song is not None:
        title, artist, lyrics, similarity = recommended_song
        print(f"🎵 제목: {title}")
        print(f"👤 가수: {artist}")
        print(f"📜 가사:\n{lyrics}")
        print(f"🔗 유사도 점수: {similarity:.4f}")
    else:
        print("추천할 노래가 없습니다.")

    # 기분전환 활동 및 상품 추천
    print("\n==== 기분전환 활동 & 상품 추천 ====")
    suggestions = suggest_activities_and_products(diary_draft, final_emotion)
    print(suggestions)



Some weights of BertForSequenceClassification were not initialized from the model checkpoint at monologg/kobert and are newly initialized: ['classifier.bias', 'classifier.weight']
You should probably TRAIN this model on a down-stream task to be able to use it for predictions and inference.
  self.model.load_state_dict(torch.load(model_file, map_location=self.device))


대화를 시작합니다. 종료하려면 'exit'를 입력하세요.
Gemini: 어머, 고소한 냄새 덕분에 기분이 좋으셨다니 저도 덩달아 행복해지네요! 매일 이렇게 작은 행복들을 일기장에 기록하다 보면 나중에는 엄청 풍성한 이야기가 될 거예요. 혹시 그 고소한 냄새가 어떤 음식에서 나는 냄새였는지 기억나세요? 예를 들어, 갓 구운 빵 냄새처럼요?


[대화 기록 확인]
User (감정: 행복): 고소한 냄새가 좋았어요
Gemini: 어머, 고소한 냄새 덕분에 기분이 좋으셨다니 저도 덩달아 행복해지네요! 매일 이렇게 작은 행복들을 일기장에 기록하다 보면 나중에는 엄청 풍성한 이야기가 될 거예요. 혹시 그 고소한 냄새가 어떤 음식에서 나는 냄새였는지 기억나세요? 예를 들어, 갓 구운 빵 냄새처럼요?


----------------------
Gemini: Gemini: 아, 먹고 나니 늘어지는 기분이 드셨군요. 왠지 모르게 힘이 쭉 빠지는 느낌이 들 때가 있죠. 일기 쓸 때는 솔직한 감정을 그대로 적는 게 제일 좋은 것 같아요. 이렇게 솔직한 감정을 쓰다 보면, 나중에 '아, 내가 이럴 때 이렇게 느꼈었구나' 하고 자신을 더 잘 이해하게 될 거예요. 혹시 오늘따라 더 늘어지는 특별한 이유가 있었을까요?


[대화 기록 확인]
User (감정: 행복): 고소한 냄새가 좋았어요
Gemini: 어머, 고소한 냄새 덕분에 기분이 좋으셨다니 저도 덩달아 행복해지네요! 매일 이렇게 작은 행복들을 일기장에 기록하다 보면 나중에는 엄청 풍성한 이야기가 될 거예요. 혹시 그 고소한 냄새가 어떤 음식에서 나는 냄새였는지 기억나세요? 예를 들어, 갓 구운 빵 냄새처럼요?

User (감정: 슬픔): 먹고나니 늘어지네
Gemini: Gemini: 아, 먹고 나니 늘어지는 기분이 드셨군요. 왠지 모르게 힘이 쭉 빠지는 느낌이 들 때가 있죠. 일기 쓸 때는 솔직한 감정을 그대로 적는 게 제일 좋은 것 같아요. 이렇게 솔직한 감정을 쓰다 보면, 나중에 '아, 내가 이럴 때 이렇게 느꼈었구나' 하고