In [1]:
### 필요한 함수 임폴트
import os
import json
import pandas as pd
import pickle
import random
import time
from dotenv import load_dotenv

# ### .env file 로드
load_dotenv()

# 변수에 담으면 노출 위험도가 작음. 
### gemini key 불러오기
# configure 환경설정에 api_key를 넣어주고 사용자 인식 
gemini_api_key = os.getenv('GEMINI_API_KEY')

### 리뷰 텍스트 전처리

# 파일 경로 설정 불러오기 
path = 'sweatshirt_review1.csv'

# DataFrame 생성
df = pd.read_csv(path)
columns = df.columns
print(f'컬럼 이름 : {columns}')

# '리뷰내용'을 리스트로 변환
review_text = df.loc[:, '리뷰내용'].to_list()

### 감성 분석 및 키워드 추출 함수 정의 (맨 위 코드 적용)
positive_keywords = ['좋다', '만족', '예쁘다', '잘', '편하다', '추천']
negative_keywords = ['나쁘다', '불편', '싫다', '문제', '아쉽다', '불만']

def keyword_based_sentiment(review):
    positive_matches = [word for word in positive_keywords if word in review]
    negative_matches = [word for word in negative_keywords if word in review]
    sentiment = "긍정" if len(positive_matches) > len(negative_matches) else "부정"
    return sentiment, positive_matches, negative_matches

### 전체 텍스트 처리 함수 정의
def process_reviews_with_keywords(text_list):
    results = {}
    for i, review in enumerate(text_list):
        print(f"리뷰 {i + 1} 처리 중...")
        sentiment, pos_matches, neg_matches = keyword_based_sentiment(review)
        results[f"리뷰 {i + 1}"] = {
            "감성_분석_결과": sentiment,
            "정확도": 100 if len(pos_matches) + len(neg_matches) > 0 else 50,
            "판단_근거_키워드": {
                "긍정": pos_matches,
                "부정": neg_matches,
                "중립_또는_기타": []
            }
        }
    return results

# 여러 텍스트 처리
all_results = process_reviews_with_keywords(review_text[:10])

# 결과 저장
output_path = 'review_analysis_keywords.pkl'
with open(output_path, 'wb') as fw:
    pickle.dump(all_results, fw)

# 저장된 결과 불러오기
with open(output_path, 'rb') as fr:
    loaded_data = pickle.load(fr)

print(f'리뷰 데이터 분석 결과:\n{loaded_data}')


컬럼 이름 : Index(['아이디', '리뷰어 등급', '작성 날짜', '옵션1', '옵션2', '상품 사이즈', '퀄리티', '색감', '키',
       '몸무게', '사이즈', '리뷰내용'],
      dtype='object')
리뷰 1 처리 중...
리뷰 2 처리 중...
리뷰 3 처리 중...
리뷰 4 처리 중...
리뷰 5 처리 중...
리뷰 6 처리 중...
리뷰 7 처리 중...
리뷰 8 처리 중...
리뷰 9 처리 중...
리뷰 10 처리 중...
리뷰 데이터 분석 결과:
{'리뷰 1': {'감성_분석_결과': '부정', '정확도': 50, '판단_근거_키워드': {'긍정': [], '부정': [], '중립_또는_기타': []}}, '리뷰 2': {'감성_분석_결과': '긍정', '정확도': 100, '판단_근거_키워드': {'긍정': ['잘'], '부정': [], '중립_또는_기타': []}}, '리뷰 3': {'감성_분석_결과': '부정', '정확도': 50, '판단_근거_키워드': {'긍정': [], '부정': [], '중립_또는_기타': []}}, '리뷰 4': {'감성_분석_결과': '긍정', '정확도': 100, '판단_근거_키워드': {'긍정': ['잘'], '부정': [], '중립_또는_기타': []}}, '리뷰 5': {'감성_분석_결과': '부정', '정확도': 50, '판단_근거_키워드': {'긍정': [], '부정': [], '중립_또는_기타': []}}, '리뷰 6': {'감성_분석_결과': '부정', '정확도': 50, '판단_근거_키워드': {'긍정': [], '부정': [], '중립_또는_기타': []}}, '리뷰 7': {'감성_분석_결과': '긍정', '정확도': 100, '판단_근거_키워드': {'긍정': ['잘'], '부정': [], '중립_또는_기타': []}}, '리뷰 8': {'감성_분석_결과': '긍정', '정확도': 100, '판단_근거_키워드': {'긍정': ['잘'], '부정': [], '