In [9]:
# 필요한 패키지 설치
!pip install google-play-scraper pandas

from google_play_scraper import reviews, Sort
import pandas as pd
from datetime import datetime

# 1. 앱 ID
app_id = 'com.netmarble.rfnext'

# 2. 2025년 3월 2주차 (2025-04-07 ~ 2025-04-13)
start_date = datetime(2025, 4, 7)
end_date = datetime(2025, 4, 13, 23, 59, 59)

# 3. 리뷰 수집 (최대한 많이 긁기)
result, _ = reviews(
    app_id,
    lang='ko',       # 한국어 리뷰
    country='kr',    # 한국 스토어
    sort=Sort.NEWEST, # 최신순
    count=2000       # 2000개 긁기 (필요시 늘릴 수 있음)
)

# 4. DataFrame 변환
df = pd.DataFrame(result)

# 필요한 컬럼만 정리
df = df[['userName', 'score', 'content', 'at']]

# 5. 날짜 타입 변환
df['at'] = pd.to_datetime(df['at'])

# 6. 주차별 필터링
df_filtered = df[(df['at'] >= start_date) & (df['at'] <= end_date)]

# 7. 저장
filename = 'rfnext_reviews_2025_04_2nd_week.csv'
df_filtered.to_csv(filename, index=False, encoding='utf-8-sig')

# 8. 완료 메시지
print(f"총 {len(df_filtered)}개 리뷰를 저장했습니다: {filename}")


총 154개 리뷰를 저장했습니다: rfnext_reviews_2025_04_2nd_week.csv


In [11]:
# 필요한 패키지 설치
!pip install pandas transformers torch

import pandas as pd
from transformers import pipeline

# 1. CSV 파일 읽기 (이 파일은 "rfnext_reviews_2025_04_2nd_week.csv"라고 가정)
filename = 'rfnext_reviews_2025_04_2nd_week.csv'
df = pd.read_csv(filename, encoding='utf-8-sig')

# 2. 감성 분석 모델 불러오기 (한국어 감성 분석 모델)
sentiment_analyzer = pipeline(
    "sentiment-analysis",
    model="snunlp/KR-FinBERT-SC",  # 이 모델은 일반 텍스트에 적합한 모델입니다.
    tokenizer="snunlp/KR-FinBERT-SC",
    device=-1  # CPU 사용 (GPU가 있으면 0으로 설정)
)

# 3. 감성 분석 함수 (긍정/부정/중립을 좀 더 세밀하게 분류)
def classify_sentiment(text):
    try:
        # 텍스트 길이가 길면 잘라서 분석 (최대 512자)
        result = sentiment_analyzer(text[:512])[0]  # 텍스트가 너무 길면 자르기
        label = result['label']

        # 라벨이 'positive'일 경우 긍정, 'negative'일 경우 부정, 'neutral'일 경우 중립
        if 'positive' in label:
            return '긍정'
        elif 'negative' in label:
            return '부정'
        else:
            return '중립'
    except Exception as e:
        print(f"에러 발생: {e}")
        return '중립'  # 예외 발생 시 '중립' 처리

# 4. 리뷰 감성 분석
df['sentiment'] = df['content'].apply(classify_sentiment)

# 5. 감성 분석 결과 저장
df.to_csv('rfnext_reviews_with_sentiment.csv', index=False, encoding='utf-8-sig')

# 6. 감성 비율 계산
sentiment_counts = df['sentiment'].value_counts(normalize=True) * 100
sentiment_counts = sentiment_counts.reindex(['부정', '중립', '긍정'], fill_value=0)

# 7. 결과 출력
print("\n=== 2025년 4월 2주차 감성 분석 결과 ===")
for label, percent in sentiment_counts.items():
    print(f"{label}: {percent:.2f}%")




config.json:   0%|          | 0.00/881 [00:00<?, ?B/s]

pytorch_model.bin:   0%|          | 0.00/406M [00:00<?, ?B/s]

tokenizer_config.json:   0%|          | 0.00/372 [00:00<?, ?B/s]

vocab.txt:   0%|          | 0.00/143k [00:00<?, ?B/s]

tokenizer.json:   0%|          | 0.00/294k [00:00<?, ?B/s]

special_tokens_map.json:   0%|          | 0.00/112 [00:00<?, ?B/s]

Device set to use cpu



=== 2025년 4월 2주차 감성 분석 결과 ===
부정: 3.25%
중립: 95.45%
긍정: 1.30%
