In [3]:
import pandas as pd
import torch
from transformers import AutoTokenizer, AutoModelForSequenceClassification
import os

# 모델과 토크나이저 로드
model_name = "monologg/koelectra-base-v3-discriminator"
tokenizer = AutoTokenizer.from_pretrained(model_name)
model = AutoModelForSequenceClassification.from_pretrained(model_name)

# 리뷰 데이터를 불러옵니다.
file_path = "./data/뱅뱅막국수_combined_reviews_감정분석완료.csv"  # 분석할 파일 경로
reviews = pd.read_csv(file_path)

# 감정 예측 함수 정의
def predict_sentiment(text):
    inputs = tokenizer(text, return_tensors="pt", truncation=True, padding=True)
    with torch.no_grad():
        outputs = model(**inputs)
    logits = outputs.logits
    predicted_class = torch.argmax(logits, dim=1).item()
    # Koelectra 모델은 0: 부정, 1: 긍정으로 레이블을 가집니다.
    return "부정" if predicted_class == 0 else "긍정"

# 리뷰 데이터에 감정 레이블 추가
reviews["감정 분석 결과"] = reviews["Review"].apply(predict_sentiment)

# 원래 파일 이름에 "_재분석" 추가하여 저장
base_name = os.path.splitext(os.path.basename(file_path))[0]
output_file_path = f"./data/{base_name}_재분석_부정.csv"
reviews.to_csv(output_file_path, index=False)
print(f"감정 분석 결과가 저장되었습니다: {output_file_path}")


Some weights of ElectraForSequenceClassification were not initialized from the model checkpoint at monologg/koelectra-base-v3-discriminator and are newly initialized: ['classifier.dense.bias', 'classifier.dense.weight', 'classifier.out_proj.bias', 'classifier.out_proj.weight']
You should probably TRAIN this model on a down-stream task to be able to use it for predictions and inference.


감정 분석 결과가 저장되었습니다: ./data/뱅뱅막국수_combined_reviews_감정분석완료_재분석_부정.csv


In [4]:
import pandas as pd
import torch
from transformers import AutoTokenizer, AutoModelForSequenceClassification
import os

# 모델과 토크나이저 로드
model_name = "smilegate-ai/kor_unsmile"
tokenizer = AutoTokenizer.from_pretrained(model_name)
model = AutoModelForSequenceClassification.from_pretrained(model_name)

# 리뷰 데이터를 불러옵니다.
file_path = "./data/뱅뱅막국수_combined_reviews_감정분석완료.csv"  # 분석할 파일 경로
reviews = pd.read_csv(file_path)

# 감정 예측 함수 정의
def predict_sentiment(text):
    inputs = tokenizer(text, return_tensors="pt", truncation=True, padding=True)
    with torch.no_grad():
        outputs = model(**inputs)
    logits = outputs.logits
    predicted_class = torch.argmax(logits, dim=1).item()
    # kor_unsmile 모델은 0: 부정, 1: 긍정으로 레이블을 가집니다.
    return "부정" if predicted_class == 0 else "긍정"

# 리뷰 데이터에 감정 레이블 추가
reviews["감정 분석 결과"] = reviews["Review"].apply(predict_sentiment)

# 원래 파일 이름에 "_재분석" 추가하여 저장
base_name = os.path.splitext(os.path.basename(file_path))[0]
output_file_path = f"./data/{base_name}_재분석_부정2.csv"
reviews.to_csv(output_file_path, index=False)
print(f"감정 분석 결과가 저장되었습니다: {output_file_path}")


To support symlinks on Windows, you either need to activate Developer Mode or to run Python as an administrator. In order to activate developer mode, see this article: https://docs.microsoft.com/en-us/windows/apps/get-started/enable-your-device-for-development


감정 분석 결과가 저장되었습니다: ./data/뱅뱅막국수_combined_reviews_감정분석완료_재분석_부정2.csv
