In [13]:
import pandas as pd
from sklearn.feature_extraction.text import TfidfVectorizer
from sklearn.preprocessing import LabelEncoder
from sklearn.model_selection import train_test_split
from sklearn.neural_network import MLPClassifier
from sklearn.metrics import classification_report, accuracy_score
import pickle
import os

# 작업 디렉토리 기준으로 상대 경로 설정
base_dir = os.path.join(os.getcwd(), 'ossproject', 'emotion')

# 데이터 로드
file_path = os.path.join(base_dir, "emotions_dataset_combined.csv")
data = pd.read_csv(file_path)

# 1. 텍스트 데이터 벡터화
vectorizer = TfidfVectorizer(max_features=5000)  # TF-IDF를 사용하여 텍스트 데이터를 수치화
X = vectorizer.fit_transform(data['B'])  # 'B' 열에서 텍스트 데이터

# 2. 감정 레이블 인코딩
label_encoder = LabelEncoder()
y = label_encoder.fit_transform(data['A'])  # 'A' 열에서 감정 레이블

# 3. 학습/테스트 데이터 분리
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# 4. MLPClassifier 모델 생성
mlp_model = MLPClassifier(hidden_layer_sizes=(64, 64), activation='relu', solver='adam', max_iter=500, random_state=42)

# 5. 모델 학습
print("Training the MLP model...")
mlp_model.fit(X_train, y_train)

# 6. 테스트 데이터로 예측 수행
y_pred = mlp_model.predict(X_test)

# 7. 성능 평가
accuracy = accuracy_score(y_test, y_pred)
classification = classification_report(y_test, y_pred, target_names=label_encoder.classes_)

# 성능 평가 출력
print("\nMLP Model Accuracy:", accuracy)
print("\nClassification Report:\n", classification)

# 8. 모델 저장
model_path = os.path.join(base_dir, 'emotion_mlp_model.sav')
vectorizer_path = os.path.join(base_dir, 'emotion_vectorizer.pkl')
label_encoder_path = os.path.join(base_dir, 'emotion_label_encoder.pkl')

# 모델과 관련 객체 저장
with open(model_path, 'wb') as f:
    pickle.dump(mlp_model, f)

with open(vectorizer_path, 'wb') as f:
    pickle.dump(vectorizer, f)

with open(label_encoder_path, 'wb') as f:
    pickle.dump(label_encoder, f)

print("모델 및 관련 객체들이 저장되었습니다.")

# 사용자 입력에 따라 감정을 예측하고 이모티콘 출력
def predict_emotion():
    # 모델, 벡터라이저, 레이블 인코더 로드
    if os.path.exists(model_path) and os.path.exists(vectorizer_path) and os.path.exists(label_encoder_path):
        with open(model_path, 'rb') as f:
            loaded_model = pickle.load(f)
        with open(vectorizer_path, 'rb') as f:
            loaded_vectorizer = pickle.load(f)
        with open(label_encoder_path, 'rb') as f:
            loaded_label_encoder = pickle.load(f)
    else:
        print("모델 또는 관련 파일이 존재하지 않습니다. 먼저 모델을 학습하고 저장하세요.")
        return

    emotion_to_emoji = {
        "분노": "😡",   # 분노를 나타내는 화난 얼굴
        "기쁨": "😊",   # 기쁨을 나타내는 미소 짓는 얼굴
        "불안": "😰",   # 불안을 나타내는 걱정스러운 얼굴
        "당황": "😳",   # 당황을 나타내는 놀란 얼굴
        "슬픔": "😢",   # 슬픔을 나타내는 눈물 흘리는 얼굴
        "상처": "💔"    # 상처를 나타내는 깨진 하트
    }

    # 사용자 입력 받기
    user_input = input("감정을 표현할 문장을 입력하세요: ")

    # 입력된 문장을 벡터화
    input_vector = loaded_vectorizer.transform([user_input])

    # 예측 수행
    predicted_label = loaded_model.predict(input_vector)
    emotion = loaded_label_encoder.inverse_transform(predicted_label)[0]

    # 예측된 감정과 이모티콘 출력
    emoji = emotion_to_emoji.get(emotion, "❓")  # 매핑되지 않은 경우 기본값으로 ❓ 설정
    print(f"예측된 감정: {emotion}, 이모티콘: {emoji}")

# 함수 호출
predict_emotion()


Training the MLP model...

MLP Model Accuracy: 0.5187875266318032

Classification Report:
               precision    recall  f1-score   support

          기쁨       0.72      0.71      0.72      1206
          당황       0.51      0.50      0.50      1718
          분노       0.49      0.49      0.49      1831
          불안       0.51      0.53      0.52      1891
          상처       0.45      0.45      0.45      1837
          슬픔       0.51      0.49      0.50      1843

    accuracy                           0.52     10326
   macro avg       0.53      0.53      0.53     10326
weighted avg       0.52      0.52      0.52     10326

모델 및 관련 객체들이 저장되었습니다.


감정을 표현할 문장을 입력하세요:  지금 면접보기 바로 전인데 대비를 많이 못해서 떨려


예측된 감정: 슬픔, 이모티콘: 😢
