In [59]:
from sklearn.feature_extraction.text import TfidfVectorizer
from sklearn.linear_model import LogisticRegression
from sklearn.model_selection import train_test_split
from sklearn.metrics import classification_report
import pandas as pd

# 데이터 불러오기
df = pd.read_csv('intent_dataset.csv')

# 데이터 셋 분리
X_train, X_test, y_train, y_test = train_test_split(df['text'], df['intent'], test_size=0.2, random_state=42)

vectorizer = TfidfVectorizer()
X_train_vec = vectorizer.fit_transform(X_train)
X_test_vec = vectorizer.transform(X_test)

# 모델 학습
clf = LogisticRegression(max_iter=1000)
clf.fit(X_train_vec, y_train)

In [81]:
# 모델 저장
import joblib

joblib.dump(clf, "intent_model.pkl")
joblib.dump(vectorizer, "vectorizer.pkl")

['vectorizer.pkl']

In [87]:
# text 의도 반환 함수
def predict_intent(text):
    vec = vectorizer.transform([text])
    pred = clf.predict(vec)[0]
    return pred

In [89]:
# 모델 테스트 
def intent_to_text(intent):
    mapping = {
        0: "증명서 발급",
        1: "주소 변경",
        2: "여권 발급",
        3: "직원 호출",
        4: "시작화면"
    }
    return mapping.get(intent)

test_sentences = [
    "등본 뽑아줬으면 좋겠어요",
    "주소 변경하러 왔어요",
    "여권 신청하고 싶어요",
    "직원 좀 불러줘",
    "처음으로 돌아가줘"
]

for sent in test_sentences:
    pred = predict_intent(sent)
    print(f"[{sent}] → 예측된 intent: {intent_to_text(pred)} [{pred}]")

[등본 뽑아줬으면 좋겠어요] → 예측된 intent: 증명서 발급 [0]
[주소 변경하러 왔어요] → 예측된 intent: 주소 변경 [1]
[여권 신청하고 싶어요] → 예측된 intent: 여권 발급 [2]
[직원 좀 불러줘] → 예측된 intent: 직원 호출 [3]
[처음으로 돌아가줘] → 예측된 intent: 시작화면 [4]
