In [1]:
import re
from konlpy.tag import Okt
from tensorflow.keras.preprocessing.text import Tokenizer
from tensorflow.keras.preprocessing.sequence import pad_sequences

okt = Okt()
tokenizer = Tokenizer()

In [2]:
import tensorflow as tf
from tensorflow.keras.models import load_model

# 모델 복원
loaded_model = tf.keras.models.load_model('best_model.h5')
# loaded_model.summary()


In [3]:
import pickle

#### 중요!!!!!!! Tokenizer object loading
with open('tokenizer.pickle', 'rb') as handle:
    tokenizer = pickle.load(handle)

In [4]:
max_len = 30
stopwords = ['의','가','이','은','들','는','좀','잘','걍','과','도','를','으로','자','에','와','한','하다']

In [5]:
def sentiment_predict(content):
    content = re.sub(r'[^ㄱ-ㅎㅏ-ㅣ가-힣 ]','', content)

    content = okt.morphs(content, stem=True) # 토큰화
    content = [word for word in content if not word in stopwords] # 불용어 제거

    encoded = tokenizer.texts_to_sequences([content]) # 정수 인코딩
    pad_new = pad_sequences(encoded, maxlen = max_len) # 패딩
    print(pad_new)
    score = float(loaded_model.predict(pad_new)) # 예측
    if(score > 0.5):
        print("{:.2f}% 확률로 긍정 리뷰입니다.\n".format(score * 100))
    else:
        print("{:.2f}% 확률로 부정 리뷰입니다.\n".format((1 - score) * 100))

In [8]:
while (True):
    text = input("영화 리뷰를 입력하세요 (취소 : Q)\n")
    if text == 'Q':
        print('Bye~')
        break
    sentiment_predict(text)

영화 리뷰를 입력하세요 (취소 : Q)
Q
Bye~


In [15]:
sentiment_predict('이 영화 개꿀잼 ㅋㅋㅋ')

[[   0    0    0    0    0    0    0    0    0    0    0    0    0    0
     0    0    0    0    0    0    0    0    0    0    0    0    0    1
  3140   92]]
91.29% 확률로 긍정 리뷰입니다.



In [25]:
sentiment_predict('이딴게 영화냐 ㅉㅉ')

[[  0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0
    0   0   0   0   0   0   0 432  38   1 220 653]]
99.79% 확률로 부정 리뷰입니다.



In [34]:
sentiment_predict('이사람 처음으로 옳은 소리하네~')

[[   0    0    0    0    0    0    0    0    0    0    0    0    0    0
     0    0    0    0    0    0    0    0    0    0    0    0   40   91
  2464  431]]
60.92% 확률로 부정 리뷰입니다.



In [40]:
sentiment_predict('감독 뭐하는 놈이냐?')

[[  0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0
    0   0   0   0   0   0   0   0  51  59 350 805]]
98.27% 확률로 부정 리뷰입니다.



In [44]:
sentiment_predict('와 개쩐다 정말 세계관 최강자들의 영화다')

[[   0    0    0    0    0    0    0    0    0    0    0    0    0    0
     0    0    0    0    0    0    0    0   87  101 1215   10 2909 1804
     1    9]]
88.88% 확률로 긍정 리뷰입니다.

