In [None]:
from keras.datasets import imdb
from keras.preprocessing import sequence
from keras.models import Sequential
from keras.layers import Embedding, GRU, Dense

# IMDB 데이터셋 로드
max_features = 10000  # 데이터에서 가장 자주 등장하는 단어 10000개만 사용
maxlen = 500  # 리뷰를 500 단어 이후는 잘라냅니다.
batch_size = 32

print('데이터 로딩...')
(input_train, y_train), (input_test, y_test) = imdb.load_data(num_words=max_features)

print('시퀀스 패딩 (samples x time)')
input_train = sequence.pad_sequences(input_train, maxlen=maxlen)
input_test = sequence.pad_sequences(input_test, maxlen=maxlen)

# GRU 모델 구축
model = Sequential()
model.add(Embedding(max_features, 32))
model.add(GRU(32))
model.add(Dense(1, activation='sigmoid'))

# 모델 컴파일
model.compile(optimizer='rmsprop', loss='binary_crossentropy', metrics=['acc'])

# 모델 훈련
history = model.fit(input_train, y_train,
                    epochs=10,
                    batch_size=128,
                    validation_split=0.2)

# 모델 평가
test_loss, test_acc = model.evaluate(input_test, y_test)
print('테스트 손실:', test_loss)
print('테스트 정확도:', test_acc)


데이터 로딩...
Downloading data from https://storage.googleapis.com/tensorflow/tf-keras-datasets/imdb.npz
시퀀스 패딩 (samples x time)
Epoch 1/10
Epoch 2/10
Epoch 3/10
Epoch 4/10
Epoch 5/10
Epoch 6/10
Epoch 7/10
Epoch 8/10
Epoch 9/10
Epoch 10/10
테스트 손실: 0.44299232959747314
테스트 정확도: 0.8614799976348877


In [None]:
# IMDB 데이터셋의 word_index 가져오기
word_index = imdb.get_word_index()

# 새로운 리뷰 텍스트
new_review = 'This movie was fantastic! I really loved it and would watch it again because it was amazingly great'

# 텍스트를 단어 인덱스의 시퀀스로 변환하는 함수
def encode_review(text):
    tokens = text.lower().split()
    tokens = [word_index[word] if word in word_index else 0 for word in tokens]
    return sequence.pad_sequences([tokens], maxlen=maxlen)

# 새로운 리뷰를 시퀀스로 인코딩
encoded_review = encode_review(new_review)

# 모델을 사용하여 새로운 리뷰의 감성 예측
prediction = model.predict(encoded_review)

# 결과 출력
print('Review sentiment (1 for positive and 0 for negative):', prediction[0][0])

Downloading data from https://storage.googleapis.com/tensorflow/tf-keras-datasets/imdb_word_index.json
Review sentiment (1 for positive and 0 for negative): 0.9953382
