In [None]:
from keras.datasets import reuters
from keras.preprocessing import sequence
from keras.utils import np_utils
from keras.models import Sequential
from keras.layers import Dense, LSTM, Embedding

import numpy as np
import tensorflow as tf
import matplotlib.pyplot as plt

seed = 0 
np.random.seed(seed)
tf.random.set_seed(3)
#불러온 데이터를 학습셋과 테스트셋으로 나누기
(X_train, Y_train),(X_test, Y_test) = reuters.load_data(num_words=1000, test_split=0.2)

category = np.max(Y_train) + 1
print(category, '카테고리')
print(len(X_train), '학습용 뉴스 기사')
print(len(X_test), '테스트용 뉴스 기사')
print(X_train[0])

#데이터 전처리 maxlen은 단어 수를 100개로 맞추라는 의미 
#100개 보다 많으면 나머지는 버리고, 100개 보다 적으면 0으로 채워 넣는다.
#인공지능 학습을 위해선 데이터 형이 동일해야 하기 때문에 진행하는 전처리 과정이다.
x_train = sequence.pad_sequences(X_train, maxlen=100)
x_test = sequence.pad_sequences(X_test, maxlen=100)

#카테고리를 나타내는 결과값들에는 원한 인코딩 처리를 하여 전처리 과정을 마친다.
y_train = np_utils.to_categorical(Y_train)
y_test = np_utils.to_categorical(Y_test)

model = Sequential()
model.add(Embedding(1000, 100))
model.add(LSTM(100, activation='tanh'))
model.add(Dense(46, activation='softmax'))

model.compile(loss='categorical_crossentropy',
              optimizer='adam',
              metrics=['accuracy'])

history = model.fit(x_train, y_train, batch_size=100, epochs=20, validation_data=(x_test,y_test))

print(f"\n Test Accuracy: {model.evaluate(x_test, y_test)[1]}")


In [None]:

y_vloss = history.history['val_loss']

y_loss = history.history['loss']

x_len = np.arange(len(y_loss))
plt.plot(x_len, y_vloss, marker = '.', c='red', label='Testset_loss')
plt.plot(x_len, y_loss, marker = '.', c='blue', label='Trainset_loss')

plt.legend(loc='upper right')
plt.grid()
plt.xlabel('epoch')
plt.ylabel('loss')
plt.show()