In [2]:
import numpy as np
import os

from keras.models import Sequential
from keras.layers import SimpleRNN, Dense
from keras.utils import to_categorical

In [5]:
fd = open('corpus.txt', 'r')
text = fd.read()
text

'\n딥 러닝이란 무엇인가요?\n우리의 일상에서 머신러닝, 딥 러닝 또는 인공지능과 같은 용어가 활용되는 사례가 늘고 있습니다. 이 용어들은 정확히 무엇을 의미하며 구체적으로 어떤 분야에서 활용될까요?\nBasler는 "기계는 어떻게 학습하나요? "를 통해 머신러닝에 대한 기초적인 내용과 머신러닝이 신경망을 이용해 지능화되는 원리에 대해 설명합니다. 이 문서에서는 머신러닝의 하위 분야 각각에 대해 자세히 살펴보고 이 주제와 관련하여 반복적으로 사용되는 다양한 기술 용어에 대해 설명하고자 합니다. 머신러닝의 하위 분야인 딥 러닝은 인공지능의 한 분야로 간주됩니다.\n1. 인공지능(AI)\nAI는 일반적으로 기계 또는 일반적으로 컴퓨터 프로그램을 통해 인간 행동의 구조를 모방하거나 복제하는 것을 가리킵니다. AI라는 용어는 전문가 시스템, 패턴 분석 시스템 또는 로봇 공학 등 다양한 하위 분야에서 사용됩니다. AI 기반의 시스템은 인간의 행동과 의사 결정 구조를 모방하거나 모델링하기 위해 통계학적 알고리즘, 휴리스틱 절차, 인공 신경망(ANN) 또는 그 밖의 머신러닝 변형 등 다양한 방법을 활용합니다.\n2. 머신러닝\nAI의 하위 분야인 머신러닝은 복수의 예시 데이터에서 일반적인 규칙을 도출하기 위한 자동화된 절차로 구성됩니다. 즉, 예시 데이터로부터 규칙이 "학습"됩니다. 이러한 작업은 사전 정의되고 이해하기 쉬운 알고리즘과 규칙을 적용하여 수행되거나, 딥 러닝의 경우 인공 신경망을 사용하여 수행됩니다. 머신러닝은 지도 학습과 비지도 학습으로 구분됩니다. 지도 학습에서 학습을 위한 샘플 데이터는 입력값과 대응되는 예상 결과(예: 분류)를 모두 포함하는 반면, 비지도 학습에서는 시스템이 입력값 자체에서 가능한 결과를 식별합니다.\n'

In [6]:
chars = sorted(list(set(text)))

char_to_idx = {char: idx for idx, char in enumerate(chars)}
idx_to_char = {idx: char for idx, char in enumerate(chars)}


voca_size = len(chars)
print("voca size:", voca_size)

voca size: 183


In [7]:
char_to_idx

{'\n': 0,
 ' ': 1,
 '"': 2,
 '(': 3,
 ')': 4,
 ',': 5,
 '.': 6,
 '1': 7,
 '2': 8,
 ':': 9,
 '?': 10,
 'A': 11,
 'B': 12,
 'I': 13,
 'N': 14,
 'a': 15,
 'e': 16,
 'l': 17,
 'r': 18,
 's': 19,
 '가': 20,
 '각': 21,
 '간': 22,
 '값': 23,
 '같': 24,
 '거': 25,
 '것': 26,
 '게': 27,
 '결': 28,
 '경': 29,
 '계': 30,
 '고': 31,
 '공': 32,
 '과': 33,
 '관': 34,
 '구': 35,
 '규': 36,
 '그': 37,
 '기': 38,
 '까': 39,
 '나': 40,
 '내': 41,
 '는': 42,
 '늘': 43,
 '능': 44,
 '니': 45,
 '닝': 46,
 '다': 47,
 '대': 48,
 '데': 49,
 '델': 50,
 '도': 51,
 '동': 52,
 '되': 53,
 '된': 54,
 '될': 55,
 '됩': 56,
 '두': 57,
 '들': 58,
 '등': 59,
 '딥': 60,
 '떤': 61,
 '떻': 62,
 '또': 63,
 '라': 64,
 '란': 65,
 '램': 66,
 '러': 67,
 '력': 68,
 '련': 69,
 '례': 70,
 '로': 71,
 '류': 72,
 '를': 73,
 '리': 74,
 '링': 75,
 '망': 76,
 '머': 77,
 '며': 78,
 '면': 79,
 '명': 80,
 '모': 81,
 '무': 82,
 '문': 83,
 '미': 84,
 '밖': 85,
 '반': 86,
 '방': 87,
 '법': 88,
 '변': 89,
 '별': 90,
 '보': 91,
 '복': 92,
 '봇': 93,
 '부': 94,
 '분': 95,
 '비': 96,
 '사': 97,
 '살': 98,
 '상': 99,
 '샘': 100

In [8]:
# 하이퍼파라미터
seq_length = 5

# 데이터 전처리
input_data = []
target_data = []

for i in range(len(text) - seq_length):
    input_seq = text[i : i + seq_length]
    target_char = text[i + seq_length]
    
    input_data.append([char_to_idx[char] for char in input_seq])
    target_data.append(char_to_idx[target_char])

input_data = np.array(input_data)
target_data = to_categorical(target_data, num_classes=len(chars))

In [12]:
# 모델 생성
model = Sequential()
model.add(SimpleRNN(64, input_shape=(seq_length, 1), activation="relu"))
model.add(Dense(voca_size, activation="softmax"))

# 모델 컴파일
model.compile(optimizer="adam", loss="categorical_crossentropy", metrics=["accuracy"])

# 모델 학습
model.fit(input_data, target_data, epochs=500, batch_size=1, verbose=2)

Epoch 1/500


2023-04-19 16:29:29.982679: I tensorflow/compiler/xla/stream_executor/cuda/cuda_gpu_executor.cc:996] successful NUMA node read from SysFS had negative value (-1), but there must be at least one NUMA node, so returning NUMA node zero. See more at https://github.com/torvalds/linux/blob/v6.0/Documentation/ABI/testing/sysfs-bus-pci#L344-L355
2023-04-19 16:29:29.983499: W tensorflow/core/common_runtime/gpu/gpu_device.cc:1956] Cannot dlopen some GPU libraries. Please make sure the missing libraries mentioned above are installed properly if you would like to use GPU. Follow the guide at https://www.tensorflow.org/install/gpu for how to download and setup the required libraries for your platform.
Skipping registering GPU devices...
2023-04-19 16:29:30.403515: W tensorflow/core/grappler/utils/graph_view.cc:849] No registered '' OpKernel for CPU devices compatible with node {{node sequential/simple_rnn/while/body/_1/sequential/simple_rnn/while/simple_rnn_cell/Relu}}
	.  Registered:  <no register

855/855 - 1s - loss: 7.0603 - accuracy: 0.1485 - 1s/epoch - 2ms/step
Epoch 2/500
855/855 - 2s - loss: 4.4163 - accuracy: 0.2117 - 2s/epoch - 2ms/step
Epoch 3/500
855/855 - 3s - loss: 4.0120 - accuracy: 0.2175 - 3s/epoch - 3ms/step
Epoch 4/500
855/855 - 2s - loss: 3.7658 - accuracy: 0.2246 - 2s/epoch - 3ms/step
Epoch 5/500
855/855 - 1s - loss: 3.5622 - accuracy: 0.2246 - 1s/epoch - 1ms/step
Epoch 6/500
855/855 - 1s - loss: 3.3739 - accuracy: 0.2386 - 890ms/epoch - 1ms/step
Epoch 7/500
855/855 - 2s - loss: 3.1658 - accuracy: 0.2327 - 2s/epoch - 2ms/step
Epoch 8/500
855/855 - 1s - loss: 2.9881 - accuracy: 0.2456 - 1s/epoch - 1ms/step
Epoch 9/500
855/855 - 1s - loss: 2.8511 - accuracy: 0.2515 - 791ms/epoch - 926us/step
Epoch 10/500
855/855 - 2s - loss: 2.7475 - accuracy: 0.2620 - 2s/epoch - 2ms/step
Epoch 11/500
855/855 - 2s - loss: 2.6041 - accuracy: 0.2936 - 2s/epoch - 2ms/step
Epoch 12/500
855/855 - 1s - loss: 2.5085 - accuracy: 0.2994 - 804ms/epoch - 940us/step
Epoch 13/500
855/855 - 2

<keras.callbacks.History at 0x7f874c29a940>

In [15]:
# 문자 생성
seed = "딥 러닝이"  # 시드 문자열 길이를 seq_length와 동일하게 설정
generated_text = seed

input_seq = np.array( [char_to_idx[char] for char in seed] )
input_seq = input_seq.reshape(1, seq_length)


for _ in range(50):
    predicted_idx = np.argmax( model.predict(input_seq) )
    predicted_char = idx_to_char[predicted_idx]
    generated_text += predicted_char
    
    print('input_seq', input_seq)
    print('predicted_idx', predicted_idx)
    
    input_seq = np.concatenate((input_seq[:, 1:], np.array(predicted_idx).reshape(1, 1)), axis=1)

print("생성된 문장:", generated_text)

input_seq [[ 60   1  67  46 135]]
predicted_idx 78
input_seq [[  1  67  46 135  78]]
predicted_idx 1
input_seq [[ 67  46 135  78   1]]
predicted_idx 28
input_seq [[ 46 135  78   1  28]]
predicted_idx 92
input_seq [[135  78   1  28  92]]
predicted_idx 56
input_seq [[78  1 28 92 56]]
predicted_idx 46
input_seq [[ 1 28 92 56 46]]
predicted_idx 47
input_seq [[28 92 56 46 47]]
predicted_idx 6
input_seq [[92 56 46 47  6]]
predicted_idx 1
input_seq [[56 46 47  6  1]]
predicted_idx 151
input_seq [[ 46  47   6   1 151]]
predicted_idx 51
input_seq [[ 47   6   1 151  51]]
predicted_idx 1
input_seq [[  6   1 151  51   1]]
predicted_idx 171
input_seq [[  1 151  51   1 171]]
predicted_idx 110
input_seq [[151  51   1 171 110]]
predicted_idx 120
input_seq [[ 51   1 171 110 120]]
predicted_idx 101
input_seq [[  1 171 110 120 101]]
predicted_idx 1
input_seq [[171 110 120 101   1]]
predicted_idx 171
input_seq [[110 120 101   1 171]]
predicted_idx 110
input_seq [[120 101   1 171 110]]
predicted_idx 132
in

In [14]:
model.save('model/rnn.h5')