<a href="https://colab.research.google.com/github/juhumkwon/source_code/blob/main/A(10_1%EA%B0%95)_RNN_hihello.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

In [None]:

import tensorflow as tf
import numpy as np

# 데이터 준비
text = "hihello"
chars = sorted(set(text))  # 고유한 문자들 (['e', 'h', 'i', 'l', 'o'])
char_to_idx = {char: idx for idx, char in enumerate(chars)}  # 문자 -> 인덱스 변환
idx_to_char = {idx: char for idx, char in enumerate(chars)}  # 인덱스 -> 문자 변환

# 입력과 출력 데이터 생성
input_seq = [char_to_idx[char] for char in text[:-1]]  # 'hihell'에 해당하는 인덱스들
output_seq = [char_to_idx[char] for char in text[1:]]  # 'ihello'에 해당하는 인덱스들

# RNN 학습을 위해 입력 데이터를 (배치 크기, 타임스텝, 특징 수) 형태로 변환
input_seq = np.array(input_seq).reshape(1, -1)  # (1, 6)
output_seq = np.array(output_seq).reshape(1, -1)  # (1, 6)

# 하이퍼파라미터 정의
vocab_size = len(chars)  # 고유한 문자 개수
embedding_dim = 10  # 임베딩 차원
rnn_units = 50  # RNN 유닛 수

# 모델 구성
model = tf.keras.Sequential([
    tf.keras.layers.Embedding(vocab_size, embedding_dim, input_length=input_seq.shape[1]),
    tf.keras.layers.SimpleRNN(rnn_units, return_sequences=True),
    tf.keras.layers.Dense(vocab_size, activation='softmax')
])

# 모델 컴파일
model.compile(optimizer='adam', loss='sparse_categorical_crossentropy')

# 모델 학습
model.fit(input_seq, output_seq, epochs=500)

# 학습된 모델로 다음 문자 예측
def predict_next_char(input_char):
    input_idx = np.array([char_to_idx[input_char]]).reshape(1, 1)
    pred = model.predict(input_idx)
    pred_char = idx_to_char[np.argmax(pred)]
    return pred_char

# 'h'로 시작하는 문자열에 대해 다음 문자 예측
start_char = 'h'
predicted_char = predict_next_char(start_char)
print(f"Next character after '{start_char}' is: '{predicted_char}'")