In [1]:
import tensorflow as tf

import numpy as np
import os
import time

### Load Data

In [5]:
text = open('bncorpus200h.txt', 'rb').read().decode(encoding='utf-8')

vocab = sorted(set(text))
char2idx = {u:i for i, u in enumerate(vocab)}
idx2char = np.array(vocab)
text_as_int = np.array([char2idx[c] for c in text])

vocab_size = len(vocab)
embedding_dim = 256
rnn_units = 1024

### Build the Model and Restore the Last Checkpoint (Trained Model)

In [14]:
checkpoint_dir = './training_checkpoints'
checkpoint_prefix = os.path.join(checkpoint_dir, "ckpt_{epoch}")

def build_model(vocab_size, embedding_dim, rnn_units, batch_size):
    model = tf.keras.Sequential()
    model.add(tf.keras.layers.Embedding(vocab_size, embedding_dim, batch_input_shape=[batch_size, None]))
    model.add(tf.keras.layers.LSTM(rnn_units * 2, return_sequences=True, stateful=True))
    model.add(tf.keras.layers.LSTM(rnn_units * 2, return_sequences=True, stateful=True))
    model.add(tf.keras.layers.LSTM(rnn_units * 2, return_sequences=True, stateful=True))
    model.add(tf.keras.layers.Dense(vocab_size))
    return model

model = build_model(
    vocab_size=len(vocab),
    embedding_dim=embedding_dim,
    rnn_units=rnn_units,
    batch_size=1)

tf.train.latest_checkpoint(checkpoint_dir)
model = build_model(vocab_size, embedding_dim, rnn_units, batch_size=1)
model.load_weights(tf.train.latest_checkpoint(checkpoint_dir))
model.build(tf.TensorShape([1, None]))
model.summary()

'./training_checkpoints\\ckpt_27'

In [22]:
def generate_text(model, start_string, num_generate = 500, temperature = 0.1):
    # Converting our start string to numbers (vectorizing)
    input_eval = [char2idx[s] for s in start_string]
    input_eval = tf.expand_dims(input_eval, 0)

    # Empty string to store our results
    text_generated = []

    model.reset_states()
    for i in range(num_generate):
        predictions = model(input_eval)
        # remove the batch dimension
        predictions = tf.squeeze(predictions, 0)

        # using a categorical distribution to predict the character returned by the model
        predictions = predictions / temperature
        predicted_id = tf.random.categorical(predictions, num_samples=1)[-1,0].numpy()

        # Pass the predicted character as the next input to the model
        # along with the previous hidden state
        input_eval = tf.expand_dims([predicted_id], 0)

        text_generated.append(idx2char[predicted_id])

    return (start_string + ''.join(text_generated))

In [24]:
print(generate_text(model, temperature = 0.5, num_generate = 500, start_string= "laiklik"))

laiklik uyarılarına rağmen somut bir basın toplantısı düzenledi
sayın seyirciler ermeni soykırımı iddialarıyla ilgili tasarı konusunda anlaşma sağlandığını
ve avrupa birliği'nin terörizme ve pkk'ya karşı oluşturan sınır güvenliği programının ele alındığı altılı görüşmelere başladı
sarkozy ayaklanmıştı bu arada basra'da yürütülen operasyonlar kapsamında hayat ayından bu yana
amerikan kuvvetlerinin yeni komutanı orama amacıyla
yapılan görüşmelerin ardından başbakan erdoğan'ın açıklamalarını
ırak islam or
