<a href="https://colab.research.google.com/github/Jeorr/ML/blob/main/Lab3.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

In [None]:
!pip install gradio

# Завантаження необхідних бібліотек
import tensorflow as tf
import numpy as np
import os
import gradio as gr
from tensorflow.keras.callbacks import ModelCheckpoint
import glob


# Завантаження даних
url = 'https://storage.googleapis.com/download.tensorflow.org/data/shakespeare.txt'
path_to_file = tf.keras.utils.get_file('shakespeare.txt', url)

# Читання тексту
with open(path_to_file, 'r') as file:
    text = file.read()

text = ' '.join(text.split())  # Видаляє зайві пробіли

print(f'Довжина тексту: {len(text)} символів')
print(f'Приклад тексту:\n{text[:500]}')

# Унікальні символи у тексті
vocab = sorted(set(text))
print(f'Унікальних символів: {len(vocab)}')

# Створення словників символів
char2idx = {char: idx for idx, char in enumerate(vocab)}
idx2char = np.array(vocab)

# Векторизація тексту
text_as_int = np.array([char2idx[char] for char in text])

# Гіперпараметри
seq_length = 64  # Довжина послідовності
examples_per_epoch = len(text) // seq_length

# Створення тренувальних прикладів та міток
char_dataset = tf.data.Dataset.from_tensor_slices(text_as_int)
sequences = char_dataset.batch(seq_length + 1, drop_remainder=True)

def split_input_target(chunk):
    input_text = chunk[:-1]
    target_text = chunk[1:]
    return input_text, target_text

dataset = sequences.map(split_input_target)

# Параметри для підготовки даних
BATCH_SIZE = 64
BUFFER_SIZE = 10000

# Створення тренувальної вибірки
dataset = (
    dataset
    .shuffle(BUFFER_SIZE)
    .batch(BATCH_SIZE, drop_remainder=True)
)

# Створення моделі
vocab_size = len(vocab)  # Розмір словника
embedding_dim = 256  # Розмір векторного простору
rnn_units = 1024  # Кількість нейронів у RNN

# Шлях для збереження моделі
model_path = '/content/drive/MyDrive/ML/text_generation_model_v1.h5'
checkpoint_folder = "/content/drive/MyDrive/ML/checkpoints/text_generation_model_v1/"
checkpoint_path = checkpoint_folder + "{epoch:02d}.weights.h5"
checkpoint_callback = ModelCheckpoint(
    filepath=checkpoint_path,
    save_weights_only=True,  # Зберігайте лише ваги, щоб уникнути великих файлів
    save_freq='epoch',      # Зберігати після кожної епохи
    verbose=1
)

def build_model(vocab_size, embedding_dim, rnn_units, batch_size):
    return tf.keras.Sequential([
    tf.keras.layers.InputLayer(batch_input_shape=[batch_size, None]),
    tf.keras.layers.Embedding(vocab_size, embedding_dim, mask_zero=True),
    tf.keras.layers.LSTM(units=rnn_units,return_sequences=True,stateful=True,recurrent_initializer=tf.keras.initializers.GlorotNormal()),
    tf.keras.layers.Dense(vocab_size)
])

def loss(labels, logits):
    return tf.keras.losses.sparse_categorical_crossentropy(
      y_true=labels,
      y_pred=logits,
      from_logits=True
    )

if os.path.exists(model_path):
    print("Завантаження збереженої моделі...")
    model = build_model(vocab_size, embedding_dim, rnn_units, batch_size=BATCH_SIZE)
    model.load_weights(model_path)
    model.compile(optimizer='adam', loss='sparse_categorical_crossentropy', metrics=['accuracy'])
else:
    print("Модель не знайдена. Початок навчання...")
    model = build_model(vocab_size, embedding_dim, rnn_units, batch_size=BATCH_SIZE)

    # Компіляція моделі
    model.compile(optimizer='adam', loss=loss, metrics=['accuracy'])

    # Тренування
    EPOCHS = 110

    # Знаходимо останній чекпойнт
    latest_checkpoint = max(glob.glob(checkpoint_folder + "*.h5"), default=None)
    initial_epoch = 0;

    if latest_checkpoint:
        print(f"Завантаження моделі з чекпойнта {latest_checkpoint}")
        model.load_weights(latest_checkpoint)
        initial_epoch = int((latest_checkpoint.split('.')[0]).split('/')[-1])
    else:
        print("Чекпойнти не знайдено. Початок навчання з нуля.")

    history = model.fit(
        dataset,
        epochs=EPOCHS,
        initial_epoch=initial_epoch,
        callbacks=[checkpoint_callback]
    )

    # Збереження моделі
    model.save(model_path)
    print(f"Модель збережено як {model_path}")

# Завантаження збереженої моделі для генерації тексту
model = build_model(vocab_size, embedding_dim, rnn_units, batch_size=1)
model.load_weights(model_path)
model.build()

# Генерація тексту
def generate_text(start_string, num_generate=1000, temperature=1.0):
    # Перетворення стартового рядка в числовий вектор
    input_eval = [char2idx[s] for s in start_string]
    input_eval = tf.expand_dims(input_eval, 0)  # Додаємо вимір для batch

    text_generated = []  # Список для збереження згенерованих символів

    # Генерація символів
    for _ in range(num_generate):
        # Передбачення наступного символу
        predictions = model(input_eval)
        predictions = tf.squeeze(predictions, 0)  # Видаляємо вимір пакету
        predictions = predictions / temperature  # Налаштування температури

        # Вибір наступного символу на основі ймовірностей
        predicted_id = tf.random.categorical(predictions, num_samples=1)[-1, 0].numpy()

        # Оновлення вхідного рядка
        input_eval = tf.expand_dims([predicted_id], 0)

        # Додавання згенерованого символу до результату
        text_generated.append(idx2char[predicted_id])

    return start_string + ''.join(text_generated)

# тестуємо
print(generate_text('Romeo: ', 500, 0.4))

# Створення інтерфейсу
gr.Interface(
    fn=generate_text,
    inputs=[
        gr.Textbox(lines=2, placeholder="Введіть початковий текст...", label="Стартовий текст"),
        gr.Slider(100, 1000, step=100, label="Кількість символів"),
        gr.Slider(0.1, 2.0, step=0.1, value=1.0, label="Температура"),
    ],
    outputs="text",
    title="Генерація тексту на основі Шекспіра",
    description="Введіть стартовий текст і налаштуйте параметри генерації.",
).launch(debug=True)

Collecting gradio
  Downloading gradio-5.8.0-py3-none-any.whl.metadata (16 kB)
Collecting aiofiles<24.0,>=22.0 (from gradio)
  Downloading aiofiles-23.2.1-py3-none-any.whl.metadata (9.7 kB)
Collecting fastapi<1.0,>=0.115.2 (from gradio)
  Downloading fastapi-0.115.6-py3-none-any.whl.metadata (27 kB)
Collecting ffmpy (from gradio)
  Downloading ffmpy-0.4.0-py3-none-any.whl.metadata (2.9 kB)
Collecting gradio-client==1.5.1 (from gradio)
  Downloading gradio_client-1.5.1-py3-none-any.whl.metadata (7.1 kB)
Collecting markupsafe~=2.0 (from gradio)
  Downloading MarkupSafe-2.1.5-cp310-cp310-manylinux_2_17_x86_64.manylinux2014_x86_64.whl.metadata (3.0 kB)
Collecting pydub (from gradio)
  Downloading pydub-0.25.1-py2.py3-none-any.whl.metadata (1.4 kB)
Collecting python-multipart>=0.0.18 (from gradio)
  Downloading python_multipart-0.0.19-py3-none-any.whl.metadata (1.8 kB)
Collecting ruff>=0.2.2 (from gradio)
  Downloading ruff-0.8.2-py3-none-manylinux_2_17_x86_64.manylinux2014_x86_64.whl.metad

  saveable.load_own_variables(weights_store.get(inner_path))


[1m266/266[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 5s/step - accuracy: 0.7285 - loss: 0.4898
Epoch 99: saving model to /content/drive/MyDrive/ML/checkpoints/text_generation_model_v1/99.weights.h5
[1m266/266[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m1411s[0m 5s/step - accuracy: 0.7285 - loss: 0.4899
Epoch 100/110
[1m266/266[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 6s/step - accuracy: 0.7277 - loss: 0.4806
Epoch 100: saving model to /content/drive/MyDrive/ML/checkpoints/text_generation_model_v1/100.weights.h5
[1m266/266[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m1519s[0m 6s/step - accuracy: 0.7277 - loss: 0.4806
Epoch 101/110
[1m266/266[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 5s/step - accuracy: 0.7305 - loss: 0.4639
Epoch 101: saving model to /content/drive/MyDrive/ML/checkpoints/text_generation_model_v1/101.weights.h5
[1m266/266[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m1476s[0m 5s/step - accuracy: 0.7305 - loss: 0.4639
Ep



Модель збережено як /content/drive/MyDrive/ML/text_generation_model_v1.h5
Romeo:  Now Lord joy &, I go; Unsued upon, , unto , let I'll Walk -bord &ubon, Knows love which &CIO: death, Zeep VINCENTIO: she affection xtremes? his last of King LUCIO: Come, be ar France: Grey post Berchance Flent, Such despair, Because quarrel QULIET: No, zen; Come --o, he y GREMIO: if Leccuse Warwick! . zents rise On Your ; Son A: Great her comes. Capulet! BENVOLIO: Strike, was Xuthonour, . Therefore $ose:  r : men ry maid, discontent to your grace of one known zell?  . murder OSPERO: Faith, come
Running Gradio in a Colab notebook requires sharing enabled. Automatically setting `share=True` (you can turn this off by setting `share=False` in `launch()` explicitly).

Colab notebook detected. This cell will run indefinitely so that you can see errors and logs. To turn off, set debug=False in launch().
* Running on public URL: https://caf8f004cfc265f921.gradio.live

This share link expires in 72 hours. For free