In [9]:
# Generowanie tekstu na podstawie wybranego modelu
# Autor: Rafał Klinowski
import numpy as np
from keras.models import load_model
from keras_preprocessing.text import Tokenizer
from keras.preprocessing.sequence import pad_sequences

# Funkcja generująca tekst
def generate_text(seed_text, next_words, model, max_sequence_len, tokenizer):
    for _ in range(next_words):
        token_list = tokenizer.texts_to_sequences([seed_text])[0]
        token_list = pad_sequences([token_list], maxlen=max_sequence_len-1, padding='pre')
        predicted_probs = model.predict(token_list)[0]
        predicted = np.random.choice(len(predicted_probs), p=predicted_probs)
        output_word = ""
        for word, index in tokenizer.word_index.items():
            if index == predicted:
                output_word = word
                break
        seed_text += " " + output_word
    return seed_text

# Załadowanie modelu z pliku
model = load_model("models/mickiewicz_pan_tadeusz.keras")

# Utworzenie tokenizera
tokenizer = Tokenizer()
pan_tadeusz = open("data/thaddeus/pan-tadeusz.txt", 'r', encoding="utf-8").read()
tokenizer.fit_on_texts([pan_tadeusz])

# Wygenerowanie tekstu
generated_text = generate_text("Litwo! Ojczyzno moja!", 100, model, 10, tokenizer)

[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 40ms/step
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 6ms/step
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 7ms/step
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 6ms/step
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 7ms/step
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 6ms/step
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 7ms/step
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 6ms/step
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 6ms/step
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 6ms/step
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 6ms/step
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 6ms/step
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 7ms/step
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 5ms/step
[1m1

In [10]:
# Wyświetlenie wygenerowanego tekstu
print(generated_text)

Litwo! Ojczyzno moja! klucznik — kwita tę nieco nic » to — mój kilka starych z złagodził na zapustach radzą i kota dwakroć różne powieści czyny gromada okulbaczyć instrumentem głosie kapitana rabinów rydza czarnym «nic cieniu rodzicach nad spoczynku — — kapelusz w ptactwa spuszcza się z daleka — świętą jak lecz o walce i gajowy przerwana — wyciąga » » hrabia gerwazy układał tam na drugim uśmiechał w gałka polityczny kota w powieści protazeńku» — sagalas stołu — rejent rzekł «panie głosem pan hrabia » wskrzeszona » tę cztery chwyta — gerwazy wracają z mego walce i miejsce i mam grzechy z


In [None]:
# Problemy z powyższym:
# - dokładność predykcji
# - występowanie symboli, które nie powinny występować w zestawie treningowym (m.in. '-' czy '«')
# - brak znaków interpunkcyjnych
# - wszystkie wygenerowane litery są małe

In [11]:
# Inna próba dla modelu z Ballad
# Załadowanie modelu z pliku
import os

model = load_model("models/mickiewicz_ballads.keras")

# Wczytanie ballad dla tokenizera
files = os.listdir("data/ballads")
ballads = ""
for file in files:
    with open("data/ballads/" + file, 'r', encoding="utf-8") as f:
        ballads += f.read().lower()

# Utworzenie tokenizera
tokenizer = Tokenizer()
tokenizer.fit_on_texts([ballads])

# Wygenerowanie tekstu na podstawie ballady, która nie jest w zestawie treningowym
generated_text = generate_text("Ja umieram. Ja nie płaczę. I wy chciejcie ulżyć sobie.", 100, model, 10, tokenizer)

[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 43ms/step
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 6ms/step
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 6ms/step
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 6ms/step
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 6ms/step
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 6ms/step
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 6ms/step
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 6ms/step
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 6ms/step
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 6ms/step
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 6ms/step
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 5ms/step
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 7ms/step
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 6ms/step
[1m1

In [12]:
# Wyświetlenie wygenerowanego tekstu
print(generated_text)

Ja umieram. Ja nie płaczę. I wy chciejcie ulżyć sobie. jak wszystkie trupa ach dosyć więcej z błędny oboje sam znika gęby nożem jak rzymu cudu pęknie dwa pusty chwile zniosą ściemniało chcą nowogródzkiej „hulaj gębie pustynie z kościoła niebie dziewicy zawiązkę lichtarzu szyjka nieskończona do domu stronie dzieciątku emroda dzika józio ziewy pasterce jęku „młodzieńcy tatem — baśniach drogę podłogę wylata świat pora gołąb toczy innych pełnym samki bojów skąpany łożem miarę ciżbą namówili poda” dziwy ona sobie i stolicę ach nie dla dzikich szczypie pójdźcie ach słyszę obiega ukosem śnie nawzajem już — młody sięga rady mieszkańców twojego wezwać odpycha odpycha skacze i z kosza zostanie głąb topieli
