In [1]:
import numpy as np
import tensorflow as tf
from tensorflow.keras.preprocessing.sequence import pad_sequences
from tensorflow.keras.utils import to_categorical

# Wczytanie danych z pliku
file_path = 'pol.txt'
with open(file_path, 'r', encoding='utf-8') as f:
    lines = f.readlines()

# Ograniczenie do pierwszych 10 000 zdań
max_samples = 10000
lines = lines[:max_samples]

# Podzielenie na listy zdań w języku angielskim i polskim
input_texts = []  # Zdania w języku angielskim
target_texts = []  # Zdania w języku polskim

for line in lines:
    try:
        en, pl, _ = line.split('\t') 
        input_texts.append(en.strip().split())
        target_texts.append(['<start>'] + pl.strip().split() + ['<end>'])
    except ValueError:
        continue 

# Sprawdzenie wczytanych danych
print(f"Przykładowe zdanie w języku angielskim: {input_texts[0]}")
print(f"Przykładowe zdanie w języku polskim: {target_texts[0]}")
print(f"Łączna liczba wczytanych par zdań: {len(input_texts)}")


Przykładowe zdanie w języku angielskim: ['Go.']
Przykładowe zdanie w języku polskim: ['<start>', 'Idź.', '<end>']
Łączna liczba wczytanych par zdań: 10000


In [2]:
# Utworzenie słowników
input_vocab = set(word for sentence in input_texts for word in sentence)
target_vocab = set(word for sentence in target_texts for word in sentence)

input_word2idx = {word: idx for idx, word in enumerate(sorted(input_vocab))}
target_word2idx = {word: idx for idx, word in enumerate(sorted(target_vocab))}

input_idx2word = {idx: word for word, idx in input_word2idx.items()}
target_idx2word = {idx: word for word, idx in target_word2idx.items()}

# Sprawdzenie długości słowników
print(f"Liczba unikalnych słów w języku angielskim: {len(input_vocab)}")
print(f"Liczba unikalnych słów w języku polskim: {len(target_vocab)}")

# Maksymalna długość sekwencji
max_input_seq_length = max(len(sentence) for sentence in input_texts)
max_target_seq_length = max(len(sentence) for sentence in target_texts)

print(f"Maksymalna długość sekwencji w języku angielskim: {max_input_seq_length}")
print(f"Maksymalna długość sekwencji w języku polskim: {max_target_seq_length}")


Liczba unikalnych słów w języku angielskim: 4485
Liczba unikalnych słów w języku polskim: 8001
Maksymalna długość sekwencji w języku angielskim: 6
Maksymalna długość sekwencji w języku polskim: 11


In [3]:
# Przygotowanie danych wejściowych i docelowych
encoder_input_data = [
    [input_word2idx[word] for word in sentence] for sentence in input_texts
]
decoder_input_data = [
    [target_word2idx[word] for word in sentence] for sentence in target_texts
]
decoder_target_data = [
    sentence[1:] for sentence in decoder_input_data 
]

# Uzupełnianie sekwencji paddingiem
encoder_input_data = pad_sequences(encoder_input_data, maxlen=max_input_seq_length, padding="post")
decoder_input_data = pad_sequences(decoder_input_data, maxlen=max_target_seq_length, padding="post")
decoder_target_data = pad_sequences(decoder_target_data, maxlen=max_target_seq_length, padding="post")

# One-hot encoding danych docelowych
decoder_target_data = to_categorical(decoder_target_data, num_classes=len(target_vocab))

print("Dane wejściowe i docelowe zostały przygotowane.")


Dane wejściowe i docelowe zostały przygotowane.


In [None]:
from tensorflow.keras.layers import Input, LSTM, Dropout
from tensorflow.keras.models import Model
from tensorflow.keras.callbacks import EarlyStopping

# Liczba jednostek w warstwach LSTM
latent_dim = 256

# Enkoder
encoder_inputs = Input(shape=(max_input_seq_length,))  
embedded_encoder_inputs = tf.keras.layers.Embedding(input_dim=len(input_vocab), output_dim=latent_dim)(encoder_inputs)

# Warstwy LSTM z Dropout
encoder_lstm1 = LSTM(latent_dim, return_sequences=True, return_state=True, dropout=0.2)
encoder_outputs, _, _ = encoder_lstm1(embedded_encoder_inputs)

encoder_lstm2 = LSTM(latent_dim, return_sequences=True, return_state=True, dropout=0.2)
encoder_outputs, _, _ = encoder_lstm2(encoder_outputs)

encoder_lstm3 = LSTM(latent_dim, return_sequences=False, return_state=True, dropout=0.2)
encoder_outputs, state_h, state_c = encoder_lstm3(encoder_outputs)

# Stany enkodera (do przekazania do dekodera)
encoder_states = [state_h, state_c]

# Callback EarlyStopping
early_stopping = EarlyStopping(monitor='val_loss', patience=5, restore_best_weights=True)

# Model enkodera
encoder_model = Model(inputs=encoder_inputs, outputs=encoder_states)

# Wyświetlenie struktury enkodera
encoder_model.summary()



In [6]:
from tensorflow.keras.layers import Embedding, Dense

# Dekoder
decoder_inputs = Input(shape=(max_target_seq_length,))
embedded_decoder_inputs = Embedding(input_dim=len(target_vocab), output_dim=latent_dim)(decoder_inputs)

# Warstwy LSTM z Dropout
decoder_lstm1 = LSTM(latent_dim, return_sequences=True, return_state=True, dropout=0.2)
decoder_outputs, _, _ = decoder_lstm1(embedded_decoder_inputs, initial_state=encoder_states)

decoder_lstm2 = LSTM(latent_dim, return_sequences=True, return_state=True, dropout=0.2)
decoder_outputs, _, _ = decoder_lstm2(decoder_outputs)

decoder_lstm3 = LSTM(latent_dim, return_sequences=True, return_state=True, dropout=0.2)
decoder_outputs, _, _ = decoder_lstm3(decoder_outputs)

# Warstwa Dense dla przewidywania słów
decoder_dense = Dense(len(target_vocab), activation="softmax")
decoder_outputs = decoder_dense(decoder_outputs)

# Tworzenie pełnego modelu Seq2Seq
model = Model([encoder_inputs, decoder_inputs], decoder_outputs)

# Wyświetlenie struktury modelu Seq2Seq
model.summary()


In [9]:
model.compile(optimizer="adam", loss="categorical_crossentropy", metrics=["accuracy"])
model.summary()



In [13]:
# Trening modelu Seq2Seq z informacjami o postępie
history = model.fit(
    [encoder_input_data, decoder_input_data],
    decoder_target_data,
    batch_size=64,
    epochs=50,
    validation_split=0.2,
    callbacks=[early_stopping],
    verbose=1 
)

print(f"Najniższa strata walidacyjna: {min(history.history['val_loss']):.4f}")
if 'val_accuracy' in history.history:
    print(f"Najwyższa dokładność walidacyjna: {max(history.history['val_accuracy']):.4f}")

import matplotlib.pyplot as plt

plt.plot(history.history['loss'], label='Train Loss')
plt.plot(history.history['val_loss'], label='Validation Loss')
plt.title('Loss During Training')
plt.xlabel('Epochs')
plt.ylabel('Loss')
plt.legend()
plt.show()

if 'accuracy' in history.history:
    plt.plot(history.history['accuracy'], label='Train Accuracy')
    plt.plot(history.history['val_accuracy'], label='Validation Accuracy')
    plt.title('Accuracy During Training')
    plt.xlabel('Epochs')
    plt.ylabel('Accuracy')
    plt.legend()
    plt.show()


Epoch 1/50
[1m125/125[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m60s[0m 461ms/step - accuracy: 0.7252 - loss: 1.9276 - val_accuracy: 0.6448 - val_loss: 2.5910
Epoch 2/50
[1m125/125[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m55s[0m 437ms/step - accuracy: 0.7253 - loss: 1.8530 - val_accuracy: 0.6450 - val_loss: 2.6484
Epoch 3/50
[1m125/125[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m54s[0m 433ms/step - accuracy: 0.7268 - loss: 1.8147 - val_accuracy: 0.6450 - val_loss: 2.6118
Epoch 4/50
[1m125/125[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m53s[0m 427ms/step - accuracy: 0.7274 - loss: 1.7832 - val_accuracy: 0.6450 - val_loss: 2.5892
Epoch 5/50
[1m125/125[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m53s[0m 424ms/step - accuracy: 0.7438 - loss: 1.7282 - val_accuracy: 0.7065 - val_loss: 2.4340
Epoch 6/50
[1m125/125[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m52s[0m 417ms/step - accuracy: 0.7708 - loss: 1.6057 - val_accuracy: 0.7117 - val_loss: 2.3644
Epoch 7/50

KeyboardInterrupt: 

In [None]:
# Model enkodera (do przewidywania stanów ukrytych)
encoder_model = Model(encoder_inputs, encoder_states)

# Model dekodera (do przewidywania sekwencji wyjściowej)
decoder_state_input_h = Input(shape=(latent_dim,))
decoder_state_input_c = Input(shape=(latent_dim,))
decoder_states_inputs = [decoder_state_input_h, decoder_state_input_c]

embedded_decoder_inputs = Embedding(input_dim=len(target_vocab), output_dim=latent_dim)(decoder_inputs)

decoder_lstm1_output, state_h1, state_c1 = decoder_lstm1(embedded_decoder_inputs, initial_state=decoder_states_inputs)
decoder_lstm2_output, state_h2, state_c2 = decoder_lstm2(decoder_lstm1_output)
decoder_lstm3_output, state_h3, state_c3 = decoder_lstm3(decoder_lstm2_output)

decoder_states = [state_h3, state_c3]
decoder_outputs = decoder_dense(decoder_lstm3_output)

decoder_model = Model(
    [decoder_inputs] + decoder_states_inputs,
    [decoder_outputs] + decoder_states
)

print("Model dekodera został zbudowany.")


In [12]:
def decode_sequence(input_seq):
    # Kodowanie danych wejściowych
    states_value = encoder_model.predict(input_seq)
    
    # Zainicjowanie sekwencji dekodera (z tokenem <start>)
    target_seq = np.zeros((1, 1))
    target_seq[0, 0] = target_word2idx['<start>']
    
    # Dekodowanie iteracyjne
    stop_condition = False
    decoded_sentence = []
    while not stop_condition:
        output_tokens, h, c = decoder_model.predict([target_seq] + states_value)
        
        # Wybranie przewidywanego słowa
        sampled_token_index = np.argmax(output_tokens[0, -1, :])
        sampled_word = target_idx2word[sampled_token_index]
        decoded_sentence.append(sampled_word)
        
        # Wyjście z pętli, gdy osiągnięty zostanie <end> lub maksymalna długość
        if sampled_word == '<end>' or len(decoded_sentence) > max_target_seq_length:
            stop_condition = True
        
        # Zaktualizowanie sekwencji wejściowej dekodera
        target_seq = np.zeros((1, 1))
        target_seq[0, 0] = sampled_token_index
        
        # Zaktualizowanie stanów ukrytych
        states_value = [h, c]
    
    return ' '.join(decoded_sentence[:-1])  # Pomijamy token <end> w wyniku

# Przykładowe testy
for seq_index in range(5):  # Testujemy na pierwszych 5 zdaniach
    input_seq = encoder_input_data[seq_index: seq_index + 1]
    decoded_sentence = decode_sequence(input_seq)
    
    print("Input sentence:", ' '.join(input_texts[seq_index]))
    print("Decoded sentence:", decoded_sentence)
    print("Target sentence:", ' '.join(target_texts[seq_index][1:-1]))  # Pomijamy <start> i <end>
    print("-" * 50)


[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m1s[0m 1s/step


NameError: name 'decoder_model' is not defined

In [None]:
# Filtrujemy tylko zdania z więcej niż jednym słowem
filtered_input_texts = [sentence for sentence in input_texts if len(sentence) > 1]
filtered_target_texts = [sentence for sentence, input_sentence in zip(target_texts, input_texts) if len(input_sentence) > 1]

# Testowanie dla wybranych zdań (np. od 20 do 25)
for seq_index in range(20, 25):
    if seq_index >= len(filtered_input_texts):  # Zapobiegamy wyjściu poza zakres
        break
    input_seq = encoder_input_data[seq_index: seq_index + 1]
    decoded_sentence = decode_sequence(input_seq)
    
    print("Input sentence:", ' '.join(filtered_input_texts[seq_index]))
    print("Decoded sentence:", decoded_sentence)
    print("Target sentence:", ' '.join(filtered_target_texts[seq_index][1:-1]))  # Pomijamy <start> i <end>
    print("-" * 50)


caly plik

In [14]:
# Wczytanie pełnego zbioru danych
with open('pol.txt', 'r', encoding='utf-8') as f:
    lines = f.readlines()

# Podział na zdania w języku angielskim i polskim
input_texts = []
target_texts = []

for line in lines:
    try:
        en, pl, _ = line.strip().split('\t')
        input_texts.append(en.strip().split())
        target_texts.append(['<start>'] + pl.strip().split() + ['<end>'])
    except ValueError:
        continue  # Pomijanie błędnych linii

print(f"Pełny zbiór danych wczytany: {len(input_texts)} zdań.")


Pełny zbiór danych wczytany: 49943 zdań.


In [15]:
# Budowa słowników na pełnym zbiorze danych
input_vocab = set(word for sentence in input_texts for word in sentence)
target_vocab = set(word for sentence in target_texts for word in sentence)

input_word2idx = {word: idx for idx, word in enumerate(sorted(input_vocab))}
target_word2idx = {word: idx for idx, word in enumerate(sorted(target_vocab))}

input_idx2word = {idx: word for word, idx in input_word2idx.items()}
target_idx2word = {idx: word for word, idx in target_word2idx.items()}

print(f"Liczba unikalnych słów w języku angielskim: {len(input_vocab)}")
print(f"Liczba unikalnych słów w języku polskim: {len(target_vocab)}")


Liczba unikalnych słów w języku angielskim: 16385
Liczba unikalnych słów w języku polskim: 37416


In [17]:
from tensorflow.keras.preprocessing.sequence import pad_sequences

# Przygotowanie danych wejściowych i docelowych
encoder_input_data = [
    [input_word2idx[word] for word in sentence] for sentence in input_texts
]
decoder_input_data = [
    [target_word2idx[word] for word in sentence] for sentence in target_texts
]
decoder_target_data = [
    sentence[1:] for sentence in decoder_input_data  # Przesunięcie o jeden w prawo
]

# Uzupełnianie sekwencji paddingiem
encoder_input_data = pad_sequences(encoder_input_data, padding="post")
decoder_input_data = pad_sequences(decoder_input_data, padding="post")
decoder_target_data = pad_sequences(decoder_target_data, padding="post")

# Dane docelowe pozostają w formacie indeksów (bez one-hot encodingu)
# Model przyjmuje indeksy i mapuje je na embeddingi, więc one-hot encoding nie jest potrzebny

print("Dane zostały przygotowane na pełnym zbiorze bez one-hot encodingu.")


Dane zostały przygotowane na pełnym zbiorze bez one-hot encodingu.


In [20]:
# Obliczenie nowych maksymalnych długości sekwencji
max_input_seq_length = max(len(sentence) for sentence in input_texts)
max_target_seq_length = max(len(sentence) for sentence in target_texts)

print(f"Nowa maksymalna długość sekwencji w języku angielskim: {max_input_seq_length}")
print(f"Nowa maksymalna długość sekwencji w języku polskim: {max_target_seq_length}")

# Ponowne przygotowanie danych wejściowych z nowymi długościami
encoder_input_data = pad_sequences(
    [[input_word2idx[word] for word in sentence] for sentence in input_texts],
    maxlen=max_input_seq_length,
    padding="post"
)

decoder_input_data = pad_sequences(
    [[target_word2idx[word] for word in sentence] for sentence in target_texts],
    maxlen=max_target_seq_length,
    padding="post"
)

decoder_target_data = pad_sequences(
    [[target_word2idx[word] for word in sentence[1:]] for sentence in target_texts],
    maxlen=max_target_seq_length,
    padding="post"
)

# Dane docelowe bez one-hot encodingu (indeksy)
print("Dane wejściowe i docelowe zostały ponownie przygotowane.")


Nowa maksymalna długość sekwencji w języku angielskim: 47
Nowa maksymalna długość sekwencji w języku polskim: 48
Dane wejściowe i docelowe zostały ponownie przygotowane.


In [22]:
# Obliczenie nowych maksymalnych długości sekwencji
max_input_seq_length = max(len(sentence) for sentence in input_texts)
max_target_seq_length = max(len(sentence) for sentence in target_texts)

print(f"Nowa maksymalna długość sekwencji w języku angielskim: {max_input_seq_length}")
print(f"Nowa maksymalna długość sekwencji w języku polskim: {max_target_seq_length}")


Nowa maksymalna długość sekwencji w języku angielskim: 47
Nowa maksymalna długość sekwencji w języku polskim: 48


In [23]:
from tensorflow.keras.layers import Input, LSTM, Embedding, Dropout

# Enkoder
encoder_inputs = Input(shape=(max_input_seq_length,))
embedded_encoder_inputs = Embedding(input_dim=len(input_vocab), output_dim=latent_dim)(encoder_inputs)

encoder_lstm1 = LSTM(latent_dim, return_sequences=True, return_state=True, dropout=0.2)
encoder_outputs, state_h1, state_c1 = encoder_lstm1(embedded_encoder_inputs)

encoder_lstm2 = LSTM(latent_dim, return_sequences=True, return_state=True, dropout=0.2)
encoder_outputs, state_h2, state_c2 = encoder_lstm2(encoder_outputs)

encoder_states = [state_h2, state_c2]


In [24]:
from tensorflow.keras.layers import Input, LSTM, Embedding, Dropout

# Enkoder
encoder_inputs = Input(shape=(max_input_seq_length,))
embedded_encoder_inputs = Embedding(input_dim=len(input_vocab), output_dim=latent_dim)(encoder_inputs)

encoder_lstm1 = LSTM(latent_dim, return_sequences=True, return_state=True, dropout=0.2)
encoder_outputs, state_h1, state_c1 = encoder_lstm1(embedded_encoder_inputs)

encoder_lstm2 = LSTM(latent_dim, return_sequences=True, return_state=True, dropout=0.2)
encoder_outputs, state_h2, state_c2 = encoder_lstm2(encoder_outputs)

encoder_states = [state_h2, state_c2]


In [25]:
# Dekoder
decoder_inputs = Input(shape=(max_target_seq_length,))
embedded_decoder_inputs = Embedding(input_dim=len(target_vocab), output_dim=latent_dim)(decoder_inputs)

decoder_lstm1 = LSTM(latent_dim, return_sequences=True, return_state=True, dropout=0.2)
decoder_outputs, _, _ = decoder_lstm1(embedded_decoder_inputs, initial_state=encoder_states)

decoder_dense = Dense(len(target_vocab), activation="softmax")
decoder_outputs = decoder_dense(decoder_outputs)


In [26]:
# Model Seq2Seq
model = Model([encoder_inputs, decoder_inputs], decoder_outputs)

# Kompilacja
model.compile(optimizer="adam", loss="sparse_categorical_crossentropy", metrics=["accuracy"])

print("Model został przebudowany.")
model.summary()


Model został przebudowany.


In [29]:
# Resetowanie sesji TensorFlow
import tensorflow as tf
tf.keras.backend.clear_session()

# Budowa modelu z nowymi długościami sekwencji
from tensorflow.keras.layers import Input, LSTM, Embedding, Dense, Dropout
from tensorflow.keras.models import Model

latent_dim = 256

# Enkoder
encoder_inputs = Input(shape=(max_input_seq_length,))
embedded_encoder_inputs = Embedding(input_dim=len(input_vocab), output_dim=latent_dim)(encoder_inputs)
encoder_lstm1 = LSTM(latent_dim, return_sequences=True, return_state=True, dropout=0.2)
encoder_outputs, state_h1, state_c1 = encoder_lstm1(embedded_encoder_inputs)
encoder_lstm2 = LSTM(latent_dim, return_sequences=True, return_state=True, dropout=0.2)
encoder_outputs, state_h2, state_c2 = encoder_lstm2(encoder_outputs)
encoder_states = [state_h2, state_c2]

# Dekoder
decoder_inputs = Input(shape=(max_target_seq_length,))
embedded_decoder_inputs = Embedding(input_dim=len(target_vocab), output_dim=latent_dim)(decoder_inputs)
decoder_lstm1 = LSTM(latent_dim, return_sequences=True, return_state=True, dropout=0.2)
decoder_outputs, _, _ = decoder_lstm1(embedded_decoder_inputs, initial_state=encoder_states)
decoder_dense = Dense(len(target_vocab), activation="softmax")
decoder_outputs = decoder_dense(decoder_outputs)

# Model Seq2Seq
model = Model([encoder_inputs, decoder_inputs], decoder_outputs)

# Kompilacja modelu
model.compile(optimizer="adam", loss="sparse_categorical_crossentropy", metrics=["accuracy"])

print("Model został zbudowany i skompilowany od nowa.")
model.summary()

# Trenowanie modelu Seq2Seq
history = model.fit(
    [encoder_input_data, decoder_input_data],
    decoder_target_data,
    batch_size=64,
    epochs=50,
    validation_split=0.2,
    callbacks=[early_stopping],
    verbose=1
)

# Wyświetlenie statystyk po treningu
print("\n=== Statystyki treningu ===")
print(f"Najniższa strata treningowa: {min(history.history['loss']):.4f}")
print(f"Najniższa strata walidacyjna: {min(history.history['val_loss']):.4f}")

# Wizualizacja wyników treningu
import matplotlib.pyplot as plt

plt.plot(history.history['loss'], label='Train Loss')
plt.plot(history.history['val_loss'], label='Validation Loss')
plt.title('Loss During Training')
plt.xlabel('Epochs')
plt.ylabel('Loss')
plt.legend()
plt.show()



Model został zbudowany i skompilowany od nowa.


Epoch 1/50
[1m  6/625[0m [37m━━━━━━━━━━━━━━━━━━━━[0m [1m27:24[0m 3s/step - accuracy: 0.5296 - loss: 10.3766   

KeyboardInterrupt: 

In [None]:
from tensorflow.keras.preprocessing.sequence import pad_sequences

# Przygotowanie danych wejściowych i docelowych
encoder_input_data = pad_sequences(
    [[input_word2idx[word] for word in sentence] for sentence in input_texts],
    maxlen=max_input_seq_length,
    padding="post"
)

decoder_input_data = pad_sequences(
    [[target_word2idx[word] for word in sentence] for sentence in target_texts],
    maxlen=max_target_seq_length,
    padding="post"
)

decoder_target_data = pad_sequences(
    [[target_word2idx[word] for word in sentence[1:]] for sentence in target_texts],
    maxlen=max_target_seq_length,
    padding="post"
)

# Upewniamy się, że kształty są zgodne
print(f"Encoder input shape: {encoder_input_data.shape}")
print(f"Decoder input shape: {decoder_input_data.shape}")
print(f"Decoder target shape: {decoder_target_data.shape}")


In [None]:
import tensorflow as tf
from tensorflow.keras.layers import Input, LSTM, Embedding, Dense, Dropout
from tensorflow.keras.models import Model
from tensorflow.keras.preprocessing.sequence import pad_sequences

# Resetowanie sesji TensorFlow
tf.keras.backend.clear_session()

# Przygotowanie danych wejściowych i docelowych
encoder_input_data = pad_sequences(
    [[input_word2idx[word] for word in sentence] for sentence in input_texts],
    maxlen=max_input_seq_length,
    padding="post"
)

decoder_input_data = pad_sequences(
    [[target_word2idx[word] for word in sentence] for sentence in target_texts],
    maxlen=max_target_seq_length,
    padding="post"
)

decoder_target_data = pad_sequences(
    [[target_word2idx[word] for word in sentence[1:]] for sentence in target_texts],
    maxlen=max_target_seq_length,
    padding="post"
)

# Model
latent_dim = 256

# Enkoder
encoder_inputs = Input(shape=(max_input_seq_length,))
embedded_encoder_inputs = Embedding(input_dim=len(input_vocab), output_dim=latent_dim)(encoder_inputs)
encoder_lstm1 = LSTM(latent_dim, return_sequences=True, return_state=True, dropout=0.2)
encoder_outputs, state_h1, state_c1 = encoder_lstm1(embedded_encoder_inputs)
encoder_lstm2 = LSTM(latent_dim, return_sequences=True, return_state=True, dropout=0.2)
encoder_outputs, state_h2, state_c2 = encoder_lstm2(encoder_outputs)
encoder_states = [state_h2, state_c2]

# Dekoder
decoder_inputs = Input(shape=(max_target_seq_length,))
embedded_decoder_inputs = Embedding(input_dim=len(target_vocab), output_dim=latent_dim)(decoder_inputs)
decoder_lstm1 = LSTM(latent_dim, return_sequences=True, return_state=True, dropout=0.2)
decoder_outputs, _, _ = decoder_lstm1(embedded_decoder_inputs, initial_state=encoder_states)
decoder_dense = Dense(len(target_vocab), activation="softmax")
decoder_outputs = decoder_dense(decoder_outputs)

# Model Seq2Seq
model = Model([encoder_inputs, decoder_inputs], decoder_outputs)

# Kompilacja modelu
model.compile(optimizer="adam", loss="sparse_categorical_crossentropy", metrics=["accuracy"])

# Trenowanie modelu
history = model.fit(
    [encoder_input_data, decoder_input_data],
    decoder_target_data,
    batch_size=64,
    epochs=50,
    validation_split=0.2,
    verbose=1
)

# Wizualizacja wyników
import matplotlib.pyplot as plt
plt.plot(history.history['loss'], label='Train Loss')
plt.plot(history.history['val_loss'], label='Validation Loss')
plt.title('Loss During Training')
plt.xlabel('Epochs')
plt.ylabel('Loss')
plt.legend()
plt.show()
