<a href="https://colab.research.google.com/github/beep1000101/pjatk_wum/blob/main/lab6/%C4%86wiczenia%20-%20Sieci%20Rekurencyjne.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Sieci rekurencyjne

## Zadanie: Sieci rekurencyjne dla szeregów czasowych
Zbiór `jena_climate_2009_2016.csv` zawiera dane klimatyczne próbkowane co 10 minut.
1. Przygotuj dane do modelowania dzieląc zbiór na sekwencje składające się ze 120 pomiarów odpowiadających 5 dniom. Jako wartość docelową (`target`) ustaw temperaturę 24 godziny po końcu każdej sekwencji. Zastosuj metodę `timeseries_dataset_from_array()`. Skaluj dane i podziel je na zbiór treningowy, walidacyjny i testowy.
2. Stwórz i wytrenuj sieć składającą się z warstw LSTM. Na wyjściu zastosuj warstwę `Dense(1)` i `mse` jako funkcję błędu.
3. Zastosuj zbiór walidacyjny do porównania sieci o różnych architekturach. Testuj sieci z 1-2 warstwami LSTM o różnych wymiarach. Warstwy można regularyzować ustawiając parametr `recurrent_dropout`. Narysuj krzywe uczenia na danych treningowych i walidacyjnych. Następnie wykorzystaj zbiór testowy do ewaluacji wybranej sieci.

In [2]:
import pandas as pd
from sklearn.preprocessing import StandardScaler
import tensorflow as tf

df = pd.read_csv("jena_climate_2009_2016.csv")
df.head()

Unnamed: 0,Date Time,p (mbar),T (degC),Tpot (K),Tdew (degC),rh (%),VPmax (mbar),VPact (mbar),VPdef (mbar),sh (g/kg),H2OC (mmol/mol),rho (g/m**3),wv (m/s),max. wv (m/s),wd (deg)
0,01.01.2009 00:10:00,996.52,-8.02,265.4,-8.9,93.3,3.33,3.11,0.22,1.94,3.12,1307.75,1.03,1.75,152.3
1,01.01.2009 00:20:00,996.57,-8.41,265.01,-9.28,93.4,3.23,3.02,0.21,1.89,3.03,1309.8,0.72,1.5,136.1
2,01.01.2009 00:30:00,996.53,-8.51,264.91,-9.31,93.9,3.21,3.01,0.2,1.88,3.02,1310.24,0.19,0.63,171.6
3,01.01.2009 00:40:00,996.51,-8.31,265.12,-9.07,94.2,3.26,3.07,0.19,1.92,3.08,1309.19,0.34,0.5,198.0
4,01.01.2009 00:50:00,996.51,-8.27,265.15,-9.04,94.1,3.27,3.08,0.19,1.92,3.09,1309.0,0.32,0.63,214.3


In [3]:
X = df.drop(columns="Date Time").to_numpy()
y = df["T (degC)"].to_numpy()

N = X.shape[0]
train_size = int(0.5 * N)
val_size = int(0.25 * N)
test_size = N - train_size - val_size

scaler = StandardScaler()
scaler.fit(X[:train_size])
X = scaler.transform(X)

In [4]:
sampling_rate = 6 # resample hourly
sequence_length = 120 # input sequences span 120 hours = 5 days
delay = sampling_rate * (sequence_length + 24 - 1) # targets delayed by 24h
batch_size = 256

train_data = tf.keras.utils.timeseries_dataset_from_array(
    X[:-delay],
    targets=y[delay:],
    sampling_rate=sampling_rate,
    sequence_length=sequence_length,
    shuffle=True,
    batch_size=batch_size,
    start_index=0,
    end_index=train_size
)

val_data = tf.keras.utils.timeseries_dataset_from_array(
    X[:-delay],
    targets=y[delay:],
    sampling_rate=sampling_rate,
    sequence_length=sequence_length,
    shuffle=True,
    batch_size=batch_size,
    start_index=train_size,
    end_index=(train_size + val_size)
)

test_data = tf.keras.utils.timeseries_dataset_from_array(
    X[:-delay],
    targets=y[delay:],
    sampling_rate=sampling_rate,
    sequence_length=sequence_length,
    shuffle=True,
    batch_size=batch_size,
    start_index=train_size + val_size,
)

In [5]:
model = tf.keras.Sequential([
    tf.keras.Input(shape=(sequence_length, X.shape[-1])),
    tf.keras.layers.LSTM(16),
    tf.keras.layers.Dense(1)
])

model.compile(optimizer="adam",
              loss="mse",
              metrics=["mae"])

In [None]:
model.fit(train_data,
          validation_data=val_data,
          epochs=5)

Epoch 1/5
[1m657/657[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m109s[0m 162ms/step - loss: 74.8717 - mae: 6.6379 - val_loss: 24.7994 - val_mae: 3.7202
Epoch 2/5
[1m657/657[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m77s[0m 117ms/step - loss: 16.8035 - mae: 3.0553 - val_loss: 14.6614 - val_mae: 2.9165
Epoch 3/5
[1m657/657[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m79s[0m 119ms/step - loss: 11.4087 - mae: 2.5833 - val_loss: 11.9531 - val_mae: 2.6486
Epoch 4/5
[1m657/657[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m77s[0m 117ms/step - loss: 10.2621 - mae: 2.4670 - val_loss: 11.2487 - val_mae: 2.5886
Epoch 5/5
[1m173/657[0m [32m━━━━━[0m[37m━━━━━━━━━━━━━━━[0m [1m43s[0m 90ms/step - loss: 9.5723 - mae: 2.3974

In [None]:
# Przygotuj dane do modelowania dzieląc zbiór na sekwencje składające się ze 120 pomiarów odpowiadających 5 dniom. Jako wartość docelową (target) ustaw temperaturę 24 godziny po końcu każdej sekwencji. Zastosuj metodę timeseries_dataset_from_array(). Skaluj dane i podziel je na zbiór treningowy, walidacyjny i testowy.
# Stwórz i wytrenuj sieć składającą się z warstw LSTM. Na wyjściu zastosuj warstwę Dense(1) i mse jako funkcję błędu.
# Zastosuj zbiór walidacyjny do porównania sieci o różnych architekturach. Testuj sieci z 1-2 warstwami LSTM o różnych wymiarach. Warstwy można regularyzować ustawiając parametr recurrent_dropout. Narysuj krzywe uczenia na danych treningowych i walidacyjnych. Następnie wykorzystaj zbiór testowy do ewaluacji wybranej sieci.


## Zadanie: Przetwarzanie tekstu sieciami rekurencyjnymi

1. Zbiór `aclImdb` zawiera przykłady pozytywnych (`pos`) i negatywnych (`neg`) recenzji filmów. Wczytaj zbiór za pomocą metody `text_dataset_from_directory()`. Dane są podzielone na zbiór treningowy i testowy - należy wczytać je osobno.
2. Stwórz warstwę `TextVectorization` z parametrem `output_modes='int'` i zastosuj metodę `adapt()` aby wygenerować słownik na podstawie zbioru treningowego.
3. Stwórz sieć LSTM i zastosuj ją do klasyfikacji recenzji. Bezpośrednio po warstwie wejściowej dodaj stworzoną wcześniej warstwę `TextVectorization`. Bezpośrednio po niej dodaj warstwę wektoryzującą słowa z tekstów. Może być to na przykład warstwa `Embedding`. Na wyjściu sieci dodaj warstwę `Dense(1, activation='sigmoid')`.
4. Porównaj działanie sieci rekurencyjnych o różnych architekturach. Zamiast warstw LSTM można stosować też warstwy GRU. Do regularyzaji warstw można stosować `recurrent_dropout`. Narysuj krzywe uczenia na danych treningowych i walidacyjnych.

In [None]:
import tensorflow as tf

batch_size = 32

train_data = tf.keras.utils.text_dataset_from_directory(
    "aclImdb/train", batch_size=batch_size
)

valid_data = tf.keras.utils.text_dataset_from_directory(
    "aclImdb/test", batch_size=batch_size
)

Found 25000 files belonging to 2 classes.
Found 25000 files belonging to 2 classes.


In [None]:
max_tokens = 5000
max_len = 600

text_vectorization = tf.keras.layers.TextVectorization(output_mode="int", max_tokens=max_tokens, output_sequence_length=max_len)
text_vectorization.adapt(train_data.map(lambda x, y: x))

2025-05-30 23:27:56.623348: I tensorflow/core/framework/local_rendezvous.cc:404] Local rendezvous is aborting with status: OUT_OF_RANGE: End of sequence


In [None]:
model = tf.keras.Sequential([
    tf.keras.layers.Input(shape=(1,), dtype="string"),
    text_vectorization,
    tf.keras.layers.Embedding(input_dim=max_tokens, output_dim=128, mask_zero=True),
    tf.keras.layers.LSTM(32),
    tf.keras.layers.Dense(1, activation="sigmoid"),
])

model.compile(
    loss="binary_crossentropy",
    optimizer="adam",
    metrics=["accuracy"],
)

model.fit(train_data, validation_data=valid_data, epochs=5)

Epoch 1/5
[1m782/782[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m243s[0m 309ms/step - accuracy: 0.7193 - loss: 0.5374 - val_accuracy: 0.8526 - val_loss: 0.3634
Epoch 2/5
[1m782/782[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m152s[0m 195ms/step - accuracy: 0.8700 - loss: 0.3155 - val_accuracy: 0.8744 - val_loss: 0.2987
Epoch 3/5
[1m782/782[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m141s[0m 180ms/step - accuracy: 0.9067 - loss: 0.2407 - val_accuracy: 0.8512 - val_loss: 0.3330
Epoch 4/5
[1m782/782[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m151s[0m 193ms/step - accuracy: 0.9230 - loss: 0.1999 - val_accuracy: 0.8226 - val_loss: 0.5118
Epoch 5/5
[1m782/782[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m146s[0m 187ms/step - accuracy: 0.8777 - loss: 0.3063 - val_accuracy: 0.8635 - val_loss: 0.3588


<keras.src.callbacks.history.History at 0x31ba811d0>