In [2]:
import os
import numpy as np
import pandas as pd

from tensorflow import keras
from tensorflow.keras import layers
from sklearn.model_selection import train_test_split


In [3]:

# Función para cargar los datos desde un archivo CSV y dividir en entrenamiento y prueba
def load_data(filename):
    data = pd.read_csv(filename)
    temperature = data['T (degC)'].values  # Tomar solo la columna de temperatura
    return temperature

# Cargar datos desde el archivo CSV
data = load_data("jena_climate_2009_2016.csv")

In [5]:
# Normalizar los datos (opcional pero generalmente recomendado)
mean = data.mean(axis=0)
std = data.std(axis=0)
data_normalized = (data - mean) / std

# Dividir los datos en conjuntos de entrenamiento y prueba
train_data, test_data = train_test_split(data_normalized, test_size=0.2)

In [7]:
train_data

array([-0.98752229, -0.4319453 ,  0.7314424 , ...,  0.69938988,
       -1.24869096, -0.32391644])

In [9]:
# Darle la forma correcta a los datos
x_train = train_data.reshape((train_data.shape[0], 1, 1))
x_test = test_data.reshape((test_data.shape[0], 1, 1))

# Definir el número de clases (en este caso, es solo una regresión)
n_classes = 1

In [10]:
# Función para construir el modelo de transformador
def transformer_encoder(inputs, head_size, num_heads, ff_dim, dropout=0):
    # Attention y Normalización
    x = layers.MultiHeadAttention(
        key_dim=head_size, num_heads=num_heads, dropout=dropout
    )(inputs, inputs)
    x = layers.Dropout(dropout)(x)
    x = layers.LayerNormalization(epsilon=1e-6)(x)
    res = x + inputs

    # Parte Feed Forward
    x = layers.Conv1D(filters=ff_dim, kernel_size=1, activation="relu")(res)
    x = layers.Dropout(dropout)(x)
    x = layers.Conv1D(filters=inputs.shape[-1], kernel_size=1)(x)
    x = layers.LayerNormalization(epsilon=1e-6)(x)
    return x + res

In [11]:
# Función para construir el modelo de transformador
def transformer_encoder(inputs, head_size, num_heads, ff_dim, dropout=0):
    # Attention y Normalización
    x = layers.MultiHeadAttention(
        key_dim=head_size, num_heads=num_heads, dropout=dropout
    )(inputs, inputs)
    x = layers.Dropout(dropout)(x)
    x = layers.LayerNormalization(epsilon=1e-6)(x)
    res = x + inputs

    # Parte Feed Forward
    x = layers.Conv1D(filters=ff_dim, kernel_size=1, activation="relu")(res)
    x = layers.Dropout(dropout)(x)
    x = layers.Conv1D(filters=inputs.shape[-1], kernel_size=1)(x)
    x = layers.LayerNormalization(epsilon=1e-6)(x)
    return x + res

In [12]:
# Función para construir el modelo
def build_model(
    input_shape,
    head_size,
    num_heads,
    ff_dim,
    num_transformer_blocks,
    mlp_units,
    dropout=0,
    mlp_dropout=0,
):
    inputs = keras.Input(shape=input_shape)
    x = inputs
    for _ in range(num_transformer_blocks):
        x = transformer_encoder(x, head_size, num_heads, ff_dim, dropout)

    x = layers.GlobalAveragePooling1D(data_format="channels_last")(x)
    for dim in mlp_units:
        x = layers.Dense(dim, activation="relu")(x)
        x = layers.Dropout(mlp_dropout)(x)
    outputs = layers.Dense(n_classes)(x)  # Una neurona de salida para la predicción de temperatura
    return keras.Model(inputs, outputs)

In [13]:
# Construir el modelo
input_shape = x_train.shape[1:]

model = build_model(
    input_shape,
    head_size=256,
    num_heads=4,
    ff_dim=4,
    num_transformer_blocks=4,
    mlp_units=[128],
    mlp_dropout=0.4,
    dropout=0.25,
)

In [15]:
model.compile(
    loss="mse",  # Usar MSE para regresión
    optimizer=keras.optimizers.Adam(learning_rate=1e-4),
    metrics=["mae"],  # Métrica de error absoluto medio
)
model.summary()

# Entrenar el modelo
callbacks = [keras.callbacks.EarlyStopping(patience=10, restore_best_weights=True)]

model.fit(
    x_train,
    x_train,  # Usamos x_train como target, ya que estamos tratando de predecir la temperatura
    validation_split=0.2,
    epochs=5,
    batch_size=64,
    callbacks=callbacks,
)

# Evaluar el modelo en datos de prueba
mse, mae = model.evaluate(x_test, x_test, verbose=1)  # Usamos x_test como target también
print("Mean Squared Error on Test Data:", mse)
print("Mean Absolute Error on Test Data:", mae)

Epoch 1/5
[1m1298/4205[0m [32m━━━━━━[0m[37m━━━━━━━━━━━━━━[0m [1m27s[0m 9ms/step - loss: 0.0142 - mae: 0.0793 

In [None]:
import matplotlib.pyplot as plt

# Predicciones del modelo en los datos de entrenamiento y prueba
train_predictions = model.predict(x_train)
test_predictions = model.predict(x_test)

# Deshacer la normalización de los datos
train_predictions = (train_predictions * std) + mean
test_predictions = (test_predictions * std) + mean

# Deshacer la normalización de los datos de prueba (inputs)
x_test_original = (x_test * std) + mean

# Graficar resultados
plt.figure(figsize=(12, 6))

# Graficar datos de entrenamiento
plt.plot(x_train.squeeze(), label='Training Data', color='blue')

# Graficar datos de prueba
plt.plot(range(len(x_train), len(x_train) + len(x_test)), x_test_original.squeeze(), label='Test Data (Actual)', color='green')

# Graficar predicciones en datos de entrenamiento
plt.plot(range(len(train_predictions)), train_predictions.squeeze(), label='Training Predictions', color='red')

# Graficar predicciones en datos de prueba
plt.plot(range(len(x_train), len(x_train) + len(test_predictions)), test_predictions.squeeze(), label='Test Predictions', color='orange')

plt.title('Temperature Prediction')
plt.xlabel('Time')
plt.ylabel('Temperature (degC)')
plt.legend()
plt.show()
