In [4]:
import torch
import torch.nn as nn
import numpy as np
import pandas as pd
from sklearn.preprocessing import MinMaxScaler
from sklearn.model_selection import train_test_split

# Load dataset
dataset = pd.read_csv('Tetuan City power consumption.csv')  # Aggiorna con il percorso corretto

# Seleziona colonne correlate al clima
columns_to_exclude = [
    "Zone 1 Power Consumption",  # Aggiorna con i nomi reali
    "Zone 2 Power Consumption",
    "Zone 3 Power Consumption",
    "DateTime",
]

dataset.columns = dataset.columns.str.strip()  # Rimuove spazi extra
climate_data = dataset.drop(columns=columns_to_exclude, errors="ignore").values

# Normalize the data
scaler = MinMaxScaler()
climate_data_scaled = scaler.fit_transform(climate_data)

# Sequence length per 8 ore (mattina, pomeriggio, sera)
sequence_length = 8  # Numero di ore per ciascun blocco

# Preparazione dei dati con intervalli di 8 ore
X, y = [], []
for i in range(len(climate_data_scaled) - sequence_length):
    X.append(climate_data_scaled[i : i + sequence_length])
    y.append(climate_data_scaled[i + sequence_length])

X = np.array(X)
y = np.array(y)

# Verifica della dimensione delle sequenze
print(f"Dimensione X: {X.shape}, Dimensione y: {y.shape}")

# Suddivisione dei dati in train e test
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# Conversione dei dati in tensori PyTorch
X_train_tensor = torch.tensor(X_train, dtype=torch.float32)
y_train_tensor = torch.tensor(y_train, dtype=torch.float32)
X_test_tensor = torch.tensor(X_test, dtype=torch.float32)
y_test_tensor = torch.tensor(y_test, dtype=torch.float32)

# Definizione del modello RNN (come nel codice precedente)
class ClimateRNN(nn.Module):
    def __init__(self, input_size, hidden_size, output_size, num_layers=1):
        super(ClimateRNN, self).__init__()
        self.rnn = nn.RNN(input_size, hidden_size, num_layers, batch_first=True)
        self.fc = nn.Linear(hidden_size, output_size)

    def forward(self, x):
        out, _ = self.rnn(x)
        out = self.fc(out[:, -1, :])  # Usa l'ultimo output per la predizione
        return out


# Hyperparameters
input_size = X.shape[2]  # Numero di caratteristiche climatiche
hidden_size = 64
output_size = input_size
num_layers = 2
learning_rate = 0.001
num_epochs = 50

# Inizializzazione del modello, della funzione di perdita e dell'ottimizzatore
model = ClimateRNN(input_size, hidden_size, output_size, num_layers)
criterion = nn.MSELoss()
optimizer = torch.optim.Adam(model.parameters(), lr=learning_rate)

# Training loop
for epoch in range(num_epochs):
    model.train()
    outputs = model(X_train_tensor)
    loss = criterion(outputs, y_train_tensor)

    optimizer.zero_grad()
    loss.backward()
    optimizer.step()

    if (epoch + 1) % 10 == 0:
        print(f"Epoch [{epoch+1}/{num_epochs}], Loss: {loss.item():.4f}")

# Generazione dati climatici per il 2022 con sequenze di 8 ore
model.eval()
generated_data = []
initial_sequence = X_test_tensor[0].unsqueeze(0)  # Usa un campione come punto di partenza

temperature_increase_per_year = 0.02  # Incremento della temperatura media annuale
precipitation_reduction_percentage = 0.1  # Riduzione delle precipitazioni

for _ in range((365 * 24) // 8):  # Generazione ogni 8 ore per un anno
    with torch.no_grad():
        prediction = model(initial_sequence)

        # Effetti del cambiamento climatico
        prediction[:, 0] += temperature_increase_per_year  # Incremento temperatura
        prediction[:, 1] *= 1 - precipitation_reduction_percentage  # Riduzione precipitazioni

        generated_data.append(prediction.numpy().flatten())
        initial_sequence = torch.cat([initial_sequence[:, 1:, :], prediction.unsqueeze(1)], dim=1)

generated_data = np.array(generated_data)
generated_data = scaler.inverse_transform(generated_data)  # Ripristino della scala originale

# Salvataggio dei dati generati
weather_columns = dataset.drop(columns=columns_to_exclude, errors="ignore").columns
assert generated_data.shape[1] == len(weather_columns), "Mismatch in feature count!"

generated_df = pd.DataFrame(generated_data, columns=weather_columns)
generated_df.to_csv("climate_data_2022_8hours.csv", index=False)
print("Dati climatici generati salvati in 'climate_data_2022_8hours.csv'")



FileNotFoundError: [Errno 2] No such file or directory: 'Tetuan City power consumption.csv'