In [1]:
import numpy as np
from typing import Callable
from dataset import load_dataset, normalize_data, denormalize_formula_str
from dag import DagGP
from operators import BINARY_OPERATORS, UNARY_OPERATORS
from gp import genetic_programming
from utils import pretty_print

In [8]:
dataset, num_variables = load_dataset("../data/problem_4.npz")
sample = dataset[0]
x_original = sample["x"]
normalized_dataset, mean_X, mean_Y, std_X, std_Y = normalize_data(dataset)
print("Primo campione normalizzato:", normalized_dataset[0])
print("original: ", x_original)

Primo campione normalizzato: {'x': array([ 1.09162757, -0.59496687]), 'y': np.float64(-0.025259829608601694)}
original:  [ 3.15087424 -1.73013313]


In [9]:
population_size=100
generations=20
tree_depth=5
batch_size = 50
#dataset = normalized_dataset

In [10]:
best_tree = genetic_programming(dataset, population_size, generations, tree_depth, num_variables, batch_size)


Variabili: ['x[0]', 'x[1]']
Costanti: ['-1.5229', '4.9237', '2.19122', '-6.94662', '1.09044']
Generazione 0: Best fitness = 7.6529, Formula = ^(/(x[1], x[1]), ^(x[0], 4.9237))
Generazione 1: Best fitness = 7.6529, Formula = ^(sin(x[1]), -(x[0], x[0]))
Generazione 2: Best fitness = 7.6529, Formula = ^(sin(x[1]), -(x[0], x[0]))
Generazione 3: Best fitness = 7.6529, Formula = ^(sin(x[1]), -(x[0], x[0]))
stagnation: aumento mutation prob
Generazione 4: Best fitness = 6.3824, Formula = ^(*(x[0], x[0]), cos(x[1]))
Generazione 5: Best fitness = 6.3824, Formula = ^(*(x[0], x[0]), cos(x[1]))
Generazione 6: Best fitness = 5.4260, Formula = /(/(x[0], x[1]), *(x[0], x[1]))
Generazione 7: Best fitness = 5.4260, Formula = /(/(x[0], x[1]), *(x[0], x[1]))
Generazione 8: Best fitness = 5.4260, Formula = /(/(x[0], x[1]), *(x[0], x[1]))
Generazione 9: Best fitness = 5.4260, Formula = /(/(x[0], x[1]), *(x[0], x[1]))
stagnation: aumento mutation prob
Generazione 10: Best fitness = 5.4260, Formula = /(/(x[0

In [11]:
# Stampiamo la miglior formula trovata
print("\nFormula migliore trovata:")
print(best_tree.long_name)

    # Verifica su alcuni campioni del dataset
print("\nEsempi di predizioni:")
for sample in dataset[:5]:  # Mostriamo solo i primi 5 esempi
    pred = best_tree(x=sample["x"])
    print(f"Input: {sample['x']}, Predetto: {pred}, Reale: {sample['y']}")

print(pretty_print(best_tree))



Formula migliore trovata:
+(-(x[0], x[0]), cos(x[1]))

Esempi di predizioni:
Input: [ 3.15087424 -1.73013313], Predetto: -0.1586634456249708, Reale: 1.8823292724754674
Input: [-0.14015422 -1.69649662], Predetto: -0.12536952735157783, Reale: 2.4145711058981614
Input: [-2.77684915 -1.408818  ], Predetto: 0.16127094807298892, Reale: 4.660753972829458
Input: [2.44925469 3.42961652], Predetto: -0.9588070829372601, Reale: -3.65489259327773
Input: [-1.9139768   3.16039541], Predetto: -0.9998232333333456, Reale: -3.545348237878441
((x[0] - x[0]) + cos(x[1]))


In [12]:
formula_denorm = denormalize_formula_str(pretty_print(best_tree), mean_X, std_X, mean_Y, std_Y)
print("Formula denormalizzata:", formula_denorm)


Formula denormalizzata: 1.9998 + 4.6499 * (((((x[0] * 2.8781) + 0.0090) - ((x[0] * 2.8781) + 0.0090)) + cos(((x[1] * 2.8649) + -0.0256))))


In [13]:
print(f"Numero di campioni: {len(dataset)}")
if len(dataset) > 0:
    print("Chiavi del primo campione:", list(dataset[0].keys()))
print(dataset[0])
print(dataset[3])
print(dataset[40])

Numero di campioni: 5000
Chiavi del primo campione: ['x', 'y']
{'x': array([ 3.15087424, -1.73013313]), 'y': np.float64(1.8823292724754674)}
{'x': array([2.44925469, 3.42961652]), 'y': np.float64(-3.65489259327773)}
{'x': array([-4.78894882, -1.16127172]), 'y': np.float64(6.501988509163342)}


In [15]:
data = np.load("../data/problem_4.npz")
x_data = data['x']
y_data = data['y']
    
print(x_data.shape)  
print(y_data.shape) 
for key in data.files:
    print(f"{key}: {data[key]}")

(2, 5000)
(5000,)
x: [[ 3.15087424 -0.14015422 -2.77684915 ... -3.48341583  4.08664981
  -4.37254358]
 [-1.73013313 -1.69649662 -1.408818   ... -3.28548272 -2.58382568
   3.30721333]]
y: [ 1.88232927  2.41457111  4.66075397 ... -3.33156904 -3.03117116
 -3.22729306]
