In [3]:
import numpy as np

# Operatori e variabili disponibili
OPERATORS = ["+", "-", "*", "/"]  # Operazioni binarie
VARIABLES = ["x[0]", "x[1]"]  # Variabili disponibili

# Genera una formula casuale
def generate_formula(max_depth=3):
    if max_depth == 0:
        # Ritorna una variabile o un numero costante
        return np.random.choice(VARIABLES + [str(np.random.uniform(-10, 10))])
    else:
        operator = np.random.choice(OPERATORS)
        left = generate_formula(max_depth - 1)
        right = generate_formula(max_depth - 1)
        if operator == "/":
            # Aggiungi una protezione per divisioni per zero
            return f"({left}) / (1e-6 + abs({right}))"
        else:
            return f"({left}) {operator} ({right})"

# Calcola l'errore quadratico medio (MSE)
def evaluate_formula(formula, x, y):
    try:
        # Calcola i valori predetti
        y_pred = np.array([eval(formula, {"x": x[:, i], "np": np}) for i in range(x.shape[1])])
        # Calcola l'MSE
        return np.mean((y - y_pred) ** 2)
    except Exception:
        return float('inf')  # Penalizza formule non valide

# Algoritmo genetico
def genetic_algorithm(x, y, generations=100, population_size=50, mutation_rate=0.2):
    # Popolazione iniziale
    population = [generate_formula(max_depth=3) for _ in range(population_size)]

    for generation in range(generations):
        # Valutazione della fitness
        fitness = [1 / (1 + evaluate_formula(f, x, y)) for f in population]

        # Selezione: scegli in base alla fitness
        selected = np.random.choice(population, size=population_size, p=np.array(fitness) / sum(fitness), replace=True)

        # Crossover: combina due formule
        offspring = []
        for _ in range(population_size // 2):
            parent1, parent2 = np.random.choice(selected, 2, replace=False)
            crossover_point = np.random.randint(1, len(parent1))
            child = parent1[:crossover_point] + parent2[crossover_point:]
            offspring.append(child)

        # Mutazione: modifica casuale di una formula
        for i in range(len(offspring)):
            if np.random.rand() < mutation_rate:
                offspring[i] = generate_formula(max_depth=3)

        # Aggiorna la popolazione
        population = offspring

        # Migliore formula della generazione corrente
        best_formula = population[np.argmax(fitness)]
        best_fitness = max(fitness)

        print(f"Generazione {generation + 1}: Migliore fitness = {best_fitness:.6f}, Formula = {best_formula}")

    # Ritorna la migliore formula trovata
    return best_formula

problem = np.load("problem_0.npz")
y_train = problem["y"]
x_train = problem["x"]

# Esegui l'algoritmo genetico per trovare la migliore formula
best_formula = genetic_algorithm(x_train, y_train, generations=50, population_size=20, mutation_rate=0.3)
best_formula

Generazione 1: Migliore fitness = 0.224576, Formula = (((x[0]) - (1.0658310095035244)) / (1e-6 + abs((2.6990444778802054) - (-1.8589553884(((x[1]) - (x[1])) / (1e-6 + abs((7.319561135641667) + (x[0]))))
Generazione 2: Migliore fitness = 0.824372, Formula = (((x[0]) - (x[1])) / (1e-6 + abs((x[1]) - (-7.805517657557974)))) + (((x[0]) + (x[1]))x[0]) + (x[1])) * ((1.0026635127614227) + (x[1])))
Generazione 3: Migliore fitness = 0.824372, Formula = (((x[0]) / (1e-6 + abs(x[0]))) / (1e-6 + abs((x[1]) - (x[1])))) - (((-5.845277860249849) - (x[0])) - ((-5.5115634313284145) + (x[1])))
Generazione 4: Migliore fitness = 0.824372, Formula = (((-1.0297088161417296) - (x[0])) - ((x[0]) / (1e-6 + abs(x[0])))) + (((x[0]) - (x[0])) + ((x[1]) - (3.9279850032567882)))
Generazione 5: Migliore fitness = 0.824372, Formula = (((x[0]) / (1e-6 + abs(-0.20819921686709364))) * ((x[0]) / (1e-6 + abs(-0.5347683055899175)))) / (1e-6 + abs(((x[1]) - (8.521057609745654)) + ((x[0]) * (x[1]))))
Generazione 6: Migliore 

'(((x[0]) / (1e-6 + abs(-9.55541468172466))) * ((x[1]) - (x[1]))) / (1e-6 + abs(((x[0]) - (6.9261056189154300685)) / (1e-6 + abs((4.8686718799401785) - (4.946228430671409)))))'