In [2]:
import numpy as np
from random import choice, random, randint

# Definizione delle operazioni matematiche consentite
OPERATIONS = [
    (np.add, 2, "({} + {})"),
    (np.subtract, 2, "({} - {})"),
    (np.divide, 2, "({} / {})"),
    (np.sin, 1, "sin({})"),
]

# Generazione casuale di un programma

def random_program(depth, input_dim):
    """Crea una formula casuale."""
    if depth == 0 or random() < 0.3:
        # Crea un nodo foglia
        return {"type": "var", "index": randint(0, input_dim - 1), "format": "x[{}]"}

    # Crea un nodo operazione
    op, arity, fmt = choice(OPERATIONS)
    children = [random_program(depth - 1, input_dim) for _ in range(arity)]
    return {"type": "op", "op": op, "arity": arity, "children": children, "format": fmt}

# Valutazione di un programma

def evaluate_program(node, x):
    if node["type"] == "var":
        return x[node["index"]]
    args = [evaluate_program(child, x) for child in node["children"]]
    try:
        return node["op"](*args)
    except ZeroDivisionError:
        return np.inf

# Rappresentazione del programma in formato leggibile

def render_program(node):
    if node["type"] == "var":
        return node["format"].format(node["index"])
    args = [render_program(child) for child in node["children"]]
    return node["format"].format(*args)

# Funzione di fitness

def fitness_function(program, x, y):
    predictions = np.array([evaluate_program(program, x_row) for x_row in x.T])
    return np.mean((predictions - y) ** 2)

# Mutazione

def mutate_program(program, input_dim):
    if random() < 0.3 or program["type"] == "var":
        return random_program(2, input_dim)
    program["children"][randint(0, program["arity"] - 1)] = mutate_program(
        program["children"][randint(0, program["arity"] - 1)], input_dim
    )
    return program

# Crossover

def crossover_program(parent1, parent2):
    if parent1["type"] == "var" or parent2["type"] == "var":
        return parent1 if random() < 0.5 else parent2
    child = parent1.copy()
    child["children"][randint(0, child["arity"] - 1)] = crossover_program(
        parent1["children"][randint(0, parent1["arity"] - 1)],
        parent2["children"][randint(0, parent2["arity"] - 1)],
    )
    return child

# Algoritmo evolutivo

def genetic_algorithm(x, y, generations=50, population_size=100):
    input_dim = x.shape[0]
    population = [random_program(3, input_dim) for _ in range(population_size)]
    
    for gen in range(generations):
        # Calcolo fitness per ogni individuo
        fitness = np.array([fitness_function(prog, x, y) for prog in population])

        # Selezione dei migliori
        sorted_indices = fitness.argsort()
        population = [population[i] for i in sorted_indices[:population_size // 2]]
        fitness = fitness[sorted_indices[:population_size // 2]]

        print(f"Generazione {gen+1}, miglior fitness: {fitness[0]:.6f}")

        # Riproduzione e mutazione
        new_population = []
        while len(new_population) < population_size:
            parent1, parent2 = np.random.choice(population, 2)
            offspring = crossover_program(parent1, parent2) if random() < 0.7 else mutate_program(parent1, input_dim)
            new_population.append(offspring)

        population = new_population

    # Ritorna il migliore individuo trovato
    best_program = population[0]
    best_fitness = fitness_function(best_program, x, y)
    print(f"Programma migliore trovato: {render_program(best_program)} con fitness: {best_fitness:.6f}")
    return best_program

# Esempio di utilizzo
if __name__ == "__main__":
    # Genera un dataset fittizio
    np.random.seed(0)
    x_train = np.random.uniform(-1, 1, size=(2, 1000))  # 2 feature, 1000 esempi
    y_train = x_train[0] + np.sin(x_train[1]) / 5

    best_formula = genetic_algorithm(x_train, y_train)


Generazione 1, miglior fitness: 0.011639


  return node["op"](*args)


Generazione 2, miglior fitness: 0.011639
Generazione 3, miglior fitness: 0.011639
Generazione 4, miglior fitness: 0.011639
Generazione 5, miglior fitness: 0.011639
Generazione 6, miglior fitness: 0.011639
Generazione 7, miglior fitness: 0.011639
Generazione 8, miglior fitness: 0.011639
Generazione 9, miglior fitness: 0.011639
Generazione 10, miglior fitness: 0.011639
Generazione 11, miglior fitness: 0.011639


  return node["op"](*args)


Generazione 12, miglior fitness: 0.011639
Generazione 13, miglior fitness: 0.011639
Generazione 14, miglior fitness: 0.011639
Generazione 15, miglior fitness: 0.011639
Generazione 16, miglior fitness: 0.011639
Generazione 17, miglior fitness: 0.011639
Generazione 18, miglior fitness: 0.011639
Generazione 19, miglior fitness: 0.011639
Generazione 20, miglior fitness: 0.011639
Generazione 21, miglior fitness: 0.011639
Generazione 22, miglior fitness: 0.011639
Generazione 23, miglior fitness: 0.011639
Generazione 24, miglior fitness: 0.011639
Generazione 25, miglior fitness: 0.011639
Generazione 26, miglior fitness: 0.011639
Generazione 27, miglior fitness: 0.011639
Generazione 28, miglior fitness: 0.011639
Generazione 29, miglior fitness: 0.011639
Generazione 30, miglior fitness: 0.011639
Generazione 31, miglior fitness: 0.011639
Generazione 32, miglior fitness: 0.011639
Generazione 33, miglior fitness: 0.011639
Generazione 34, miglior fitness: 0.011639
Generazione 35, miglior fitness: 0