In [1]:
%pip install ANNarchy
%pip install gymnasium

Defaulting to user installation because normal site-packages is not writeable
[0mNote: you may need to restart the kernel to use updated packages.
Defaulting to user installation because normal site-packages is not writeable
[0mNote: you may need to restart the kernel to use updated packages.


In [2]:
from ANNarchy import *
import numpy as np
import matplotlib.pyplot as plt
import random as rd
import scipy.sparse
import gymnasium as gym
from scipy.special import erf

ANNarchy 4.7 (4.7.3) on linux (posix).


Para utilizar el algoritmo evolutivo se deben definir los parametros de uso, como el modelo neuronal, la red, funcion objetivo y las configuraciòn de hiperparametros 

# Modelos de Neurona
Mediante annarchy definir las neuronas a utilizar, se debe generar un archivo de python llamador neuronmodel.py por eso se utiliza la sentencia "%%writefile"

Para mayor guia en la definiciòn de modelos de neurona para tu red neuronal de espiga utilizar https://annarchy.readthedocs.io/API/Neuron.html

Ejemplos:

In [3]:
%%writefile neuronmodel.py

from ANNarchy import *

LIF = Neuron(  #I = 75
    parameters = """
    tau = 50.0 : population
    I = 0.0
    tau_I = 10.0 : population
    """,
    equations = """
    tau * dv/dt = -v + g_exc - g_inh + (I-65) : init=0
    tau_I * dg_exc/dt = -g_exc
    tau_I * dg_inh/dt = -g_inh
    """,
    spike = "v >= -40.0",
    reset = "v = -65"
)

IZHIKEVICH = Neuron(  #I = 20
    parameters="""
        a = 0.02 : population
        b = 0.2 : population
        c = -65.0 : population
        d = 8.0 : population
        I = 0.0
        tau_I = 10.0 : population
    """,
    equations="""
        dv/dt = 0.04*v*v + 5*v + 140 - u + I + g_exc - g_inh : init=-65
        tau_I * dg_exc/dt = -g_exc
        tau_I * dg_inh/dt = -g_inh
        du/dt = a*(b*v - u) : init=-14.0
    """,
    spike="v >= 30.0",
    reset="v = c; u += d"
)

Overwriting neuronmodel.py


# Definición de la función objetivo

En este apartado, se debe definir la codificaciòn de la entrada para la red neuronal y además la decodificación de la salida. En esste proceso se debe construir una función objetivo que devuelva un unico valor.

Para los ejemplos planteados se utilizará la libreria gymnsaium que permite la implementación de problemas de aprendizaje por refuerzo. Actualmente el algoritmo evolutivo maximiza el fitness, por lo que si se tiene un problema de minimización se debe adecuar por el momento al evaluar la función objetivo.



Ejemplo 1:
Problema del cartpole
Entrada de la red, corresponde a una codificación de las caracteristicas del entorno generando dos neuronas por cada una, activando una de las dos dependiendo si la caracteristica tiene un valor positivo o negativo. Para la decodificaciòn se ve cual de ls dos neuronas de salida tuvo mayor cantidad de spikes en el tiempo simulado, eligiendo así la acción correspondiente a la neurona.

In [4]:
%%writefile fitness.py

from ANNarchy import *
import gymnasium as gym
import numpy as np


def cartpole(pop,Monitor,input_index,output_index,inputWeights):
    env = gym.make("CartPole-v1")
    observation, info = env.reset(seed=42)
    max_steps = 500
    terminated = False
    truncated = False
    maxInput = inputWeights[1]
    minInput = inputWeights[0]
    #Generar 4 input weights para cada input
    inputWeights = np.random.uniform(minInput,maxInput,4)
    #Number of episodes
    episodes = 100
    h=0
    #Final fitness 
    final_fitness = 0
    while h < episodes:
        j=0
        returns = []
        actions_done = []
        terminated = False
        truncated = False
        while j < max_steps and not terminated and not truncated:
            #encode observation, 4 values split in 8 neurons (2 for each value), if value is negative the left neuron is activated, if positive the right neuron is activated
            i = 0
            k = 0
            for val in observation:
                if val < 0:
                    pop[int(input_index[i])].I = -val*inputWeights[k]
                    pop[int(input_index[i+1])].I = 0
                else:
                    pop[int(input_index[i])].I = 0
                    pop[int(input_index[i+1])].I = val*inputWeights[k]
                i += 2
                k += 1
            simulate(50.0)
            spikes = Monitor.get('spike')
            #Output from 2 neurons, one for each action
            output1 = np.size(spikes[output_index[0]])
            output2 = np.size(spikes[output_index[1]])
            #Choose the action with the most spikes
            action = env.action_space.sample()
            if output1 > output2:
                action = 0
            elif output1 < output2:
                action = 1
            observation, reward, terminated, truncated, info = env.step(action)
            returns.append(reward)
            actions_done.append(action)
            pop.reset()
            Monitor.reset()
            j += 1
        env.reset()
        #print("Episode: ",h," Fitness: ",np.sum(returns))
        final_fitness += np.sum(returns)
        h += 1
    final_fitness = final_fitness/episodes
    #print("Final mean fitness: ",final_fitness,"\n")
    env.close()
    #print("Returns: ",returns)
    #print("Actions: ",actions_done)
    return final_fitness

import random as rd
from scipy.special import erf

def cartpoleB(pop, Monitor, input_index, output_index, inputWeights):
    env = gym.make("CartPole-v1")
    observation, info = env.reset(seed=42)
    max_steps = 1000
    terminated = False
    truncated = False
    # Number of episodes
    episodes = 100
    h = 0
    # Final fitness 
    final_fitness = 0
    
    # Definir límites para cada variable de observación
    limites = [
        (-4.8, 4.8),  # Posición del carro
        (-10.0, 10.0),  # Velocidad del carro (estimado)
        (-0.418, 0.418),  # Ángulo del poste en radianes
        (-10.0, 10.0)  # Velocidad angular del poste (estimado)
    ]
    
    num_neuronas_por_variable = 20
    intervals = []

    for low, high in limites:
        # Generar valores centrados en 0 siguiendo una distribución normal
        values = np.random.normal(loc=0, scale=1, size=1000)
        z = np.linspace(low, high, num_neuronas_por_variable + 1)
        interval_limits = np.percentile(values, (0.5 * (1 + erf(z / np.sqrt(2)))) * 100)
        # Dividir los valores en intervalos
        intervals = [values[(values >= interval_limits[i]) & (values < interval_limits[i+1])] for i in range(num_neuronas_por_variable)]
        intervals[-1] = np.append(intervals[-1], values[-1])  # Asegurar que el último intervalo incluye el valor máximo

    flag=True
    while h < episodes:
        j = 0
        returns = []
        actions_done = []
        terminated = False
        truncated = False
        while j < max_steps and not terminated and not truncated:
            # Codificar observación
            for i, obs in enumerate(observation):  # Primer ciclo: Itera sobre cada observación
                for j in range(num_neuronas_por_variable):
                    if obs >= interval_limits[j] and obs < interval_limits[j + 1]:
                        pop[input_index[i * num_neuronas_por_variable + j]].I = 75 # Activa la neurona correspondiente
                        break
            simulate(50.0)
            spikes = Monitor.get('spike')
            # Decodificar la acción basada en el número de picos en las neuronas de salida
            left_spikes = sum(np.size(spikes[idx]) for idx in output_index[:20])  # Neuronas que controlan el movimiento a la izquierda
            right_spikes = sum(np.size(spikes[idx]) for idx in output_index[20:])  # Neuronas que controlan el movimiento a la derecha
            
            action = env.action_space.sample()
            if left_spikes > right_spikes:
                action = 0  # Mover a la izquierda
            elif left_spikes < right_spikes:
                action = 1  # Mover a la derecha

            observation, reward, terminated, truncated, info = env.step(action)
            returns.append(reward)
            actions_done.append(action)
            pop.reset()
            Monitor.reset()
            #resetear I=0, resetear a -65 (Iz valor de descanso)
            j += 1
        env.reset()
        final_fitness += np.sum(returns)
        h += 1

    final_fitness = final_fitness / episodes
    env.close()
    return final_fitness


Overwriting fitness.py


# Hiperparámetros evolutivos

Se deben definir un conjunto de hiperparametros que se utilizarán en el proceso de evolución, además se deben definir ciertos parametros de configuración relacionados a la poblaciòn, función objetivo y entre otros.

Para ello primero se debe contar con una carpeta llamada config donde se tendrá un archivo con los hiperparametros a utilizar.

In [5]:
%mkdir -p config

A continuación una definición de los elementos contenidos en el archivo de configuración

- keep: porcentaje de población que quedará luego del proceso de eliminación
- threshold: Umbral de diferencia entre un individuo y el representante de una especie para incorporarlos a la especie en cuestion
- interSpecieRate: probabilidad de generar un entrecruzamiento entre individuos de distintas especies
- noCrossoverOff: probabilidad de generar un individuo nuevo en la población, unicamente de una mutación.
- probabilityWeightMutated: Probabilidad de que una mutación sea cambiar el peso de una conexión aleatoria
- probabilityAddNodeSmall: Probabilidad de que una mutación sea añadir un nodo en una conexión aleatoria para una red pequeña
- probabilityAddLink_small: Probabilidad de que una mutación sea añadir una conexión aleatoria para una red pequeña
- probabilityAddNodeLarge: Probabilidad de que una mutación sea añadir un nodo en una conexión aleatoria para una red grande
- probabilityAddLink_Large: Probabilidad de que una mutación sea conexión aleatoria para una red grande
- c1, c2 y c3: Factores utilizados en el calculo de un valor representativo de la red, utilizado en la especiación
- largeSize: Cantidad de neuronas necesarias para considerar a una red como grande
- numberInputs: Cantidad de neuronas de entrada en cada red
- numberOutputs: Cantidad de neuronas de salida en cada red
- n_max: Cantidad de neuronas maximas que puede tener una red
- learningRate: Valor que define el maximo que se le sumará o restará al peso de una conexión
- inputWeights: Serie de valores separados por coma, que pueden ser utilizados en la función objetivo.
- weightsRange: Valores que tendrán los pesos de las redes al crearlas. Puede ser un rango n,m (donde n < m) y se tomará valores aleatorios en dicho rango. También si se desea tener pesos de un solo valor "n", pero que sean positivos y negativos de forma aleatoria se debe definir como n,n
- function: Nombre de la función objetivo definida
- neuronModel: Nombre del modelo neuronal escogido

In [6]:
%%writefile config/config.cfg
keep=0.49
threshold=3.251
interSpeciesRate=0.0001
noCrossoverOff=0.159
probabilityWeightMutated=0.821
probabilityAddNodeSmall=0.026
probabilityAddLink_small=0.038
probabilityAddNodeLarge=0.223
probabilityAddLink_Large=0.154
c1=1.188
c2=1.09
c3=0.481
largeSize=20
numberInputs=8
numberOutputs=2
n_max=200
learningRate=5
inputWeights=110,150
weightsRange=-20,80

Overwriting config/config.cfg


Parametros de ejecución

- func: Nombre de la función objetivo a evaluar
- neuron_model: Nombre del modelo neuronal utilizado en la red
- procesos: Cantidad de procesos utilizados en la evaluación de los individuos de la población
- evolutions: Cantidad de iteraciones del ciclo evolutivo, es decir las numero de evoluciones de la población
- population: Cantidad de genomas en la red

# Ejemplo 1 Cartpole A LIF

In [7]:
func = "cartpole"
neuron_model = "LIF"
procesos = 2
evolutions = 2
population = 4

In [8]:
from neatannarchy import runNEAT

#runNEAT requiere como entrada un valor que identificará la carpeta donde se guardará la información de la ejecución
#esta carpeta se guardará como results/trial-X, donde X es el valor de la entrada
#Las otras entradas son el nombre de la función de fitness, el modelo de neurona, el número de procesos, el número de evoluciones y el tamaño de la población
fitness1 = runNEAT(1, func, neuron_model, procesos, evolutions, population)
print("Fitness: ", fitness1)

Fitness:  15.94


# Ejemplo 2 Cartpole B LIF


In [9]:
func = "cartpoleB"
neuron_model = "LIF"
procesos = 2
evolutions = 2
population = 4

fitness2 = runNEAT(2, func, neuron_model, procesos, evolutions, population)
print("Fitness: ", fitness2)

Fitness:  -1.0


# Ejemplo 3 Cartpole A Izhikevich

In [11]:
func = "cartpole"
neuron_model = "IZHIKEVICH"
procesos = 2
evolutions = 2
population = 4

fitness3 = runNEAT(3, func, neuron_model, procesos, evolutions, population)
print("Fitness: ", fitness3)

Fitness:  91.73
