In [None]:
import random
import numpy as np

In [None]:
# Se crea la matriz de pesos y recompensas de los cargamentos
weight = [61, 58, 92, 50, 108, 83, 93, 101, 54, 50, 72, 51, 100, 108, 91, 112, 66, 58, 110, 73]
reward = [1100, 1147, 1442, 1591, 1078, 1385, 1777, 1196, 1753, 1371, 1517, 1675, 1193, 1177, 1365, 1143, 1314, 1526, 1470, 1605]

In [None]:
# Se crea la clase de agente, cuenta con sus cromosomas, peso y recompensa
class Agent():
    def __init__(self, num_genes=20):
        self.chromosome = [bool(random.choice([0, 1])) for _ in range(num_genes)]
        self.num_genes = num_genes
        self.weight = 0
        self.reward = 0
    #Se crea la función de mutar el cual elige un gen al azar y lo cambia
    def mutate(self):
        gene = random.randint(0, self.num_genes - 1)
        self.chromosome[gene] = not self.chromosome[gene]

In [105]:
#Esta función calcula el peso de cada agente en la población
def calc_weight(population, weight):
    for entity in population:
        entity.weight = sum([entity.chromosome[i] * weight[i] for i in range(entity.num_genes)])
        
#Esta función calcula la recompensa de cada agente en la población
def calc_reward(population, reward):
    for entity in population:
        entity.reward = sum([entity.chromosome[i] * reward[i] for i in range(entity.num_genes)])
    
#Esta función calcula el fitness de cada agente en la población, se penaliza si el peso supera el límite
def calc_fitness(population, weight, reward):
    max_weight = 800
    total_penalty = 0
    for entity in population:
        if entity.weight > max_weight:
            reward_per_weight = [reward_element / weight_element for reward_element, weight_element in zip(reward, weight)]
            penalty_per_unit = np.mean(reward_per_weight)
            total_penalty = (entity.weight - max_weight) * penalty_per_unit + 1300
        entity.fitness = entity.reward - total_penalty

In [106]:
#Se toma la mitad de la población con mejor fitness
def selection(population):
    sorted_population = sorted(population, key=lambda x: x.fitness, reverse=True)
    return sorted_population[:len(population)//2]
    
#Se realiza el cruce de los cromosomas de los agentes
def crossover(population):
    offspring = []
    
    # Convert the elements list to a numpy array
    arpopulation = np.array(population)
    
    # Shuffle the elements using numpy's shuffle
    np.random.shuffle(arpopulation)

    # Check if the number of elements is even
    if len(arpopulation) % 2 != 0:
        raise ValueError("The number of elements must be even to form pairs.")
    
    # Reshape the array into pairs
    arparents = arpopulation.reshape(-1, 2)
    
    # Convert the numpy array of pairs back to a list of lists
    parents = arparents.tolist()
    
    for parent in parents:
        parent1 = parent[0] 
        parent2 = parent[1]
        child1 = Agent()
        child2 = Agent()
        child3 = Agent()
        child4 = Agent()
        child1.chromosome = parent1.chromosome[:10] + parent2.chromosome[10:]
        child2.chromosome = parent2.chromosome[:10] + parent1.chromosome[10:] 
        child3.chromosome = parent2.chromosome[10:] + parent2.chromosome[:10]
        child4.chromosome = parent1.chromosome[10:] + parent1.chromosome[:10]
        childs = [child1, child2, child3, child4]
        
        # Se toman solo los dos mejores hijos de cada cruce
        for child in childs:
            calc_weight([child], weight)
            calc_reward([child], reward)
            calc_fitness([child], weight, reward)
        childs = sorted(childs, key=lambda x: x.fitness)
        childs = childs[2:]
        offspring.extend(childs)

        
        
    return offspring
# Se realiza la probabilidad de mutación
def mutation(population):
    for entity in population:
        if random.random() < 0.0001: #Probabilidad de mutacion
            entity.mutate()
    return population

In [186]:
#population_size = int(0.01 * len(weight)**20)
from numpy import cross

# Se inicializa la población
population_size = 300
population = [Agent(num_genes=20) for _ in range(population_size)]
counter = 0
past_agent = 0
epoch = 0
#Número de epocas
while counter < 2:
    epoch += 1
    calc_weight(population, weight)
    calc_reward(population, reward)
    calc_fitness(population, weight, reward)
    purged_population = selection(population)
    babies = crossover(purged_population)
    mutated_babies = mutation(babies)
    purged_population.extend(mutated_babies)
    population = purged_population
    #Look for the best agent
    best_agent = max(population, key=lambda x: x.fitness)
    if best_agent.fitness == past_agent:
        counter += 1
    else:
        counter = 0
    past_agent = best_agent.fitness
    print("Epoca:"+ str(epoch))
    print("Este es el fitness mejor agente: " + str(best_agent.fitness))
    print("Este es el reward mejor agente: " + str(best_agent.reward))
    print("Este es el peso mejor agente: " + str(best_agent.weight))


Epoca:1
Este es el fitness mejor agente: 16900
Este es el reward mejor agente: 16900
Este es el peso mejor agente: 794
Epoca:2
Este es el fitness mejor agente: 16661
Este es el reward mejor agente: 16661
Este es el peso mejor agente: 708
Epoca:3
Este es el fitness mejor agente: 17761
Este es el reward mejor agente: 17761
Este es el peso mejor agente: 769
Epoca:4
Este es el fitness mejor agente: 17812
Este es el reward mejor agente: 17812
Este es el peso mejor agente: 794
Epoca:5
Este es el fitness mejor agente: 18103
Este es el reward mejor agente: 18103
Este es el peso mejor agente: 800
Epoca:6
Este es el fitness mejor agente: 18103
Este es el reward mejor agente: 18103
Este es el peso mejor agente: 800
Epoca:7
Este es el fitness mejor agente: 18103
Este es el reward mejor agente: 18103
Este es el peso mejor agente: 800
Epoca:8
Este es el fitness mejor agente: 18103
Este es el reward mejor agente: 18103
Este es el peso mejor agente: 800
