In [4]:
import numpy as np
import matplotlib.pyplot as plt
import pandas as pd
import plotly.graph_objects as go
import time
import os
import pickle

from plotly.subplots import make_subplots
from my_lib.utility import *
from openpyxl import load_workbook
from openpyxl.styles import PatternFill

## Actividad 3: Algoritmo genético para resolver el problema del viajero frecuente

El problema es de tipo TSP con 18 ciudades del conteninte Americano. Por lo tanto existen $18!\$ soluciones posibles ($6402373705728000$), dada el basto espacio de busqueda la población de individuos se debe limitar a minimo 100 y máximo 500.

> Criterios para la evaluación
> - Implementar 2 métodos de cruza, PMX y algún otro método como OX o CX
> - Implementar 2 métodos de mutación, Scramble y Heuristic
> - Implementar un método de selección, cualquiera de los ya vistos
> - Implementar un método hibrido de paro
> - Implementar un méotodo elitista
> - Realizar las comparaciones y la discusión de los resultados

# Codificación del dominio

In [5]:
ciudades18 = {
    'Ciudad': ['Mexico City', 'Merida', 'Buenos Aires', 'Quito', 'Washington D.C.', 
               'New York', 'Miami', 'Monterrey', 'Panama City', 'San Salvador',
               'Managua', 'Brazilia', 'Mendoza', 'Caracas', 'Montevideo', 
               'Guadalajara', 'Boston', 'Bogotá'],
    'Latitud': [19.4326, 20.9674, -34.6037, -0.1807, 38.9072, 
                40.7128, 25.7617, 25.6866, 8.9824, 13.6929, 
                12.1140, -15.8267, -32.8895, 10.4806, -34.9011, 
                20.6597, 42.3601, 4.7110],
    'Longitud': [-99.1332, -89.5926, -58.3816, -78.4678, -77.0369, 
                 -74.0060, -80.1918, -100.3161, -79.5199, -89.2182, 
                 -86.2362, -47.9218, -68.8458, -66.9036, -56.1645, 
                 -103.3496, -71.0589, -74.0721]
} 
nombre_ciudades = np.array(ciudades18['Ciudad'])

In [6]:
id_ciudades = np.arange(nombre_ciudades.shape[0])
bin_ciudades = binarizar(datos=id_ciudades,nbites=3)

ciudades = np.zeros((nombre_ciudades.shape[0],4),dtype="object")
ciudades[:,0] = nombre_ciudades
ciudades[:,1] = id_ciudades
ciudades[:,2] = bin_ciudades
ciudades[:,3] = np.zeros((nombre_ciudades.shape[0]))
print(ciudades)

[['Mexico City' 0 '000' 0.0]
 ['Merida' 1 '001' 0.0]
 ['Buenos Aires' 2 '010' 0.0]
 ['Quito' 3 '011' 0.0]
 ['Washington D.C.' 4 '100' 0.0]
 ['New York' 5 '101' 0.0]
 ['Miami' 6 '110' 0.0]
 ['Monterrey' 7 '111' 0.0]
 ['Panama City' 8 '1000' 0.0]
 ['San Salvador' 9 '1001' 0.0]
 ['Managua' 10 '1010' 0.0]
 ['Brazilia' 11 '1011' 0.0]
 ['Mendoza' 12 '1100' 0.0]
 ['Caracas' 13 '1101' 0.0]
 ['Montevideo' 14 '1110' 0.0]
 ['Guadalajara' 15 '1111' 0.0]
 ['Boston' 16 '10000' 0.0]
 ['Bogotá' 17 '10001' 0.0]]


## Matriz de distancias

#### Fórmula de Haversine 

$d = 2r \cdot arsin(\sqrt{sin^2(\frac{\Delta\phi}{2}) + cos(\phi_1) \cdot cos(\phi_2) \cdot sin^2(\frac{\Delta\lambda}{2})})$

* d es la distancia entre los dos puntos 
* r = radio de la tierra (6371)
* $\phi_1, \phi_2$ = latitudes de los puntos en rad
* $\Delta\phi$ = diferencia de las latitudes
* $\Delta\lambda$ = diferencia de las longitudes


In [7]:
# Latitud y longitud de cada ciudad

n_ciudades = ciudades.shape[0]
distancias = np.zeros((n_ciudades, n_ciudades))

for i in range(n_ciudades):
    c1_latitud = ciudades18["Latitud"][i]
    c1_longitud = ciudades18["Longitud"][i]
    for j in range(n_ciudades):
        if i != j:
            c2_latitud = ciudades18["Latitud"][j]
            c2_longitud = ciudades18["Longitud"][j]
            distancias[i][j] = get_distancia(
                lat1=c1_latitud, long1=c1_longitud, lat2=c2_latitud, long2=c2_longitud
            )

distancias_df = pd.DataFrame(distancias,columns=ciudades18["Ciudad"],index=ciudades18["Ciudad"])
display(distancias_df)

Unnamed: 0,Mexico City,Merida,Buenos Aires,Quito,Washington D.C.,New York,Miami,Monterrey,Panama City,San Salvador,Managua,Brazilia,Mendoza,Caracas,Montevideo,Guadalajara,Boston,Bogotá
Mexico City,0.0,1009.959843,7392.178684,3135.709015,3031.811604,3359.383041,2065.27296,705.925938,2408.857647,1233.956557,1600.957943,6835.065741,6648.609671,3595.449156,7554.599238,461.067374,3665.482788,3170.731318
Merida,1009.959843,0.0,7004.211339,2644.150812,2327.56526,2643.050506,1097.212425,1213.52072,1715.030837,809.861482,1047.292813,6116.463263,6381.173335,2689.07002,7144.536815,1429.853511,2941.198434,2464.943628
Buenos Aires,7392.178684,7004.211339,0.0,4360.060643,8396.527908,8526.194114,7094.952486,8028.590573,5333.037977,6280.332978,5968.507501,2334.403612,985.614665,5093.044534,205.232076,7766.608993,8654.780454,4670.520317
Quito,3135.709015,2644.150812,4360.060643,0.0,4348.827501,4569.460001,2890.594533,3711.248568,1025.530802,1944.67944,1613.735904,3776.161246,3774.047997,1743.741681,4501.636863,3562.151769,4788.167318,730.923189
Washington D.C.,3031.811604,2327.56526,8396.527908,4348.827501,0.0,327.582714,1491.176569,2623.50027,3336.690529,3048.362836,3114.733025,6797.691847,8028.085133,3317.116974,8483.304262,3229.236038,633.671486,3814.195109
New York,3359.383041,2643.050506,8526.194114,4569.460001,327.582714,0.0,1757.961225,2945.076096,3570.004517,3348.328915,3397.166346,6839.011011,8201.32739,3433.343519,8603.779701,3554.283691,306.108494,4003.222959
Miami,2065.27296,1097.212425,7094.952486,2890.594533,1491.176569,1757.961225,0.0,2013.994655,1867.122418,1639.74284,1644.533412,5794.75809,6631.4023,2200.658515,7204.245436,2430.007251,2025.336834,2429.837957
Monterrey,705.925938,1213.52072,8028.590573,3711.248568,2623.50027,2945.076096,2013.994655,0.0,2876.282439,1766.700637,2111.06086,7310.080266,7315.684383,3898.681265,8184.245928,639.142332,3245.755067,3640.297547
Panama City,2408.857647,1715.030837,5333.037977,1025.530802,3336.690529,3570.004517,1867.122418,2876.282439,0.0,1179.637483,812.486225,4440.058794,4791.33643,1392.559785,5462.750288,2865.971802,3802.437689,766.25443
San Salvador,1233.956557,809.861482,6280.332978,1944.67944,3048.362836,3348.328915,1639.74284,1766.700637,1179.637483,0.0,367.803223,5601.769099,5613.686901,2451.382655,6430.418383,1687.99176,3634.269046,1937.742276


# Generación de población

Para poder realizar una buena comparación con las distintas combinaciones de operadores genéticos se trabajará con 5 poblaciones iniciales, las cuales son las mismas parar cada experimento


Si ya existe el archivo de poblaciones no hay necesidad de crear nuevamente las poblaciones iniciales

In [8]:
POB_FILE = "files\poblaciones_3.pkl"

In [9]:
def get_poblaciones_iniciales(n=5, tam_pob=60):
    """
    Genera y carga las poblaciones iniciales para un algoritmo genético.

    Si el archivo de poblaciones no existe, la función lo crea generando las poblaciones iniciales y guardándolas en el archivo.
    Si el archivo ya existe, la función lo carga y devuelve las poblaciones.

    Parámetros:
        n (int): Número de poblaciones iniciales a generar (por defecto, 5).
        tam_pob (int): Tamaño de cada población (por defecto, 60).

    Valor de retorno:
        list: Lista de poblaciones iniciales, donde cada población es una matriz de numpy con 4 columnas: ruta, aptitud, individuo y aptitud.
    """
    poblaciones = []
    POB_PATH = os.path.join("..", POB_FILE)
    if not os.path.exists(POB_PATH):
        print("El archivo de poblaciones no existse, creando archivo")
        
        for i in range(n):
            recorrido = generar_poblacion_perm(ciudades, tam_pob)
            
            poblacion = np.zeros((recorrido.shape[0], 4), dtype="object")
            poblacion[:, 0] = [c.astype(int) for c in recorrido]  # Ruta
            poblacion[:, 1] = np.ones((recorrido.shape[0]))
            poblacion[:,2] = [" ".join([chr(c+64) for c in perm.astype(int)]) for perm in recorrido]
            # poblacion[:, 2] = [individuo_toString(c.astype(int)) for c in recorrido]
            poblacion[:, 3] = np.zeros((recorrido.shape[0]))  # Aptitud
        
            poblaciones.append(poblacion)
        
        try:
            with open(POB_PATH, "wb") as f:
                pickle.dump(poblaciones,f)
            print("Archivo de poblaciones creado correctamente")
        except Exception as e:
            print(f"Error al guardar archivo: {e}")
            
    else:
        try:
            with open(POB_PATH, "rb") as f:
                poblaciones = pickle.load(f)
            print("Archivo de poblaciones cargado correctamente")
        except Exception as e:
            print(f"Error al cargar archivo: {e}")
    
    return poblaciones

In [10]:
pobs = get_poblaciones_iniciales(n=5,tam_pob=100)
print(len(pobs))
print(pobs[0][:2])

Archivo de poblaciones cargado correctamente
5
[[array([12, 16, 13,  3,  9, 14,  7,  1, 15,  0, 10,  6,  4,  5,  8, 17, 11,
          2])
  1.0 'L P M C I N G A O @ J F D E H Q K B' 0.0]
 [array([12, 17,  3,  0, 13,  9, 14, 15,  1,  2, 16,  5,  7,  8, 10,  6,  4,
         11])
  1.0 'L Q C @ M I N O A B P E G H J F D K' 0.0]]


# Función objetivo

In [11]:
def y(ciudad1,ciudad2):
    return distancias[ciudad1,ciudad2]

def evaluar(poblacion):
    evaluacion = np.zeros((poblacion.shape[0]))
    for idx,fila in enumerate(poblacion):
        individuo = fila[0]
        n = len(individuo) - 1
        aptitud = 0
        
        for i in range (n,-1,-1):
            c1 = int(individuo[i]) #Id de la ciudad
            c2 = int(individuo[i-1])
            distancia = y(c1,c2)
            aptitud += distancia
        evaluacion[idx] = np.around(aptitud,4)
        
    return evaluacion

In [12]:
def historial_cruces(descendencia):
    hijos = [ind[0] for ind in descendencia]
    padres_codificados = [ind[1] for ind in descendencia]
    padres_codificados = [
        [p.replace(" ", "") for p in padres] for padres in padres_codificados
    ]
    padres_decodificados = [
        [[ord(c) - 64 for c in p] for p in padres] for padres in padres_codificados
    ]
    
    historial = []
    
    for j in range(0,len(hijos),2):
        fila = np.array([padres_decodificados[j][0],padres_decodificados[j][1],hijos[j],hijos[j+1]])
        historial.append(fila)

    return np.array(historial)

In [13]:
def get_report(n_poblacion,poblacion,time=None):
    info = np.zeros((8))
    info[0] = n_poblacion
    info[1] = np.around(np.mean(poblacion[:,3]),decimals=2)
    info[2] = np.around(np.var(poblacion[:,3]),decimals=2)
    info[3] = np.around(np.std(poblacion[:,3]),decimals=2)
    info[4] = np.around(np.min(poblacion[:,3]),decimals=2)
    info[5] = np.around(np.max(poblacion[:,3]),decimals=2)
    info[6] = np.around(diversity_rate(poblacion),decimals=2)
    if time:
        info[7] = time
    
    return info

In [14]:
def intial_stats(pobs, msg):
    reportes_iniciales = np.array([get_report(i + 1, p) for i, p in enumerate(pobs)])
    # Comportamiento de las poblaciones iniciales
    fig = make_subplots(
        rows=6,
        cols=1,
        subplot_titles=[
            "Costo promedio",
            "Varianza del costo",
            "Desviación estándar",
            "Individuos con menor costo población inicial",
            "Individuos mayor costo población inicial",
            "Diversidad de genes",
        ],
    )

    fig.add_trace(
        go.Scatter(
            x=reportes_iniciales[:, 0],
            y=reportes_iniciales[:, 1],
            mode="markers+lines",
            name="Costo promedio inicial",
            marker=dict(symbol="star-diamond", size=8),
        ),
        row=1,
        col=1,
    )
    fig.add_trace(
        go.Scatter(
            x=reportes_iniciales[:, 0],
            y=reportes_iniciales[:, 2],
            mode="markers+lines",
            marker=dict(symbol="diamond-x", size=8),
            name="Varianza costo",
        ),
        row=2,
        col=1,
    )
    fig.add_trace(
        go.Scatter(
            x=reportes_iniciales[:, 0],
            y=reportes_iniciales[:, 3],
            mode="markers+lines",
            marker=dict(symbol="octagon", size=8),
            name="Desviación costo",
        ),
        row=3,
        col=1,
    )
    fig.add_trace(
        go.Scatter(
            x=reportes_iniciales[:, 0],
            y=reportes_iniciales[:, 4],
            mode="markers+lines",
            marker=dict(symbol="bowtie", size=8),
            name="Costo menor",
        ),
        row=4,
        col=1,
    )
    fig.add_trace(
        go.Scatter(
            x=reportes_iniciales[:, 0],
            y=reportes_iniciales[:, 5],
            mode="markers+lines",
            marker=dict(symbol="bowtie", size=8),
            name="Costo mayor",
        ),
        row=5,
        col=1,
    )
    fig.add_trace(
        go.Scatter(
            x=reportes_iniciales[:, 0],
            y=reportes_iniciales[:, 6],
            mode="markers+lines",
            marker=dict(symbol="hexagram", size=8),
            name="Costo mayor",
        ),
        row=6,
        col=1,
    )

    fig.update_layout(height=1000, width=900)  # Ajusta el tamaño de la figura
    # Agrega títulos a los ejes x y y de cada gráfica
    fig.update_layout(
        title=f"{msg}",
        xaxis1=dict(title="número población"),  # Eje x de la primera gráfica
        yaxis1=dict(title="Costo"),  # Eje y de la primera gráfica
        xaxis2=dict(title="número población"),  # Eje x de la segunda gráfica
        yaxis2=dict(title="Costo"),  # Eje y de la segunda gráfica
        xaxis3=dict(title="número población"),  # Eje x de la tercera gráfica
        yaxis3=dict(title="Costo"),  # Eje y de la tercera gráfica
        xaxis4=dict(title="número población"),  # Eje x de la tercera gráfica
        yaxis4=dict(title="Costo"),  # Eje y de la tercera gráfica
        xaxis5=dict(title="número población"),  # Eje x de la tercera gráfica
        yaxis6=dict(title="Costo"),  # Eje y de la tercera gráfica
    )
    fig.show()

In [15]:
def show_report(resutaldos, n_gen, total_pobs=5, msg=""):
    gen_reports = np.zeros((total_pobs, n_gen, 8))
    for i, rg in enumerate(resutaldos):
        rg_tiempos = rg[:, 1]
        rg_res = rg[:, 0]

        rg_res_pobs = np.array([respob[0] for respob in rg_res])
        rg_report = np.array(
            [
                get_report(k + 1, rpob, rg_tiempos[k])
                for k, rpob in enumerate(rg_res_pobs)
            ]
        )
        gen_reports[i] = rg_report

    fig = make_subplots(
        rows=3,
        cols=2,
        subplot_titles=[
            "Costo promedio",
            "Varianza",
            "Desviación estándar",
            "Costo menor",
            "Costo mayor",
            "Diversidad genética",
        ],
    )

    colors = [
        "#f5bde6",  # muted blue
        "#c6a0f6",  # safety orange
        "#ed8796",  # cooked asparagus green
        "#a6da95",  # brick red
        "#7dc4e4",  # muted purple
    ]

    for i, pop in enumerate(gen_reports):
        fig.add_trace(
            go.Scatter(
                x=pop[:, 0],
                y=pop[:, 1],
                name=f"Población {i+1}",
                mode="markers+lines",
                marker=dict(symbol="star-dot", size=10, color=colors[i]),
                legendgroup=f"Población {i+1}",
            ),
            row=1,
            col=1,
        )

        fig.add_trace(
            go.Scatter(
                x=pop[:, 0],
                y=pop[:, 2],
                name=f"Población {i+1}",
                mode="markers+lines",
                marker=dict(symbol="star-dot", size=10, color=colors[i]),
                legendgroup=f"Población {i+1}",
            ),
            row=1,
            col=2,
        )

        fig.add_trace(
            go.Scatter(
                x=pop[:, 0],
                y=pop[:, 3],
                name=f"Población {i+1}",
                mode="markers+lines",
                marker=dict(symbol="star-dot", size=10, color=colors[i]),
                legendgroup=f"Población {i+1}",
            ),
            row=2,
            col=1,
        )

        fig.add_trace(
            go.Scatter(
                x=pop[:, 0],
                y=pop[:, 4],
                name=f"Población {i+1}",
                mode="markers+lines",
                marker=dict(symbol="star-dot", size=10, color=colors[i]),
                legendgroup=f"Población {i+1}",
            ),
            row=2,
            col=2,
        )

        fig.add_trace(
            go.Scatter(
                x=pop[:, 0],
                y=pop[:, 5],
                name=f"Población {i+1}",
                mode="markers+lines",
                marker=dict(symbol="star-dot", size=10, color=colors[i]),
                legendgroup=f"Población {i+1}",
            ),
            row=3,
            col=1,
        )

        fig.add_trace(
            go.Scatter(
                x=pop[:, 0],
                y=pop[:, 6],
                name=f"Población {i+1}",
                mode="markers+lines",
                marker=dict(symbol="star-dot", size=10, color=colors[i]),
                legendgroup=f"Población {i+1}",
            ),
            row=3,
            col=2,
        )

    for i in range(6):
        fig.update_xaxes(title_text="Generación", row=(i // 2) + 1, col=(i % 2) + 1)

    fig.update_layout(height=1200, width=1000, title=f"{msg}")
    fig.show()

In [16]:
def create_excel_hist(reslt,file_name):
    # Colores de resaltado
    fill_green = PatternFill(start_color="00FF00", end_color="00FF00", fill_type="solid")
    fill_yellow = PatternFill(start_color="FFFF00", end_color="FFFF00", fill_type="solid")

    #arch = "exp1_no_mutacion_style2.xlsx"
    hist_file = f"../files/act_2/{file_name}"

    with pd.ExcelWriter(hist_file, engine='openpyxl') as writer:
        for i, res in enumerate(reslt):
            start_row = 0

            for g, gen_res in enumerate(res[:, 0]):
                # Crear los DataFrames
                historial_generaciones = np.zeros((gen_res[0][:, 0].shape[0], 2), dtype="object")
                historial_generaciones[:, 0] = np.array([" ".join([str(c) for c in r]) for r in gen_res[0][:, 0]])
                historial_generaciones[:, 1] = gen_res[0][:, 3]
                
                hg_df = pd.DataFrame(historial_generaciones, columns=["Ruta", "Distancia"])

                # DataFrame de cruces con columnas adicionales
                historial_cruces = np.zeros((gen_res[1].shape[0], 4), dtype="object")
                historial_cruces[:, 0] = np.array([" ".join([str(c) for c in r]) for r in gen_res[1][:, 0]])
                historial_cruces[:, 1] = np.array([" ".join([str(c) for c in r]) for r in gen_res[1][:, 1]])
                historial_cruces[:, 2] = np.array([" ".join([str(c) for c in r]) for r in gen_res[1][:, 2]])
                historial_cruces[:, 3] = np.array([" ".join([str(c) for c in r]) for r in gen_res[1][:, 3]])
                
                hc_df = pd.DataFrame(historial_cruces, columns=["Padre 1", "Padre 2", "Hijo 1", "Hijo 2"])
                hc_df["Apto h1"] = hc_df["Hijo 1"].isin(hg_df["Ruta"])
                hc_df["Apto h2"] = hc_df["Hijo 2"].isin(hg_df["Ruta"])

                # DataFrame de mutantes con columna adicional
                historial_mutante = gen_res[2]
                hm_df = pd.DataFrame(historial_mutante, columns=["Original", "Mutante", "Incio mutación", "Genes mutados"])
                hc_df["mutado 1"] = hc_df["Hijo 1"].isin(hm_df["Original"])
                hc_df["mutado 2"] = hc_df["Hijo 2"].isin(hm_df["Original"])
                hm_df["Apto mut"] = hm_df["Mutante"].isin(hg_df["Ruta"])

                # Agregar columnas "Cruza" y "Mutado" a hg_df
                hg_df["Cruza"] = hg_df["Ruta"].isin(hc_df["Hijo 1"]) | hg_df["Ruta"].isin(hc_df["Hijo 2"])
                hg_df["Mutado"] = hg_df["Ruta"].isin(hm_df["Mutante"])

                start_col = 0
                hg_df.to_excel(writer, sheet_name=f"Poblacion_{i}", index=False, startrow=start_row, startcol=start_col)
                start_col += hg_df.shape[1] + 1
                
                hc_df.to_excel(writer, sheet_name=f"Poblacion_{i}", index=False, startrow=start_row, startcol=start_col)
                start_col += hc_df.shape[1] + 1
                
                hm_df.to_excel(writer, sheet_name=f"Poblacion_{i}", index=False, startrow=start_row, startcol=start_col)
                
                start_row += hg_df.shape[0] + 2
                
    # Resaltar las celdas
    wb = load_workbook(hist_file)
    for sheet_name in wb.sheetnames:
        ws = wb[sheet_name]
        
        for row in ws.iter_rows(min_row=2, max_row=ws.max_row, min_col=1, max_col=ws.max_column):
            ruta_value = row[0].value  # Valor de la columna "Ruta"
            cruza_value = row[2].value  # Valor de la columna "Cruza"
            mutado_value = row[3].value  # Valor de la columna "Mutado"
            
            # Resaltar en verde si "Cruza" es True
            if cruza_value:
                row[0].fill = fill_green
            # Resaltar en amarillo si "Mutado" es True
            if mutado_value:
                row[0].fill = fill_yellow

    wb.save(hist_file)

In [17]:
def seleccion_cruza(poblacion, op_seleccion=0, op_cruza=3, mode="min"):
    desc = get_next_gen(poblacion, op_seleccion, op_cruza, mode)
    cruces = historial_cruces(desc)
    hijos = np.array([hijo[0] for hijo in desc])
    # new_age = poblacion.copy()
    new_age = np.zeros((hijos.shape[0], 4), dtype="object")
    for i, hijo in enumerate(hijos):
        # nuevo_indiviudo = np.zeros((1, 4), dtype="object")
        # nuevo_indiviudo[0, 0] = hijo
        # nuevo_indiviudo[0, 1] = 1.0
        # nuevo_indiviudo[0, 2] = " ".join([chr(c + 64) for c in hijo])
        # nuevo_indiviudo[0, 3] = evaluar(nuevo_indiviudo)[0]
        # new_age = np.vstack([new_age, nuevo_indiviudo])
        new_age[i, 0] = hijo
        new_age[i, 1] = 1.0
        new_age[i, 2] = " ".join([chr(c + 64) for c in hijo])
    # new_age[:, 3] = evaluar(new_age)
    return new_age, cruces


def msg_info_exp(msg):
    print("===================================================================")
    print(f"{msg}")


def msg_info_inicial(num_pob, poblacion):
    print("===================================================================")
    print(f"Población incial #{num_pob+1}")
    print(f"Costo promedio inicial {np.mean(poblacion[:,3])}")


def msg_info_generacion(num_gen, poblacion, tiempo):
    print("...................................................................")
    print(f"Generación: {num_gen}")
    print(f"Costo promedio: {np.mean(poblacion[:,3])}")
    print(f"Varianza del costo en la genearción: {np.var(poblacion[:,3])}")
    print(f"Desviación estándar del costo en la genearción: {np.std(poblacion[:,3])}")
    print(f"Diversidad promedio: {diversity_rate(poblacion)} genes")
    print(f"Menor costo de toda la generación : {np.min(poblacion[:,3])}")
    print(f"Mayor costo de toda la generación : {np.max(poblacion[:,3])}")
    print(f"Tiempo de ejecución de la genaración {num_gen}: {tiempo}")

    print("...................................................................")


def msg_tiempo_pob(num_pob, tiempo):
    print("--------------------------------------------------------------------")
    print(f"Tiempo de ejecución para la población #{num_pob+1}: {tiempo}")
    print("===================================================================")


def experimentacion(
    poblaciones_iniciales,
    max_gen=10,
    op_seleccion=0,
    op_cruza=3,
    mode="min",
    mutar=False,
):
    start_exp_time = time.time()
    msg_info_exp("Inicio del algoritimo genético")
    gen_results = []

    tam_pob = poblaciones_iniciales[0].shape[0]
    for i in range(len(poblaciones_iniciales)):
        poblacion = poblaciones_iniciales[i]
        poblacion[:, 3] = evaluar(poblacion)
        poblacion = ordenar_poblacion(poblacion, reverse=True)

        msg_info_inicial(i, poblacion)
        pob_time = 0

        historial_generacional = np.zeros((max_gen, 2), dtype="object")

        for gen in range(max_gen):
            start_gen_time = time.time()
            # if GEN >= MAX_GEN or paro_epsilon(poblacion, 14000, 0.9, opt=1):
            #     print("Convergencia alcanzada")
            #     break

            new_age, cruces = seleccion_cruza(poblacion, op_seleccion, op_cruza, "min")
            mutantes = np.zeros((1, 4))

            if mutar:
                print("mutar")
                pob_mutante, mutantes = mutation(
                    new_age,
                    opt=1,
                    operator=0,
                    funcion_aptitud=evaluar,
                    cromosomas_mutation=6,
                )
                new_age = pob_mutante.copy()

            new_age = np.vstack([poblacion, new_age])
            new_age[:,3] = evaluar(new_age)
            
            poblacion = ordenar_poblacion(new_age, reverse=True)[: tam_pob]
            
            end_gen_time = time.time()
            elapsed_gen_time = end_gen_time - start_gen_time
            pob_time += elapsed_gen_time

            msg_info_generacion(gen, poblacion, elapsed_gen_time)
            historial_generacional[gen, 0] = [poblacion, cruces,mutantes]
            historial_generacional[gen, 1] = elapsed_gen_time

        msg_tiempo_pob(i, pob_time)
        gen_results.append(historial_generacional)
        
    end_exp_time = time.time()
    elapsed_exp_time = end_exp_time - start_exp_time
    msg_info_exp(f"Tiempo de experimentación: {elapsed_exp_time}")

    return gen_results, elapsed_exp_time

# Experimento combinacion PMX, y Heuristic mutation

En este experimento a partir de la población incial, tomar en cuenta que hay 5 poblaciones inciales con las cuales debe realizarse el experimento, se obtienen nuevas generaciones de individuos y una vez alcanza el 80% de individuos aptos, esto quiere decir que los individuso deben superar más del 0.8 de aptitud, o se llega un 10 generaciones el algoritmo se detiene.

**Condiciones de termino:**

* Epsilon:
    * Cuando el 80% de la población alcanza una aptitud mayor de 0.8
* Generaciones:
    * Cuando se llega a la generación número 10

**Operadores:**
* Método de competencia genética para la creación de las poblaciones
* Operador de selección *Ruleta*
* Operador de cruce *PMX*
* Operador de mutación  *Hueristico*

## Evaluar y Ordenar la poblacion

La función de ordenar población ordena de mayor a menor.

Este problema es un problema para encontrar las rutas con menor costo

In [15]:
max_gen_ = 40

In [16]:
resultados1, tiempo_ejecucion1 = experimentacion(
    poblaciones_iniciales=pobs,
    max_gen=max_gen_,
    op_seleccion=1,
    op_cruza=3,
    mode="min",
    mutar=True,
)

Inicio del algoritimo genético
Población incial #1
Costo promedio inicial 68260.256915
mutar
...................................................................
Generación: 0
Costo promedio: 61728.90248899999
Varianza del costo en la genearción: 24962071.014404565
Desviación estándar del costo en la genearción: 4996.205661740173
Diversidad promedio: 16.902626262626264 genes
Menor costo de toda la generación : 49452.1596
Mayor costo de toda la generación : 68845.8327
Tiempo de ejecución de la genaración 0: 3.6290836334228516
...................................................................
mutar
...................................................................
Generación: 1
Costo promedio: 56938.44335399998
Varianza del costo en la genearción: 13213417.656040337
Desviación estándar del costo en la genearción: 3635.026500046504
Diversidad promedio: 16.80929292929293 genes
Menor costo de toda la generación : 45135.3696
Mayor costo de toda la generación : 62272.1314
Tiempo de ejecución

In [17]:
resultados2, tiempo_ejecucion1 = experimentacion(
    poblaciones_iniciales=pobs,
    max_gen=max_gen_,
    op_seleccion=1,
    op_cruza=3,
    mode="min",
    mutar=False,
)

Inicio del algoritimo genético
Población incial #1
Costo promedio inicial 68260.256915
...................................................................
Generación: 0
Costo promedio: 62205.737366999994
Varianza del costo en la genearción: 27832466.32138617
Desviación estándar del costo en la genearción: 5275.648426628349
Diversidad promedio: 16.89757575757576 genes
Menor costo de toda la generación : 48694.7977
Mayor costo de toda la generación : 68965.2118
Tiempo de ejecución de la genaración 0: 0.05420565605163574
...................................................................
...................................................................
Generación: 1
Costo promedio: 58346.67077699999
Varianza del costo en la genearción: 16666810.924134767
Desviación estándar del costo en la genearción: 4082.500572459821
Diversidad promedio: 16.806262626262626 genes
Menor costo de toda la generación : 48694.7977
Mayor costo de toda la generación : 63978.1536
Tiempo de ejecución de la gena

In [18]:
intial_stats(pobs, "Estadisticas de las poblaciones iniciales")

In [19]:
show_report(resultados1, max_gen_, msg="Resultados Experimento 1 mutación")

In [20]:
show_report(resultados2, max_gen_, msg="Resultados Experimento 1 sin mutación")

In [22]:
create_excel_hist(resultados1,"exp1_mutacion.xlsx")

In [23]:
create_excel_hist(resultados2,"exp1_no_mutacion.xlsx")

In [40]:
# def create_excel_histo(reslt,file_name)
#     hist_file = f"../files/act_2/{file_name}"

#     # Estilo de fondo amarillo para resaltar
#     highlight = PatternFill(start_color="FFFF00", end_color="FFFF00", fill_type="solid")

#     # Escribe los DataFrames en el archivo Excel
#     with pd.ExcelWriter(hist_file, engine='openpyxl') as writer:
#         for i, res in enumerate(reslt):
#             start_row = 0

#             for g, gen_res in enumerate(res[:, 0]):
#                 # Crear los DataFrames
#                 historial_generaciones = np.zeros((gen_res[0][:, 0].shape[0], 2), dtype="object")
#                 historial_generaciones[:, 0] = np.array([" ".join([str(c) for c in r]) for r in gen_res[0][:, 0]])
#                 historial_generaciones[:, 1] = gen_res[0][:, 3]

#                 historial_cruces = np.zeros((gen_res[1].shape[0], 4), dtype="object")
#                 historial_cruces[:, 0] = np.array([" ".join([str(c) for c in r]) for r in gen_res[1][:, 0]])
#                 historial_cruces[:, 1] = np.array([" ".join([str(c) for c in r]) for r in gen_res[1][:, 1]])
#                 historial_cruces[:, 2] = np.array([" ".join([str(c) for c in r]) for r in gen_res[1][:, 2]])
#                 historial_cruces[:, 3] = np.array([" ".join([str(c) for c in r]) for r in gen_res[1][:, 3]])

#                 historial_mutante = gen_res[2]

#                 hg_df = pd.DataFrame(historial_generaciones, columns=["Ruta", "Distancia"])
#                 hc_df = pd.DataFrame(historial_cruces, columns=["Padre 1", "Padre 2", "Hijo 1", "Hijo 2"])
#                 hm_df = pd.DataFrame(historial_mutante, columns=["Original", "Mutante", "Inicio mutación", "Genes mutados"])

#                 # Comprobaciones
#                 hijos_en_hg_df = hc_df["Hijo 1"].isin(hg_df["Ruta"]) | hc_df["Hijo 2"].isin(hg_df["Ruta"])
#                 mutantes_en_hg_df = hm_df["Mutante"].isin(hg_df["Ruta"])

#                 # Escribir los DataFrames en el file_nameivo Excel
#                 if g == 0:
#                     start_col = 0
#                     ini_df.to_excel(writer, sheet_name=f"Poblacion_{i}", index=False, startrow=start_row, startcol=start_col)
#                     start_col += ini_df.shape[1] + 1

#                 hc_df.to_excel(writer, sheet_name=f"Poblacion_{i}", index=False, startrow=start_row, startcol=start_col)
#                 start_col += hc_df.shape[1] + 1
#                 hm_df.to_excel(writer, sheet_name=f"Poblacion_{i}", index=False, startrow=start_row, startcol=start_col)

#                 start_row += hg_df.shape[0] + 2
#                 start_col = 0

#                 hg_df.to_excel(writer, sheet_name=f"Poblacion_{i}", index=False, startrow=start_row, startcol=start_col)
#                 start_col += hg_df.shape[1] + 1

#     # Cargar el file_nameivo Excel para aplicar estilos
#     wb = load_workbook(hist_file)

#     for i, res in enumerate(reslt):
#         ws = wb[f"Poblacion_{i}"]
#         start_row = 0

#         for g, gen_res in enumerate(res[:, 0]):
#             # Actualiza start_row en cada generación
#             start_row += len(gen_res[0]) + 2
            
#             # Aplicar estilo de fondo amarillo a los hijos que están en las rutas
#             for idx in range(hc_df.shape[0]):
#                 if hijos_en_hg_df[idx]:
#                     # Resaltar "Hijo 1" y "Hijo 2" si están en las rutas
#                     cell_hijo1 = ws.cell(row=start_row + idx + 1, column=start_col + 2)  # Ajusta fila/columna
#                     cell_hijo2 = ws.cell(row=start_row + idx + 1, column=start_col + 3)  # Ajusta fila/columna
#                     cell_hijo1.fill = highlight
#                     cell_hijo2.fill = highlight

#             # Aplicar estilo de fondo amarillo a los mutantes que están en las rutas
#             for idx in range(hm_df.shape[0]):
#                 if mutantes_en_hg_df[idx]:
#                     # Resaltar "Mutante" si está en las rutas
#                     cell_mutante = ws.cell(row=start_row + idx + 1, column=start_col + 4)  # Ajusta fila/columna
#                     cell_mutante.fill = highlight

#     # Guardar el file_nameivo con los cambios de estilo
#     wb.save(hist_file)

In [208]:
# for i,fila in enumerate(resultados[-1]):
#     msg_info_generacion(i,fila[0],fila[1])
    
# for i,pob_A in enumerate(pobs):
#     aux_res = resultados[i]
#     tiempo = np.sum(aux_res[:,1])
#     msg_info_generacion(i,pob_A,tiempo)

In [None]:
"""
Pruebas para la codificacion con ascii
# a = np.random.permutation(18)
a = np.arange(18)

aux = [individuo_toString(c.astype(int)) for c in a]
print(aux)

# for ciudad in a:
#     print(chr(ciudad+33))
    

aux = [chr(c+48)for c in a]

print(aux)

numeros = [ord(c) - 48 for c in aux]
print(numeros)
    
"""

# Experimento 2

**Condiciones de termino:**

* Epsilon:
    * Cuando el 80% de la población alcanza una aptitud mayor de 0.8
* Generaciones:
    * Cuando se llega a la generación número 10

**Operadores:**
* Método de competencia genética para la creación de las poblaciones
* Operador de selección *Ruleta*
* Operador de cruce *CX*
* Operador de mutación  *Scramble*

In [None]:
resultados2,tiempo_ejecucion2 = experimentacion(poblaciones_iniciales=pobs,max_gen=100,op_seleccion=0,op_cruza=4,mode="min",mutar=True)

In [None]:
def show_reporte(resultados, msg):
    reportes_iniciales = np.array([get_report(i + 1, p) for i, p in enumerate(pobs)])
    # Comportamiento de las poblaciones iniciales
    fig = make_subplots(
        rows=6,
        cols=1,
        subplot_titles=["Costo promedio", "Varianza del costo", "Desviación estándar","Individuos con menor costo población inicial","Individuos mayor costo población inicial","Diversidad de genes"],
    )

    fig.add_trace(
        go.Scatter(
            x=reportes_iniciales[:, 0],
            y=reportes_iniciales[:, 1],
            mode="markers+lines",
            name="Costo promedio inicial",
            marker=dict(symbol="star-diamond",size=8),
        ),
        row=1,
        col=1,
    )
    fig.add_trace(
        go.Scatter(
            x=reportes_iniciales[:, 0],
            y=reportes_iniciales[:, 2],
            mode="markers+lines",
            marker=dict(symbol="diamond-x",size=8),
            name="Varianza costo",
        ),
        row=2,
        col=1,
    )
    fig.add_trace(
        go.Scatter(
            x=reportes_iniciales[:, 0],
            y=reportes_iniciales[:, 3],
            mode="markers+lines",
            marker=dict(symbol="octagon",size=8),
            name="Desviación costo",
        ),
        row=3,
        col=1,
    )
    fig.add_trace(
        go.Scatter(
            x=reportes_iniciales[:,0],
            y=reportes_iniciales[:,4],
            mode="markers+lines",
            marker=dict(symbol="bowtie",size=8),
            name="Costo menor"
        ),row=4,col=1
    )
    fig.add_trace(
        go.Scatter(
            x=reportes_iniciales[:,0],
            y=reportes_iniciales[:,5],
            mode="markers+lines",
            marker=dict(symbol="bowtie",size=8),
            name="Costo mayor"
        ),row=5,col=1
    )
    fig.add_trace(
        go.Scatter(
            x=reportes_iniciales[:,0],
            y=reportes_iniciales[:,6],
            mode="markers+lines",
            marker=dict(symbol="hexagram",size=8),
            name="Costo mayor"
        ),row=6,col=1
    )

    fig.update_layout(height=1000, width=900)  # Ajusta el tamaño de la figura
    # Agrega títulos a los ejes x y y de cada gráfica
    fig.update_layout(
        title = f"{msg}",
        xaxis1=dict(title="número población"),  # Eje x de la primera gráfica
        yaxis1=dict(title="Costo"),  # Eje y de la primera gráfica
        xaxis2=dict(title="número población"),  # Eje x de la segunda gráfica
        yaxis2=dict(title="Costo"),  # Eje y de la segunda gráfica
        xaxis3=dict(title="número población"),  # Eje x de la tercera gráfica
        yaxis3=dict(title="Costo"),  # Eje y de la tercera gráfica
        xaxis4=dict(title="número población"),  # Eje x de la tercera gráfica
        yaxis4=dict(title="Costo"),  # Eje y de la tercera gráfica
        xaxis5=dict(title="número población"),  # Eje x de la tercera gráfica
        yaxis6=dict(title="Costo"),  # Eje y de la tercera gráfica
    )
    fig.show()


show_reporte(resultados2, "Experimento número 2, sin implementar mutación")

In [148]:
gen_reports = np.zeros((5,100,8))
for i,rg in enumerate(resultados2):
    rg_tiempos = rg[:,1]
    rg_res = rg[:,0]
    
    rg_res_pobs = np.array([respob[0] for respob in rg_res])
    rg_report = np.array([get_report(k+1,rpob,rg_tiempos[k]) for k,rpob in enumerate(rg_res_pobs)])
    gen_reports[i] = rg_report

    #rg_res_cros = np.array([rescros[1] for rescros in rg_res])
    
# print(tiempo_ejecucion1)
# for i,res in enumerate(resultados1):
#     n_pob = i
#     for j,gen in enumerate(res):
#         historico = gen[0]
#         tiempo_ejecucion = gen[1]
#         registr_mutante = None
#         if len(historico) == 3:
#             print("Mutante")
#         print(historico[0].shape)
#         print(historico[1].shape)
#     break

In [None]:
import plotly.graph_objects as go
from plotly.subplots import make_subplots

# Assuming gen_reports has shape (5, 10, 8)

fig = make_subplots(
    rows=3,
    cols=2,
    subplot_titles=[
        "Costo promedio",
        "Varianza",
        "Desviación estándar",
        "Costo menor",
        "Costo mayor",
        "Diversidad genética",
    ],
    
)

colors = [
    '#f5bde6',  # muted blue
    '#c6a0f6',  # safety orange
    '#ed8796',  # cooked asparagus green
    '#a6da95',  # brick red
    '#7dc4e4',  # muted purple
]

# Plot each metric for each population
for i, pop in enumerate(gen_reports):
    fig.add_trace(
        go.Scatter(
            x=pop[:, 0],
            y=pop[:, 1],
            name=f"Población {i+1}",
            mode="markers+lines",
            marker=dict(symbol="star-dot", size=10,color=colors[i]),
            legendgroup=f"Población {i+1}"
        ),
        row=1,
        col=1,
    )
    fig.add_trace(
        go.Scatter(
            x=pop[:, 0],
            y=pop[:, 2],
            name=f"Población {i+1}",
            mode="markers+lines",
            marker=dict(symbol="star-dot", size=10,color=colors[i]),
            legendgroup=f"Población {i+1}"
        ),
        row=1,
        col=2,
    )
    fig.add_trace(
        go.Scatter(
            x=pop[:, 0],
            y=pop[:, 3],
            name=f"Población {i+1}",
            mode="markers+lines",
            marker=dict(symbol="star-dot", size=10,color=colors[i]),
            legendgroup=f"Población {i+1}"
        ),
        row=2,
        col=1,
    )
    fig.add_trace(
        go.Scatter(
            x=pop[:, 0],
            y=pop[:, 4],
            name=f"Población {i+1}",
            mode="markers+lines",
            marker=dict(symbol="star-dot", size=10,color=colors[i]),
            legendgroup=f"Población {i+1}"
        ),
        row=2,
        col=2,
    )
    fig.add_trace(
        go.Scatter(
            x=pop[:, 0],
            y=pop[:, 5],
            name=f"Población {i+1}",
            mode="markers+lines",
            marker=dict(symbol="star-dot", size=10,color=colors[i]),
            legendgroup=f"Población {i+1}"
        ),
        row=3,
        col=1,
    )
    fig.add_trace(
        go.Scatter(
            x=pop[:, 0],
            y=pop[:, 6],
            name=f"Población {i+1}",
            mode="markers+lines",
            marker=dict(symbol="star-dot", size=10,color=colors[i]),
            legendgroup=f"Población {i+1}"
        ),
        row=3,
        col=2,
    )

# Customize axis labels
for i in range(6):
    fig.update_xaxes(title_text="Generación", row=(i // 2) + 1, col=(i % 2) + 1)

fig.update_layout(
    height=1200, width=1000, title="Comportamiento de las 5 poblaciones iniciales"
)
fig.show()

In [102]:
indi_test = pobs[0][0,0]
print(indi_test)

[14  9 13 12 16  3  0  4  8  7  1  2 11  5 15 17 10  6]


In [103]:
mute_a,_ = heuristic_mutation(indi_test,funcion_aptitud=evaluar,cromosomas_mutation=5)

In [104]:
print(mute_a)

[array([14,  9, 13, 12, 16,  3,  8,  1,  0,  7,  4,  2, 11,  5, 15, 17, 10,
         6])
 0 'N I M L P C H A @ G D B K E O Q J F' 69116.0753]


In [107]:
mute_b = mutacion_scramble(indi_test,cromosomas_mutation=5,funcion_aptitud=evaluar)

In [106]:
print(mute_b)

(array([array([ 0,  4,  8,  7,  1,  2, 11,  5, 12, 14, 13,  3,  9, 16, 15, 17, 10,
               6])                                                               ,
       0, '@ D H G A B K E L N M C I P O Q J F', 61285.5578], dtype=object), 0)
