In [None]:
%pip install pandas

In [None]:
%pip install matplotlib seaborn

In [None]:
%pip install networkx

In [None]:
%pip install plotly

In [None]:
%pip install nbformat

In [None]:
%pip install ipykernel

In [None]:
%pip install --upgrade nbformat

In [None]:
%pip install nbformat 

In [2]:
# importação de bibliotecas

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
import random
import networkx as nx
from math import sqrt
import plotly.express as px
import plotly.graph_objects as go


In [13]:
# Cria uma solucao inicial com as cidades em um ordem aleatoria

def solucao_aleatoria(tsp):
    cidades = list(tsp.keys())
    solucao = []

    # as 3 linhas abaixo não são estritamente necessarias, servem
    # apenas para fixar a primeira cidade da lista na solução
    cidade = cidades[0]
    solucao.append(cidade)
    cidades.remove(cidade)

    for _ in range(0,len(cidades)):
        #print(_, cidades, solucao)
        cidade = random.choice(cidades)

        solucao.append(cidade)
        cidades.remove(cidade)

    return solucao

In [3]:
# Gera aleatoriamente as coordenadas de N cidades.
# Obs: esta informação geralmente é fornecida como entrada do problema.

def gera_coordenadas_aleatorias(n_cidades):
    minimo = 10
    maximo = 90
    escala = (maximo-minimo)-1

    # gera n coordenadas (x,y) aleatorias entre [min, max]
    X = minimo + escala * np.random.rand(n_cidades)
    Y = minimo + escala * np.random.rand(n_cidades)
    coordenadas = {'X':X, 'Y': Y}

    cidades = ['A'+str(i) for i in range(n_cidades)]

    df_cidades = pd.DataFrame(coordenadas, index=cidades)
    df_cidades.index.name = 'CIDADE'

    return df_cidades

In [4]:
# distancia Euclidiana entre dois pontos
def distancia(x1,y1,x2,y2):
    dx = x2 - x1
    dy = y2 - y1
    return sqrt(dx**2 + dy**2)

In [5]:
# Calcula matriz de distancias.
#
# OBS:  Não é estritamente necessario calculá-las a priori.
#       Foi feito assim apenas para fins didáticos.
#       Ao invés, as distâncias podem ser calculadas sob demanda.

def gera_matriz_distancias(Coordenadas):

    n_cidades = len(Coordenadas)
    dist = np.zeros((n_cidades,n_cidades), dtype=float)

    for i in range(0, n_cidades):
        for j in range(i+1, n_cidades):
            x1,y1 = Coordenadas.iloc[i]
            x2,y2 = Coordenadas.iloc[j]

            dist[i,j] = distancia(x1,y1,x2,y2)
            dist[j,i] = dist[i,j]

    return dist

In [6]:
# Recebe uma lista com as coordenadas reais de uma cidade e
# gera uma matriz de distancias entre as cidades.
# Obs: a matriz é simetrica e com diagonal nula
def gera_problema_tsp(df_cidades):
    # nomes ficticios das cidades
    cidades = df_cidades.index

    # calcula matriz de distancias
    distancias = gera_matriz_distancias(df_cidades)

    # cria estrutura para armazena as distâncias entre todas as cidades
    tsp = pd.DataFrame(distancias, columns=cidades, index=cidades)

    return tsp

In [7]:
# Plota a solução do roteamento das cidades
# usando a biblioteca PLOTLY
def plota_rotas(df_cidades, ordem_cidades):
    df_solucao = df_cidades.copy()
    df_solucao = df_solucao.reindex(ordem_cidades)

    X = df_solucao['X']
    Y = df_solucao['Y']
    cidades = list(df_solucao.index)

    # cria objeto gráfico
    fig = go.Figure()

    fig.update_layout(autosize=False, width=500, height=500, showlegend=False)

    # gera linhas com as rotas da primeira ate a ultima cidade
    fig.add_trace(go.Scatter(x=X, y=Y,
                             text=cidades, textposition='bottom center',
                             mode='lines+markers+text',
                             name=''))

    # acrescenta linha da última para a primeira para fechar o ciclo
    fig.add_trace(go.Scatter(x=X.iloc[[-1,0]], y=Y.iloc[[-1,0]],
                             mode='lines+markers', name=''))

    fig.show()

In [8]:
n_cidades=10
df_coordenadas = gera_coordenadas_aleatorias(n_cidades)
df_coordenadas

Unnamed: 0_level_0,X,Y
CIDADE,Unnamed: 1_level_1,Unnamed: 2_level_1
A0,78.196656,76.679819
A1,34.764039,80.73485
A2,68.141847,34.15606
A3,26.792879,38.876939
A4,47.886766,67.631953
A5,54.782487,60.852554
A6,79.613989,13.717934
A7,79.668407,60.935228
A8,36.497645,82.465976
A9,40.124213,34.128599


In [9]:
tsp = gera_problema_tsp(df_coordenadas)
tsp

CIDADE,A0,A1,A2,A3,A4,A5,A6,A7,A8,A9
CIDADE,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1
A0,0.0,43.621503,43.69633,63.80757,31.631524,28.261734,62.977836,15.813229,42.09854,57.097436
A1,43.621503,0.0,57.303244,42.610141,18.544322,28.214251,80.639848,49.075731,2.449937,46.913474
A2,43.69633,57.303244,0.0,41.617591,39.126765,29.852559,23.437727,29.154509,57.751221,28.017647
A3,63.80757,42.610141,41.617591,0.0,35.662346,35.585753,58.506796,57.292142,44.656317,14.151721
A4,31.631524,18.544322,39.126765,35.662346,0.0,9.67012,62.55668,32.479514,18.70188,34.39087
A5,28.261734,28.214251,29.852559,35.585753,9.67012,0.0,53.275472,24.886057,28.310342,30.480072
A6,62.977836,80.639848,23.437727,58.506796,62.55668,53.275472,0.0,47.217325,81.149938,44.452645
A7,15.813229,49.075731,29.154509,57.292142,32.479514,24.886057,47.217325,0.0,48.241971,47.773827
A8,42.09854,2.449937,57.751221,44.656317,18.70188,28.310342,81.149938,48.241971,0.0,48.473229
A9,57.097436,46.913474,28.017647,14.151721,34.39087,30.480072,44.452645,47.773827,48.473229,0.0


In [15]:
solucao = ['A'+str(i) for i in range(n_cidades)]
print(solucao)
plota_rotas(df_coordenadas, solucao)

['A0', 'A1', 'A2', 'A3', 'A4', 'A5', 'A6', 'A7', 'A8', 'A9']


In [14]:
solucao = solucao_aleatoria(tsp)
print(solucao)
plota_rotas(df_coordenadas, solucao)

['A0', 'A1', 'A3', 'A6', 'A9', 'A4', 'A2', 'A7', 'A8', 'A5']


In [16]:
# Função Objetivo: calcula custo de uma dada solução.
# Obs: Neste caso do problema do caixeiro viajante (TSP problem),
# o custo é o comprimento da rota entre todas as cidades.
def calcula_custo(tsp, solucao):

    N = len(solucao)
    custo = 0

    for i in range(N):

        # Quando chegar na última cidade, será necessário
        # voltar para o início para adicionar o
        # comprimento da rota da última cidade
        # até a primeira cidade, fechando o ciclo.
        #
        # Por isso, a linha abaixo:
        k = (i+1) % N
        cidadeA = solucao[i]
        cidadeB = solucao[k]

        custo += tsp.loc[cidadeA, cidadeB]

        #print(tsp.loc[cidadeA, cidadeB], cidadeA,cidadeB)

    return custo

In [17]:
# A partir de uma dada solução, gera diversas variações (vizinhos)
def gera_vizinhos(solucao):

    N = len(solucao)
    for i in range(1, N):       # deixa o primeiro fixo
        for j in range(i + 1, N):
            vizinho = solucao.copy()
            vizinho[i] = solucao[j]
            vizinho[j] = solucao[i]

            yield(vizinho)

In [18]:
def obtem_melhor_vizinho(tsp, solucao):
    melhor_custo = calcula_custo(tsp, solucao)
    melhor_vizinho = solucao

    for vizinho in gera_vizinhos(solucao):
        custo_atual = calcula_custo(tsp, vizinho)
        if custo_atual < melhor_custo:
            melhor_custo = custo_atual
            melhor_vizinho = vizinho

    return melhor_vizinho, melhor_custo

In [19]:
def hill_climbing(tsp):

    # solucao inicial
    solucao_inicial = solucao_aleatoria(tsp)
    # melhor solucao ate o momento
    solucao_melhor, custo_melhor = obtem_melhor_vizinho(tsp, solucao_inicial)

    while True:

        # tenta obter um candidato melhor
        candidato_novo, custo_novo = obtem_melhor_vizinho(tsp, solucao_melhor)
        #print(custo_melhor, custo_novo)

        if custo_novo < custo_melhor:
            custo_melhor   = custo_novo
            solucao_melhor = candidato_novo
        else:
            break   # custo nao melhorou, entao sai do while

    return custo_melhor, solucao_melhor

In [20]:
def hill_climbing_restart(tsp):

    for _ in range(50):

        # solucao inicial
        solucao_inicial = solucao_aleatoria(tsp)
        # melhor solucao ate o momento
        solucao_melhor, custo_melhor = obtem_melhor_vizinho(tsp, solucao_inicial)

        while True:

            # tenta obter um candidato melhor
            candidato_atual, custo_atual = obtem_melhor_vizinho(tsp, solucao_melhor)
            #print(custo_melhor, custo_atual)

            if custo_atual < custo_melhor:
                custo_melhor   = custo_atual
                solucao_melhor = candidato_atual
            else:
                break   # custo nao melhorou, entao sai do while

    return custo_melhor, solucao_melhor

In [21]:
custo, solucao = hill_climbing(tsp)

print(f'{custo:7.3f}    {solucao}')

plota_rotas(df_coordenadas, solucao)

267.439    ['A0', 'A7', 'A9', 'A3', 'A1', 'A8', 'A4', 'A5', 'A2', 'A6']


In [22]:
custo, solucao = hill_climbing_restart(tsp)

print(f'{custo:7.3f}    {solucao}')

plota_rotas(df_coordenadas, solucao)

256.044    ['A0', 'A2', 'A6', 'A9', 'A3', 'A5', 'A4', 'A1', 'A8', 'A7']


In [23]:
# Executando várias vezes de forma simples

n_vezes = 30

for _ in range(n_vezes):

    #solucao, custo = random_walk(tsp)
    custo, solucao = hill_climbing(tsp)
    print(f'{custo:7.3f}, {solucao}')

239.870, ['A0', 'A7', 'A5', 'A4', 'A8', 'A1', 'A3', 'A9', 'A6', 'A2']
262.251, ['A0', 'A5', 'A9', 'A3', 'A1', 'A8', 'A4', 'A2', 'A6', 'A7']
247.987, ['A0', 'A7', 'A5', 'A2', 'A6', 'A9', 'A3', 'A1', 'A8', 'A4']
235.359, ['A0', 'A7', 'A2', 'A6', 'A9', 'A3', 'A5', 'A4', 'A1', 'A8']
257.016, ['A0', 'A8', 'A1', 'A3', 'A9', 'A6', 'A2', 'A5', 'A4', 'A7']
228.704, ['A0', 'A7', 'A2', 'A6', 'A9', 'A3', 'A1', 'A8', 'A4', 'A5']
235.359, ['A0', 'A7', 'A2', 'A6', 'A9', 'A3', 'A5', 'A4', 'A1', 'A8']
228.704, ['A0', 'A7', 'A2', 'A6', 'A9', 'A3', 'A1', 'A8', 'A4', 'A5']
247.987, ['A0', 'A4', 'A8', 'A1', 'A3', 'A9', 'A6', 'A2', 'A5', 'A7']
239.870, ['A0', 'A7', 'A5', 'A4', 'A8', 'A1', 'A3', 'A9', 'A6', 'A2']
257.763, ['A0', 'A7', 'A3', 'A9', 'A6', 'A2', 'A5', 'A4', 'A1', 'A8']
228.704, ['A0', 'A5', 'A4', 'A8', 'A1', 'A3', 'A9', 'A6', 'A2', 'A7']
257.763, ['A0', 'A8', 'A1', 'A4', 'A5', 'A2', 'A6', 'A9', 'A3', 'A7']
257.763, ['A0', 'A8', 'A1', 'A4', 'A5', 'A2', 'A6', 'A9', 'A3', 'A7']
262.251, ['A0', 'A7'

In [24]:
# Cria estruta de dados (DataFrame) para armazenar vários resultados
# diferentes e visualizá-los através de estatísticas

def cria_df_custos(algoritmos, n_vezes):

    nomes_algoritmos  = algoritmos.keys()

    n_lin = len(nomes_algoritmos)
    n_col = n_vezes

    df_results = pd.DataFrame(np.zeros((n_lin, n_col)),
                              index=nomes_algoritmos)
    df_results.index.name='ALGORITMO'

    return df_results

In [25]:
# Executa N vezes para gerar estatísticas da variável custo
def executa_n_vezes(tsp, algoritmos, n_vezes):

    # Cria DataFrame para armazenar os resultados
    df_custo = cria_df_custos(algoritmos, n_vezes)

    for algoritmo, funcao_algoritmo in algoritmos.items():

        print(algoritmo)

        for i in range(n_vezes):

            custo, solucao = funcao_algoritmo(tsp)
            df_custo.loc[algoritmo,i] = custo

            print(f'{custo:10.3f}  {solucao}')

    return df_custo

In [26]:
# Dicionario com Nomes dos modelos e suas respectivas variantes
# Tuple: (Algoritmo, Variante): funcao_algoritmo
algoritmos = {
    'Hill-Climbing Restart': hill_climbing_restart,
    'Hill-Climbing': hill_climbing
}

In [41]:

n_cidades = 10
df_coordenadas = gera_coordenadas_aleatorias(n_cidades)

tsp = gera_problema_tsp(df_coordenadas)

# numero de vezes que executará cada algoritmo
n_vezes = 100

# Executa N vezes para gerar estatísticas da variável custo
df_custo = executa_n_vezes(tsp, algoritmos, n_vezes)

Hill-Climbing Restart
   276.102  ['A0', 'A3', 'A4', 'A1', 'A5', 'A9', 'A6', 'A2', 'A7', 'A8']
   262.881  ['A0', 'A8', 'A7', 'A3', 'A9', 'A5', 'A6', 'A2', 'A1', 'A4']
   234.226  ['A0', 'A3', 'A9', 'A5', 'A1', 'A4', 'A2', 'A6', 'A7', 'A8']
   235.902  ['A0', 'A8', 'A7', 'A4', 'A1', 'A2', 'A6', 'A5', 'A9', 'A3']
   304.306  ['A0', 'A2', 'A1', 'A4', 'A7', 'A8', 'A6', 'A5', 'A9', 'A3']
   262.881  ['A0', 'A8', 'A7', 'A3', 'A9', 'A5', 'A6', 'A2', 'A1', 'A4']
   234.226  ['A0', 'A3', 'A9', 'A5', 'A1', 'A4', 'A2', 'A6', 'A7', 'A8']
   304.961  ['A0', 'A6', 'A2', 'A1', 'A4', 'A7', 'A8', 'A5', 'A9', 'A3']
   235.902  ['A0', 'A8', 'A7', 'A4', 'A1', 'A2', 'A6', 'A5', 'A9', 'A3']
   235.902  ['A0', 'A3', 'A9', 'A5', 'A6', 'A2', 'A1', 'A4', 'A7', 'A8']
   276.102  ['A0', 'A3', 'A4', 'A1', 'A5', 'A9', 'A6', 'A2', 'A7', 'A8']
   250.245  ['A0', 'A8', 'A7', 'A3', 'A9', 'A5', 'A1', 'A4', 'A2', 'A6']
   304.306  ['A0', 'A3', 'A9', 'A5', 'A6', 'A8', 'A7', 'A4', 'A1', 'A2']
   317.481  ['A0', 'A6', 'A5'

In [42]:
df_custo.T.describe()

ALGORITMO,Hill-Climbing Restart,Hill-Climbing
count,100.0,100.0
mean,264.984407,263.042975
std,23.337363,25.46878
min,234.226346,234.226346
25%,246.659108,235.90164
50%,262.880955,260.691934
75%,277.762498,276.102121
max,317.480796,335.933759


In [43]:
def boxplot_sorted(df, rot=90, figsize=(12,6), fontsize=20):
    df2 = df.T
    meds = df2.median().sort_values(ascending=False)
    axes = df2[meds.index].boxplot(figsize=figsize, rot=rot, fontsize=fontsize,
                                   boxprops=dict(linewidth=4, color='cornflowerblue'),
                                   whiskerprops=dict(linewidth=4, color='cornflowerblue'),
                                   medianprops=dict(linewidth=4, color='firebrick'),
                                   capprops=dict(linewidth=4, color='cornflowerblue'),
                                   flierprops=dict(marker='o', markerfacecolor='dimgray',
                                        markersize=12, markeredgecolor='black'),
                                   return_type="axes")

    axes.set_title("Cost of Algorithms", fontsize=fontsize)

In [47]:
%matplotlib inline
boxplot_sorted(df_custo, rot=90, figsize=(12,6), fontsize=20)