In [1]:
import plotly
import pandas
import numpy
import scipy
import plotly.plotly as py
import plotly.graph_objs as go

In [2]:
# Fitness máximo possível para cada instância do problema
MAX_FITNESS = {
    "warmup": 21,
    "anchors": 21,
    "ranges": 21,
    "backrefs": 21,
    "abba": 22,
    "aman-aplan": 19,
    "prime": 20,
    "four": 21,
    "order": 21,
    "triples": 21,
    "glob": 21,
    "balance": 32,
    "powers": 11,
    "long-count": 1,
    "alphabetical": 17,
}

# Fitness que o Bartoli conseguiu segundo expressão regular gerada
BARTOLI_FITNESS = {
    "warmup": 21,
    "anchors": 21,
    "ranges": 21,
    "backrefs": 18,
    "abba": 20,
    "aman-aplan": 16,
    "prime": 13,
    "four": 21,
    "order": 21,
    "triples": 15,
    "glob": 19,
    "balance": 29,
    "powers": 7,
    "long-count": 1,
    "alphabetical": 12,
}

NORVIG_FITNESS = {
    "warmup": 21,
    "anchors": 21,
    "ranges": 21,
    "backrefs": 21,
    "abba": 21,
    "aman-aplan": 19,
    "prime": 19,
    "four": 21,
    "order": 21,
    "triples": 21,
    "glob": 0,
    "balance": 31,
    "powers": 11,
    "long-count": 1,
    "alphabetical": 17,
}

FITNESS_LINE = go.Scatter(
    name="Pontuação Máxima",
    x=list(MAX_FITNESS.keys()),
    y=list(MAX_FITNESS.values()),
    mode='lines',
)

BARTOLI_LINE = go.Scatter(
    name="Algoritmo Genético",
    x=list(BARTOLI_FITNESS.keys()),
    y=list(BARTOLI_FITNESS.values()),
    mode='markers',
    type='scatter',
)

NORVIG_LINE = go.Scatter(
    name="Algoritmo Exato",
    x=list(NORVIG_FITNESS.keys()),
    y=list(NORVIG_FITNESS.values()),
    mode='markers',
    type='scatter',
)

In [3]:
# Importando os dados
ILS_S_08 = pandas.read_csv("../08/ILS_Shrink.csv").sort_values(by=["Nome"])
ILS_S_09 = pandas.read_csv("../09/ILS_Shrink.csv").sort_values(by=["Nome"])
ILS_S = pandas.read_csv("./ILS_Shrink.csv").sort_values(by=['Nome'])

C_RRLS = pandas.read_csv("./Constructed_RRLS.csv").sort_values(by=['Nome'])



In [4]:
# Boxplot comparando 'melhor fitness'
data = [
    FITNESS_LINE,
    BARTOLI_LINE,
    NORVIG_LINE,
    go.Box(name="Busca Local", x=ILS_S.Nome, y=ILS_S.Melhor_fitness),
]

layout = go.Layout(title="Melhor fitness",
                xaxis=dict(title='Instâncias'),
                yaxis=dict(title='fitness'),
                boxmode='group')
fig = go.Figure(data=data, layout=layout)

py.iplot(fig)


In [5]:
# Boxplot comparando 'melhor fitness' entre os ILS_S
data = [
    FITNESS_LINE,
    # BARTOLI_LINE,
    # NORVIG_LINE,
    go.Box(name="ILS_S 08", x=ILS_S_08.Nome, y=ILS_S_08.Melhor_fitness),
    go.Box(name="ILS_S 09", x=ILS_S_09.Nome, y=ILS_S_09.Melhor_fitness),
    go.Box(name="ILS_S 10", x=ILS_S.Nome, y=ILS_S.Melhor_fitness),
    go.Box(name="C_RRLS", x=C_RRLS.Nome, y=C_RRLS.Melhor_fitness),
]

layout = go.Layout(title="Melhor fitness entre os ILS_S e C_RRLS atual",
                xaxis=dict(title='Instâncias'),
                yaxis=dict(title='fitness'),
                boxmode='group')
fig = go.Figure(data=data, layout=layout)

py.iplot(fig)


In [6]:
# Boxplot comparando 'Tempo total de execução' entre os ILS_S
data = [
    go.Box(name="ILS_S 08", x=ILS_S_08.Nome, y=ILS_S_08.Tempo_total),
    go.Box(name="ILS_S 09", x=ILS_S_09.Nome, y=ILS_S_09.Tempo_total),
    go.Box(name="ILS_S 10", x=ILS_S.Nome, y=ILS_S.Tempo_total),
    go.Box(name="C_RRLS", x=C_RRLS.Nome, y=C_RRLS.Tempo_total),
]

layout = go.Layout(title="Tempo total de execução em ms",
                xaxis=dict(title='Instâncias'),
                yaxis=dict(title='fitness'),
                boxmode='group')
fig = go.Figure(data=data, layout=layout)

py.iplot(fig)

In [7]:
# Médias de número de comparações para encontrar melhor fitness


MAX_LINE = go.Scatter(name="Máximo", x=ILS_S.Nome.unique(), y=[600000 for i in range(15)], mode='lines', marker=go.Marker(color='rgb(255, 77, 77)'))


data = [
    go.Box(name="ILS_S 08", x=ILS_S_08.Nome, y=ILS_S_08.Numero_de_comparacoes),
    go.Box(name="ILS_S 09", x=ILS_S_09.Nome, y=ILS_S_09.Numero_de_comparacoes),
    go.Box(name="ILS_S 10", x=ILS_S.Nome, y=ILS_S.Numero_de_comparacoes),
    go.Box(name="C_RRLS", x=C_RRLS.Nome, y=C_RRLS.Numero_de_comparacoes),
    
    MAX_LINE,
]

layout = go.Layout(title="Número de comparações até encontrar Melhor Fitness",
                xaxis=dict(title='Instâncias'),
                yaxis=dict(title='Quantidade de comprações'),
                boxmode='group')
fig = go.Figure(data=data, layout=layout)

py.iplot(fig)

### Essas são avaliações apenas das soluções melhores e melhores locais
Por favor observe que todas levam menos de 1ms, porém tem **uma** que levou 9ms.

In [8]:
# Tempo de avaliação das expressões regulares


data = [
    go.Box(name="ILS_S", x=ILS_S.Nome, y=ILS_S.Tempo_avaliacao),
    go.Box(name="C_RRLS", x=C_RRLS.Nome, y=C_RRLS.Tempo_avaliacao),
]

layout = go.Layout(title="Tempo de avaliação das expressões regulares (em ms)",
                xaxis=dict(title='Instâncias'),
                yaxis=dict(title='tempo em ms'),
                boxmode='group')
fig = go.Figure(data=data, layout=layout)

py.iplot(fig)