# Generador de instancias:
>Se guardan en la carpeta instancias


In [1]:
import random, math
import pandas as pd
from random import randint, uniform,random
import os
from IPython.display import display, clear_output

In [2]:
def save_instance(dataset, instance_name, Locales, CONTAGIO):
    with open(F"instancias/{dataset}/{instance_name}.txt", "w") as f:
        print(int(len(Locales)/2), CONTAGIO, file=f)
        for m in Locales: 
            print(m, file=f, end=" ")

def save_index(dataset, instances):
    with open(F"instancias/{dataset}/instances.txt", "w") as f:
        for instance in instances: 
            print(instance, file=f)
            
def createInstancesDir(dir):
    # Si no existe la carpeta la creo
    if os.path.exists(F"instancias/{dir}") == False:
        os.mkdir(F"instancias/{dir}")

### Backtracking: peor caso
#### PC-BT
> El peor caso se genera ubicando la solución en el último nodo a recorrer del árbol de backtracking. Para eso se generan instancias desde 1 hasta CANT_INSTANCIAS locales con límite de contagio mayor o igual a CANT_INSTANCIAS. Cada local suma 1 beneficio y 1 contagio excepto el local solución que suma CANT_INSTANCIAS beneficio y contagio. De esa forma, el último local siempre es la solución.

In [3]:
filas_indices = []
TIPO = "PC-BT"
createInstancesDir(TIPO)

In [4]:
CANT_INSTANCIAS = 31
# MAX_CONTAGIO > CANT_INSTANCIAS
MAX_CONTAGIO = CANT_INSTANCIAS
BENEFICIO = 100 # Solución
    
for i in range(1, CANT_INSTANCIAS):
    Locales = []
    
    for j in range(0, i-1):
        Locales.append(1)
        Locales.append(1)
    
    # Agrego el local solución al final.
    Locales.append(BENEFICIO)
    Locales.append(MAX_CONTAGIO)
    
    save_instance(TIPO, F"{TIPO}-{i}", Locales, MAX_CONTAGIO)
    filas_indices.append([TIPO, F"{TIPO}-{i}", i, Locales, MAX_CONTAGIO, F"instancias/{TIPO}/{TIPO}-{i}.txt"])
    
pd.DataFrame(filas_indices, columns=["dataset", "instancia", "n", "Locales", "Contagio", "archivo"]).to_csv(F"instancias/{TIPO}/indice.csv", index=False, header=True)

### Backtracking: mejor caso
#### MC-BT
> El mejor caso se genera ubicando la solución en el primer nodo a recorrer del árbol de backtracking. Para eso se generan instancias desde 1 hasta CANT_INSTANCIAS locales, cada local suma 1 beneficio y contagio mayor al límite excepto el local solución que suma CANT_INSTANCIAS beneficio y contagio igual al límite. De esa forma, el primer local siempre es la solución.

In [5]:
filas_indices = []
TIPO = "MC-BT"
createInstancesDir(TIPO)

In [6]:
CANT_INSTANCIAS = 7000
MAX_CONTAGIO = 1 
BENEFICIO = 100 # Solución
    
for i in range(1, CANT_INSTANCIAS):
    Locales = []
    
    # Agrego el local solución al final.
    Locales.append(BENEFICIO)
    Locales.append(MAX_CONTAGIO)
    
    for j in range(0, i-1):
        Locales.append(1)
        Locales.append(MAX_CONTAGIO + 1)
    
    save_instance(TIPO, F"{TIPO}-{i}", Locales, MAX_CONTAGIO)
    filas_indices.append([TIPO, F"{TIPO}-{i}", i, Locales, MAX_CONTAGIO, F"instancias/{TIPO}/{TIPO}-{i}.txt"])
    
pd.DataFrame(filas_indices, columns=["dataset", "instancia", "n", "Locales", "Contagio", "archivo"]).to_csv(F"instancias/{TIPO}/indice.csv", index=False, header=True)

### Programación dinamica.
#### PD - Mismo contagio, diferente cantidad de negocios

> La generación de la familia de instancias para esta prueba se modelo con un contagio maximo realtivamente alto en comparación al contagio que puede tener cada celda por separado, este mismo es variable pero en un rango acotado. ¿Por que? Pues porque para programación dinamica la cantidad de elementos distintos que tenga el vector va a hacer que no se repitan muchas celdas, y así podremos modelar un peor caso


In [7]:
def crearInstanciasDCN(n, M):
    filas_indices = []
    # Concateno el max contagio porque voy a crear varios parecidos
    TIPO = "PD-DCN" + "-" + str(M)
    createInstancesDir(TIPO)
    
    for i in range(1, n):
        Locales = []
        
        for j in range(0, i-1):
            Locales.append(1)
            #a = randint(1,i)
            a = randint(1, M)
            Locales.append(a)       

        save_instance(TIPO, F"{TIPO}-{i}", Locales, M)
        filas_indices.append([TIPO, F"{TIPO}-{i}", i, Locales, M, F"instancias/{TIPO}/{TIPO}-{i}.txt"])
        clear_output(wait=True)
        display('Instancia: ' + str(i) + "/" + str(n))
    
    pd.DataFrame(filas_indices, columns=["dataset", "instancia", "n", "Locales", "Contagio", "archivo"]).to_csv(F"instancias/{TIPO}/indice.csv", index=False, header=True)

In [8]:
Ms = [4000, 6000, 8000, 10000]
for M in Ms:
    crearInstanciasDCN(7000, M)

'Instancia: 6999/7000'

#### PD - Misma cantidad de negocios, diferente contagio

In [9]:
def crearInstanciasDC(n, M):
    filas_indices = []
    # Concateno el max n porque voy a crear varios parecidos
    TIPO = "PD-DC" + "-" + str(n)
    createInstancesDir(TIPO)
    
    for i in range(1, M):
        Locales = []
        
        for j in range(0, n-1):
            Locales.append(1)
            #a = randint(1,i)
            a = randint(1, i)
            Locales.append(a)       

        save_instance(TIPO, F"{TIPO}-{i}", Locales, i)
        filas_indices.append([TIPO, F"{TIPO}-{i}", i, Locales, i, F"instancias/{TIPO}/{TIPO}-{i}.txt"])
        clear_output(wait=True)
        display('Instancia: ' + str(i) + "/" + str(M))
    
    pd.DataFrame(filas_indices, columns=["dataset", "instancia", "n", "Locales", "Contagio", "archivo"]).to_csv(F"instancias/{TIPO}/indice.csv", index=False, header=True)

In [10]:
ns = [4000, 6000, 8000, 10000]
for n in ns:
    crearInstanciasDC(n, 7000)

'Instancia: 6999/7000'

# PD vs BT 

> Este experimento nacio de la pregunta ¿Que sucede con el beneficio? ¿Algún algoritmo es mas eficiente / menos eficiente variando el beneficio de los locales? 


In [30]:
filas_indices = []
TIPO = "PD-VS-BT"
createInstancesDir(TIPO)

In [31]:
CANT_INSTANCIAS = 34
MAX_CONTAGIO = 10000  
    
for i in range(1, CANT_INSTANCIAS):
    Locales = []
    
    for j in range(0, i-1):
        Locales.append(2**j)
        a = randint(1,i)
        Locales.append(a)       
   
    save_instance(TIPO, F"{TIPO}-{i}", Locales, MAX_CONTAGIO)
    filas_indices.append([TIPO, F"{TIPO}-{i}", i, Locales, MAX_CONTAGIO, F"instancias/{TIPO}/{TIPO}-{i}.txt"])
    
pd.DataFrame(filas_indices, columns=["dataset", "instancia", "n", "Locales", "Contagio", "archivo"]).to_csv(F"instancias/{TIPO}/indice.csv", index=False, header=True)

In [32]:
filas_indices = []
TIPO = "PD-VS-BT-2"
createInstancesDir(TIPO)

In [33]:
CANT_INSTANCIAS = 35
MAX_CONTAGIO = 10000  
    
for i in range(1, CANT_INSTANCIAS):
    Locales = []
    
    for j in range(0, i-1):
        if j < i//4:
            Locales.append(1)
        elif j < i //2:
            Locales.append(100)
        elif j < i*3/4:
            Locales.append(1)
        else:
            Locales.append(100)
        a = randint(1,i)
        Locales.append(a)       
   
    save_instance(TIPO, F"{TIPO}-{i}", Locales, MAX_CONTAGIO)
    filas_indices.append([TIPO, F"{TIPO}-{i}", i, Locales, MAX_CONTAGIO, F"instancias/{TIPO}/{TIPO}-{i}.txt"])
    
pd.DataFrame(filas_indices, columns=["dataset", "instancia", "n", "Locales", "Contagio", "archivo"]).to_csv(F"instancias/{TIPO}/indice.csv", index=False, header=True)

#### Experimento 5: Rangos de Contagio (1)

In [14]:
def crearInstanciasBC(n, M, m, tipo):
    filas_indices = []
    # Concateno el max contagio porque voy a crear varios parecidos
    TIPO = tipo + "-" + str(m)
    createInstancesDir(TIPO)
    
    for i in range(1, n):
        Locales = []
        
        for j in range(0, i-1):
            Locales.append(1)
            a = randint(1, m)
            Locales.append(a)       

        save_instance(TIPO, F"{TIPO}-{i}", Locales, M)
        filas_indices.append([TIPO, F"{TIPO}-{i}", i, Locales, M, F"instancias/{TIPO}/{TIPO}-{i}.txt"])
        clear_output(wait=True)
        display('Instancia: ' + str(i) + "/" + str(n))
    
    pd.DataFrame(filas_indices, columns=["dataset", "instancia", "n", "Locales", "Contagio", "archivo"]).to_csv(F"instancias/{TIPO}/indice.csv", index=False, header=True)

In [23]:
ms = [10, 100, 1000]
Ms = [10000]

for M in Ms:
    for m in ms:
        crearInstanciasBC(3000, M, m, F"PD-BC-{M}")

'Instancia: 2999/3000'

#### Experimento 6: Rangos de Contagio (2)

In [19]:
def crearInstanciasBC2(n, M, m, tipo):
    filas_indices = []
    # Concateno el max contagio porque voy a crear varios parecidos
    TIPO = tipo + "-" + str(m)
    createInstancesDir(TIPO)
    
    for i in range(1, n):
        Locales = []
        
        for j in range(0, i-1):
            Locales.append(1)
            a = randint(m-20, m)
            Locales.append(a)       

        save_instance(TIPO, F"{TIPO}-{i}", Locales, M)
        filas_indices.append([TIPO, F"{TIPO}-{i}", i, Locales, M, F"instancias/{TIPO}/{TIPO}-{i}.txt"])
        clear_output(wait=True)
        display('Instancia: ' + str(i) + "/" + str(n))
    
    pd.DataFrame(filas_indices, columns=["dataset", "instancia", "n", "Locales", "Contagio", "archivo"]).to_csv(F"instancias/{TIPO}/indice.csv", index=False, header=True)

In [22]:
ms = [20, 120, 220]
Ms = [10000]

for M in Ms:
    for m in ms:
        crearInstanciasBC2(5000, M, m, F"PD-BC2-{m}")

'Instancia: 4999/5000'

#### Experimento 7: Comparación podas BT con 4 casos generales

In [17]:
def crearInstanciasBTPodas(n, M, distBeneficio, nivelContagio, TIPO):
    filas_indices = []
    # Concateno el max contagio porque voy a crear varios parecidos
    createInstancesDir(TIPO)
    
    for i in range(1, n):
        Locales = []
        
        for j in range(0, i-1):
            if distBeneficio is 'CONSTANTE':
                b = randint(1, 2*i)
            else:
                b = randint(2*j,  2*(j+1))
            Locales.append(b)
            
            if nivelContagio is 'ALTO':
                m = randint(int(M/3), M/2)
            else:
                m = randint(1, int(M/4))
            Locales.append(m)       

        save_instance(TIPO, F"{TIPO}-{i}", Locales, M)
        filas_indices.append([TIPO, F"{TIPO}-{i}", i, Locales, M, F"instancias/{TIPO}/{TIPO}-{i}.txt"])
        clear_output(wait=True)
        display('Instancia: ' + str(i) + "/" + str(n))
    
    pd.DataFrame(filas_indices, columns=["dataset", "instancia", "n", "Locales", "Contagio", "archivo"]).to_csv(F"instancias/{TIPO}/indice.csv", index=False, header=True)

In [20]:
n = 33
M = 100

bMaxs = ["CONSTANTE", "INCREMENTAL"]
nivelesContagio = ["BAJO", "ALTO"]

for i in range(0, len(bMaxs)):
    for j in range(0, len(nivelesContagio)):
        crearInstanciasBTPodas(n, M, bMaxs[i], nivelesContagio[j], F"BT-PODA-{bMaxs[i]}-{nivelesContagio[j]}")

'Instancia: 32/33'

0
1
