# Generador de instancias
En este notebook está el código para generar los sets de instancias que se usan para experimentar.
- Estas instancias van a ser guardadas en la carpeta __instancias__.
- Cada set estará en su propia carpeta y tendrá un archivo _indice.csv_ que contendrá información sobre las instancias.

In [1]:
import random, math
import pandas as pd

In [2]:
def save_instance(dataset, instance_name, B, S, W):
    with open(F"instancias/{dataset}/{instance_name}.txt", "w") as f:
        print(len(S), W, file=f) #LONGITUD-RIESGOTOTAL
        for s in S: # Leo riesgos.
            print(s, file=f, end=" ")
        print("", file=f)
        for b in B: # Leo beneficios.
            print(b, file=f, end=" ")

def save_index(dataset, instances):
    with open(F"instancias/{dataset}/instances.txt", "w") as f:
        for instance in instances: 
            print(instance, file=f)

## Dataset 1
Instancias de mejor caso de backtracking, están descriptas en el informe en más detalle.
```

B = [0,...,0]
R = [W+1, ..., W+1]
```


In [3]:
filas_indice = []
for i in range(1, 500):
    n = i * 10
    W = 1000
    S = [W+1 for i in range(0, n)]
    B = [1 for i in range(0,n)]
    save_instance("mejor-caso-bt", F"BT-MC-{n}",B, S, W)
    filas_indice.append(["mejor-caso-bt", F"BT-MC-{n}", n, W, F"instancias/mejor-caso-bt/BT-MC-{n}.txt"])
pd.DataFrame(filas_indice, columns=["dataset", "instancia", "n", "W", "archivo"]).to_csv("instancias/mejor-caso-bt/indice.csv", index=False, header=True)

## Dataset 2
Instancias de peor caso de backtracking, están descriptas en el informe en más detalle.
```
S = {1,...,W+1} con W = n
B = [0,...,1]
```


In [4]:
filas_indice = []
for n in range(1, 31):
    W = n
    S = [1 for i in range(0, n)]
    S[-1] = W+1
    B = [0 for i in range(0,n)]
    B[-1] = 1
    save_instance("peor-caso-bt", F"BT-PC-{n}",B, S, W)
    filas_indice.append(["peor-caso-bt", F"BT-PC-{n}", n, W, F"instancias/peor-caso-bt/BT-PC-{n}.txt"])
pd.DataFrame(filas_indice, columns=["dataset", "instancia", "n", "W", "archivo"]).to_csv("instancias/peor-caso-bt/indice.csv", index=False, header=True)

## Dataset 3
Instancias con densidad alta:
```
S = { 1, ..., n } con W = n/2
```

In [5]:
filas_indice = []
for n in range(1, 201):
    
    W = math.floor(n/2) #RiesgoTotal
    B = [1 for i in range(0,n)] #Serian los Beneficios. Todos iguales, no cambia en nada.
    
    S = [0 for i in range(0, n)] #Serian los Riesgos
    for i in range(0, n): S[i] = i+1 # Coloco los digitos 
    random.shuffle(S) #mezclo todo
    
    save_instance("densidad-alta", F"ALTA-{n}", B, S, W) # Guarda la instancia en un archivo nuevo.
    
    # Genera un CSV.
    filas_indice.append(["densidad-alta", F"ALTA-{n}", n, W, F"instancias/densidad-alta/ALTA-{n}.txt"])
    pd.DataFrame(filas_indice, columns=["dataset", "instancia", "n", "W", "archivo"]).to_csv("instancias/densidad-alta/indice.csv", index=False, header=True)

## Dataset 4
Instancias con densidad baja:

S = { 1, ..., n } con W = $\frac{n \cdot (n - 1)}{4} $


In [6]:
filas_indice = []
for n in range(1, 201):
    W = max(1, math.floor(n * (n-1) / 4))
    B = [1 for i in range(0,n)]  #Serian los Beneficios. Todos iguales, no cambia en nada.
    S = [0 for i in range(0, n)]
    for i in range(0, n): S[i] = i+1
    random.shuffle(S)
    save_instance("densidad-baja", F"BAJA-{n}", B, S, W)
    filas_indice.append(["densidad-baja", F"BAJA-{n}", n, W, F"instancias/densidad-baja/BAJA-{n}.txt"])
pd.DataFrame(filas_indice, columns=["dataset", "instancia", "n", "W", "archivo"]).to_csv("instancias/densidad-baja/indice.csv", index=False, header=True)

# Dataset 5
Instancias variando n y W con densidad baja.

vario la cantiad de tiendas y el riesgo total
con una densidad baja de riesgos
y beneficios  <- Ver Porq no esta dando muy claro O(N w)

In [8]:
filas_indice = []
for n in range(1000, 8000, 500):
    for W in range(1000, 8000, 500):
        #los beneficios y riesgos son una permutacion de los numeros 1....n.
        S = [0 for i in range(0,n)] 
        B = [0 for i in range(0,n)]
        for i in range(0,n) : 
            B[i] = i
            S[i] = i
        random.shuffle(B)
        random.shuffle(S)
        save_instance("dinamica", F"DP-{n}-{W}", B, S, W)
        filas_indice.append(["dinamica", F"DP-{n}-{W}", n, W, F"instancias/dinamica/DP-{n}-{W}.txt"])
pd.DataFrame(filas_indice, columns=["dataset", "instancia", "n", "W", "archivo"]).to_csv("instancias/dinamica/indice.csv", index=False, header=True)

# Dataset 6

Para probar la efectividad de podas, vamos a generar dataset con:
* densidad alta y baja de riesgos
* densidad alta y baja de beneficios

In [9]:
def oneOrAHundred():
    if bool(random.getrandbits(1)):
        return(100)
    else:
        return(1)

filas_indice = []
for n in range(1, 46):
    highDensityRiskLimit = max(1, math.floor(n/2))
    lowDensityRiskLimit = max(1, math.floor(n*(n-1)/4))
    equalBenefits = [1 for i in range(0,n)]
    unequalBenefits = [oneOrAHundred() for i in range(0,n)]
    risks = [i + 1 for i in range(0, n)]
    random.shuffle(risks)
    #Densidad de riesgo alta - mismos beneficios
    save_instance("podas-BT", F"RiesgoAlto-IgualBeneficios-{n}", equalBenefits, risks, highDensityRiskLimit)
    filas_indice.append(["podas-BT", F"RiesgoAlto-IgualBeneficios-{n}", n, highDensityRiskLimit, F"instancias/podas-BT/RiesgoAlto-IgualBeneficios-{n}.txt"])
    #Densidad de riesgo alta - beneficios desiguales
    save_instance("podas-BT", F"RiesgoAlto-BeneficiosDesiguales-{n}", unequalBenefits, risks, highDensityRiskLimit)
    filas_indice.append(["podas-BT", F"RiesgoAlto-BeneficiosDesiguales-{n}", n, highDensityRiskLimit, F"instancias/podas-BT/RiesgoAlto-BeneficiosDesiguales-{n}.txt"])
    #Densidad de riesgo baja - mismos beneficios
    save_instance("podas-BT", F"RiesgoBajo-IgualBeneficios-{n}", equalBenefits, risks, lowDensityRiskLimit)
    filas_indice.append(["podas-BT", F"RiesgoBajo-IgualBeneficios-{n}", n, lowDensityRiskLimit, F"instancias/podas-BT/RiesgoBajo-IgualBeneficios-{n}.txt"])
    #Densidad de riesgo baja - beneficios desiguales
    save_instance("podas-BT", F"RiesgoBajo-BeneficiosDesiguales-{n}", unequalBenefits, risks, lowDensityRiskLimit)
    filas_indice.append(["podas-BT", F"RiesgoBajo-BeneficiosDesiguales-{n}", n, lowDensityRiskLimit, F"instancias/podas-BT/RiesgoBajo-BeneficiosDesiguales-{n}.txt"])
    
pd.DataFrame(filas_indice, columns=["dataset", "instancia", "n", "W", "archivo"]).to_csv("instancias/podas-BT/indice.csv", index=False, header=True)

# Dataset 7

Para comparar backtracking y progrmación dinámica, vamos a generar dataset con densidades altas y bajas

In [10]:
filas_indice = []
for n in range(1, 46):
    highDensityRiskLimit = max(1, math.floor(n/2))
    lowDensityRiskLimit = max(1, math.floor(n*(n-1)/4))
    equalBenefits = [1 for i in range(0,n)]
    risks = [i + 1 for i in range(0, n)]
    #Densidad de riesgo alta - mismos beneficios
    save_instance("BTvsPD", F"DensidadAlta-{n}", equalBenefits, risks, highDensityRiskLimit)
    filas_indice.append(["BTvsPD", F"DensidadAlta-{n}", n, highDensityRiskLimit, F"instancias/BTvsPD/DensidadAlta-{n}.txt"])
    #Densidad de riesgo baja -mismos beneficios
    save_instance("BTvsPD", F"DensidadBaja-{n}", equalBenefits, risks, lowDensityRiskLimit)
    filas_indice.append(["BTvsPD", F"DensidadBaja-{n}", n, highDensityRiskLimit, F"instancias/BTvsPD/DensidadBaja-{n}.txt"])
pd.DataFrame(filas_indice, columns=["dataset", "instancia", "n", "W", "archivo"]).to_csv("instancias/BTvsPD/indice.csv", index=False, header=True)