# Generador de instancias
En este notebook está el código para generar los sets de instancias que se usan para experimentar.
- Estas instancias van a ser guardadas en la carpeta __instancias__.
- Cada set estará en su propia carpeta y tendrá un archivo _indice.csv_ que contendrá información sobre las instancias.

In [7]:
import random, math
import pandas as pd

In [8]:
def save_instance(dataset, instance_name, S, W):
    with open(F"instancias/{dataset}/{instance_name}.txt", "w") as f:
        print(math.floor(len(S)/3), W, file=f)
        for s in S: 
            print(s, file=f, end=" ")

def save_index(dataset, instances):
    with open(F"instancias/{dataset}/instances.txt", "w") as f:
        for instance in instances: 
            print(instance, file=f)

## Dataset 1
Instancias con densidad alta de contagio:
```
C = { 1, 2, ... , n } con M = n(n+1)/2
B = { 1, 2, ... , n } 
```
Ambos beneficios y contagios luego serán mezclados

En este caso el limite es muy grande, y deberá recorrer nodo del arbol de ejecución

In [9]:
filas_indice = []
B = []
for n in range(1, 201):
    M = math.floor(n/2)
    B = [0 for i in range(0, n)]
    for i in range(0, n): B[i] = i+1
    random.shuffle(B)
    S = []
    for i in B:
        S.append(i)
        S.append(i)
        S.append('\n')
    save_instance("densidad-alta", F"ALTA-{n}", S, M)
    B = []
    filas_indice.append(["densidad-alta", F"ALTA-{n}", n, M, F"instancias/densidad-alta/ALTA-{n}.txt"])
pd.DataFrame(filas_indice, columns=["dataset", "instancia", "n", "M", "archivo"]).to_csv("instancias/densidad-alta/indice.csv", index=False, header=True)

## Dataset 2
Instancias con densidad alta de contagio:
```
C = { 1, 2, ... , n } con M = n/2
B = { 1, 2, ... , n } 
```
Ambos beneficios y contagios luego serán mezclados

En este caso el limite de contagio es pequeño y en teoría deberia tardar mucho menos que el caso anterior

In [11]:
filas_indice = []
B = []
for n in range(1, 201):
    M = math.floor(n/2)
    B = [0 for i in range(0, n)]
    for i in range(0, n): B[i] = i+1
    random.shuffle(B)
    S = []
    for i in B:
        S.append(i)
        S.append(i)
        S.append('\n')
    save_instance("densidad-baja", F"BAJA-{n}", S, M)
    B = []
    filas_indice.append(["densidad-baja", F"BAJA-{n}", n, M, F"instancias/densidad-baja/BAJA-{n}.txt"])
pd.DataFrame(filas_indice, columns=["dataset", "instancia", "n", "M", "archivo"]).to_csv("instancias/densidad-baja/indice.csv", index=False, header=True)

# Dataset 3
- Backtracking mejor caso
Instancias de mejor caso de backtracking, están descriptas en el informe en más detalle.
```
B = {1, ...,1, 1} con #B, #C = n y M = n
C = {1, ..., 1, 1} 
```
NOTA:
En principio el beneficio en este caso se puede cambiar la variable que realmente importa es el Contagio C
En este caso hay poco contagio de local y mucho limite

In [12]:
filas_indice = []
B = []e
for i in range(1, 201):
    n = i * 10
    M = 1000
    for j in range(0, n):
        B.append(1)
        B.append(1)
        B.append('\n')
    save_instance("mejor-caso-bt", F"BT-MC-{n}", B, M)
    B = []
    filas_indice.append(["mejor-caso-bt", F"BT-MC-{n}", n, M, F"instancias/mejor-caso-bt/BT-MC-{n}.txt"])
pd.DataFrame(filas_indice, columns=["dataset", "instancia", "n", "M", "archivo"]).to_csv("instancias/mejor-caso-bt/indice.csv", index=False, header=True)

# Dataset 4
```
B = {1, ...,1, 1} con #B, #C = n y M = n/4
C = {2, ..., 2, 2} 
```
NOTA:
En principio el beneficio en este caso se puede cambiar la variable que realmente importa es el Contagio C
En este caso hay mucho contagio de local y poco limite M

In [14]:
filas_indice = []
B = []
for n in range(1, 201):
    n = i * 10
    M = math.floor(n/4)
    B = [0 for i in range(0, n)]
    for i in B:
        S.append(1)
        S.append(2)
        S.append('\n')
    save_instance("dataset-4", F"DS-4-{n}", S, M)
    B = []
    filas_indice.append(["dataset-4", F"DS-4-{n}", n, M, F"instancias/dataset-4/DS4-{n}.txt"])
pd.DataFrame(filas_indice, columns=["dataset", "instancia", "n", "M", "archivo"]).to_csv("instancias/dataset-4/indice.csv", index=False, header=True)

# Dataset 5
EXPERIMENTAL, CONSULTAR
```
B = {M, ..., 1, 1} y M arbitrariamente grande
C = {M, ..., 1, 1} 
```
La hipótesis es que dado que el beneficio máximo y contagio máximo se encuentran en el primer lugar del Dataset, el algoritmo de Backtracking termina muy rápido, de hecho termina más rápido que con sus 2 podas.

In [15]:
filas_indice = []
B = []
for i in range(1, 201):
    n = i * 10
    M = 1000
    for j in range(0, n):
        B.append(1)
        B.append(1)
        B.append('\n')
    B[0] = M
    B[1] = M
    save_instance("dataset-5", F"DS-5-MC-{n}", B, M)
    B = []
    filas_indice.append(["dataset-5", F"DS-5-{n}", n, M, F"instancias/dataset-5/DS-5-{n}.txt"])
pd.DataFrame(filas_indice, columns=["dataset", "instancia", "n", "M", "archivo"]).to_csv("instancias/dataset-5/indice.csv", index=False, header=True)