# Generador de instancias
En este notebook está el código para generar los sets de instancias que se usan para experimentar.
- Estas instancias van a ser guardadas en la carpeta __instancias__.
- Cada set estará en su propia carpeta y tendrá un archivo _indice.csv_ que contendrá información sobre las instancias.

In [1]:
import random, math
import pandas as pd

In [2]:
def save_instance(dataset, instance_name, C, M, n):
    with open(F"instancias/{dataset}/{instance_name}.txt", "w") as f:
        print(n, M, file=f)
        for c in C: 
            print(c, c, sep=" ", file=f)

def save_index(dataset, instances):
    with open(F"instancias/{dataset}/instances.txt", "w") as f:
        for instance in instances: 
            print(instance, file=f)

## Dataset 1
Instancias con densidad alta de contagio:
(necesito menos locales para alcanzar M)
```
C = { 1, 2, ... , n } con M = n/2
B = { 1, 2, ... , n } 
```
Ambos beneficios y contagios luego serán mezclados

En este caso el limite es muy grande, y deberá recorrer nodo del arbol de ejecución

In [3]:
filas_indice = []
B = []
for n in range(1, 201):
    M = math.floor(n/2)
    B = [0 for i in range(0, n)]
    for i in range(0, n): B[i] = i+1
    random.shuffle(B)
    #S = []
    #for i in B:
    #    S.append(i)
    #    S.append(" ")
    #    S.append(i)
    save_instance("densidad-alta", F"ALTA-{n}", B, M, n)
    B = []
    filas_indice.append(["densidad-alta", F"ALTA-{n}", n, M, F"instancias/densidad-alta/ALTA-{n}.txt"])
pd.DataFrame(filas_indice, columns=["dataset", "instancia", "n", "M", "archivo"]).to_csv("instancias/densidad-alta/indice.csv", index=False, header=True)

## Dataset 2
Instancias con densidad baja de contagio:
(necesito mayor cantidad de elementos para llegar a M)
```
C = { 1, 2, ... , n } con M = n(n+1)/2
B = { 1, 2, ... , n } 
```
Ambos beneficios y contagios luego serán mezclados

En este caso el limite de contagio es pequeño y en teoría deberia tardar mucho menos que el caso anterior

In [4]:
filas_indice = []
B = []
for n in range(1, 201):
    M = max(1, math.floor(n * (n+1) / 4))
    B = [0 for i in range(0, n)]
    for i in range(0, n): B[i] = i+1
    random.shuffle(B)
    #S = []
    #for i in B:
    #    S.append(i)
    #    S.append(i)
    #    S.append('\n')
    #ahora a save le pasas el n
    save_instance("densidad-baja", F"BAJA-{n}", B, M, n)
    B = []
    filas_indice.append(["densidad-baja", F"BAJA-{n}", n, M, F"instancias/densidad-baja/BAJA-{n}.txt"])
pd.DataFrame(filas_indice, columns=["dataset", "instancia", "n", "M", "archivo"]).to_csv("instancias/densidad-baja/indice.csv", index=False, header=True)

# Dataset 3
- Backtracking mejor caso
Instancias de mejor caso de backtracking, están descriptas en el informe en más detalle.
```
B = {2*n, ...,1, 1} con #B y #C = n y M = n*2
C = {2*n, ..., 1, 1} 
```
NOTA:
En principio el beneficio en este caso se puede cambiar la variable que realmente importa es el Contagio C
En este caso hay poco contagio de local y mucho limite

In [5]:
filas_indice = []
B = []
for n in range(1, 1001):
    #n = i * 10
    M = n*2
    B = [1 for i in range(0, n)]
    B[0]=n*2    
    #for j in range(0, n):
    #    B.append(1)
    #    B.append(1)
    #    B.append('\n')
    save_instance("mejor-caso-bt", F"BT-MC-{n}", B, M, n)
    B = []
    filas_indice.append(["mejor-caso-bt", F"BT-MC-{n}", n, M, F"instancias/mejor-caso-bt/BT-MC-{n}.txt"])
pd.DataFrame(filas_indice, columns=["dataset", "instancia", "n", "M", "archivo"]).to_csv("instancias/mejor-caso-bt/indice.csv", index=False, header=True)

# Dataset 4
genera el peor caso de bt, donde tengo que agregar todos los elementos 
```
B = {1, ...,1, 1} con #B, #C = n y M = n
C = {1, ..., 1, 1} 
```

NOTA:
En principio el beneficio en este caso se puede cambiar la variable que realmente importa es el Contagio C
En este caso hay mucho contagio de local y poco limite M

In [6]:
filas_indice = []
B = []
for n in range(1, 60):
    #n = i * 10
    M = n
    B = [1 for i in range(0, n)]
    #for i in B:
    #    S.append(i)
    #    S.append(i)
    #    S.append('\n')
    save_instance("dataset-4", F"DS-4-{n}", B, M, n)
    B = []
    filas_indice.append(["dataset-4", F"DS-4-{n}", n, M, F"instancias/dataset-4/DS4-{n}.txt"])
pd.DataFrame(filas_indice, columns=["dataset", "instancia", "n", "M", "archivo"]).to_csv("instancias/dataset-4/indice.csv", index=False, header=True)

# Dataset 5
EXPERIMENTAL, CONSULTAR
```
B = {M, ..., 1, 1} y M arbitrariamente grande
C = {M, ..., 1, 1} 
```
La hipótesis es que dado que el beneficio máximo y contagio máximo se encuentran en el primer lugar del Dataset, el algoritmo de Backtracking termina muy rápido, de hecho termina más rápido que con sus 2 podas.

In [8]:
filas_indice = []
B = []
for i in range(1, 201):
    n = i * 10
    M = 1000
    for j in range(0, n):
        B.append(1)
        B.append(1)
        B.append('\n')
    B[0] = M
    B[1] = M
    save_instance("dataset-5", F"DS-5-MC-{n}", B, M, n)
    B = []
    filas_indice.append(["dataset-5", F"DS-5-{n}", n, M, F"instancias/dataset-5/DS-5-{n}.txt"])
pd.DataFrame(filas_indice, columns=["dataset", "instancia", "n", "M", "archivo"]).to_csv("instancias/dataset-5/indice.csv", index=False, header=True)

#Dataset 6

Instancias variando n y M con densidad baja.


In [9]:
filas_indice = []
for n in range(1000, 8000, 500):
    for M in range(1000, 8000, 500):
        S = [1 for i in range(0, n)]
        save_instance("dinamica", F"DP-{n}-{M}", S, M, n)
        filas_indice.append(["dinamica", F"DP-{n}-{M}", n, M, F"instancias/dinamica/DP-{n}-{M}.txt"])
pd.DataFrame(filas_indice, columns=["dataset", "instancia", "n", "M", "archivo"]).to_csv("instancias/dinamica/indice.csv", index=False, header=True)

#DataSet 7
para probar pd con bt creo instancias que sean M = 2^n 
esto hace que pd sea O(n* 2^n)

In [10]:
filas_indice = []
B = []
for n in range(1, 11):
    M = 2**n
    B = [0 for i in range(0, n)]
    for i in range(0, n): B[i] = i+1
    random.shuffle(B)
    #for j in range(0, n):
    #    B.append(1)
    #    B.append(1)
    #    B.append('\n')
    #B[0] = M
    #B[1] = M
    save_instance("dataset-7", F"DS-7-{n}", B, M, n)
    B = []
    filas_indice.append(["dataset-7", F"DS-7-{n}", n, M, F"instancias/dataset-7/DS-7-{n}.txt"])
pd.DataFrame(filas_indice, columns=["dataset", "instancia", "n", "M", "archivo"]).to_csv("instancias/dataset-7/indice.csv", index=False, header=True)