# Proyecto 3 - Intratabilidad

El problema asociado, es cobertura de Cliques. Dado esto; y que es un problema NP-Completo, se debe definir una propuesta aproximada para dar una solución al problema. El objetivo de la solución es que también sea rápida y que se pueda ejecutar en tiempo polinomial para el tamaño de la entrada.

Para nuestro enfoque, vamos a pensar en una idea constructiva para diseñar un clique. Para ello podemos tomar la siguiente definición

Dado un grafo no dirigido $G = (V,E)$, definimos un clique $S$ como:

$$\texttt{CLIQUE}(S) \equiv ( S \subseteq V \wedge ( \forall x,y \mid x \in S \wedge y \in S : (x,y) \in E ))$$

A partir de esta definición yo puedo definir un esquema recursivo para relacionar un clique de tamaño $|S|$ con un clique de tamaño $|S|+1$ siempre y cuando exista un elemento $x$ que cumpla lo siguiente:

$$\texttt{CLIQUE}(S) \wedge (\exist x \forall y \mid x \in V - S \wedge y \in S: (x,y) \in E) \implies \texttt{CLIQUE}(S \cup \{x\})$$

Usando este principio, si yo tengo un clique conocido, puedo construir otro de tamaño más grande; esto se logra de manera progresiva y esta tarea se puede evaluar elemento a elemento.

Adicionalmente, podemos definir una propiedad interesante que tienen los cliques respecto al grado de cada nodo que lo componen

Dado que podemos construir cliques elemento a elemento, el objetivo es para todo elemento empezar a construir los cliques siempre que sea posible

In [19]:
!java ProblemaP3.java < Ptest.in

1 1
2 1
3 2
4 2


In [18]:
%%timeit
!java ProblemaP3.java < P1.in > P1.out

900 ms ± 27.1 ms per loop (mean ± std. dev. of 7 runs, 1 loop each)


Diseñamos entradas y salidas del tamaño más grande posible para ver que tan rápido es el código

In [42]:
import random
import string

def generate_chains(num_chains, chain_length):
    characters = string.ascii_letters + string.digits
    chains = set()
    while len(chains) < num_chains:
        chain = ''.join(random.choices(characters, k=chain_length))
        chains.add(chain)
    return list(chains)

Vamos a diseñar un caso de prueba con $10^5$ celulas y que todas puedan conectarse entre si. Esto se puede lograr con que la distancia sea lo suficientemente grande y que todas compartan al menos un aminoacido en común. Dado que se busca medir eficiencia, se probara con que todas las celulas tengan todos los aminoacidos (Esto hace que la captura de la entrada se demore lo mayor posible)

In [None]:
import random

def makeInput(n,m,d,s=None,grill = (100,100),verbose = False):
    if s == None: s=m
    r = f'1\n{n} {d}\n'
    c = generate_chains(m, 5)
    if verbose: print(f'{len(c)} chains created')
    for i in range(1,n+1):
        x = random.randint(0, grill[0])
        y = random.randint(0, grill[1])
        amino = ' '.join(random.sample(c, s))
        if(i!=n): r+=f'{i} {x} {y} {amino}\n'
        else: r+=f'{i} {x} {y} {amino}'
        if verbose and i%5000==0: print(f'Progress: {i} cells')
    return r

def save_string_to_file(content, filename):
    if not filename.endswith(".in"):
        filename += ".in"
    with open(filename, "w", encoding="utf-8") as file:
        file.write(content)


Probamos creando una entrada no muy grande para ver el generador

In [44]:
test = makeInput(n=5,m=15,d=10, s = 3)
print(test)

5 10
1 0 58 8jUbj epBDb SsC32
2 22 81 awVnV K2Ou7 rldND
3 72 9 awVnV PcjET LRwJ1
4 27 2 LRwJ1 SsC32 ngQDd
5 74 20 mUlqk rldND awVnV


Creamos una entrada del tamaño mas grande posible

In [41]:
largeInput = makeInput(n=int(1e5),m=int(1e2),d=150,verbose=True)

100 chains created
Progress: 5000 cells
Progress: 10000 cells
Progress: 15000 cells
Progress: 20000 cells
Progress: 25000 cells
Progress: 30000 cells
Progress: 35000 cells
Progress: 40000 cells
Progress: 45000 cells
Progress: 50000 cells
Progress: 55000 cells
Progress: 60000 cells
Progress: 65000 cells
Progress: 70000 cells
Progress: 75000 cells
Progress: 80000 cells
Progress: 85000 cells
Progress: 90000 cells
Progress: 95000 cells
Progress: 100000 cells


In [46]:
save_string_to_file(largeInput, 'PLargeTest.in')