# 3er Proyecto DAA. Problema: Raul el Incongruente

### Equipo: Broken Phone

- Niley González Ferrales C-411 [@NileyGF](https://github.com/NileyGF)
- Arian Pazo Valido C-311 [@ArPaVa](https://github.com/ArPaVa)

## Problema conciso:
Dada una colección [ ( $a_1,b_1$ ) , … , ( $a_n,b_n$ ) ] de enteros positivos, con $a_i ≤ b_i$. 

Encuentre, si existe, algún entero X tal que para todo $1 ≤ i ≤ n$ :  X ≢ $a_i$ $(mod$ $b_i)$.

## Analisis de Congruencia

X es congruente a modulo b ( `X ≡ a (mod b)`  ) si : b es un divisor de X-a (o lo que es lo mismo, si existe un entero k, tal que X - a = kb)
    
El enunciado X ≡ a (mod b) implica que X y a tienen el mismo resto al ser divididos por b.

Osea:

- `X % b = r `  y  `  a % b = r`

- X = pb + r 

- a = qb + r

Al restarlos:

X - a = (p - q)b $ \implies $ X - a = kb



In [2]:
def are_congruent(X, a, b):
    return X%b == a%b

### Generador
Para el generar los casos de prueba, se recibe n_min y n_max que marcan el rango del tamaño de la lista de enteros a y b. También se recibe el rango de los números que van la lista. 

De esta forma se pueden generar casos más o menos complejos. Por ejemplo si se generan las listas con alta densidad de números más a%b serán cubiertos y será más difícil encontrar un X solución.

In [9]:
import random
# a and b generators
def generator(n_min:int,n_max:int, range_min:int,range_max:int):
    """ generate two lists of integers of size n in range [n_min, n_max]

        the numbers of both lists a and b are such that, for every index i, 
        a[i] <= b[i] and a[i],b[i] are in range [range_min,range_max]
    """
    n = random.randint(n_min,n_max)
    a = []
    b = []
    if range_min <= 0:
        range_max = (range_max - range_min) + 1
        range_min = 1
    source = range(range_min,range_max+1)
    for i in range(n):       
        x1 = random.sample(source,1)[0]
        x2 = random.sample(source,1)[0]
        if x1 <= x2:
            a.append(x1)
            b.append(x2)
        else:
            a.append(x2)
            b.append(x1)
    return a, b

## Evaluador

La siguiente función, dado un entero X, y un par de listas a y b; calcula con cuántos pares $a_i, b_i$ es congruente dicha X. Si el resultado es 0, significa que la X es incongruente con todos, y por lo tanto es solución al problema.

In [6]:
def evaluator(X,a,b):
    score = 0
    for i in range(len(a)):
        if are_congruent(X, a[i], b[i]):
            score += 1
    return score

## Solución iterativa

Nuestra primera propuesta de solución es comenzar con X = 1, y probar si es solución, y si no lo es, se prueba con X += 1. Además se guarda el menor valor que ha dado `evaluator`, como mejor solución parcial. Introducimos una condición de parada, lo suficientemente grande, como para decir que si la alcanza, es muy probable que no haya solución para el problema, y en ese caso se retorna la mejor solución parcial.

In [17]:
import time
def find_X(a:list, b:list, stop_iter):
    # dumbest solution 
    X = 1
    best_int = 1
    int_score = evaluator(best_int,a,b)
    while X < stop_iter+2:
        temp_score = evaluator(X,a,b)
        if temp_score < int_score:
                best_int = X
                int_score = temp_score
        if int_score == 0:
            return best_int,int_score
        X += 1
    return best_int, int_score

a, b = generator(500, 750,1, 150)
print(a,'\n',b)
st = time.time()
X = find_X(a,b,10**5)
et = time.time()
print('X = ',X, 'time ', et-st)

[125, 32, 1, 15, 7, 33, 96, 32, 23, 88, 62, 56, 67, 45, 122, 77, 38, 51, 23, 34, 131, 51, 11, 52, 92, 13, 32, 27, 13, 9, 19, 38, 42, 109, 66, 76, 127, 42, 57, 136, 9, 10, 27, 89, 89, 39, 35, 8, 79, 47, 55, 49, 53, 3, 77, 12, 59, 2, 52, 110, 14, 85, 44, 1, 11, 80, 32, 42, 35, 22, 94, 44, 81, 42, 125, 10, 30, 35, 115, 58, 56, 71, 109, 8, 33, 117, 60, 14, 96, 24, 11, 6, 77, 12, 33, 108, 63, 30, 20, 14, 32, 92, 118, 106, 138, 43, 64, 99, 73, 9, 28, 26, 122, 107, 126, 112, 19, 54, 48, 1, 7, 77, 17, 36, 64, 33, 41, 67, 49, 45, 75, 66, 4, 81, 65, 17, 61, 73, 5, 18, 77, 80, 71, 31, 32, 96, 87, 100, 20, 104, 9, 76, 31, 11, 24, 31, 53, 111, 107, 13, 13, 10, 3, 95, 109, 96, 58, 78, 85, 100, 33, 6, 79, 97, 62, 35, 77, 3, 11, 80, 65, 35, 8, 70, 33, 25, 1, 32, 79, 38, 24, 110, 10, 46, 34, 77, 68, 107, 23, 38, 3, 67, 6, 45, 89, 59, 33, 19, 52, 34, 19, 55, 58, 93, 25, 32, 20, 26, 71, 26, 104, 2, 5, 40, 20, 97, 78, 42, 57, 47, 44, 31, 86, 123, 27, 93, 90, 16, 23, 133, 22, 45, 71, 49, 14, 101, 46, 40, 1

X =  (1821, 0) time  3.6888034343719482


# Taboo Search
Dado que decidir si existe un entero X que cumpla con las condiciones del problema es NP-completo, como será demostrado posteriormente, diseñamos una metaheurística basada en búsqueda tabú, para obtener 'buenos' resultados siempre, incluso si no se obtiene una solución óptima. 

Primero definimos lo que es para nosotros una solución parcial. Si un entero $X^{*}$ no es solución, entonces existe al menos un k para el que 
$ X^{*} mod $ $b_k = a_k $ mod $b_k$. Una solución parcial está compuesta por un entero X (el candidato) y la cantidad de pares a los que es congruente $(X,c)$. Entonces una solución óptima para la metaheurística es un par  $(X,c)$, donde $c = 0$. 

Escogimos utilizar esta metaherística debido a que por las propiedades del problema si $X^{*}$ no es incongruente con todos los pares, no tiene sentido probar nuevamente con él. 

Al generar una instancia de TS:

` ts = TS(a_list, b_list, times_to_try, am_in_neighborhood=5, random_range=50, taboo_list_size=200)`, 

se genera una solución inicial, que se añade a `taboo_list`, ya que no queremos evaluar en ella más de una vez. En un ciclo que se ejecuta, a lo sumo, `times_to_try` veces se generan `am_in_neighborhood` vecinos a partir de la mejor solución parcial, que en este momento es la solución inicial. Se evalúa cada vecino y se añade a `taboo_list`. Si alguno mejora el best_score hasta el momento, se actualiza la mejor solución parcial. Si en algún momento de la ejecución se obtiene una solución con score = 0, entonces se retorna, ya que es solucón óptima. 

Nosotros definimos como vecinos de un número, todos los enteros en una vecindad de radio `random_range`. Si al generar vecinos,se encuentran menos de 5 vecinos que no están en `taboo_list`, se genera la lista de vecinos a partir de un número aleatorio que no esté en `taboo_list`.

Las condiciones de parada son:
- la mejor solución parcial tiene como evaluación 0 $\implies$ es solución óptima. Retorna la solución óptima.
- el ciclo se ha ejecutado `times_to_try` veces. Retorna la mejor solución parcial, aunque no sea óptima.
- después de 500 intentos no se pudo generar una lista de vecinos que no estuvieran en `taboo_list`. Retorna la mejor solución parcial, aunque no sea óptima.

In [14]:
class TS():
    def __init__(self,a_list:list,b_list,times_to_try,am_in_neighborhood=5,random_range=50,taboo_list_size=200):
        self.a_list = a_list
        self.b_list = b_list
        self.times_to_try = times_to_try
        self.taboo_list = []
        self.neigbor_list = []
        self.am_in_neighborhood = am_in_neighborhood
        self.random_range = random_range
        intial_value = self.get_InitialSolution(2, 2*max(self.b_list))
        self.taboo_list.append(intial_value)
        self.neigbor_list.append(intial_value)
        self.taboo_list_size = taboo_list_size

    def neighbor_generate(self, n):
        """
        Generates a list of neighbors for a given value n.
        :param n: int - the value from which neighbors are to be generated.
        :return: list - a list of neighbors for the given value.
        """
        neighbor_list = []
        iter_count = 0
        attempts = 0
        # Check if n is None
        if n is None:
            return None
        # Generate neighbors
        while iter_count < self.am_in_neighborhood and attempts < 500:
            new_neighbor = random.randint(n - self.random_range, n + self.random_range)
            # Check if new_neighbor is not in taboo_list
            if new_neighbor not in self.taboo_list and new_neighbor != 0:
                neighbor_list.append(new_neighbor)
                if len(self.taboo_list) == self.taboo_list_size:
                    self.taboo_list.remove(self.taboo_list[0])
                self.taboo_list.append(new_neighbor)
                iter_count += 1
            attempts += 1
        return neighbor_list
    def get_random_non_taboo(self):
        n = random.randint(2, 2 * max(self.b_list))
        attempts = 0
        # While the generated number is in the taboo list and the number of attempts is less than 500
        while (n in self.taboo_list or n == 0) and attempts < 500:
            n = random.randint(2, 2 * max(self.b_list))
            attempts += 1
        # If the number of attempts is equal to 500, return None
        if attempts == 500:
            return None
        # Otherwise, return the generated non-taboo number
        return n
    
    def get_InitialSolution(self,n_min,n_max):
        # n = random.randint(n_min,n_max)
        # return n
        return 1
    
    def evaluator(self, neighbor):
        neighbor_score = 0
        for j in range(len(a)):
            if are_congruent(neighbor, a[j], b[j]):
                neighbor_score += 1
        return neighbor_score

    # This function tries to find the best solution by generating neighbors and evaluating them.
    # It returns the best solution found, its score and the number of iterations done.
    def Solve(self):
        i = 0
        besto_waifu = self.neigbor_list[0] # initialize the best solution with the first neighbor
        waifu_score = evaluator(besto_waifu,self.a_list,self.b_list) # evaluate the first neighbor
        self.neigbor_list = self.neighbor_generate(self.neigbor_list[0]) # generate new neighbors from the first neighbor
        # iterate until the max number of tries is reached or there are no more neighbors or the best solution has a score of 0
        while i < self.times_to_try and len(self.neigbor_list) > 0 and waifu_score > 0: 
            best_neighbor = self.neigbor_list[0]
            neighbor_score = evaluator(best_neighbor,self.a_list,self.b_list)
            # iterate over all the neighbors and find the best one
            for j in range(1, len(self.neigbor_list)):
                temp = self.neigbor_list[j]
                temp_score = evaluator(temp,self.a_list,self.b_list)
                if temp_score < neighbor_score:
                    best_neighbor = temp
                    neighbor_score = temp_score 

            # update the best solution if the best neighbor is better
            if waifu_score > neighbor_score:
                besto_waifu = best_neighbor
                waifu_score = neighbor_score
            # generate new neighbors from the best neighbor
            self.neigbor_list = self.neighbor_generate(best_neighbor)        
            i += 1  
            # if there are no more neighbors, generate a random non-taboo solution
            while self.neigbor_list is not None and len(self.neigbor_list) < 5:
                self.neigbor_list = self.neighbor_generate(self.get_random_non_taboo())
            # if there is a problem generating a random non-taboo solution, return the best solution found so far
            if self.neigbor_list is None:
                print("Problems generating a random non taboo int")
                return besto_waifu, waifu_score, i
        if len(self.neigbor_list) == 0:
            print("Stopped because there are not more neigbors")
        # return the best solution found, its score and the number of iterations done
        return besto_waifu, waifu_score, i

## Comparación
Aquí comparamos ambas soluciones. Empíricamente, en los casos díficiles, donde niguna de las dos encuentra el óptimos, la metaherística suele encontrar soluciones tan buenas, o mejores que la solución iterativa, pero mucho más rápido (o sea, en menos iteraciones).

In [18]:
import time
for i in range(5):
    #a, b = generator(400, 550, 5, 300)
    a, b = generator(500, 1000,1, 100)
    #print(a,'\n',b)
    clase_porque_si = TS(a,b,5 * 10**3)

    st = time.time()
    X = clase_porque_si.Solve()
    et = time.time()
    print("Taboo Search result:", X[0], ". Number of congruences for that X:", X[1], '. time :', et-st)
    
    st = time.time()
    Y = find_X(a,b,10**5)
    et = time.time()
    print( "\t Iterative result:", Y[0], ". Number of congruences for that X:", Y[1], '. time :',et-st,"\n")
    

Taboo Search result: 1250 . Number of congruences for that X: 3 . time : 51.15000343322754
	 Iterative result: 1250 . Number of congruences for that X: 3 . time : 194.92378687858582 

Taboo Search result: -1230 . Number of congruences for that X: 1 . time : 47.53412914276123
	 Iterative result: 33795 . Number of congruences for that X: 0 . time : 52.65845775604248 

Taboo Search result: -756 . Number of congruences for that X: 1 . time : 37.70026779174805
	 Iterative result: 44268 . Number of congruences for that X: 0 . time : 68.86539363861084 

Taboo Search result: 3910 . Number of congruences for that X: 2 . time : 46.16846776008606
	 Iterative result: 3910 . Number of congruences for that X: 2 . time : 165.29956316947937 

Taboo Search result: -1216 . Number of congruences for that X: 4 . time : 42.99068832397461
	 Iterative result: 22460 . Number of congruences for that X: 2 . time : 179.84776830673218 



## Reducción desde 3-SAT

Para demostrar que el problema de decisión es NP-Completo, elegimos un famoso problema NP-Completo: 3-SAT. Que consiste en dada una fórmula de la lógica proposicional en forma normal conjuntiva, con 3 literales en cada cláusula; decir si existen valores de las variables que satisfacen la fórmula. 

Si exite un algoritmo polinomial que convierta una entrada de 3-SAT (problema A), en una entrada de nuestro problema (problema B),  y dada una respuesta de existencia en B se puede determinar la satisfacibilidad en A, entonces el problema B es tan o más díficil que el A. Como conocemos que A es NP-Completo, entonces B, nuestro problema sería NP-Completo.

En primer lugar presentamos un algoritmo para solucionar 3-SAT, además de un generador de casos de prueba.

In [20]:
import itertools

def brute_force_3sat(cnf):
    # Create a set of all variables in the CNF
    variables = set()
    for clause in cnf:
        for literal in clause:
            variables.add(abs(literal))
    variables = list(variables)
    # Get the number of variables
    n = len(variables)
    # Generate all possible truth value assignments for the variables
    for assignment in  itertools.product([True, False], repeat=n):
        # Create a dictionary mapping each variable to its truth value
        truth_values = dict(zip(variables, assignment))
        # Check if the truth values satisfy the CNF
        if satisfies_formula(cnf, truth_values):
            # Return the first satisfying assignment
            return True, truth_values
    # If no satisfying assignment is found, return False and None
    return False, None

def satisfies_formula(cnf, truth_values):
    # Loop through each clause in the CNF
    for clause in cnf:
        clause_satisfied = False
        # Loop through each literal in the clause
        for literal in clause:
            # Check if the literal is true based on the truth values
            if (literal > 0 and truth_values[literal]) or (literal < 0 and not truth_values[abs(literal)]):
                clause_satisfied = True
                break
        # If the clause is not satisfied, return False
        if not clause_satisfied:
            return False
    # If all clauses are satisfied, return True
    return True

cnf = [[1, -2, 3], [-1, -3, -4], [-2, -3, 4]]
satisfiable, truth_values = brute_force_3sat(cnf)

print("Satisfiable:", satisfiable)
if satisfiable:
    print("Truth Values:", truth_values)

Satisfiable: True
Truth Values: {1: True, 2: True, 3: False, 4: True}


In [21]:
import random
def generate_3sat_formula(num_vars, num_clauses):
    # Generate a list of all possible literals
    literals = list(range(1, num_vars+1)) + list(range(-num_vars, 0))
    # Generate a list of random clauses
    clauses = []
    for i in range(num_clauses):
        # Choose three random literals and combine them into a clause
        clause = random.sample(literals, 3)
        clauses.append(clause)
    return clauses

cnf = generate_3sat_formula(5, 3)
print(cnf)
satisfiable, truth_values = brute_force_3sat(cnf)

print("Satisfiable:", satisfiable)
if satisfiable:
    print("Truth Values:", truth_values)

[[-1, -3, 4], [-1, 3, 1], [5, -1, -3]]
Satisfiable: True
Truth Values: {1: True, 3: True, 4: True, 5: True}


## Conversión de la entrada de 3-SAT

Una entrada de 3-SAT consiste en en n variables $x_1, x_2, ..., x_n$ en cláusulas de la forma: $$ ... (x_i \lor \neg x_j \lor \neg x_k) \land (x_i \lor  x_j \lor x_k) ... $$

Necesitamos convertirlo a una lista de pares $(a_i,b_i)$, tal que si existe una X que no sea congruente con ningún par, la forma normal conjuntiva (FNC) original sea satisfacible.

Primero, encontramos n primos relativos, por ejemplo, los primeros n primos, $p_1, … , p_n$. Entonces codificamos cada variable $x_i$ como $x $ mod $p_i$. 

``` 
i = 0
for var in variables:
    encoding_for_var[var] = primes[i]
    i+=1
```

Para asegurar que $x $ mod $p_i$ es binario, o sea, que solo pueda ser 0 o 1, por cada $p_i$ añadimos la restricción de congruencia por cada número menor que $p_i$. O sea, por cada $2 \leq a < pi$, añadimos a la entrada de nuestro problema el par $(a, p_i)$. 

```
for p in primes:
    for i in range(2, p):
        result_a.append(i)
        result_b.append(p)
```
Esto es válido porque en cada par $(a_j,p_i)$, $a_j \leq p_i$. ¿Por qué $x $ mod $p_i$ es binario? 

Si $a < b$, entonces a % b = a. Luego, como $x $ mod $p_i$ no puede ser ningún número en el intervalo [2, $p_i$ - 1]; está forzado a ser 0, o 1. Ya que m % n, solo puede dar resultados entre 0 y n-1. 

Luego, por cada cláusula, compuesta por $x_i, x_j, x_k$, se busca un a, $0 \leq a < p_i*p_j*p_k$, que satisfaga:
por cada literal en la cláusula($x*$), si está negado, que $a \equiv 1 (mod $ $p*)$; y si no lo está, que $a \equiv 0 (mod $ $p*)$. 

Por ejemplo, en la cláusula ($x_i \lor x_j \lor \neg x_k$), si exitste un a, $0 \leq a < p_i*p_j*p_k$, que satisface:
- $a \equiv 0 (mod $ $p_i)$
- $a \equiv 0 (mod $ $p_j)$
- $a \equiv 1 (mod $ $p_k)$

Entonces se añade el par ($a, p_i*p_j*p_k$).


In [26]:
from sympy import primerange, prime

def reduction(cnf_input):
    result_a = []
    result_b = []
    # Create a set of all variables in the CNF
    variables = set()
    for clause in cnf:
        for literal in clause:
            variables.add(abs(literal))
    variables = list(variables)
    
    # Get the number of variables
    n = len(variables)
    # Get the first n primes
    primes = list(primerange(prime(n) + 1))
    
    # Ensure that the variables are indeed binary
    for p in primes:
        for i in range(2, p):
            result_a.append(i)
            result_b.append(p)

    encoding_for_var = {}
    i = 0
    for var in variables:
        encoding_for_var[var] = primes[i]
        i+=1

    for clause in cnf_input:
        ab = find_a(clause, encoding_for_var)
        if ab != None:
            a, b = ab
            result_a.append(a)
            result_b.append(b)
    return result_a, result_b

def find_a(clause, encoding):
    pr = encoding[abs(clause[0])]
    ps = encoding[abs(clause[1])]
    pt = encoding[abs(clause[2])]
    mul = pr*ps*pt

    for a in range(0, mul):
        valid = True
        for literal in clause:
            if literal > 0:
                valid =  valid and are_congruent(a,0,encoding[abs(literal)])
            else:
                valid =  valid and are_congruent(a,1,encoding[abs(literal)])
        if valid: 
            return a, mul
    return None


In [43]:
cnf = generate_3sat_formula(5, 7)
# cnf = [[1,2,3], [1,2,-3], [1,-2,3], [1,-2,-3],
#        [-1,2,3],[-1,2,-3],[-1,-2,3],[-1,-2,-3]]
print(cnf)

print('encoding',encoding)
satisfiable, truth_values = brute_force_3sat(cnf)
print("Satisfiable:", satisfiable)
if satisfiable:
    print("Truth Values:", truth_values)

a, b = reduction(cnf)
# print(a,'\n',b)
X = find_X(a,b,500)
print(X, X[1] == 0)


[[-3, -2, -4], [-1, -4, -5], [-1, -4, -3], [-5, -3, 1], [-3, 5, 4], [-2, -3, 2], [4, -2, 5]]
encoding {1: 2, 2: 3, 3: 5, 4: 7, 5: 11}
Satisfiable: True
Truth Values: {1: True, 2: True, 3: True, 4: False, 5: True}
(210, 0) True
