<a href="https://colab.research.google.com/github/Aranzasuu/ADA-Informes/blob/main/NP_Hard.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

### **INTEGRANTES**

- Catalina Araya
- Luis Castro
- Aranzasu Larraín

**Grupo:** Los Chubis

A lo largo del curso hemos visto distintos algoritmos que resuelven distintos tipos de problemas en un tiempo estimado. Pero la realidad es que no todos los problemas de la vida cotidiana pueden ser resueltos facilmente o en un periodo considerable de tiempo, y estos corresponden a los problemas denominados **NP-Hard**, donde analizaremos algunos de ellos a lo largo de este informe. Pero antes de irnos de lleno al análisis, debemos entender en qué consisten.

# **1. ¿Qué quiere decir que un problema sea NP-Hard?**

↪ En teoría de la complejidad computacional, la clase de complejidad **NP-Hard** es el conjunto de los problemas de decisión que contiene los problemas $H$ tales que todo problema $L$ en NP puede ser transformado **polinomialmente** en $H$. Es decir, que puede ser descrita como aquella que contiene a los problemas que son como mínimo tan difíciles como un problema de **NP**.

↪ En palabras más simples, un problema $x$ es NP-Hard, si hay un problema NP-Completo $y$, tal que $y$ es reducible a $x$ en un tiempo polinomial.

> ![image](https://media.geeksforgeeks.org/wp-content/uploads/NP-Completeness-1.png)

# **1.1 ¿Qué quiere decir que P $\neq$ NP?**

↪ Todos los problemas P son a su vez problemas NP. Es decir P es un **subconjunto** de NP, recordemos que un problema P es aquel que tiene un algoritmo de orden polinómico que lo resuelve. Mientras que un problema NP tiene un algoritmo de orden polinómico que lo **verifica**, ya que estos no pueden resolverse en ese tiempo.

# **1.2 ¿Cómo se prueba que un problema es NP-Hard usando reducciones?**

↪ La idea tras esto es transformar un problema A a un problema B, donde esta tenga un tiempo polinomial. Por lo tanto para probar que un problema $A$ es NP-Hard, se selecciona un problema $B$ que sepamos que sea NP-Hard, si $B$ es **transformada** a $A$, en caso de no ser así surgiría una contradicción, entonces se puede concluir que $B$ es de tipo NP-Hard.

> ![image](https://chartreuse-goal-d5c.notion.site/image/https%3A%2F%2Fs3-us-west-2.amazonaws.com%2Fsecure.notion-static.com%2F6cd852e0-3c4e-440f-9522-b4590d2a6a06%2FUntitled.png?table=block&id=a8728d4e-fadb-41f9-86aa-baf731a7a72a&spaceId=4f8bebe4-a843-44d2-b6ee-51e2006a90d1&width=1530&userId=&cache=v2)

# **2. Problemas NP-Hard**

Ahora que ya entendimos los conceptos para entender de mejor manera el análisis de estos problemas, veremos 2 problemas.

# **2.1 Problema del vendedor ambulante (TSP)**

> ![image](https://upload.wikimedia.org/wikipedia/commons/thumb/1/11/GLPK_solution_of_a_travelling_salesman_problem.svg/330px-GLPK_solution_of_a_travelling_salesman_problem.svg.png)

↪ El problema del viajante de comercio (TSP) es un problema algorítmico encargado de encontrar la ruta más corta entre un conjunto de puntos y ubicaciones que deben visitarse. En el enunciado del problema, los puntos son las ciudades que un vendedor podría visitar. El objetivo del vendedor es mantener tanto los costos de viaje como la distancia recorrida lo más bajo posible.

> **↪ ENTRADA:** Un grafo ponderado no dirigido $G = (V,E)$ y un costo $C$ $ϵ$ $ℜ$ para cada arco $e$ $ϵ$ $E$.
>
> **↪ SALIDA:** Un camino $T ⊆ E$ de $G$ con la mínima suma posible de los costos de los arcos $C$.

↪ Centrado en la optimización, TSP se usa a menudo en informática para encontrar la ruta más eficiente para que los datos viajen entre varios nodos. Las aplicaciones incluyen la identificación de métodos de optimización de redes o hardware. Fue descrito por primera vez por el matemático irlandés W.R. Hamilton y el matemático británico Thomas Kirkman en el siglo XIX a través de la creación de un juego que se podía resolver encontrando un ciclo de Hamilton, que es un camino que no se superpone entre todos los nodos.

↪ En lugar de centrarse en encontrar la ruta más eficaz, TSP a menudo se preocupa por encontrar la solución más económica. En los TSP, la gran cantidad de variables crea un reto a la hora de encontrar la ruta más corta, lo que hace más atractivas las soluciones aproximadas, rápidas y económicas.

> $$minimizar ∑_{i=1}^{n} ∑_{j=1}^{n}d_{ij}x_{ij}$$

## **2.1.1 Demostración a través de Reducción**

↪ Para demostrar que EL TSP ES NP-hard usaremos el **Problema del Ciclo hamiloniano** en un grafo que es visitado cada vertice exccamante una vez. Los problemas del hamilton ciclo son del orden de NP-complete donde se debe decidir si el el grafo de entrada tiene un ciclo hamiltoniano.

> ![image](https://i.imgur.com/yGvi7io.png)

> **↪ ENTRADA:** Un grafo no dirigido $G = (V,E)$, un nodo inicial $o ϵ V$ y un nodo final $f ϵ V$.
>
> **↪ SALIDA:** Un camino desde $o$ hasta $f$, donde visita todos los nodos una vez, a menos que aquel camino no existe.

↪ Ejemplo de ciclo hamiltoniano:

> ![image](https://upload.wikimedia.org/wikipedia/commons/thumb/a/ae/Grafo_-_ciclo_hamiltoniano.svg/1024px-Grafo_-_ciclo_hamiltoniano.svg.png)

↪ Se reduce desde el HCP hacia el TSP en grafos. Dada una instancia de HC, es decicr un grafo $G = (V,E)$ con $n=|V|$ vertices, la reducción produce la siguiente instancia de TSP:

↪ Un grafo completo $G'$ en el mismo conjunto de vertices $V$, donde cada arista es etiquetada con peso 1 si esta en $E$, y con peso $n+1$ de lo contario, el peso objetivo $t = n$. Ahora se tiene que probar dos propiedades sobre esto:

1. Se necesita mostar que nuestra reducción está en tiempo polinomial. Se necesita $O(n)$ para contar el numero de $n$ vertices y $O(n^2)$ para crear el grafo completo $G'$, por lo que nuestra reducción es polinomial. 

2. Se debe demostrar que la reducción es correcta, es decir, el resultdo de TSP en la instancia $(G'n)$ siempre tiene la misma respuesta que la instancias orginal $G$ de HCP.

> **↪ PRE-PROCESO:** Debemos traducir la entrada del problema para que pueda funcionar en nuestro problema TSP, por lo que, debemos agregar un nodo adicional para poder realizar el proceso de recorrer todos los nodos y se asigna a los arcos un costo de cero, y los faltantes se rellenan con unos.
>
> **↪ POST-PROCESO:** Ahora podremos tener nuestra salida esperada, por lo que se debe eliminar el nodo adicional y todos los arcos que los unían.

↪ En una dirección, suponemos que existe una solución para una instancia HCP, es decir, que $G$ tiene un HC " X ", se puede pensar x como un ciclo en $G'$ tambien. Porque x es Hamilitoniano, este visita todos los vertices $n$ exactamente una vez. De este modo X tiene un largo  $n$ y por eso tiene un peso $n$ en $G'$, ya que solo usa aristas en $E$. El ciclo  X visita cada vertices al menos una vez y tiene un peso menor o igual a $n$, por lo que tambien es una solución a la instancia de TSP.

↪ En la otra dirección, supongamos que existe una solución en instancias de grafos para TSP, es decir, un ciclo X en $G'$ visita cada vertice al menos una vez y tiene un peso menor o igual a $n$. Porque X  visita cada vertice al menos una vez, tiene un largo mayor o igual a $n^2$, por otra parte X tiene un peso menor o igual a $n$ y una longitud menor o igual a $n$, porque los pesos son enteros positivos. Entonces el ciclo  X  debe tener un largo exactamen de $n$, lo que significa que visita cada vertice exactamente una vez. Finalmente, X debe ser un ciclo en $G$ porque, si este incluyera alguna arista que no este en $E$, entonces solo esa arista sola deberia tener un peso al menos $n+1$, porque los pesos no son negativos, obteniendo así una contradicción. Por lo tanto X es un ciclo hamilitoniano en $G$, por lo que tambien es una solución para la instancia de HSP.

### Por lo tanto, HCP es NP-hard, entonces TSP tambien lo es.

## **2.1.2 Otros algoritmos que pueden resolver este problema**

↪ El algoritmo de **Dijkstra** es un algoritmo muy famoso que resuelve el problema, sin embargo, solo considera costos positivos $l_e ≥ 0$, ya que:

> **↪ ENTRADA:** Un grafo dirigido $G = (V,E)$, un vértice fuente $s ϵ V$, y un valor real $l_e ≥ 0$ asociado a cada arco $e ϵ E$.
>
> **↪ SALIDA:** La distancia más corta $dist(s,v)$ para cada vértice $v ϵ V$.

↪ Donde consiste en ir explorando todos los caminos más cortos que parten del vértice origen y que llevan a todos los demás vértices; cuando se obtiene el camino más corto desde el vértice origen hasta el resto de los vértices que componen el grafo, el algoritmo se detiene.

↪ Se trata de una especialización de la búsqueda de costo uniforme y, como tal, no funciona en grafos con aristas de coste negativo (al elegir siempre el nodo con distancia menor, pueden quedar excluidos de la búsqueda nodos que en próximas iteraciones bajarían el costo general del camino al pasar por una arista con costo negativo).

Tiempo de ejecucion: 

- $E$ = Numero de aristias en el grafo. 
- $V$ = numero de vertices en el grafo.

priority queue = $O(|V|^2)$

binary heap = $O((|E|+|V|)*X*log|V|)$

Fibonacci heap = $O(|V|+|E|$*$log|V|)$

# **2.2 Problema de la mochila (Knapsack)**

El problema de la mochila es un problema COP (Combinational Optimization Problem) problemas de optimización combinatoria que tienen el siguiente tema general: se visualiza un escenario en el que se está limitado la cantidad de artículos que se pueden colocar dentro de una mochila de tamaño fijo. Dado un conjunto de artículos con pesos y valores específicos, el objetivo es obtener el mayor valor posible en la mochila dada la restricción de peso de la mochila. El problema de la mochila es NP-difícil y aparece con mucha frecuencia en situaciones prácticas de la vida real. Una solución de programación dinámica para el problema de la mochila se ejecuta en tiempo polinomial.

> ![image](https://i.imgur.com/fbq3iNR.png)

> **↪ ENTRADA:** Tenemos un conjunto de $n$ objetos, donde cada uno contiene un valor $V = [v_1, v_2,...,v_n] ≥ 0$ y peso específico $W = [w_1,w_2,...,w_n] ≥ 0$. Además de un peso máximo de la mochila.
>
> **↪ SALIDA:** La cantidad máxima que se puede almacenar de forma que sea la solución óptima.

El problema de la mochila en base en que se tiene una capacidad $c$  y un conjunto $n$  de objetos los cuales estan numerados del  $1$  al  $n$, cada objeto a insertar se describe como $j$ y su peso como $w$; $x$  es una variable binaria la cual cambia a $1$ si el objeto $j$ se debe incluir en la mochila y $0$ si no se debe incluir, tal que:

\begin{array}{rl}{\text{maximizar}}&\sum _{j=1}^{n}p_{j}x_{j}\\{\text{tal que}}&\sum _{j=1}^{n}w_{j}x_{j}\leq C\\{\text{y}}&x_{j}\in \{0,1\}.\end{array}

## **2.2.1 Demostración a través de Reducción**

Dado $n$ elementos $S =$ {$a_1, a_2,...,a_n$} donde cada elementos tiene un peso $w_i ≥ 0$ y un valor $v_i ≥ 0$. También un peso $W$ y un valor $K$. Existe un subconjunto $X$ de números tal que:

- $\sum_{a_iϵX}w_i ≤ W$
- $\sum_{a_iϵX}v_i≥ K$

SubsetSum $≤_p$ Knapsack. $K = W = T$ y $w_i = v_i = a_i$ para todo $i$.

Informalmente, el problema consiste en elegir los elementos que se incluirán en la mochila de forma que la suma de los valores supere el mínimo dado K (el objetivo es maximizar esta suma), y la suma de los pesos sea menor o igual que la capacidad W de la mochila.

Entonces, reducimos a partir del subset-sum. Nuestra redución produce la siguiente instancia de la mochila: el coste $w_i$ del elemento $i$ se ajusta en $a_i$ y el valor $v_i$ del elemento $i$ también se ajusta en $a_i$. Es evidente que esta reducción de ejecuta en tiempo polinómico.

> **↪ ENTRADA:** Conjunto de números enteros positivos y un número $x ϵ ℤ$ objetivo
>
> **↪ SALIDA:** Una respuesta de tipo booleana, donde dependerá de si existe o no una secuencia donde los números sumados den el total del número $x$ ingresado.

Si empezamos con una instancia Sí del subset-sum, entonces afirmamos que la reducción produce una instancia Sí de knapsack. Supongamos que existe un subconjunto T ⊆ S para el que $∑_{aϵT}a = B$. Entonces meter un elemento T tiene un valor de costo B, por lo que la instacnia de la mochila producida por la reducción es una instancia Sí. Si la reducción produce una instancia Sí de la mochila, entonces afirmamos que (S, B) es una instancia Sí del subset-sum. Sea T ⊆ S los elementos empaquetados en la mochila, cuyo valor total sea al menos $V$ y cuyo coste total es como máximo $W$. En otras palabras $∑_{aϵT}a ≥ V$ y $∑_{aϵT}a ≤ W$,que implica que $∑_{aϵT}a = B$. Concluyendo así que (S,B) sí es un caso de subset-sum como se requiere.

> **↪ PRE-PROCESO:** Debemos adaptar la entrada a los datos del problema de la mochila, es decir un arreglo para el peso y otros para el valor y el valor máximo de la mochila correspondería al valor objetivo de nuestro problema de subset-sum.
>
> **↪ POST-PROCESO:** Como ya adaptamos la entrada podremos obtener nuestra solución que corresponde a una suma que corresponde al corte total.


### Como sabemos que el problema de subset-sum es de tipo NP-Hard y comprobamos que se puede reducir al problema de la mochila, este último también es de tipo NP-Hard.

## **2.2.2 Otros algoritmos que pueden resolver este problema**

### **Algoritmo Greedy como solución**

Un algoritmo capaz de acercarse a resolver el problema de la mochila seria un algoritmo Greedy.

El objetivo de los algoritmos Greedy es poder dar una solución rápida con la información entregada en el mismo instante que se le ingresa. Estos algoritmos se utilizan para resolver problemas de optimización, son faciles de implementar pero no siempre pueden dar una solución correcta al problema, en este caso del problema de la mochila un algoritmo Greedy nos daria una solución factible pero no óptima al problema.

**Entrada**: arrays w[1..n], y v[1..n] contienen los pesos y valores de los objetos a meter en la mochila.

**Salida**: array x[1..n] con la posición de cada elemento dentro de la mochila.

Como se explico anteriormennte si $\sum _{j=1}^{n}p_{j}<c$ entonces $x_{j}=1$ lo que quiere decir que el objeto es óptimo para entrar en la mochila.

### Tiempo de ejecución

Si es que ordenaramos los elementos de menor a mayor peso con un algoritmo de ordenamiento como lo puede ser el BubbleSort y luego aplicaramos la solución Greddy tendria un tiempo constante lo cual nos daria **$O(n log n)$**.

### **Fuerza bruta como solución**

La solucion de fuerza bruta lo que hace es evaluar la capacidad total y el peso de todos los subconjuntos posibles, luego de esto se selecciona el subconjunto con el peso más alto que no supere la capacidad del la mochila. Esta solución es óptima pero el tiempo de ejecución es de **$O(2^n)$** lo que hace que tenga tiempo exponencial.

