## _Introducción_

Se tratan de un problema de optimización que, por regla general, no tiene un algoritmo eficiente. Se basa en una exploración del árbol de soluciones similar a **backtracking** solo que en profundidad y con una **poda** de estados por factibilidad. Esto se hace en un contexto donde:
- Hay más de un estado activo.
- Hay un criterio de selección diferente.
- Hay criterios de poda adicionales.

En el proceso de ramificación y poda se llevan a cabo las siguientes acciones:
- Selección:
  - En cada instante hay una serie de estados no visitados a los que denominamos **"estados activos"**, y se debe escoger uno para explorar. Seleccionaremos siempre el **más prometedor**, lo que nos asegura alcanzar la solución óptima al problema lo antes posible.
- Ramificación: Se basa en expandir el estado activo actual en nodos hijos con configuraciones heredadas del nodo padre, "completando" la solución.
- Poda:
  - Consideramos tanto la poda por factibilidad como la poda por **cota optimsta**. Una función estima el valor de la función objetivo sobre la mejor solución de un estado, produciendo **siempre un valor igual que este**. Si el valor de este estado es peor que el visto hasta el momento, se poda.
  
**_Ejemplo con mochila discreta_**

Es una variante más del ya conocido problema de la mochila.

Lo modelamos tal que:

$ W = 10, w=[12,5,6,2,6], v=[10,2,3,4,2]$

$\text{Soluciones:} \ (0,1,0,0,0), (0,0,1,1,0), (0,0,0,0,0)... $

De manera que podemos definir el espacio de soluciones tal que...

$ X = \{(x_1, x_2, ..., x_N) \in {0, 1^N} | \sum_{1 \leq i \leq N}{x_iw_i} \leq W \}$

La función objetivo sería...

$ f((x_1, x_2, ..., x_N)) = \sum_{1 \leq i \leq N}{x_iv_i} $

De la cual buscaríamos los argumentos que maximizaran su resultado

$ \argmax_{(x_1, x_2, ..., x_N)\in X} \sum_{ \leq i \leq N}{x_iv_i}$ 

#### Esto ya lo sabemos de ejercicios anteriores. Sin embargo, ahora presentamos el concepto de **estado**.

- Estado inicial $ \rightarrow (?) = X $
- Estado intermedio:
  - Estado que representa un conjunto de soluciones **factibles o no**. Puede ser:
    - **Prometedor**, estado que _podría_ contener la solución factible buscada.
    - **No factible**, estado que seguro que no contiene ninguna solución factible.
- Estado unitario o terminal:
  - Contiene una solución al problema (que puede ser cualquiera y no necesariamente la mejor).

A partir del estado inicial ramificaremos subconjuntos de soluciones y seguiremos la expansión por aquellos que sean **prometedores**.
En cada iteración...
- Seleccionamos un estado activo y lo extraemos de A.
- Ramificamos e insertamos en A los hijos.
- Eliminar de A los hijos no prometedores.

Donde A es un subset que contiene los estados que podrían derivar a la solución factible.

Así pues, con un problema tal que...

$ W = 10, w=[12,5,6,2,6], v=[10,2,3,4,2]$

<center>
<img src=./resources/mochilaarbol.png alt="image">
</center>

No hemos llegado a esa solución por mera coincidencia, hemos hecho un **cribado** seleccionando siempre los valores más prometedores a expandir. **Aunque hemos necesitado comprobar más de la cuenta ya que nada nos aseguraba la solución óptima** Tanto es así, que hemos tenido que vaciar por completo el conjunto de hijos prometedores A.

<center>
<img src=./resources/mochilaexpandido.png alt="image">
</center>

**Puntuación basada en una estimación**

Es una buena manera de explorar menos en el árbol el guiarnos por
- Valor de los objetos sobre los que hemos decidido su inclusión.
- Valor de los objetos sobre los que aún no hemos decidido nada.

De tal manera, es siempre conveniente:
- **Relajar las restricciones del problema.**
- **Resolver un problema relajado proporciona una estimación optimista de lo que obtendré con el problema original.**

##### Como por ejemplo en el siguiente ejemplo donde nos "guiamos" seleccionando el nodo cuyo valores restantes sumen un mayor valor

Huelga decir que todos aquellos estados que incumplan las reglas de una solución posible **no aparecen representados**, es decir, toda combinación de objetos que no quepa en la mochila no será representada en el árbol.

<center>
<img src=./resources/drawntree.png alt="image">
</center>

Esta vez no hemos tenido que explorar tantos estados. **Gracias a que los estados se puntúan con una estimación optimista hemos podido acceder rápidamente a la solución, ya que los estados que "prometían" no lo hacían tanto en comparación con la solución encontrada**

<center>
<img src=./resources/drawtreeclean.png alt="image">
</center>

## _Esquema de ramificación y poda_

Existe un esquema de referencia para llevar a cabo los ejercicios y los problemas de ramificación y poda. Este esquema usa una **estimación optimista con poda implícita**.

La poda implícita es un concepto relacionado con los algoritmos de branch and bound, y se refiere a la eliminación de ramas del espacio de búsqueda sin necesidad de explorarlas completamente. A diferencia de la poda explícita, que ocurre cuando se toma una decisión consciente de no explorar una rama en particular (basada en una regla o cota explícita), la poda implícita se da de forma "automática" o implícita a medida que el algoritmo sigue sus reglas de optimización.

**Diferencia con la poda explícita**

- _Poda explícita_: En algunos casos, el algoritmo puede tener una regla específica para descartar una rama. Por ejemplo, si se sabe que una rama nunca podrá proporcionar una solución válida o factible, se puede decidir explícitamente no explorarla.

- _Poda implícita_: En este caso, el algoritmo toma una decisión implícita de no explorar una rama, basándose en una comparación de cotas o evaluaciones que indican que la rama no llevará a una mejor solución. Esto no requiere una acción explícita de descartar la rama.


In [4]:
class BranchAndBoundScheme:
    def is_complete(self, s):
        """Determines if a state is complete."""
        # Implement logic to check if the state s represents a complete solution.
        pass

    def is_factible(self, s):
        """Determines if a state is feasible."""
        # Implement logic to check if the state s is a feasible solution.
        pass

    def worst_value(self):
        """Returns the worst possible value (used as an initial comparison for optimization)."""
        # Return the worst possible value for the objective function.
        pass

    def branch(self, s):
        """Generates the next possible states (branches) from a given state."""
        # Implement logic to generate branches (next possible states) from the current state s.
        pass

    def f(self, s):
        """Objective function for a state."""
        # Implement the objective function f(s) which evaluates the state s.
        pass

    def opt(self, a, b):
        """Optimization function to compare two values."""
        # Implement the optimization function that compares two values a and b, 
        # returning the better value according to the problem's objective.
        pass

    def optimistic_bound(self, s):
        """Calculates the optimistic bound of the objective value for state s."""
        # Implement logic to calculate the optimistic bound on the value of the objective function 
        # for the state s, considering potential future developments.
        pass

    def priority_queue(self, iterable=[]):
        """Creates a priority queue from the given iterable."""
        # Implement a priority queue structure to handle states based on their optimistic bounds.
        # You can use a heap-based priority queue or any appropriate implementation.
        pass

    def solve(self, initial_state):
        """Solves the optimization problem using branch and bound."""
        
        # Check if the initial state is complete and return it if true
        if self.is_complete(self.X):
            return self.X
        
        # Initialize the priority queue with the initial state and its optimistic bound
        A = self.priority_queue([self.optimistic_bound(self.X), self.X])
        x, fx = None, self.worst_value()  # Initialize the best solution (x) and its score (fx)
       
        # Loop until the priority queue is empty. The second condition ensures the implicit prune.
        while len(A) != 0 and self.opt(A.opt()[0], fx) != fx:
            # Extract the state with the best optimistic bound from the priority queue
            (score_s, s) = A.extract_opt()
            
            # Generate all branches from the current state
            for score in self.branch(s):
                if self.is_complete(score):
                    # If the state is complete, check if it's feasible and better than the current best solution
                    if self.is_factible(score) and self.opt(fx, self.f(score)) != fx:
                        x, fx = score, self.f(score)
                else:
                    # Calculate the optimistic bound for the branch
                    optimistic_score = self.optimistic_bound(score)
                    
                    # Only add the branch to the priority queue if it could potentially lead to a better solution
                    if self.opt(optimistic_score, fx) != fx:
                        A.insert((optimistic_score, score))
        
        # Return the best solution found
        return x


## _Construcción y consejos sobre cotas optimistas_

Es bueno considerar que un estado representa soluciones de las que ya conozco una parte... y nada sé de la otra parte. La función optimista puede estructurarse en 2 partes:

$ \text{optimistic} \left((s_1, s_2, s_3, ..., s_k, ?)\right)$

- Parte conocida:   $ \ \sum_{1 \leq i \leq k}{s_iv_i}$
- Parte desconocida:  $ \ \sum_{k \leq i \leq N}{v_i} $

$ \text{optimistic} \left((s_1, s_2, s_3, ..., s_k, ?)\right) = \sum_{1 \leq i \leq k}{s_iv_i} + \sum_{k \leq i \leq N}{v_i} $

La parte desconocida puede verse como una instancia nueva del mismo problema, pero de menor talla. Calculando el valor exacto de la parte conocida, le **añadimos una estimación optimista de la parte desconocida**, con lo que se obitene una estimación optimista GLOBAL. (Como se ha hecho anteriormente).

Es importante elegir la cota atendiendo a los siguientes criterios:
- Calidad de la aproximación.
- Costes espaciales y temporales del cálculo.


#### Construcción de cotas incrementales

El cálculo de una cota incremental se hace teniendo en cuenta el valor de la cota previa (padre). Tomando como ejemplo el problema de la mochila, la cota incremental para el valor de los nodos hijo del nodo k sería...

$ cota(x_1, x_2, ..., x_k, 1) = cota(x_1, x_2, ..., x_k)$

$ cota(x_1, x_2, ..., x_k, 0) = cota(x_1, x_2, ..., x_k) - v_{k+1}$


## _Variantes del esquema originial_

Hay 4 líneas de mejora por lo general:

### Poda temprana

El esquema no poda hasta encontrar una solución completa... Pero y si me invento una al principio? Este algoritmo pretende encontrar una solución para poder podar cuanto antes. Lo ideal es que esta solución esté cerca de la solución óptima, para hacer el proceso más efectivo.

Este esquema presenta las siguientes modificaciones con respecto al original:


In [6]:
class BranchAndBoundWithInitializationScheme(BranchAndBoundScheme):   
  """"
  DIFERENCIA CON LA CLASE ANTERIOR
  Se añade el método arbitrary_solution 
  """
  def arbitrary_solution(self):
    """Proporciona un elemento arbitrario de X, o sea, un elemento cualquiera de X."""
    
  def solve(self, initial_state):
      """Solves the optimization problem using branch and bound."""
      
      # Check if the initial state is complete and return it if true
      if self.is_complete(self.X):
          return self.X
      
      # Initialize the priority queue with the initial state and its optimistic bound
      A = self.priority_queue([self.optimistic_bound(self.X), self.X])

      """"
      DIFERENCIA CON LA CLASE ANTERIOR
      x, fx = None, self.worst_value() se sustituye por...
      """
      x, fx = self.arbitrary_solution, self.f()  # Initialize the best solution (x) and its score (fx)
      
      # Loop until the priority queue is empty. The second condition ensures the implicit prune.
      while len(A) != 0 and self.opt(A.opt()[0], fx) != fx:
          # Extract the state with the best optimistic bound from the priority queue
          (score_s, s) = A.extract_opt()
          
          # Generate all branches from the current state
          for score in self.branch(s):
              if self.is_complete(score):
                  # If the state is complete, check if it's feasible and better than the current best solution
                  if self.is_factible(score) and self.opt(fx, self.f(score)) != fx:
                      x, fx = score, self.f(score)
              else:
                  # Calculate the optimistic bound for the branch
                  optimistic_score = self.optimistic_bound(score)
                  
                  # Only add the branch to the priority queue if it could potentially lead to a better solution
                  if self.opt(optimistic_score, fx) != fx:
                      A.insert((optimistic_score, score))
      
      # Return the best solution found
      return x

### Cota pesimista

Una cota es pesimista cuando las soluciones voraces o escogidas al azar son pesimistas y mediante estas me guio por el árbol para encontrar la solución factible. Siempre seleccionaremos la cota pesimista que **mayor provecho nos represente**

Una cota es pesimista si...

$ \text{opt}(\text{pessimistic}(s), opt_{x \in s \cap X }f(x)) = opt_{x \in s \cap X }f(x) $ 

In [9]:
class BranchAndBoundWithInitializationScheme(BranchAndBoundScheme):   
  """"
  DIFERENCIA CON LA CLASE ANTERIOR
  Se añade el método pessimistic
  """
  def pessimistic(self):
    """Proporciona un elemento arbitrario de X, o sea, un elemento cualquiera de X."""
    
  def solve(self, initial_state):
      """Solves the optimization problem using branch and bound."""
      
      # Check if the initial state is complete and return it if true
      if self.is_complete(self.X):
          return self.X
      
      # Initialize the priority queue with the initial state and its optimistic bound
      A = self.priority_queue([self.optimistic_bound(self.X), self.X])

      x, fx = None, self.worst_value()
      """"
      DIFERENCIA CON LA CLASE ANTERIOR
      se instancia worst a la cota pesimista
      """ 
      worst = self.pessimistic(self.X)
      
      # Loop until the priority queue is empty. The second condition ensures the implicit prune.
      while len(A) != 0 and self.opt(A.opt()[0], fx) != fx:
          # Extract the state with the best optimistic bound from the priority queue
          (score_s, s) = A.extract_opt()
          
          # Generate all branches from the current state
          for score in self.branch(s):
              if self.is_complete(score):
                  # If the state is complete, check if it's feasible and better than the current best solution
                  if self.is_factible(score) and self.opt(fx, self.f(score)) != fx:
                      x, fx = score, self.f(score)
                      """"Diferencia"""
                      worst = self.optimistic_bound(worst, fx)
              else:
                  # Calculate the optimistic bound for the branch
                  optimistic_score = self.optimistic_bound(score)
                  
                  # Only add the branch to the priority queue if it could potentially lead to a better solution
                  """Diferencia"""
                  if self.optimistic_bound(optimistic_score, worst) == optimistic_score and self.opt(optimistic_score, fx) != fx:
                      A.insert((optimistic_score, score))
      
      # Return the best solution found
      return x

### Tolerancia

Elegimos acelerar el algoritmo aproximándonos a una solución que entra dentro de unos márgenes de tolerancia aceptables, pero que **no representa una solución óptima al problema necesariamente**.

Para ello necesitaremos una función de tolerancia $ \ \text{tolerance} (f(x))$
Con ella, podremos podar estados que no cumplan que...

$ \text{optimistic}(s) \leq f(x)$

Donde x es la **mejor solución vista**.

Ahora me lo cargaré si...

$ \text{optimistic}(s) \leq f(x) + \text{tolerance} (f(x)) $

Haciendo eso llegaremos eventualmente a una solución $ x_0 $ tal que

$ f(x_0) \leq f(\hat{x}) \leq f(x_0) + \text{tolerance} (f(x))$



In [11]:
class ApproximateBranchAndBoundScheme(BranchAndBoundScheme):
  """Diferencia. Se añade método tolerance"""
  def tolerance(self, fx):
    """Tolerancia con la que una solución se considera aceptable."""
    
  def solve(self, initial_state):
    """Solves the optimization problem using branch and bound."""
    
    # Check if the initial state is complete and return it if true
    if self.is_complete(self.X):
        return self.X
    
    # Initialize the priority queue with the initial state and its optimistic bound
    A = self.priority_queue([self.optimistic_bound(self.X), self.X])
    x, fx, approx_fx = None, self.worst_value(), self.worst_value() # Initialize the best solution (x) and its score (fx)
    
    # Loop until the priority queue is empty. The second condition ensures the implicit prune.
    """Diferencia. Se cambia fx por approx_fx"""
    while len(A) != 0 and self.opt(A.opt()[0], approx_fx) != approx_fx:
        # Extract the state with the best optimistic bound from the priority queue
        (score_s, s) = A.extract_opt()
        
        # Generate all branches from the current state
        for score in self.branch(s):
            if self.is_complete(score):
                # If the state is complete, check if it's feasible and better than the current best solution
                if self.is_factible(score) and self.opt(fx, self.f(score)) != fx:
                    x, fx = score, self.f(score)
                    approx_fx = fx + self.tolerance(fx)
            else:
                # Calculate the optimistic bound for the branch
                optimistic_score = self.optimistic_bound(score)
                
                # Only add the branch to the priority queue if it could potentially lead to a better solution
                if self.opt(optimistic_score, approx_fx) != approx_fx:
                    A.insert((optimistic_score, score))
    
    # Return the best solution found
    return x

### Hibridación con programación dinámica

No tiene sentido mantener 2 estados activos a la vez si son equivalentes, ya que cuando se completen lo harán con la misma "mejor" solución. Podemos aprovecharnos de la programación dinámica para cribar estos estados ya que una siempre ganará realmente sobre la otra opción. No veremos esta alternativa en detalle.