<a href="https://colab.research.google.com/github/acarulla-viu/Algoritmos_de_optimizacion/blob/main/Proyecto_Algoritmos.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Algoritmos de optimización - Proyecto<br>
Nombre y apellidos: Alexandre Carulla Rodes  <br>
URL: https://github.com/acarulla-viu/Algoritmos_de_optimizacion<br>
Problema:
> 3. Combinar cifras y operaciones <br>

Descripción del problema:

El problema consiste en analizar el siguiente problema y diseñar un algoritmo que lo resuelva.

Disponemos de las nueve cifras del $1$ al $9$ (excluimos el cero) y de los cuatro signos básicos de las operaciones fundamentales: suma ($+$), resta ($-$), multiplicación ($⋅$) y división ($/$).

Debemos combinarlos alternativamente sin repetir ninguno de ellos para obtener una cantidad dada. Un ejemplo sería para obtener el $4$:

$4+2-6 \,/ \,3\cdot1 = 4$

(*) La respuesta es obligatoria





                                        

In [1]:
import math
import random

(*)¿Cuantas posibilidades hay sin tener en cuenta las restricciones?<br>



¿Cuantas posibilidades hay teniendo en cuenta todas las restricciones.




Respuesta

Para poder encontrar una expresión para la cantidad de posibilidades, podemos esquematizar las cifras y operaciones de la siguiente manera:

$\boxed{\color{red}{D_1}}$ $\boxed{\color{blue}{O_1}}$ $\boxed{\color{red}{D_2}}$ $\boxed{\color{blue}{O_2}}$ $\boxed{\color{red}{D_3}}$ $\boxed{\color{blue}{O_3}}$ $\boxed{\color{red}{D_4}}$ $\boxed{\color{blue}{O_4}}$ $\boxed{\color{red}{D_5}}$ $=$ $\boxed{R}$

Donde:
- $D_i$ ($\forall i = 1, 2, 3, 4, 5$) representa un dígito del $1$ al $9$ (es decir, $D_i\in\{1,2,3,...,9\}$).
- $O_j$ ($\forall j = 1, 2, 3, 4$) es el operador (es decir, $O_j\in\{+, -, \cdot, /\}$).
- $R$ el resultado (entero) que se quiere que dé la expresión.

Nótese que, en cada cálculo habrá cinco dígitos y cuatro operadores.

Si consideramos que no hay restricciones, eso implica que tanto $D_i$ como $O_j$ pueden valer lo que sea en cualquier posición de toda la expresión, o sea, se pueden repetir dígitos y operadores. En este caso, el número de posibilidades es:
$$ \text{Número de posibilidades sin restricciones: }9^5 \cdot  4^4$$
Este cálculo es trivial, ya que para cada una de las $5$ posiciones de dígito existen $9$ opciones independientes y, del mismo modo, para cada una de las $4$ posiciones de operador hay $4$ opciones. Se está usando la fórmula de variaciones con repetición.

Con restricciones (limitando a que no se repitan dígitos ni operadores) el resultado de las posibilidades queda de la siguiente manera:
$$ \text{Número de posibilidades con restricciones: }\frac{9!}{(9-5)!}\cdot\frac{4!}{(4-4)!}$$

En este caso, se tiene en cuenta que, para los dígitos, el primer puesto $D_1$ tiene $9$ opciones, el segundo $D_2$ tiene $8$ opciones, el tercero $D_3$ tiene $7$ opciones, el cuarto $D_4$ tiene $6$ opciones y el quinto $D_5$ tiene $5$ opciones; y para los operadores pasa lo mismo que con los dígitos, en el primer puesto $O_1$ tiene $4$ opciones, el segundo $O_2$ tiene $3$ opciones, el tercero $O_3$ tiene $2$ opciones, y el primero $O_4$ tiene $1$ opción. Se está usando la fórmula de variaciones sin repetición.

In [2]:
print("El número de posibilidades sin restricciones es:", 9**5 * 4**4)
print("El número de posibilidades con restricciones es:", math.perm(9, 5) * math.perm(4, 4))

El número de posibilidades sin restricciones es: 15116544
El número de posibilidades con restricciones es: 362880


¿Qué valor máximo y mínimo se pueden obtener según las condiciones del problema?

Respuesta

Teniendo en cuenta que no se pueden repetir dígitos y operadores, es posible encontrar una cota inferior y superior de posibles resultados de todas las combinaciones:
- La cota inferior se tiene con la siguiente combinación: $1 + 2 \,/ \,7 − 8 \cdot 9 \approx -70.7$.
- La cota superior se tiene con la siguiente combinación: $7 − 1\,/ \,6 + 8\cdot 9 \approx 78.8$.

Como se restringe que los resultados $R$ de las expresiones sean enteros, esto nos indica que el rango en el que puede haber combinaciones es desde el $-70$ hasta el $78$.

Modelo para el espacio de soluciones<br>
(*) ¿Cual es la estructura de datos que mejor se adapta al problema? Arguméntalo. (Es posible que hayas elegido una al principio y veas la necesidad de cambiar, arguméntalo)


Respuesta

Lo ideal es conformar un conjunto de los datos del problema: los dígitos y los operadores. En este caso, pensándolo en programación en Python, se podría crear una lista exclusivamente para los dígitos y los operadores, pudiéndolas modificar para cambiar las entradas del problema. El conjunto de expresiones que conformen la solución también se pueden almacenar en una lista.

Sin embargo, también sería posible usar el tipo de dato de conjuntos (`sets`), ya que, en esencia, los dígitos, operadores y soluciones son conjuntos matemáticos (no tendría sentido tenerlos repetidos y el orden no debería importar). Esta estructuración de los datos sería más coherente con una resolución de árbol de búsqueda con la técnica de backtracking, que es una de las soluciones que se han abordado.

Tanto en el algoritmo de fuerza bruta como en el mejorado (backtracking) se han empleado listas, aunque en el de backtraking lo ideal hubiese sido usar `sets` y explotar la sencillez de sus operaciones.

Según el modelo para el espacio de soluciones<br>
(*)¿Cual es la función objetivo?

(*)¿Es un problema de maximización o minimización?

Respuesta

La función objetivo $F$ con un resultado deseado $R$ es:
$$ F(e) = |\text{eval}(e) - R| $$

Donde:
- $e$ es la expresión generada con una determinada combinación de dígitos y operadores.
- $\text{eval}$ denota la evaluación matemática de una expresión.

En este caso, se pretende encontrar la combinación de dígitos y operadores determinados para que la función objetivo sea $F(e)=0$ (es decir, $\text{eval}(e) = R$), de hecho, se busca que la función objetivo dé exactamente cero y no se consideran como válidos resultados que puedan quedarse muy cerca del cero, puesto que se pretende encontrar una combinación que dé exactamente el resultado deseado.

Viéndolo desde la función objetivo definida $F(e)$, este es un problema de minimización, ya que, como es una función con el valor absoluto (sin otros términos fuera del valor absoluto que añadan algún desplazamiento), el valor mínimo se encuentra en el cero (que es el mínimo de un función de valor absoluto). Por este motivo, es importante mencionar que no es un problema de minimización como tal, ya que se busca encontrar soluciones con un resultado matemático en concreto.

En realidad, la función objetivo se podría haber definido de forma distinta, como, por ejemplo, la resta cuadrática, ya que cuando da cero, es un mínimo y también se satisface que $\text{eval}(e) = R$. Otra opción podría haber sido no usar el valor absoluto en la función objetivo definida, sin embargo, en ese caso se estaría admitiendo resultados positivos y negativos, y no se tendría un mínimo en cero.

Diseña un algoritmo para resolver el problema por fuerza bruta

Respuesta

In [3]:
def brute_force_solver(R, digits, operators):
  """
  Resolución mediante fuerza bruta

  Entradas:
  - R: Resultado deseado de la expresión.
  - digits: Conjunto de dígitos numéricos para la expresión.
  - operators: Conjunto de operadores para la expresión.

  Salidas:
  - solutions: Conjunto de expresiones que son solución.
  """
  solutions = []
  # Análisis de los dígitos
  for d1 in digits: # Recorrido del primer dígito
    for d2 in digits: # Recorrido del segundo dígito
      if d2 == d1: # Restricción para no repetir dígitos
        continue
      for d3 in digits: # Recorrido del tercer dígito
        if d3 in [d1, d2]: # Restricción para no repetir dígitos
          continue
        for d4 in digits: # Recorrido del cuarto dígito
          if d4 in [d1, d2, d3]: # Restricción para no repetir dígitos
            continue
          for d5 in digits: # Recorrido del quinto dígito
            if d5 in [d1, d2, d3, d4]: # Restricción para no repetir dígitos
              continue
            # Análisis de los operadores
            for o1 in operators: # Recorrido del primer operador
              for o2 in operators: # Recorrido del segundo operador
                if o2 == o1: # Restricción para no repetir operadores
                  continue
                for o3 in operators: # Recorrido del tercer operador
                  if o3 in [o1, o2]: # Restricción para no repetir operadores
                    continue
                  for o4 in operators: # Recorrido del cuarto operador
                    if o4 in [o1, o2, o3]: # Restricción para no repetir operadores
                      continue
                    expression = eval(f"{d1}{o1}{d2}{o2}{d3}{o3}{d4}{o4}{d5}")

                    # Se comprueba si la expresión construida coincide con el resultado deseado
                    if expression == R: # No hay problemas de precisión (comprobado empíricamente)
                      expr = f"{d1}{o1}{d2}{o2}{d3}{o3}{d4}{o4}{d5}"
                      solutions.append(expr)

  return solutions

In [4]:
R = 4 # Resultado deseado de las expresiones
digits = [1, 2, 3, 4, 5, 6, 7, 8, 9]
operators = ["+", "-", "*", "/"]
solutions = brute_force_solver(R, digits, operators)

"""
print(f"Expresiones que dan como resultado exactamente {R}:")
for i, solution in enumerate(solutions):
  print(f"{solution} = {R}")
"""

print(f"Total de soluciones encontradas: {len(solutions)}")

Total de soluciones encontradas: 2112


De forma simplficada, la función `brute_force_solver` mediante fuerza bruta recorre todas las posibilidades que existen de dígitos y operadores para un resultado deseado dado. Por este motivo, se recorre cada posible posición en la que puede haber un dígito u operador mediante bucles anidados. Además, como no se pueden repetir los dígitos y operadores, se ha impuesto mediante condicionales la exclusión de esas soluciones mediante la sentencia `continue` para que se salga del bucle y se empiece a recorrer otra posibilidad.

Calcula la complejidad del algoritmo por fuerza bruta

Respuesta

Observando la función desarrollada `brute_force_solver` se puede notar que hay varios bucles anidados. Esta estructura facilita notablemente la obtención de la complejidad computacional $\mathcal{O}$.

Vamos a denotar a $D$ como dígitos disponibles, $O$ como los operadores disponibles y $k$ el número de posiciones para los dígitos (en otras palabras, casillas posibles para los dígitos). Es trivial notar que el número de posiciones para los operadores siempre será uno menos que el de los dígitos, o sea, $k-1$. Entonces, se tiene que $\mathcal{O}(D^k O^{k-1})$.

En el caso resuelto, se consideran cinco posibidades de dígitos, por lo que forzosamente el número de operadores tiene que ser cuatro. Por lo tanto, $k=5$, y la complejidad computacional es $\mathcal{O}(D^5 O^4)$ (tipo polinómico). Se está asumiendo que el número de posiciones tanto de los dígitos ($k$) como de los operadores ($k-1$) siempre es el mismo, y que los dígitos $D$ y operadores $O$ son los datos de entrada del algoritmo.

Esta complejidad computacional es coherente con la cantidad de bucles anidados que se tiene en `brute_force_solver`: cinco respectivos a los dígitos y cuatro respectivos a los operadores.

(*)Diseña un algoritmo que mejore la complejidad del algortimo por fuerza bruta. Argumenta por qué crees que mejora el algoritmo por fuerza bruta

Respuesta

In [5]:
def backtracking_solver(R, digits, operators):
  """
  Resolución mediante backtracking

  Entradas:
  - R: Resultado deseado de la expresión.
  - digits: Conjunto de dígitos numéricos para la expresión.
  - operators: Conjunto de operadores para la expresión.

  Salidas:
  - solutions: Conjunto de expresiones que son solución.
  """
  solutions = []

  def backtrack(expr, level, used_digits, used_ops):
    if level == 9:  # Ya no hay nada más, se acaba la recursión
      result = eval(expr)
      if result == R: # No hay problemas de precisión (comprobado empíricamente)
        solutions.append(expr)
      return
    if level in [0, 2, 4, 6, 8]:  # Posición de dígito, niveles pares
      for d in digits:
        if d not in used_digits:
          backtrack(expr + str(d), level + 1, used_digits + [d], used_ops)
    else:  # Posición de operador, niveles impares
      for o in operators:
        if o not in used_ops:
          # Aplicamos la poda si el último operador es + o - y el resultado parcial de la expresión (sin terminar aún) es un entero
          if level == 7 and o in ("+", "-") and not eval(expr).is_integer():
            continue
          backtrack(expr + o, level + 1, used_digits, used_ops + [o])

  backtrack("", 0, [], [])  # Invocación inicial de la recursión
  return solutions

In [6]:
R = 4 # Resultado deseado de las expresiones
digits = [1, 2, 3, 4, 5, 6, 7, 8, 9]
operators = ["+", "-", "*", "/"]
solutions = backtracking_solver(R, digits, operators)

"""
print(f"Expresiones que dan como resultado exactamente {R}:")
for i, solution in enumerate(solutions):
  print(f"{solution} = {R}")
"""

print(f"Total de soluciones encontradas: {len(solutions)}")

Total de soluciones encontradas: 2112


Para mejorar el algoritmo de fuerza bruta se ha empleado la técnica de backtracking, que permite explorar el espacio de soluciones de manera sistemática (en cada nivel de la recursión añade un dígito o un operador) y retroceder cuando una solución parcial no puede conducir a una solución válida. Se ha añadido una poda para eliminar la profundización en ramas que se tiene certeza que matemáticamente no se podrán satisfacer. En concreto, se va a analizar si es necesario añadir el último operador y dígito teniendo en cuenta si el resultado parcial de la expresión es entero y queda un operador suma o resta por añadir.

Por ejemplo, supongamos que, en un momento dado, se ha construido la siguiente expresión $3-2\,/\,5 \cdot 4$, cuyo resultado parcial es $1.4$, y queda añadir el operador suma $+$ y un dígito. Sin embargo, dado que el resultado de la expresión tiene que ser un valor entero, directamente será matemáticamente imposible que la suma de un número decimal con otro entero dé un número entero (y lo mismo pasaría con el operador resta). Por lo tanto, cuando el último operador es una suma `+` o resta `-` y la expresión construida parcialmente da como resultado un valor decimal, se decide no seguir profundizando ya que no tendría sentido. Es importante notar que esta estrategia con los operadores multiplicación `*` y división `/` no es posible hacerla.

Por lo tanto, esto se trata de una estrategia de poda, y se evita continuar explorando aquellas expresiones, haciendo que el espacio del árbol a recorrer sea menor, siendo lógicamente mejor que el algoritmo de fuerza bruta. En el caso de no añadir ninguna poda, se recorrería todo el árbol y eso sería equivalente a recorrer todas las posibilidades tal como se hacía con la fuerza bruta.

Respecto al algoritmo, se ha definido la posición de cada dígito como `[0, 2, 4, 6, 8]` y la posición de cada operador como `[1, 3, 5, 7, 9]`, y en la función `backtrack` dicha posición es la variable `level`. Por este motivo, cuando `level == 7`, se analiza la viabilidad matemática tal como se ha comentado recientemente. También, es interesante notar que, cuando `level == 9`, ya no hay que añadir más dígitos u operadores y se calcula el resultado final de la expresión construida.

Es posible comparar el tiempo de ejecución de `brute_force_solver` y `backtracking_solver`. Esto puede dar una idea de la mejora entre una algoritmo y el otro:

In [7]:
R = 4 # Resultado deseado de las expresiones
digits = [1, 2, 3, 4, 5, 6, 7, 8, 9]
operators = ["+", "-", "*", "/"]
print("Resolución con fuerza bruta:")
%time solutions = brute_force_solver(R, digits, operators)
print("Resolución con backtracking:")
%time solutions = backtracking_solver(R, digits, operators)

Resolución con fuerza bruta:
CPU times: user 3.69 s, sys: 9.9 ms, total: 3.7 s
Wall time: 3.77 s
Resolución con backtracking:
CPU times: user 2.47 s, sys: 3.99 ms, total: 2.48 s
Wall time: 2.49 s


(*)Calcula la complejidad del algoritmo

Respuesta

Como ya se ha comentado, la complejidad con fuerza bruta (es decir, recorriendo todo el espacio) es $\mathcal{O}(D^5 O^4)$. En el caso del algoritmo de backtracking no es tan evidente calcular la complejidad computacional, sin embargo, es posible realizar una estimación de la misma.

Mediante la técnica de poda implementada, en la gran parte de los casos se va a ejecutar dicha poda para el último operador y dígito, ya que la probabilidad de que los primeros dígitos y operandos (que contienen multiplicaciones y divisiones) den un resultado no entero es muy alta. Por lo tanto, si asumimos que la poda se va a realizar en gran parte de los casos, podemos despreciar esas últimas iteraciones, tanto la del último operador como la del último dígito, bajando la complejidad. Así pues, en el mejor de los casos se va a tener que la complejidad computacional con la poda es cercana a $\mathcal{O}(D^4 O^3)$.

Según el problema (y tenga sentido), diseña un juego de datos de entrada aleatorios

Respuesta

In [8]:
R = 4 # Resultado deseado
operators = ["+", "-", "*", "/"]

list_digits = []
for num_digits in range(5, 10):  # De 5 a 9 dígitos
  digits_random = random.sample(range(1, 10), num_digits) # Generación de la lista de dígitos únicos (del 1 al 9)
  list_digits.append(digits_random)

for i, list_d in enumerate(list_digits, start = 5):
  print(f"Lista aleatoria con {i} dígitos: {list_d}")

Lista aleatoria con 5 dígitos: [3, 8, 4, 1, 9]
Lista aleatoria con 6 dígitos: [1, 4, 2, 5, 6, 8]
Lista aleatoria con 7 dígitos: [2, 8, 6, 9, 4, 7, 1]
Lista aleatoria con 8 dígitos: [5, 4, 6, 8, 2, 9, 1, 7]
Lista aleatoria con 9 dígitos: [2, 8, 5, 1, 4, 3, 9, 7, 6]


Para enriquecer más el ejercicio, se genera aleatoriamente cinco listas distintas (desde cinco dígitos hasta nueve dígitos) con números aleatorios en su interior.

Aplica el algoritmo al juego de datos generado

Respuesta

In [9]:
for i, list_d in enumerate(list_digits, start = 5):
  solutions = backtracking_solver(R, list_d, operators)
  print(f"Número de soluciones encontradas (lista aleatoria con {i} dígitos): {len(solutions)}")

Número de soluciones encontradas (lista aleatoria con 5 dígitos): 16
Número de soluciones encontradas (lista aleatoria con 6 dígitos): 144
Número de soluciones encontradas (lista aleatoria con 7 dígitos): 368
Número de soluciones encontradas (lista aleatoria con 8 dígitos): 656
Número de soluciones encontradas (lista aleatoria con 9 dígitos): 2112


Enumera las referencias que has utilizado(si ha sido necesario) para llevar a cabo el trabajo

Respuesta

No se han usado referencias como tal para resolver el problema, pero sí ha sido útil consultar el siguiente [enlace](https://brilliant.org/wiki/arithmetic-puzzles-operator-search/) para entender el problema y posibles heurísticas para aplicar.

Como es lógico, también se ha usado el manual de la asignatura para la consulta de ciertos conceptos.

Describe brevemente las lineas de como crees que es posible avanzar en el estudio del problema. Ten en cuenta incluso posibles variaciones del problema y/o variaciones al alza del tamaño

Respuesta

En el algoritmo de backtracking desarrollado (`backtracking_solver`) se ha empleado una determinada técnica de poda, pero se podría haber usado otras más complejas e inteligentes, reduciendo aún más el espacio a recorrer. Algunas de ellas podrían ser:
- Si hay una división `/` con valores que da un resultado no entero y antes del dígito del numerador o después del dígito del denominador no hay un operador de multiplicación `*` entonces forzosamente el resultado será decimal y automáticamente no sería válido.
- Si el resultado de la expresión parcial tiene un valor muy alto respecto al valor deseado, automáticamente cortar el proceso y buscar otras opciones.

Además, en el caso de generalizar el problema con un determinado número de casillas/posiciones de dígitos, con el algoritmo de backtracking la generalización es inmediata ya que eso implicaría un mayor valor de niveles (variable `levels`). Sin embargo, con el algoritmo por fuerza bruta esa generalización es inviable por la forma en la que está construido con bucles anidados.

¿Es posible encontrar todos los valores enteros posibles entre dicho mínimo y máximo?

Respuesta

In [10]:
digits = [1, 2, 3, 4, 5, 6, 7, 8, 9]
operators = ["+", "-", "*", "/"]

for R in range(-70, 79): # Se recorren todos los resultados dentro del rango teórico calculado
  solutions = backtracking_solver(R, digits, operators)
  print(f"Total de soluciones encontradas con R={R}: {len(solutions)}")

Total de soluciones encontradas con R=-70: 0
Total de soluciones encontradas con R=-69: 16
Total de soluciones encontradas con R=-68: 16
Total de soluciones encontradas con R=-67: 40
Total de soluciones encontradas con R=-66: 48
Total de soluciones encontradas con R=-65: 88
Total de soluciones encontradas con R=-64: 80
Total de soluciones encontradas con R=-63: 112
Total de soluciones encontradas con R=-62: 72
Total de soluciones encontradas con R=-61: 64
Total de soluciones encontradas con R=-60: 56
Total de soluciones encontradas con R=-59: 56
Total de soluciones encontradas con R=-58: 56
Total de soluciones encontradas con R=-57: 48
Total de soluciones encontradas con R=-56: 104
Total de soluciones encontradas con R=-55: 96
Total de soluciones encontradas con R=-54: 72
Total de soluciones encontradas con R=-53: 104
Total de soluciones encontradas con R=-52: 96
Total de soluciones encontradas con R=-51: 96
Total de soluciones encontradas con R=-50: 88
Total de soluciones encontradas 

Como era de esperar, solamente hay un número no nulo de soluciones en el rango calculado anteriormente de forma teórica. Por lo tanto, bajo las condiciones impuestas, sí se puede encontrar todos los valores posibles entre dicho mínimo y máximo.