##### Máster Universitario en Inteligencia Artificial
##### Universidad Internacional de Valencia
##### 03MIAR: Algoritmos de Optimización
##### 📌 Daniel Felipe Hernández Mancipe

---

# 🛠 Proyecto: Trabajo Práctico

URL: [GitHub](https://github.com/danielhndz/03MIAR-Algoritmos-de-Optimizacion/blob/main/Project/Seminario_Algoritmos.ipynb)

### Problemas:

> 1. [ ] Sesiones de doblaje
> 2. [ ] Organizar los horarios de partidos de La Liga
> 3. [x] **Combinar cifras y operaciones**

### Descripción del problema:

* El problema consiste en **analizar** el siguiente problema y **diseñar** un algoritmo que lo **resuelva**.
* Disponemos de las 9 cifras ($c$) del 1 al 9 (excluimos el cero) y de los 4 signos ($s$) básicos de las operaciones fundamentales: suma ($+$), resta ($-$), multiplicación ($\cdot$), y división ($/$).
* Debemos **combinarlos alternativamente sin repetir ninguno de ellos** para obtener una cantidad dada. Un ejemplo sería para obtener el 4:
  $$4 + 2 - \frac{6}{3} \cdot 1 = 4$$

1. Debe analizarse el problema para encontrar todos los **valores enteros** posibles planteando las siguientes cuestiones:
    1. ¿Qué valor **máximo y mínimo** se pueden obtener según las condiciones del problema?

       De manera analítica, la forma de obtener el valor **máximo** consiste en aplicar los operadores que amplifican el resultado ($\cdot$ y $+$) a los dígitos de mayor valor ($9 \cdot 8 + 7$), y luego aplicar los operadores que disminuyen el resultado ($/$ y $-$) a los dígitos de menor valor ($x/1 - 2$). Por lo tanto, el valor **máximo** es:

       $$ 
       9 \cdot 8 + 7 / 1 - 2 = \frac{9 \cdot 8 + 7}{1} - 2 = 72 + 7 - 2 = \boxed{77}
       $$

       De manera similar es posible obtener el valor **mínimo**, primero se usa el operador $-$ para convertir el dígito de mayor valor ($9$) a negativo, y luego se aplica el operador que más amplifica el resultado ($\cdot$) al siguiente dígito de mayor valor ($8$), con lo cual se tiene el mayor valor negativo posible, luego se aplican los operadores restantes ($+$ y $/$) de manera que el resulta crezca lo menos posible y se mantenga entero, para asegurar que el resultado se mantiene entero se aplica el operador $/$ con el dígito $1$, y luego se aplica el operador $+$ al siguiente dígito de menor valor que aún no se ha usado ($2$). Por lo tanto, el valor **mínimo** es:

       $$ 
       -9 \cdot 8 / 1 + 2 = \frac{-9 \cdot 8}{1} + 2 = -72 + 2 = \boxed{-70}
       $$

    2. ¿Es posible encontrar **todos los valores enteros posibles** entre dicho mínimo y máximo?
  
       En base al resultado anterior, a medida que se va incrementando el dígito de menor valor usado en la última operacion ($+2$), se pueden obtener los valores desde $-70$ hasta $-65$, pero no es posible obtener los valores $-64,-63,$ y $-62$ con base en la expresión presentada. Sin embargo, en base a los resultados del algoritmo por fuerza bruta, **si** es posible encontrar **todos los valores enteros posibles** entre dicho mínimo y máximo.

(*) La respuesta es obligatoria

2. (*) ¿Cuantas posibilidades hay sin tener en cuenta las restricciones?

Sin las restricciones, se podrían combinar las cifras ($c$) y los signos ($s$) con repetición, es decir, en cada paso de la construcción de la expresión, se tienen las mismas posibilidades de elección tanto para cifras como para signos. Por lo tanto, el número de posibilidades sin tener en cuenta las restricciones es:
$$ 
c \cdot s \cdot c \cdot s \cdot c \cdot s \cdot c \cdot s \cdot c = 
$$
$$ 
c^5 \cdot s^4 = 9^5 \cdot 4^4 = \boxed{15,116,544}
$$

3. ¿Cuantas posibilidades hay teniendo en cuenta todas las restricciones?

Para saber cuantas posibilidades hay, se puede empezar por saber cuantas posibilidades hay en cada paso. Se sabe que cada expresion se construye combinando alternativamente 5 de las 9 cifras ($c$) y los 4 signos ($s$), por lo tanto, los pasos serían escoger alternativamente una cifra o un signo entre los que no se han elegido aún hasta completar la expresión. Al principio se tienen las 9 cifras y los 4 signos como posibilidades, pero con cada elección el número de posibilidades decrece. Por lo tanto, el número de posibilidades teniendo en cuenta todas las restricciones es:
$$ 
(c) \; (s) \; (c-1) \; (s-1) \; (c-2) \; (s-2) \; (c-3) \; (s-3) \; (c-4) = 
$$
$$ 
9 \cdot 4 \cdot 8 \cdot 3 \cdot 7 \cdot 2 \cdot 6 \cdot 1 \cdot 5 = 
$$
$$ 
9 \cdot 8 \cdot 7 \cdot 6 \cdot 5 \cdot 4 \cdot 3 \cdot 2 \cdot 1 =
$$
$$ 
9! = \boxed{362,880}
$$
Vale la pena notar que el algoritmo por fuerza bruta evalúa $\boxed{381,024}$ expresiones, debido a que adicionalmente considera las expresiones que en lugar de empezar con un dígito, empiezan con el signo de resta ($-$), es decir, con un dígito negativo, y por lo tanto no estarían formadas por 5 dígitos y 4 operaciones, sino por 4 dígitos y 4 operaciones, es decir, $18,144$ expresiones adicionales.

De este total de posibles expresiones calculado de manera analítica ($362,880$), aún se deben eliminar las que no resulten en valores enteros. Una aproximación a dicho valor podría ser considerar las posibles combinaciones con la división al final por 1, esta sería una cota inferior (no precisa) de la cantidad de expresiones que resultan en un valor entero:
$$ 
8 \cdot 3 \cdot 7 \cdot 2 \cdot 6 \cdot 1 \cdot 5 =
$$
$$ 
8 \cdot 7 \cdot 6 \cdot 5 \cdot 3 \cdot 2 \cdot 1 =
$$
$$ 
\frac{8 \cdot 7 \cdot 6 \cdot 5 \cdot 4 \cdot 3 \cdot 2 \cdot 1}{4} =
$$
$$ 
\frac{1}{4} 8! = \boxed{10,080}
$$
Sin embargo, el algoritmo por fuerza bruta obtiene $\boxed{94,824}$ valores enteros.

### Modelo para el espacio de soluciones

4. (*) ¿Cuál es la estructura de datos que mejor se adapta al problema? Arguméntalo. (Es posible que hayas elegido una al principio y veas la necesidad de cambiar, arguméntalo)

Las estructuras de datos que mejor se adaptan al problema son los `sets`, las `tuples`, un `dictionary`, y un `string`.
* Los `sets` se usan para:
    * Almacenar los dígitos
    * Almacenar los signos de operación
    * Almacenar las permutaciones de los dígitos que ya se han procesado en el caso de expresiones empezando con el operador $-$, esto es debido a que estas expresiones no tienen 5 dígitos sino 4, por lo tanto al iterar todas las permutaciones de dígitos (que tienen 5 dígitos), se repiten muchas veces los primeros 4. De esta manera al almacenar los primeros 4 dígitos de las permutaciones que ya se han procesado, se evita la repetición antes mencionada.
    * Almacenar los resultados de evaluar las expresiones construidas, para posteriormente hacer la diferencia con el conjunto de todos los valores enteros entre el mínimo y máximo obtenidos, y de esta manera saber si el algoritmo pudo generarlos.
    * Almacenar todos los valores enteros entre el mínimo y el máximo obtenidos por el algoritmo, para el propósito descrito en el inciso anterior.
* Se utilizan `sets` en lugar de `lists` por ser computacionalmente más eficientes.
* Las `tuples` las usa la librería `itertools` para almacenar cada una de las permutaciones, luego estas permutaciones se almacenan en un objeto de tipo `itertools.permutations`.
* El `dictionary` se usa para almacenar las expresiones generadas como `key` y el resultado de evaluar dicha expresión como `value` de dicha `key`. La razón es la facilidad que ofrece esta estructura para manterner un enlace entre la expresión y el resultado de evaluarla, sumado a su eficiencia computacional.
* El `string` se utiliza para construir cada una de las expresiones, evaluarlas con la función `eval`, y luego almacenarlas en el `dictionary` del inciso anterior. La razón es que básicamente es la estructura más inmediata y simple para representar una expresión, sumado a que es uno de los tipos (el otro es `code object`) esperados por la función `eval`.
* Aunque no se menciona por que no se usa directamente para resolver el problema, se utiliza una `list` (posteriormente ordenada) para mostrar los valores enteros entre el mínimo y el máximo obtenidos que el algoritmo no pudo obtener. El algoritmo nunca ejecuta esta línea ya que si obtiene todos los valores enteros entre el mínimo y el máximo. La razón es la necesidad (aunque no es necesariamente una necesidad, sino más bien una preferencia) de mostrar los valores ordenados.

### Según el modelo para el espacio de soluciones

5. (*) ¿Cuál es la función objetivo?

Este problema no es el típico probelma de optimización con una función a maximizar o minimizar, más bien se trata de un problema de búsqueda exhaustiva en permutaciones, donde el objetivo es generar todas las permutaciones de expresiones matemáticas válidas usando permutaciones de dígitos y de operaciones bajo ciertas restricciones.

Se puede representar cada expresión como una función,

$$ 
f(d_1, s_1, d_2, s_2, d_3, s_3, d_4, s_4, d_5) = d_1 \; s_1 \; d_2 \; s_2 \; d_3 \; s_3 \; d_4 \; s_4 \; d_5
$$

incluyendo el caso especial donde la expresión empieza con $-$,

$$ 
f(-, d_1, s_2, d_2, s_3, d_3, s_4, d_4) = - d_1 \; s_2 \; d_2 \; s_3 \; d_3 \; s_4 \; d_4 .
$$

Las restricciones son:
* $d_1, d_2, \dots, d_5 \in \{1, 2, \dots, 9\}$, con $d_1 \neq d_2 \dots \neq d_5$
* $s_1, s_2, s_3, s_4 \in \{+, -, \cdot, /\}$, con $s_1 \neq s_2 \dots \neq s_4$
* $f \in \mathbb{Z}$
* Respetar la **precedencia estándar** de los operadores.

Según lo mencionado desde la sesión `VC2` a la sesión `VC5` del curso, en el contexto de este problema:

> La función objetivo práctica es **evaluar todas las expresiones construidas bajo las restricciones** establecidas para la expresión, y conservar únicamente aquellas que cumplen las restricciones establecidas para el resultado

6. (*) ¿Es un problema de maximización o minimización?

Como se mencionó en el inciso anterior, este problema no es el típico problema de optimización, ya que no se plantea de forma explícita una función a maximizar/minimizar en un dominio continuo. Dicho esto, el problema puede reinterpretarse como una función simbólica, en donde la misma función y su resultado se filtran en base a las restricciones establecidas, sirviendo de esta manera como una aproximación a una métrica de evaluación de la expresión y su resultado, es decir de la función en sí misma. Es decir, no hay valores minímos o máximos de la función, solamente valores válidos o inválidos, según cumplan las restricciones o no, es por eso que no es un problema cuya naturaleza inmediata de evaluación se base en un valor mínimo o máximo de la función.

### Fuerza bruta

7. Diseña un algoritmo para resolver el problema por fuerza bruta.

In [1]:
import time
import itertools


LIMIT = 10
FIGURES = {_ for _ in range(1, 10)}
SIGNS = {"+", "-", "*", "/"}


def brute_force_alg(lim=LIMIT):
    counter = 0
    results = {}
    start = time.time()
    for signs_p in itertools.permutations(SIGNS, 4):
        # To avoid repeating the same 4 figs for the starting minus case
        starting_minus = set()
        for figs_p in itertools.permutations(FIGURES, 5):
            expression = ""
            for _ in range(4):
                expression += str(figs_p[_]) + signs_p[_]
            expression += str(figs_p[-1])
            counter = add_expression(expression, results, counter)
            if signs_p[0] == "-":
                expression = ""
                if figs_p[:-1] not in starting_minus:
                    starting_minus.add(figs_p[:-1])
                    for _ in range(4):
                        expression += signs_p[_] + str(figs_p[_])
                    counter = add_expression(expression, results, counter)
    finish = time.time()
    results_values_set = set(results.values())
    min_value = min(results_values_set)
    max_value = max(results_values_set)
    missing_values = set(range(min_value, max_value+1)) - results_values_set
    print(f"""
    Brute-force algorithm results:\n
    Run time = {finish - start:.3f} seconds
    Evaluated expressions = {counter}
    Evaluated expressions with integer result = {len(results)}
    Evaluated expressions with unique integer result = {len(results_values_set)}
    Minimum value = {[k for k, v in results.items() if v == min_value][0]} = {min_value}
    Maximum value = {[k for k, v in results.items() if v == max_value][0]} = {max_value}""")
    print(f"{' '*4}Did it get all the integers between the min and max values? {'Yes' if len(missing_values) == 0 else 'No'}")
    if len(missing_values) > 0:
        print(f"First {lim} missing values for the full range:\n{sorted(list(missing_values))[:lim]}")
    return results


def add_expression(expression, results, counter):
    if expression not in results.keys():
        result = eval(expression)
        counter += 1
        if result.is_integer():
            results[expression] = int(result)
    return counter


BRUTE_FORCE_RESULTS = brute_force_alg()


    Brute-force algorithm results:

    Run time = 1.562 seconds
    Evaluated expressions = 381024
    Evaluated expressions with integer result = 94824
    Evaluated expressions with unique integer result = 148
    Minimum value = -8/1*9+2 = -70
    Maximum value = 7/1+8*9-2 = 77
    Did it get all the integers between the min and max values? Yes


### Complejidad

7. Calcula la complejidad del algoritmo por fuerza bruta.

El coste computacional de generar todas las permutaciones para un conjunto de tamaño $n$ es típicamente $O(n \cdot n!)$ dependiendo si la operación de procesar cada permutación es considerada. Este coste exponencial surge porque hay $n!$ permutaciones posibles, y cada permutación puede tomar hasta $O(n!)$ tiempo para generarse o analizarse. Según la documentación de `itertools`, el método calcula $\frac{n!}{(n-r)!}$ permutaciones, por lo que el coste computacional teniendo en cuenta la operación de procesar cada permutación es $O(n \cdot \frac{n!}{(n-r)!})$.

Si se dice que los conjuntos de dígitos y de signos de operación son de tamaño $n_d$ y $n_s$ respectivamente, donde $r_s = n_s$, el denominador del coste computacional de generar todas las permutaciones del conjunto de signos de operación es $(n_s-r_s)!=0!=1$. Por lo tanto, el coste computacional de generar todas las permutaciones del conjunto de dígitos y del conjunto de signos de operación es

$$ 
O(n_s \cdot \frac{n_s!}{(n_s-r_s)!} + n_d \cdot \frac{n_d!}{(n_d-r_d)!}) = O(n_s \cdot n_s! + n_d \cdot \frac{n_d!}{(n_d-r_d)!})
$$

La siguiente operación que contribuye a la complejidad del algoritmo es la iteración anidada que se hace a lo largo de las permutaciones generadas, junto con la iteración anidada a las dos anteriores que construye la expresión, más otra adicional para el caso en el que el primer signo es $-$. Estas dos últimas no se tienen en cuenta dado que no depende del tamaño de la entrada, siempre son $O(4)$. Así, estos ciclos `for` anidados tendrían un coste computacional de

$$ 
O(n_s! \cdot \frac{n_d!}{(n_d-r_d)!})
$$

Por lo tanto, el coste computacional total del algoritmo es:

$$ 
O(n_s \cdot n_s! + n_d \cdot \frac{n_d!}{(n_d-r_d)!} + n_s! \cdot \frac{n_d!}{(n_d-r_d)!}) = O(n_s \cdot n_s! + (n_d+n_s!) \frac{n_d!}{(n_d-r_d)!}).
$$

En términos de simplificación, se podrían descartar $n_s$ y $n_d$ por ser valores muy pequeños comparados con sus factoriales,

$$ 
O(n_s \cdot n_s! + (n_d+n_s!) \frac{n_d!}{(n_d-r_d)!}) = O(n_s! + \frac{n_s! \cdot n_d!}{(n_d-r_d)!})
$$

Para simplificar aún más, se puede asumir que $n_s \approx n_d$ y $n_d \approx r_d$, por lo que $(n_d-r_d)! \approx 0!=1$. Así, el coste computacional más simplifcado es

$$ 
O(n_s! + \frac{n_s! \cdot n_d!}{(n_d-r_d)!}) = O(n! + n! \cdot n!) = \boxed{O(n! + n!^2)}
$$

### Búsqueda de una o todas las expresiones que evalúen a un objetivo

Ya con el espacio de soluciones completo, simplemente se tendría que buscar en el diccionario que claves tienen como valor el resultado de interés. Por ejemplo, se puede obtener todas las expresiones que evalúan en `4` y la primera que evalúa a `5`:

In [2]:
def expressions_by_target(target, all_expressions=True, lim=LIMIT):
    expressions = [e for e, v in BRUTE_FORCE_RESULTS.items() if v == target]
    if all_expressions:
        if len(expressions) <= lim:
            print(f"\nExpressions that evaluate to {target}:")
            for e in expressions:
                print(e)
        else:
            print(f"First {lim} expressions that evaluate to {target}")
            for _ in range(lim):
                print(expressions[_])
    else:
        print(f"\nFirst expression that evaluates to {target}:\n{expressions[0]}")

expressions_by_target(4)
expressions_by_target(5, False)

First 10 expressions that evaluate to 4
3/1+9-2*4
3/1+9-4*2
4/1+6-2*3
4/1+6-3*2
4/2+5-1*3
4/2+5-3*1
4/2+7-1*5
4/2+7-5*1
4/2+8-1*6
4/2+8-6*1

First expression that evaluates to 5:
4/1+7-2*3


### Diseño de un mejor algoritmo

8. (*) Diseña un algoritmo que mejore la complejidad del algortimo por fuerza bruta. Argumenta porque crees que mejora el algoritmo por fuerza bruta.

### Backtracking

La primera técnica que se va a usar para intentar mejorar el algoritmo por fuerza bruta implementado anteriormente es la de **backtracking**, donde se va ramificando cada una de las posibles elecciones en cada paso. Se puede ver una representacición de como se desarrollaría cada una de las posibilidades en este flujo en el siguiente diagrama:

                                       1
                          ┌────────────┼────────────┬────────────┐
                         [+]          [-]          [*]          [/]
                         / \           ...           ...           ...
                       2     6
                     /   \
                   [-]   [*] ...
                  /   \
                 3    ...
                  \
                   [*]  
                 /  |  \
                4   5   6
               /    |    \
             [/]    ...    ...
            / | \  
           5  6  7  ...

Para el desarrollo del algoritmo, se itera sobre las lista de números (ramificación) y se verifica si la expresión es válida, en caso negativo se retrocede un paso, se añade el siguiente operador y se continua la iteración sobre los números restantes de manera recursiva. En el caso de que se haya llegado al final del árbol, no se puede utilizar más operadores por lo que se hace backtraking para explorar otra ramificación.

In [3]:
def backtracking_alg(figures, signs, target, expression=""):
    for fig in figures:
        remaining_figures = figures.copy()
        remaining_figures.remove(fig)
        current_expression = f"{expression}{fig}"
        # Check if the current expression is valid
        if len(current_expression) > 0 and eval(current_expression) == target and len(signs) == 0:
            return current_expression
        # Return None if there is no more figures or operation signs to try
        elif len(signs) == 0 and fig == figures[-1]:
            return None
        # Branch to add an operator sign to the expression
        for sign in signs:
            remaining_signs = signs.copy()
            remaining_signs.remove(sign)
            current_solution = backtracking_alg(remaining_figures, remaining_signs, target, f"{current_expression}{sign}")
            # If current solution is an actual solution, return it
            if current_solution != None:
                return current_solution
    return None


def expression_by_target_with_backtracking(target):
    start = time.time()
    expression = backtracking_alg(list(FIGURES), list(SIGNS), 5)
    finish = time.time()
    print(f"Run time = {finish - start:.3f} seconds")
    if expression != None:
        print(f"First expression that evaluates to {target} found by backtracking:\n\t{expression}")
    else:
        print("No expression found")


expression_by_target_with_backtracking(5)

Run time = 0.004 seconds
First expression that evaluates to 5 found by backtracking:
	1/2*4+6-3


### Complejidad

9. (*) Calcula la complejidad del algoritmo.

El algoritmo con backtracking solo reduce levemente la complejidad comparado con el algoritmo por fuerza bruta, esto se debe a que no se implemento ningún tipo de poda, más alla de esperar hasta completar la expresión y verificar que es válida, en caso contrario se retrocede un paso y se sigue iterando con el siguiente operador y las cifras que aún no han sido utilizadas. La diferencia no es tan notoria debido a que no se aplica ninguna técnica de poda antes de completar la expresión. El siguiente nivel de optimización sería añadir técnicas de poda en cada paso de la construcción de la expresión.

Para simplificar el cálculo, se asume que $n_s \approx n_d = n$. El coste computacional de la cantidad de decisiones binarioas (operador/dígito) a tomar en cada nivel de la recursión es $O(2^n)$, el coste asociado a la dos ciclos `for` anidados es $O(n^2)$. Por lo tanto, en el peor caso, el coste total del algoritmo con backtracking es:

$$ 
O(n^2 \cdot 2^n)
$$

### Datos de entrada aleatorios

10. Según el problema (y tenga sentido), diseña un juego de datos de entrada aleatorios.

In [4]:
import numpy as np


MIN_VALUE = -70
MAX_VALUE = 77


def generate_random_input(size=LIMIT, low=MIN_VALUE, high=MAX_VALUE):
    return np.random.randint(low, high+1, size)


print(generate_random_input())

[-68   8 -23 -37  25  52  50 -11  47 -15]


### Aplicación del algoritmo

11. Aplica el algoritmo al juego de datos generado.

In [5]:
def backtracking_with_random_input():
    start = time.time()
    for target in generate_random_input():
        expression = backtracking_alg(list(FIGURES), list(SIGNS), target)
        if expression != None:
            print(f"First expression that evaluates to {target} found by backtracking:\n\t{expression}")
        else:
            print("No expression found")
    finish = time.time()
    print(f"Run time = {finish - start:.3f} seconds")


backtracking_with_random_input()

First expression that evaluates to 17 found by backtracking:
	1+2*9-6/3
First expression that evaluates to 64 found by backtracking:
	3/1+7*9-2
First expression that evaluates to -53 found by backtracking:
	1+4/2-7*8
First expression that evaluates to 41 found by backtracking:
	1+6*7-4/2
First expression that evaluates to -25 found by backtracking:
	1+6/3-4*7
First expression that evaluates to 44 found by backtracking:
	1+5*9-4/2
First expression that evaluates to -14 found by backtracking:
	1+3-4/2*9
No expression found
First expression that evaluates to -58 found by backtracking:
	1+8/2-7*9
First expression that evaluates to -56 found by backtracking:
	2/1+5-7*9
Run time = 2.877 seconds


### Referencias

12. Enumera las referencias que has utilizado(si ha sido necesario) para llevar a cabo el trabajo.

    * Universidad Internacional de Valencia (VIU). (2025). Apuntes y recursos de la asignatura Algoritmos de Optimización. Material docente en el aula virtual.
    * Universidad Internacional de Valencia (VIU). (2025). Apuntes y recursos de la asignatura Python para la Inteligencia Artificial. Material docente en el aula virtual.
    * https://docs.python.org/3/library/itertools.html

### Estudio avanzado del problema

13. Describe brevemente las lineas de como crees que es posible avanzar en el estudio del problema. Ten en cuenta incluso posibles variaciones del problema y/o variaciones al alza del tamaño.

El siguiente nivel de optimización del algoritmo por backtracking sería añadir técnicas de poda en cada paso de la construcción de la expresión.