# Algoritmos de optimización - Seminario<br>
Nombre y Apellidos:  Patrick Kohn Beruete <br>
Url: https://github.com/pkohn19/03-AlgOptimizacion/tree/master/SEMINARIO<br>
Problema:
>3. Combinar cifras y operaciones

(*) La respuesta es obligatoria
                               
                               
**Descripción del problema:**       

• Disponemos de las 9 cifras del 1 al 9 (excluimos el cero) y de los 4 signos básicos de las
operaciones fundamentales: suma(+), resta(-), multiplicación(*) y división(/).

• Debemos combinarlos alternativamente **sin repetir ninguno de ellos** para obtener una cantidad
dada. Un ejemplo sería para obtener el 4:
4+2-6/3*1 = 4

• Debe analizarse el problema para encontrar todos los valores enteros posibles planteando las
siguientes cuestiones:
- ¿Qué valor máximo y mínimo se pueden obtener según las condiciones del problema?
- ¿Es posible encontrar todos los valores enteros posibles entre dicho mínimo y máximo ?

**(*)¿Cuantas posibilidades hay sin tener en cuenta las restricciones?**<br>

Respuesta:

---------------------
Dado que no tenemos ningún tipo de restricción podemos repetir operadores y números. Por lo tanto para los operadores tenemos 4 (+-*/) opciones de las cuales tenemos que usar 4 por lo que resultan 4⁴ posibilidades. Idem para los números. Tenemos 9 cifras y debemos elegir 5= 9⁵.

Esto resulta en un total de 9⁵ * 4⁴ = 15116544 combinaciones posibles **sin restricciones**

¿Cuantas posibilidades hay teniendo en cuenta todas las restricciones.

Respuesta:

---------------------
    
- Respecto a la segunda pregunta, debemos evitar repetir números por lo que la variación debe de ser **variación sin repetición**. 
Calculamos V(9,5) = 9!/(9-5)! = 15120. Podemos ordenar los números de 15120 formas. Respecto a las operaciones tenemos que ordenar 4 opciones sin repetición. Estamos ante una permutación (4!). Por lo tanto el resultado final es 9! = 362880. Mas de 40 veces menos opciones que para el caso con restricciones. Vemos como simples matices en las restricciones afectan y reducen considerablemente el espacio de soluciones

Modelo para el espacio de soluciones<br>
**(*) ¿Cual es la estructura de datos que mejor se adapta al problema? Argumentalo.(Es posible que hayas elegido una al principio y veas la necesidad de cambiar, argumentalo)**


Respuesta

---------------------

Por un momento pensé en tener de alguna manera una matriz con valores y resultados pero debido a la alta cantidad de valores y opciones no sería óptimo. Otra opción podría ser un árbol donde los nodos son los números y las ramas son las operaciones pero también lo veo excesivamente amplio para la cantidad de operaciones posibles a realizar. El arbol acabaría siendo demasiado alto. <br>
Creo que la mejor manera es utilizando arrays. Además contamos con la ventaja de que evaluar una cadena tiene un coste O(1) ya que solo es realizar 4 operaciones aritméticas básicas.
Por lo tanto vamos a utilizar un array de operaciones con los operandos (+-*/) y otro con las cifras del 1 al 9. 

numeros = ["0","1","2","3","4","5","6","7","8","9"]
signos = ["+","-","*","/"]

- Vemos como los números los guardamos como strings. Esto es debido a que usaremos la función eval() que evalua strings.
- Para el algoritmo de fuerza bruta he usado estas mismas estructuras en string para poder ser combinadas con itertools pero internamente un string sigue siendo un array de chars así que mantenemos la idea.
- **Añadido tras obtener el algoritmo óptimo:** Para mejorar el coste temporal y espacial podemos usar la estructura de set(), que tiene un orden O(1) de consulta y borrado de elementos.

Según el modelo para el espacio de soluciones<br>
**(*)¿Cual es la función objetivo?**

**(*)¿Es un problema de maximización o minimización?**

Respuesta

---------------------

- No estamos ante un algoítmo de optimización en el que debemos buscar un máximo o un mínimo como puede ser por ejemplo el problema tipo 2. Es un problema de búsqueda. Queremos buscar los valores, tanto números como variables, que obtengan el valor n de entrada. Por lo tanto nuestra función es la siguiente: n = eval(numeros[i]+signos[a]+numeros[j]+signos[b]+numeros[k]+signos[c]+numeros[l]+signos[d]+numeros[m]).
- Importante destacar que el + de la función es para unir cadenas y que eval() utlice un string.
- Sin embargo, el problema también puede transformarse en encontrar un valor máximo/mínimo posible de todas las situaciones. ¿Qué valor máximo podemos construir?

Creo que el problema principal que le aporta complejidad al problema es el orden de los operadores dado que si fuese un orden establecido, encontrar un minimo y maximo de una función de 4 variables sería relativamente sencillo usando derivadas.

Diseña un algoritmo para resolver el problema por fuerza bruta

Respuesta

---------------------

**Algoritmo:**

In [77]:
from itertools import permutations
import numpy as np
from time import time
import random
import operator

SIGNOS = "+-/*" # ponemos en string para que la funcion de itertools entienda el formato de entrada
NUMEROS = "123456789"
OPERACIONES = list(permutations(SIGNOS)) # creamos las posibles combinaciones de operadores
COMB_NUMEROS = list(permutations(NUMEROS, 5)) # creamos las posibles combinaciones de números

In [78]:
def obtener_operaciones(objetivo):
    resultados = []
    for comb_num in COMB_NUMEROS:
        for operacion in OPERACIONES:
            formula = ""
            for i in range(4):
                formula += f"{comb_num[i]}{operacion[i]}"
            formula += comb_num[i+1]
            if eval(formula) == objetivo: 
                resultados.append(formula)
    if len(resultados) == 0:
        return False
    else:
        formula_random = np.random.choice(resultados, 1)[0] # elegimos una solución de todas las posibles
        return formula_random

In [79]:
start = time()
obtener_operaciones(2)
print(f"Hemos tardado {time()-start} segundos")

Hemos tardado 2.339439630508423 segundos


Vamos a calcular de nuevo el ejercicio pero con mas opciones posibles para ver como aumenta rapidamente el tiempo de ejecución y la complejidad temporal

In [58]:
NUMEROS = "0123456789"
COMB_NUMEROS = list(permutations(NUMEROS, 5)) # creamos las posibles combinaciones de números

start = time()
obtener_operaciones(2)
print(f"Para 4 operaciones y 10 números hemos tardado {time()-start} segundos")

print("-----------------------")

NUMEROS = "01234567891"
COMB_NUMEROS = list(permutations(NUMEROS, 5)) # creamos las posibles combinaciones de números

start = time()
obtener_operaciones(2)
print(f"Para 4 operaciones y 11 números hemos tardado {time()-start} segundos")

print("-----------------------")

NUMEROS = "012345678912"
COMB_NUMEROS = list(permutations(NUMEROS, 5)) # creamos las posibles combinaciones de números

start = time()
obtener_operaciones(2)
print(f"Para 4 operaciones y 12 números hemos tardado {time()-start} segundos")

print("-----------------------")

NUMEROS = "0123456789123"
COMB_NUMEROS = list(permutations(NUMEROS, 5)) # creamos las posibles combinaciones de números

start = time()
obtener_operaciones(2)
print(f"Para 4 operaciones y 13 números hemos tardado {time()-start} segundos")

Para 4 operaciones y 10 números hemos tardado 5.172226667404175 segundos
-----------------------
Para 4 operaciones y 11 números hemos tardado 9.51769757270813 segundos
-----------------------
Para 4 operaciones y 12 números hemos tardado 16.174983263015747 segundos
-----------------------
Para 4 operaciones y 13 números hemos tardado 26.637192487716675 segundos


Por último, vamos a probar el valor máximo, minimo y si algun valor no se puede conseguir por fuerza bruta:

In [61]:
NUMEROS = "123456789"
COMB_NUMEROS = list(permutations(NUMEROS, 5)) # creamos las posibles combinaciones de números

for i in range(-100, 100):
    if not obtener_operaciones(i):
        print(f"NO HEMOS ENCONTRADO COMBINACIÓN PARA EL VALOR {i}")



---------------------

Calcula la complejidad del algoritmo por fuerza bruta

Respuesta

---------------------

- La complejidad logicamente depende de si buscamos la solución del problema con restricciones o sin restricciones.

Sin restricciones: Ya hemos visto que tenemos 9⁵*5⁴ operaciones. Por lo tanto podemos decír que tenemos O(x*n) operaciones siendo x el número de cifras y n el tamaño de la operación a evaluar.
Con restricciones: Teníamos 9! operaciones por lo que ahora tendremos O(n!) siendo n el número de cifras.

La complejidad sin restricciones es mucho mayor, lo cual es lógico al tener un espacio a recorres considerablemente mayor

**(*)Diseña un algoritmo que mejore la complejidad del algortimo por fuerza bruta. Argumenta porque crees que mejora el algoritmo por fuerza bruta**

Después de barajar varias opciones (alguna heruística o ramificación y poda) me he decidio implementar una búsqueda aleatoria ya que es sencillo de implementar y entender. Creo que es una buena manera de obtener máximos/minimos aproximados (para iteraciones altas) con un coste computacional bajo. Además puede que también encontremos una fórmula exacta al numero que buscamos. En caso de no encontrarla devolvemos la función con el resultado mas cercano

Algoritmo:

---------------------

In [157]:
from random import random,choice
import numpy as np

SIGNOS = ["+","-","*","/"]
NUMEROS = ["1","2","3","4","5","6","7","8","9"]

def busqueda_random_operacion(num, iter_max):
    """
    Función para búsqueda aleatoria de soluciones aproximadas de num.
    
    Returns: formula, maximo encontrado, minimo encontrado
    """
    iter = 0
    eval_form = 0
    min_eval_form = "np.inf"
    max_encontrado = -np.inf
    min_encontrado = np.inf
    
    while eval_form != num and iter <= iter_max:
        numeros_disponibles = NUMEROS.copy()
        signos_disponibles = SIGNOS.copy()
        
        # construimos la fórmula aleatoria
        formula = ""
        for i in range(4):
            choice_op = choice(signos_disponibles)
            choice_num = choice(numeros_disponibles)
            numeros_disponibles.remove(choice_num) #eliminamos el numero para no volver a utilizarlo y complir la restriccion de repetición
            signos_disponibles.remove(choice_op) #eliminamos el signo para no volver a utilizarlo y complir la restriccion de repetición
            formula += f"{choice_num}{choice_op}"
        formula += choice(numeros_disponibles)
        eval_form = eval(formula)        
        
        #analizamos la formula obtenida
        if abs(num-eval_form) < abs(num-eval(min_eval_form)): # almacenamos la formula mas cercana al numero
            min_eval_form = formula
        if eval_form > max_encontrado: # guardamos el maximo encontrado
            max_encontrado = eval_form
        elif eval_form < min_encontrado: # guardamos el minimo encontrado
            min_encontrado = eval_form            
        iter+=1
        
    if eval_form == num:
        return formula, max_encontrado, min_encontrado, 1
    else:
        # print(f"Encontrada solución más cercana con una diferencia de {abs(num-eval(min_eval_form))}")
        return min_eval_form, max_encontrado, min_encontrado, 0

In [168]:
start = time()
busqueda_random_operacion(10, 1000)
print(f"Para el numero 10 y 1000 iteraciones maximas hemos tardado {time()-start} segundos")

Para el numero 10 y 1000 iteraciones maximas hemos tardado 0.0006313323974609375 segundos


In [155]:
flag_list = []
for i in range(100):
    _, _, _, flag = busqueda_random_operacion(20, 300)
    flag_list.append(flag)
flag_list = np.array(flag_list)
print(f"Hemos encontrado la fórmula correcta un {len(flag_list[flag_list==1])/len(flag_list)}")

Hemos encontrado la fórmula correcta un 0.63


In [156]:
flag_list = []
for i in range(100):
    _, _, _, flag = busqueda_random_operacion(40, 300)
    flag_list.append(flag)
flag_list = np.array(flag_list)
print(f"Hemos encontrado la fórmula correcta un {len(flag_list[flag_list==1])/len(flag_list)}")

Hemos encontrado la fórmula correcta un 0.27


- Vemos como el tiempo es mucho menor (casi 100 veces) a la búsqueda por fuerza bruta.
- Vemos como para números mas bajos obtenemos la formula correcta más veces. Esto es logico ya que con pocos numeros es mas facil obtener numeros bajos
- Vemos como para numeros altos obtenemos la formula correcta menos veces. Menos de la mitad

In [133]:
formula, max_encontrado, min_encontrado  = busqueda_random_operacion(10, 200)
print(f"Para 1000 iteraciones hemos encontrado un máximo de {max_encontrado} y un minimo de {min_encontrado}")

Para 1000 iteraciones hemos encontrado un máximo de 74.0 y un minimo de -69.14285714285714


**(*)Calcula la complejidad del algoritmo**

Respuesta

---------------------

- Tenemos un máximo de iter_max iteraciones. Además en cada iteración hacemos 5 selecciones aleatorias de valores junto a un borrado de datos. El orden es O(n) siendo n el número de iteraciones. Sin embargo, es cierto que tenemos ciertos multiplicadores y no es n exactamente si no > 4n. Hemos conseguido reducir el problema a un problema lineal.
- Podemos reducir la complejidad aun mas si usamos EEDD más adecuadas como por ejemplo los set() que permites borrar elementos en O(1) y no O(n) como las listas.

Según el problema (y tenga sentido), diseña un juego de datos de entrada aleatorios

Respuesta

---------------------

Aplica el algoritmo al juego de datos generado

Respuesta

---------------------

Enumera las referencias que has utilizado(si ha sido necesario) para llevar a cabo el trabajo

Respuesta

---------------------

- https://www.unirioja.es/talleres/creatividad_matematica/SeminarioBachillerato/COMBINATORIA.pdf
- https://docs.python.org/3/library/itertools.html
- https://wiki.python.org/moin/TimeComplexity 
---------------------

Describe brevemente las lineas de como crees que es posible avanzar en el estudio del problema. Ten en cuenta incluso posibles variaciones del problema y/o variaciones al alza del tamaño

Respuesta

---------------------

Basado en mi experiencia trabajando en el mundo de la IA (en campos sobretodo de Deeplearning) he conversado muchas veces con compañeros especializados en Aprendizaje por refuerzo. Este tipo de algoritmos se sirven de unas recompensas o premios para elegir los siguientes pasos a realizar. Creo que si aumentamos la complejidad del problema aportando más restricciones y aumentando e número de condiciones y variables debemos pensar en aplicar algoritmos de este tipo.

Es cierto que se trata de algoritmos que no están pensados para optimizar procesos si no obtener los mejores resultados (con implementaciones sencillas). Es ocmunmente usado para resolver juegos o problemas espaciales (por ejemplo movimientos y decisiones de robots o el problema del taxista). Realmente veo una similitud entre lo que queremos hacer y este tipo de algoritmo de Machine Learnings, pero como digo, puede ir en contra de la filosofía de la presente asignatura de encontrar algoritmos eficaces pero eficientes.

---------------------