# Heurísticas de creación de algoritmos

En genral, tenemos dos tipos de problemas algorítmicos:

- **Optimización.** Queremos encontrar un mínimo o un máximo para un problema en cierto **espacio de estados**.
- **Decisión.** Queremos responder preguntas de sí/no también para un problema en cierto espacio de estados.

No todos los problemas de algoritmos son así, pero una cantidad muy grande de los que son interesantes sí. Por ejemplo, insertar un elemento en una lista no está intentando optimizar ni decidir nada. Pero hay algunos problemas que ya hemos visto de este estilo. El problema de buscar un elemento en una diccionario es un problema de decisión: dado un diccionario $D$ y un elemento $x$, lo que queremos responder en el problema es si $x$ está en $D$.

Veamos algunos ejemplos más:

- **Resolver un Sudoku.** Dadas entradas en un tablero de Sudoku, decidir si hay una solución que lo complete o no. También, decidir si esta solución es única o no.
- **Brazo robótico que une circuitos.** Dados puntos en plano, queremos encontrar un ciclo hamiltoniano de longitud mínima que los recorre.
- **Decidir el número cromático de una gráfica.** Dada una gráfica $G$, queremos encontrar la mínima cantidad posible de colores necesarios para poder dar una buena coloración.
- **Determinar el número de clique de una gráfica.** Dada una gráfica $G$, queremos encontrar la máxima cantidad posible de vértices que forman una gráfica completa.
- **Determinar si una gráfica es bipartita o no.** Dada una gráfica $G$, ver si existe una partición de sus vértices en conjuntos $A$ y $B$ de modo que las únicas artistas vayan de $A$ a $B$.

El primero y último son algorimos de decisión, mientras que el segundo, tercero y cuarto son algoritmos de optimización.

## Espacio de estados

En un problema de decisión o de optimización, es muy importante que quede claro el **espacio de estados**, es decir, todas las posibles configuraciones/entradas que debemos considerar para poder responder la pregunta. Para ello, en problemas de aplicación es muy importante decidir cómo estamos modelando el problema.

Espacios de estados típicos en varios de estos problemas son:

- Todas las permutaciones de $n$ elementos.
- Todos los subconjunto de un conjunto de $n$ elementos.
- Todas las configuraciones de $n$ puntos en el plano.
- Todos los números del $1$ al $n$.
- Para cierta $k$, todos subconjuntos de tamaño $k$ de $n$ elementos.
- Todos los vectores de $m$ elementos tomados de un conjunto de $n$ elementos.

**Ejemplo.** Dada una lista de $n$ números, queremos:
- Decidir si hay dos de ellos cuya suma es $1000$.
- Decidir cuáles dos ellos tienen la suma más pequeña.

El primer problema es un problema de decisión. El segundo es un problema de optimización. Notemos que ambos problemas tienen como espacio de estados a los subconjuntos de $2$ elementos de un conjunto de $n$ elementos.

Hay otros problemas que tiene espacios de estados más complicados, o más particulares al problema. Por ejemplo, consideremos los siguientes dos problemas.

**Ejemplo.**

- ¿Será posible colocar 15 caballos de ajedrez en un tablero de ajedrez sin que se ataquen entre sí?
- ¿Cuál es el máximo número de caballos de ajedrez que se pueden poner en un tablero de ajedrez sin que se ataquen entre sí?
- ¿Será posible colocar $3$ torres, $5$ caballos y $4$ alfiles sin que se ataquen entre sí?

# Heurísticas algorítmicas

Ya que tenemos un problema algorítmico de decisión o de optimización y entendemos bien cuál es espacio de estados que debemos estudiar, lo siguiente es saber dónde en ese espacio de estados se encuentra la solución óptima o bien la instancia que cumple lo que queremos.

Hay muchas formas de resolver este tipo de problemas algorítmicos, pero en transcurso de la historia del análisis de algoritmos, estas formas se han agrupado en **heurísticas** generales que ayudan en muchas situaciones.

A continuación ponemos algunas:

- Explorar todo el espacio de estados (fuerza bruta): Consiste en estudiar todos los elementos del espacio de estados uno por uno para ver si son el óptimo/cumplen la propiedad que queremos.
- Explorar el espacio de estados de manera inteligente: Consiste en estudiar parcialmente el espacio de estados, descartando con suficiente anticipación las exploraciones que ya no serán exitosas.
- Reducir el espacio de estados con argumentos de simetría.
- Explorar el espacio de estados de manera voraz (glotona, avariciosa).
- Dividir el problema que queremos en problemas más pequeños que sean más sencillos de resolver.
- Explotar una estructura recursiva de los objetos del problema para poner soluciones a instancias grandes en términos de soluciones de instancias más pequeñas.
- Programación dinámica: Hacer lo anterior con mucho más cuidado, para no repetir múltiples veces el cómputo para casos pequeños.

## Exploración exhaustiva

Consiste en explorar todo el espacio de estados para buscar el valor óptimo o el testigo.

Es una técnica básica, pero que a veces es la única con la que contamos. Usualmente es la única opción en problemas con muy poca estructura, o en problemas en donde queremos asegurarnos de pasar por todas las posibilidades.

También se conoce como "fuerza bruta", o como "explorar por completo el espacio de estados".

Usaremos esta heurística para resolver los siguientes problemas. Aunque no necesariamente sea la mejor heurística para estos problemas, ayudará a entender el concepto que estamos estudiando.

## Problemas de exploración exhaustiva

**Problema 1.** ¿De cuántas formas se puede poner a $10000$ como suma de cuadrados de dos números enteros positivos? ¿En cuál de las expresiones $x^2+y^2=10000$ se minimiza $3x+5y-1$?

**Problema 2.** Se toman tres enteros $a$, $b$ y $c$ en el intervalo $[1,100]$. ¿Para cuáles de ellos el valor de $a^2+2b^2+3c^2-2ab-5bc-7ca$ es mínimo?

**Problema 3.** ¿Cuál es la palabra más larga en español que tenga únicamente cuatro vocales?

**Problema 4.** ¿Existe alguna palabra en español que use exactamente diez vocales y diez consonantes? Si sí, ¿cuántas hay?

**Problema 5.** Las letras $a,b,c,d,e,f,g,h,i,j$ representan dígitos distintos. ¿para cuantas elecciones tenemos que $\frac{abcde}{fghij}$ es un número entero? Aquí $abcde$ y $fghij$ son los números de cinco dígitos obtenidos de concatenar los dígitos correspondientes.

## Soluciones con exploración exhaustiva

**Problema 1.** ¿De cuántas formas se puede poner a $10000$ como suma de cuadrados de dos números enteros positivos? ¿En cuál de las expresiones $x^2+y^2=10000$ se minimiza $3x+5y-1$?

Para el Problema 1, el espacio de estados que queremos explorar son las parejas $(x,y)$ con $x$ y $y$ en el intervalo $[1,99]$. Una exploración exhaustiva verifica todos los casos posibles. Implementaremos esto en Python usando dos ciclos.

In [11]:
# Primero, la exploración exhaustiva para ver quienes son todas las parejas
cuantos=0
cuales=[]
for x in range(1,100):
    for y in range(1,100):
        if x**2+y**2==10000:
            cuantos+=1
            cuales+=[(x,y)]
            
print(cuantos)
print(cuales)

# Ahora, hagamos otra exploración para ver en cuál se minimiza 3x+5y-1
minimo=10000000
for pair in cuales:
    x=pair[0]
    y=pair[1]
    if 3*x+5*y-1<minimo:
        minimo=3*x+5*y-1
        optimo=(x,y)

print(minimo)
print(optimo)

4
[(28, 96), (60, 80), (80, 60), (96, 28)]
427
(96, 28)


Pensemos que el Problema 1 se generaliza para dos números $x$ y $y$ que queremos que su cuadrado sume $n$. En este caso, el espacio de estados sería, de acuerdo a nuestra estrategia anterior, que $x$ y $y$ estén en $[1,2,\ldots, \lceil \sqrt{n} \rceil]$.

En el primer ciclo estamos corriendo por $O(
\sqrt{n})$ elementos y el que está anidado también corre por $O(\sqrt{n})$ así que estos ciclos anidados corren en tiempo $O(n)$. Con este tiempo se puede tanto determinar cuáles parejas son, como determinar cuál es el mínimo de la expresión $3x+5y-1$ sujeta a las condiciones $x^2+y^2=n$ y $x,y$ enteros.

**Problema 2.** Se toman tres enteros $a$, $b$ y $c$ en el intervalo $[1,100]$. ¿Para cuáles de ellos el valor de $a^2+2b^2+3c^2-2ab-5bc-7ca$ es mínimo?

En este caso tenemos menos simetría en las variables $a$, $b$ y $c$, por lo que en este problema tiene un poco más de sentido hacer una exploración exhaustiva. Necesitamos tres ciclos anidados para explorar el espacio de estados.

In [63]:
def funcion(a,b,c):
    return(a**2+2*b**2+3*c**2-2*a*b-5*b*c-7*c*a)

minimo=100000
for a in range(1,101):
    for b in range(1,101):
        for c in range(1,101):
            F=funcion(a,b,c)
            # Típica forma de ir guardando el optimo.
            if F<minimo:
                minimo=F
                optimo=(a,b,c)
                
print(minimo)
print(optimo)

-80000
(100, 100, 100)


Si el problema fuera para números en el intervalo $[1,\ldots,n]$, entonces el algoritmo de acá arriba corre en tiempo $O(n^3)$. Si fuera para $k$ números en ese intervalo, el tiempo cambia a $O(n^k)$.

**Problema 3.** ¿Cuál es la palabra más larga en español que tenga únicamente cuatro vocales?

Primero haremos una función auxiliar que cuenta vocales. Después, haremos una exploración exhaustiva palabra por palabra para determinar cuáles tienen exactamente cuatro palabras y ver cuál de ellas es la más grande.

Para nuestra exploración exhaustiva, tomaremos como espacio de estados la lista de palabras en español disponible en <a href="http://www.gwicks.net/dictionaries.htm">este sitio</a>.


In [2]:
# En la lista de palabras, las siguientes
# letras aparecen como vocales. Notemos
# cómo sí hay palabras con, por ejemplo ì, lo que
# no es correcto en español, pero sí debemos considerarlo.

vocales='aeiouáéíàèìòùóúüAEIOUÁÉÍÓÚÜÀÈÌÒÙ'
# Función auxiliar para contar vocales. Notemos que, en cierto sentido
# es una búsqueda exhaustiva dentro de la palabra.
def contarvocales(palabra):
    cuenta=0
    for j in palabra:
        if j in vocales:
            cuenta+=1
    return cuenta

# Hacemos algunas pruebas para ver que la funció auxiliar hace lo que queremos
print(contarvocales('Hola mundo!'))
print(contarvocales('Esta oración tiene acentos'))
print(contarvocales('PIngÜinoS y MurCIElAGOs'))

4
12
9


In [44]:
lista=open('espanol.txt','r',encoding = "ISO-8859-1")
linea=lista.readline()
maximo=0

# Vamos a encontrar todas las palabras que sean óptimas y guardarlas en esta lista.
mejores=[]
while linea:
    # Algunas líneas de nuestra lista incluyen 'subj' al final, por eso primero
    # las limpiamos con esto.
    limpio=linea[:-1].split(' ')[0]
    # Ahora sí, procesamos la cadena limpia. Típico algoritmo que va almacenando los
    # mínimos.
    if contarvocales(limpio)==4:
        if len(limpio)>maximo:
            maximo=len(limpio)
            mejores=[mejor]
            mejor=limpio
        if len(limpio)==maximo:
            mejores.append(limpio)
    linea=lista.readline()

print('''Las palabras con cuatro vocales y la máxima cantidad de letras tienen {} letras. \nSon las siguientes {}:'''.format(maximo,len(mejores)))
for palabra in mejores:
    print('- '+palabra)
    
lista.close()

Las palabras con cuatro vocales y la máxima cantidad de letras tienen 14 letras. 
Son las siguientes 5:
- circunscriban
- prescriptibles
- transformables
- transpondremos
- transportables


**Problema 4.** ¿Existe alguna palabra en español que use exactamente diez vocales y diez consonantes? Si sí, ¿cuántas hay?

Una vez más, nuestro espacio de estados será la lista de palabras en español que cargamos previamente.

In [4]:
lista=open('espanol.txt','r',encoding = "ISO-8859-1")
linea=lista.readline()

# Vamos a encontrar todas las palabras que sean óptimas y guardarlas en esta lista.
testigos=[]
while linea:
    # Algunas líneas de nuestra lista incluyen 'subj' al final, por eso primero
    # las limpiamos con esto.
    limpio=linea[:-1].split(' ')[0]
    # Ahora sí, procesamos la cadena limpia. Típico algoritmo que va almacenando lo que
    # cumple.
    if contarvocales(limpio)==10 and len(limpio)==20:
        testigos.append(limpio)
    linea=lista.readline()

print('''Hay {} palabras con diez vocales y diez consontantes. Son:'''.format(len(testigos)))
for j in testigos:
    print('- ' + j)
    
lista.close()

Hay 2 palabras con diez vocales y diez consontantes. Son:
- desnacionalizaciones
- impermeabilizaríamos


Consideremos el siguiente problema que se parece al anterior, pero en vez de ser de decisión es de optimización:

**Problema.** Encontrar el mayor entero $k$ tal que en español hay una palabra que use exctamente $k$ vocales y $k$ consonantes.

Observemos que podemos resolver este problema de optimización resolviendo varias instancias del siguiente problema de decisión:

**Problema.** Dado un entero $k$, determinar si en español hay una palabra que use exactamente $k$ vocales y $k$ consonantes.

Aunque a veces esta estrategia es lo mejor para algunos problemas, hay otros problemas en los que hay mejores formas de resolver la versión de optimización.

Pensemos en la complejidad de un problema un poco más general, y que prácticamente abarca los dos anteriores.

**Problema.** Dada una lista $C$ de $m$ caracteres, una lista $P$ de $n$ palabras, cada una con longitud a lo más $l$, para cada palabra, decir cuántos caracteres de $C$ tiene, contando repeticiones.

Haciendo el algoritmo de arriba, tenemos ciclos anidados. Cada 
caracter de cada palabra en $P$ se debe buscar en $C$. Como $C$ tiene $m$ elementos, esto toma tiempo $O(m)$. Como cada palabra tiene longitud a lo más $l$, cada palabra se verifica en tiempo $O(lm)$. Como hay $n$ palabras, el algoritmo corre en tiempo $O(lmn)$.

Esto se puede mejorar a tiempo cerca de $O(ln)$ si implementamos $C$ como un diccionario o conjunto, pues tiene tiempo de búsqueda cerca de $O(1)$.

**Problema 5.** Las letras $a,b,c,d,e,f,g,h,i,j$ representan dígitos distintos. ¿para cuantas elecciones tenemos que $\frac{abcde}{fghij}$ es un número entero? Aquí $abcde$ y $fghij$ son los números de cinco dígitos obtenidos de concatenar los dígitos correspondientes.

Aquí hay que decidir cuidadosamente el espacio de estados. Si elegimos como espacio de estados que cada letra tome cada una de las 10 posibilidades que tiene, y luego verificamos duplicados, y luego procesamos, se tendrán que verificar $\approx10^{10}$ casos. Esto es demasiado, pues son 10 mil millones de casos.

¿Queremos que sean todas las permutaciones posibles? Son 10!=3628800. Está bien, no son tantísimas. Pero este sería un tiempo imposible para permutaciones de más números.

In [31]:
def perms(lista):
    L = len(lista)
    if L == 1:
        return [lista]
    else:
        old = perms(lista[:-1])
        last = lista[-1]
        new = []
        for k in range(L):
            for perm in old:
                to_add = perm[:k]+[last]+perm[k:]
                new.append(to_add)
        return new
    
# Creamos las permutaciones que nos interesan
numeros=[1,2,3,4,5,6,7,8,9,0]
permutaciones=perms(numeros)
print(len(permutaciones))

3628800


In [6]:
# Ahora recorramos cada una de las permutaciones y procesemos. Vamos
# a almacenar todas las soluciones y luego las contamos.

soluciones=[]
for pi in permutaciones:
    first=[str(j) for j in pi[:5]]
    last=[str(j) for j in pi[5:]]
    a=int(''.join(first))
    b=int(''.join(last))
    if a%b==0:
        soluciones.append((a,b))

print("Hay {} soluciones".format(len(soluciones)))

Hay 281 soluciones


La función auxiliar `perms` regresa una lista con todas las permutaciones, que puede o no ser lo que queremos. Un pequeño problema de esto es que además de usar $\Theta(n!)$ tiempo, también se usa $\Theta(n!)$ espacio, pues regresa una lista con todas las permutaciones.

Hay formas de mejorar esta complejidad en espacio, por ejemplo, haciendo un generador de permutaciones, o bien ir procesando cada permutación conforme aparezca. Esto requiere de una cuidadosa adaptación del argumento recursivo.

In [None]:
# En vez de crear una función que de una lista de todas las
# permutaciones, vamos lidiando con cada permutación, una
# por una. Pero cómo estamos trabajando recursivamente,hay que
# tener cuidado de sólo procesar en el nivel superior.

numeros=[1,2,3,4,5,6,7,8,9,0]
permutaciones=perms(numeros)

def problema5(lista):
    L=len(lista)
    if L==1:
        return [lista]
    else:
        old=perms(lista[:-1])
        last=lista[-1]
        new=[]
        for k in range(L):
            for perm in old:
                to_add=perm[:k]+[last]+perm[k:]
                # Ya no vamos al
                # new.append(to_add)
        return new
    
# Creamos las permutaciones que nos interesan
numeros=[1,2,3,4,5,6,7,8,9,0]
permutaciones=perms(numeros)

## Exploración exhaustiva recortada

Consiste en dejar de explorar posibilidades que ya no se pueden extender a posibilidades exitosas. Esto no es lo mismo que reducir el espacio de estados. Tampoco quiere decir que no exploremos todas las posibilidades. Consiste en dar argumentos para que nuestro algoritmo revise menos casos y siga dando la respuesta correcta.

Retomemos uno de los problemas de la sección anterior:

**Problema 1.** ¿De cuántas formas se puede poner a $10000$ como suma de cuadrados de dos números enteros positivos? ¿En cuál de las expresiones $x^2+y^2=10000=100^2$ se minimiza $3x+5y-1$?

Recortemos el espacio de estados a partir de las siguientes dos observaciones:
- Ambos $x$ y $y$ tienen que ser pares
- Si $x$ ya está dada, no tiene chiste mover $y$ por todos sus valores posibles de $1$ a $100$ pues por tamaño ya sólo puede tener pocas posibilidades.

$y$ ya nada más puede ser a lo mucho $\approx\sqrt{10000-x^2}$. Esto ahorra algunos pasos.

Los otros problemas también se prestan a este tipo de recorte de espacio de estados.

In [15]:
soluciones=[]
for x in range(1,100):
    for y in range(1,int((10000-x**2)**(0.5)+1)):
        if x**2+y**2==10000:
            soluciones.append((x,y))
            
print(soluciones)

[(28, 96), (60, 80), (80, 60), (96, 28)]


## Problemas de exploración exhaustiva recortada

Pongamos otros cuantos problemas que se pueden estudiar usando un recorte de espacio de estados.

**Problema 6.** Tenemos que encontrar todas las parejas de palabras `x` y `y` en español que sean diferentes y que `x y` tenga en total 9 caracteres.

**Problema 7.** Queremos encontrar para cuantas parejas `x` y `y` de palabras en español sucede que cada una de ellas tiene por lo menos cinco letras y las últimas cinco letras de la primera son iguales a las primeras cinco letras de la última. 

**Problema 8.** Tenemos el siguiente arreglo de números $$[4,1,7,4,2,5,5,7,1,8,4,9,9,1,4,1,5,7,2,8,3,6,1]$$. Queremos determinar de cuántas formas se pueden elegir algunos de estos números de forma consecutiva de modo que sumen $18$.

**Problema 9.** Una **matriz mágica sencilla**  consiste de una matriz de $3\times 3$, la suma de las entradas en cada fila es un cierto número $x$ y la suma de las entradas en cada columna es ese mismo número $x$. Las entradas deben ser los números del $1$ al $9$. ¿Cuántas matrices mágicas existen?

**Problema 10.** Se cayeron los $12$ números de un reloj. Se quieren volver a poner, uno en cada posición. No importa tanto saber la hora, pero es muy importante que la suma de tres de esos números consecutivos (en orden cíclico) no sea $13$, porque da mala suerte. ¿De cuántas formas es posible hacer esto?

Veamos los problemas uno por uno.

**Problema 6.** Tenemos que encontrar todas las parejas de palabras `x` y `y` en español que sean diferentes y que `x y` tenga en total 9 caracteres.

Podemos pensar el espacio de estados como todas las parejas de palabras en español y procesar cada una de ellas. Si lo exploramos de manera directa, esto toma tiempo cuadrático en la cantidad de palabras en español. Al procesar cada posibilidad seguro que cubrimos todas, pero parece que hay cierta pérdida de tiempo pues las palabras grandes (de $7$ letras o más) las estamos considerando en muchas parejas, pero todas ellas van a fallar.

Una mejor forma de explorar el espacio de estados es primero usar tiempo lineal en descartar las palabras grandes y luego usar tiempo cuadrático en una lista mucho más corta.

In [49]:
with open('listado-general.txt', 'r', encoding = "utf8") as f:
    lines = f.readlines()
    print(lines[:10])
    num_lines = len(lines)
num_lines

['a\n', 'aaronita\n', 'aarónico\n', 'aba\n', 'ababa\n', 'ababillarse\n', 'ababol\n', 'abacal\n', 'abacalero\n', 'abacero\n']


80383

In [50]:
words = []
with open('0_palabras_todas.txt', 'r', encoding = "utf8") as f:
    lines = f.readlines()
    for line in lines:
        lst = line.strip()
        if 1 < len(lst) < 8:
            words.append(lst)
    
print(f"Los casos a checar sin cortar la búsqueda son aproximadamente {num_lines}^2 = {num_lines**2}")
print(f"Los casos en la búsqueda cortada son aproximadamente {len(words)}^2 = {len(words)**2}")

Los casos a checar sin cortar la búsqueda son aproximadamente 80383^2 = 6461426689
Los casos en la búsqueda cortada son aproximadamente 32936^2 = 1084780096


Para reducir el espacio de estados, podemos ordenar la lista de palabras por longitud ascendente. Después, tomamos una palabra de la lista (llámese $u$) y recorremos la lista en un bucle. Denotando con $v$ la palabra obtenida en cada iteración del bucle, tenemos que la combinación $u+v$ es una palabra válida si:

$$ |u+v| = |u|+|v| = 9 $$

Sin embargo, si en algún momento encontramos una $v$ tal que $|u|+|v|>$, sabemos que podemos detener el bucle ahí, ya que como la lista está ordenada, todas las palabras posteriores a $v$ también cumplirán esto. Implementando esto:

- Estamos usando tiempo $O(n)$ primero para reducir la lista a una de palabras más cortas.
- Estamos usando tiempo $O(n\log n)$ en la lista de palabras cortas para ordenarla.
- Así, el tiempo $O(n^2)$ que usamos lo podemos recortar. Esto es muy conveniente pues es lo que asintóticamente tiene la carga más pesada.

In [59]:
test = [[0,1], [2,4], [2,6], [8,2], [5,1]]
test.sort(key=lambda x: x[1], reverse=True)
test

[[2, 6], [2, 4], [8, 2], [0, 1], [5, 1]]

In [60]:
words.sort(key=lambda x: len(x))
print(words[:70])
pairs = 0

for j in words:
    for k in words:
        if len(j) + len(k) == 9:
            pairs += 1
        elif len(j) + len(k) > 9:
            break

print(pairs)

['ad', 'ah', 'aj', 'al', 'ál', 'ar', 'as', 'ax', 'ay', 'be', 'bu', 'ca', 'ce', 'ch', 'cu', 'de', 'dí', 'do', 'ea', 'eh', 'el', 'él', 'en', 'et', 'ex', 'fa', 'fe', 'fi', 'fo', 'fu', 'ge', 'gu', 'ha', 'he', 'hi', 'hí', 'hu', 'ir', 'ja', 'je', 'ji', 'jo', 'ju', 'ka', 'la', 'le', 'll', 'lo', 'me', 'mi', 'mí', 'mu', 'na', 'ña', 'ne', 'ni', 'no', 'ño', 'ñu', 'oa', 'oc', 'oh', 'os', 'ox', 'pe', 'pi', 'pu', 'qu', 'ra', 're']
34313788


Acá arriba recortamos la búsqueda en cuanto estuvimos seguros de que ya no habría soluciones. Esto nos dejó todavía con un algoritmo en $O(n^2)$, pero, con un mejor factor constante que permitió correrlo en pocos segundos. Esto todavía no es el mejor algorimo, pero refleja bien la idea de recorte de espacio de estados.

Los siguientes dos problemas quedan como práctica.

**Problema 7.** Queremos encontrar para cuantas parejas de `x` y `y` de palabras en español sucede que cada una de ellas tiene por lo menos cinco letras y las últimas cinco letras de la primera son iguales a las primeras cinco letras de la última. 

**Problema 8.** Tenemos el siguiente arreglo de números $$[4,1,7,4,2,5,5,7,1,8,4,9,9,1,4,1,5,7,2,8,3,6,1]$$. Queremos determinar de cuántas formas se pueden elegir algunos de estos números de forma consecutiva de modo que sumen $18$.

**Problema 9.** Una **matriz mágica sencilla**  consiste de una matriz de $3\times 3$, la suma de las entradas en cada fila es un cierto número $x$ y la suma de las entradas en cada columna es ese mismo número $x$. Las entradas deben ser los números del $1$ al $9$, sin repetir ¿Cuántas matrices mágicas existen?

Lo primero que tenemos que hacer es decidir quién será nuestro espacio de estados. Como los números no se repiten, podemos pensar en permutaciones. Esto en total nos da un espacio de estados con 9! elementos a verificar. 

La permutación $[a_0,\ldots,a_8]$ la pensaremos como la matriz

$$\begin{pmatrix}a_0 & a_1 & a_2 \\ a_3 & a_4 & a_5 \\ a_6 & a_7 & a_8 \\\end{pmatrix}$$

Una observación adicional es que la suma de todos los números del $1$ al $9$ es $45$. De este modo, la suma en cada fila y en cada columna debe ser igual a $15$. Esto nos permite comparar la suma de cada fila y columna no entre sí, sino entre ellas y un número constante.

Primero, definimos una función para calcular todas las permutaciones de una lista:

In [2]:
def perms(lista):
    L = len(lista)
    if L == 1:
        return [lista]
    else:
        old = perms(lista[:-1])
        last = lista[-1]
        new = []
        for k in range(L):
            for perm in old:
                to_add = perm[:k]+[last]+perm[k:]
                new.append(to_add)
        return new
    
test = [1,2,3]
perms(test)

[[3, 2, 1], [3, 1, 2], [2, 3, 1], [1, 3, 2], [2, 1, 3], [1, 2, 3]]

Luego, generamos todas las candidatas mágicas posibles:

In [42]:
numeros = [1,2,3,4,5,6,7,8,9]
candidatas = perms(numeros)
len(candidatas)

362880

Y definimos una función para comprobar si es mágica:

In [43]:
def es_magica_3(lista):
    a = (lista[0]+lista[3]+lista[6] == 15)
    b = (lista[1]+lista[4]+lista[7] == 15)
    c = (lista[2]+lista[5]+lista[8] == 15)
    
    d = (lista[0]+lista[1]+lista[2] == 15)
    e = (lista[3]+lista[4]+lista[5] == 15)
    f = (lista[6]+lista[7]+lista[8] == 15)
    return a and b and c and d and e and f

Finalmente, iteramos sobre todas las matrices candidatas generadas, y guardamos las que sean mágicas:

In [64]:
soluciones = []
for matriz in candidatas:
    if es_magica_3(matriz):
        soluciones.append(matriz)
        
print(len(soluciones))
print(soluciones[0])

72
[9, 4, 2, 1, 8, 6, 5, 3, 7]


In [65]:
#¿Qué tal que queremos ver la matriz un poco más linda?
for k in range(3):
    print(soluciones[0][3*k:3*(k+1)])

[9, 4, 2]
[1, 8, 6]
[5, 3, 7]


Esta solución es suficientemente rápida para matrices de $3\times 3$, pero es muy lenta si quisiéramos encontrar matrices mágicas más grandes. Cuando tenemos matrices de $4\times 4$, la cantidad de números que queremos acomodar es $16!\approx 10^{13}$ (como $10$ millones de segundos) y eso es demasiado grande para esperar. ¿Cómo podemos cambiar o recortar el espacio de estados en este caso?

Primero generalicemos algunas de las observaciones anteriores. En una matriz mágica de $n\times n$ tenemos los números de $1$ a $n^2$ y por lo tanto la suma de todos ellos es $$1+2+\ldots+n^2=n^2(n^2+1)/2,$$ de donde la suma en cada renglón y columna debe ser igual a $n(n^2+1)/2$. Para $n=4$ obtenemos $34$.



In [48]:
def es_magica_4(lista):
    magica=True
    # Verificar que las filas sumen 34.
    for fila in range(4):
        magica = magica and (sum(lista[entrada] for entrada in range(4*fila,4*fila+4))==34)
    # Verificar que las columnas sumen 34.
    for columna in range(4):
        magica = magica and (sum(lista[entrada] for entrada in range(columna,16,4))==34)
    return magica

#Hacemos una prueba con una matriz que sepamos que es mágica
A=[8,11,14,1,13,2,7,12,3,16,9,6,10,5,4,15]
print(es_magica_4(A))
#Y con una que no
B=[8,11,1,14,13,2,7,12,3,16,9,6,10,5,4,15]
print(es_magica_4(B))

True
False


Retomaremos este problema más adelante, cuando hablemos de bactrack y búsquedas combinatorias.

## Recortes de espacio de estados con simetrías

Es usar simetrías en el espacios de estados y el problema planteado para reducir la exploración. Por ejemplo, si estamos buscando cuántas parejas $(x,y)$ de una lista de núméros suman cierto número $M$, entonces una posibilidad es que recorramos todo el espacio de estados para $x$ y $y$, pero otra forma de hacerlo es suponer que $x\leq y$ y luego tras encontrar todas las soluciones bajo esta suposición, simplemente a partir de cada pareja $(x,y)$ construir la pareja $(y,x)$.

Apliquemos esta esta idea en siguiente problema.

**Problema 10.** Se cayeron los $12$ números de un reloj. Se quieren volver a poner, uno en cada posición. No importa tanto saber la hora, pero es muy importante que la suma de tres de esos números consecutivos (en orden cíclico) no sea $13$, porque da mala suerte. ¿De cuántas formas es posible hacer esto?

Si hiciéramos una solución que explore todos los posibles estados, entonces necesitaríamos pasar por $12!$ de ellos, que son como $480$ millones. Sin embargo, podemos ahorrarnos un factor de $12$ si observamos que tenemos una simetría rotacional de orden 12: un acomodo funciona si y sólo si funcionan todas sus rotaciones. Por esta razón, basta con considerar aquellas permutaciones que comiencen con $1$ y verificar lo que queremos.

In [6]:
from itertools import permutations

numeros=[2,3,4,5,6,7,8,9,10,11,12]
test = permutations(numeros)

In [10]:
next(test)

(2, 3, 4, 5, 6, 7, 8, 9, 11, 12, 10)

In [35]:
def buena_suerte(lista):
    buena=True
    for j in range(10):
        buena = buena and (lista[(j%10)]+lista[(j+1)%10]+lista[(j+2)%10]!=13)
    return buena

soluciones=0
for lista in candidatas:
    if buena_suerte(lista):
        soluciones+=1
        
print(soluciones)

165520


Tenemos 165520 soluciones que comienzan con $1$. Si queremos regresar al problema con 10 números, todavía cada una de estas soluciones crea 10 soluciones, una por cada una de las 10 rotaciones posibles. Así, la cantidad total de soluciones es 1655200.

## Algoritmos voraces (greedy, glotones, ambiciosos)

Consisten en intentar realizar en cada momento la mejor decisión para optimizar una función. En cada problema puede que no haya una única forma de hacer "lo mejor" en cada momento, así que a veces tenemos que elegir de entre varias formas de hacer las cosas cuál nos conviene.

**Problema 11.** Se tienen números enteros positivos distintos $a_1,a_2,\ldots,a_n$. Se quiere encontrar una permutación de ellos $b_1,\ldots,b_n$ que haga la siguiente suma $$b_1+2b_2+3b_3+\ldots+nb_n$$ máxima. Resolver el problema en general, y luego ejecutarlo para:

`50, 76, 72, 52, 70, 74, 84, 16, 43, 29, 31, 77, 22, 92, 46, 38, 91, 42, 48, 98, 87, 83, 6, 44, 7, 36, 80, 11, 10, 82, 67, 90, 18, 27, 37, 86, 33, 64, 26, 9`

**Problema 12.** Se tienen $2n$ números enteros $a_1,\ldots,a_{2n}$. Hay que encontrar cuáles $n$ de ellos tienen la suma menor. Resolver el problema en general y luego ejecutarlo para:

`34, -51, -67, -42, -72, 27, -12, 55, -69, 47, 89, -54, 92, 8, 77, 82, -52, -48, -61, -90, 95, -49, 32, 18, 40, 96, 65, 44, 81, 24, 38, -4, -14, -97, -20, 63, 86, -98, -19, -8`

**Problema 13.** Se tienen $n$ bloques de longitudes enteras positivas $a_1,a_2,\ldots a_n$. Se quiere acomodarlos en forma de pirámide, de modo que se obtenga la mayor altura de pirámide posible. ¿Cuál es la altura que se obtiene? Resolver en general y luego ejecutarlo para:

`355, 572, 532, 788, 82, 433, 225, 183, 499, 374, 734, 157, 121, 53, 486, 954, 792, 97, 684, 933, 51, 868, 485, 907, 292, 349, 804, 83, 214, 704, 200, 236, 404, 276, 778, 958, 105, 500, 334, 448, 836, 890, 537, 167, 31, 398, 313, 175, 930, 342`

**Problema 14.** Se tiene la siguiente pirámide de números. Se comienza desde arriba y en cada paso se puede ir al número inferior, o bien al número inferior a la derecha, hasta que se llega a la fila de hasta abajo. 

<code>[7116]
[2675 8480]
[4356 6635 9218]
[7772 5841 2088 5391]
[4167 7727 3335 8931 4326]
[3838 2437 3248 9461 7437 6341]
[2117 5132 4482 1541 5000 8745 3782]
[6343 8811 6752 7523 2144 7855 9078 6472]
[1717 1943 8715 4741 3475 9590 7878 6717 4730]
[1683 1507 6681 1496 9129 7566 8605 3997 8064 7240]
[4668 9965 6544 1470 6365 8740 8637 6981 5703 9535 1509]
[7196 9964 7924 6509 8146 6239 4603 9728 1090 2069 8021 3227]</code>

Por ejemplo, un posible camino es:

`7116,2675,6635,2088,8931,9461,1541,2144,3475,9129,8740,4603`

Hay que encontrar el camino que vaya de hasta arriba hasta abajo cuya suma de valores sea máxima.

Comenzamos con el siguiente problema.

**Problema 11.** Se tienen números enteros positivos distintos $a_1,a_2,\ldots,a_n$. Se quiere encontrar una permutación de ellos $b_1,\ldots,b_n$ que haga la siguiente suma $$b_1+2b_2+3b_3+\ldots+nb_n$$ máxima. Resolver el problema en general, y luego ejecutarlo para:

`50, 76, 72, 52, 70, 74, 84, 16, 43, 29, 31, 77, 22, 92, 46, 38, 91, 42, 48, 98, 87, 83, 6, 44, 7, 36, 80, 11, 10, 82, 67, 90, 18, 27, 37, 86, 33, 64, 26, 9`

En este problema, el espacio de estados son todas posibles permutaciones de $a_1,\ldots,a_n$, que son $n!$. Por lo tanto, si queremos resolver el problema por exploración exhaustiva, tendríamos que verificar $\Theta(n!)$. Incluso cuando $n$ no es tan grande, esto es demasiado tiempo.

Para resolver el problema, vamos a realizar un algoritmo voraz eligiendo los $a_i$ más grandes para los coeficientes más grandes. Es decir, el máximo de los $a_i$ va a acompañar al coeficiente $n$, el siguiente al coeficiente $n-1$ y así sucesivamente.

Con esta idea, se puede proponer el siguiente algoritmo:

- Poner los $a_i$ en una lista de Python - Tiempo $O(n)$
- Tomar el $a_i$ más grande y declarlo como $b_n$ - Tiempo $O(n)$.
- Eliminar ese $a_i$ de la lista. - Tiempo $O(n)$
- Repetir para ir definiendo $b_{n-1},\ldots,b_1$. En total, tiempo $O(n^2)$.

Este algoritmo toma $O(n^2)$ tiempo en total. Se puede mejorar a tiempo $O(n\log n)$ si primero ordenamos la lista y luego de ahí ya vamos tomando los más grandes (que simplemente es ordenar).

In [28]:
A=[50, 76, 72, 52, 70, 74, 84, 16, 43, 29, 31, 77, 22, 92, 46, 38, 91, 42, 48, 98, 87, 83, 6, 44, 7, 36, 80, 11, 10, 82, 67, 90, 18, 27, 37, 86, 33, 64, 26, 9]
A.sort()
print(A)

print(sum(i*a for i,a in enumerate(A)))

[6, 7, 9, 10, 11, 16, 18, 22, 26, 27, 29, 31, 33, 36, 37, 38, 42, 43, 44, 46, 48, 50, 52, 64, 67, 70, 72, 74, 76, 77, 80, 82, 83, 84, 86, 87, 90, 91, 92, 98]
53023


Vamos a mostrar que la permutación de $a_1,\ldots,a_n$ que maximiza $a_1+2a_2+\ldots+na_n$ es precisamente en la cual tenemos los $a_i$'s ordenados.

Pensemos que tenemos una permutación $b_1,b_2,\ldots,b_n$ en la cual los $b_i$ no están en orden creciente. Como los $b_i$ no están orden creciente, debe existir una pareja de índices $i$ y $j$ tales que $i<j$ y $b_i>b_j$. Entonces la suma se ve así: $$S=\ldots + i b_i + \ldots + j b_j + \ldots.$$

Al pasar $b_i$ a la posición $j$ y $b_j$ a la posición $b_i$, la nueva suma es: $$S-i b_i-j b_j+jb_i+ib_j=S+(j-i)(b_i-b_j)>S,$$

por lo cual dicha permutación que habíamos tomado no puede ser la mayor.

**Problema 12.** Se tienen $2n$ números enteros $a_1,\ldots,a_{2n}$. Hay que encontrar cuáles $n$ de ellos tienen la suma menor. Resolver el problema en general y luego ejecutarlo para:

`34, -51, -67, -42, -72, 27, -12, 55, -69, 47, 89, -54, 92, 8, 77, 82, -52, -48, -61, -90, 95, -49, 32, 18, 40, 96, 65, 44, 81, 24, 38, -4, -14, -97, -20, 63, 86, -98, -19, -8`

Una forma de resolver el problema es con exploración exhaustiva sobre el espacio de estados de subconjuntos de $n$ elementos de un conjunto con $2n$ elementos. Para cada uno de estos subconjuntos hacemos su suma y buscamos de entre ellas la menor. Con este algoritmo tendríamos que verificar $\binom{2n}{n}$ casos. Estos son $\Omega(2^{2n})$ casos, que como es exponencial tampoco nos conviene mucho.

Una mucho mejor forma de resolverlo es tomando de entre la lista los $n$ más pequeños. Estos definitivamente tienen la suma más pequeña. ¿Cuánto tiempo tarda? Si vamos encontrando los más pequeños uno por uno leyendo la lista $n$ veces, toma tiempo $O(n^2)$, pero una mejor forma de hacerlo es ordenándolos y tomando los $n$ más pequeños.

In [31]:
A=[34, -51, -67, -42, -72, 27, -12, 55, -69, 47, 89, -54, 92, 8, 77, 82, -52, -48, -61, -90, 95, -49, 32, 18, 40, 96, 65, 44, 81, 24, 38, -4, -14, -97, -20, 63, 86, -98, -19, -8]
A.sort()
print(A)
print(len(A))
print(sum(j for j in A[:20]))

[-98, -97, -90, -72, -69, -67, -61, -54, -52, -51, -49, -48, -42, -20, -19, -14, -12, -8, -4, 8, 18, 24, 27, 32, 34, 38, 40, 44, 47, 55, 63, 65, 77, 81, 82, 86, 89, 92, 95, 96]
40
-919


**Problema 13.** Se tienen $n$ bloques de longitudes enteras positivas $a_1,a_2,\ldots a_n$. Se quiere acomodarlos en forma de pirámide, de modo que se obtenga la mayor altura de pirámide posible. Aquí una pirámide es acomodar los bloques en niveles de modo que para cada nivel, tenga más bloques que el nivel de arriba y una suma total mayor que el nivel de arriba. ¿Cuál es la altura que se obtiene? Resolver en general y luego ejecutarlo para:

`355, 572, 532, 788, 82, 433, 225, 183, 499, 374, 734, 157, 121, 53, 486, 954, 792, 97, 684, 933, 51, 868, 485, 907, 292, 349, 804, 83, 214, 704, 200, 236, 404, 276, 778, 958, 105, 500, 334, 448, 836, 890, 537, 167, 31, 398, 313, 175, 930, 342`

Una exploración exhaustiva permutando los bloques a acomodándolos seguro que resuelve el problema, pero el tiempo de ejecución será muy elevado.

Para resolver este problema, es mejor hacer lo siguiente:

- Ordenamos los bloques de menor a mayor.
- Ponemos el mayor hasta arriba, los siguientes dos en el nivel inferior, los siguientes tres en el inferior y así sucesivamente.
- La altura máxima que podamos completar totalmente es la que se obtiene con este procedimiento.

In [37]:
lista=[355, 572, 532, 788, 82, 433, 225, 183, 499, 374, 734, 157, 121, 53, 486, 954, 792, 97, 684, 933, 51, 868, 485, 907, 292, 349, 804, 83, 214, 704, 200, 236, 404, 276, 778, 958, 105, 500, 334, 448, 836, 890, 537, 167, 31, 398, 313, 175, 930, 342]
lista.sort()

j=1
suma=0
piramide=[]
suma=1
while suma<len(lista):
    fila=lista[suma-j:suma]
    piramide.append(fila)
    j+=1
    suma+=j

print("La altura máxima es {} y se puede alcanzar con la siguiente pirámide:".format(len(piramide)))
for fila in piramide:
    print(fila, "Esta fila tiene suma {}".format(sum(fila)))
    

La altura máxima es 9 y se puede alcanzar con la siguiente pirámide:
[31] Esta fila tiene suma 31
[51, 53] Esta fila tiene suma 104
[82, 83, 97] Esta fila tiene suma 262
[105, 121, 157, 167] Esta fila tiene suma 550
[175, 183, 200, 214, 225] Esta fila tiene suma 997
[236, 276, 292, 313, 334, 342] Esta fila tiene suma 1793
[349, 355, 374, 398, 404, 433, 448] Esta fila tiene suma 2761
[485, 486, 499, 500, 532, 537, 572, 684] Esta fila tiene suma 4295
[704, 734, 778, 788, 792, 804, 836, 868, 890] Esta fila tiene suma 7194


El análisis de tiempo y la correctitud quedan como tarea moral.

**Problema 14.** Se tiene la siguiente pirámide de números. Se comienza desde arriba y en cada paso se puede ir al número inferior, o bien al número inferior a la derecha, hasta que se llega a la fila de hasta abajo. 

<code>[7116]
[2675 8480]
[4356 6635 9218]
[7772 5841 2088 5391]
[4167 7727 3335 8931 4326]
[3838 2437 3248 9461 7437 6341]
[2117 5132 4482 1541 5000 8745 3782]
[6343 8811 6752 7523 2144 7855 9078 6472]
[1717 1943 8715 4741 3475 9590 7878 6717 4730]
[1683 1507 6681 1496 9129 7566 8605 3997 8064 7240]
[4668 9965 6544 1470 6365 8740 8637 6981 5703 9535 1509]
[7196 9964 7924 6509 8146 6239 4603 9728 1090 2069 8021 3227]</code>

Por ejemplo, un posible camino es:

`7116,2675,6635,2088,8931,9461,1541,2144,3475,9129,8740,4603`

Hay que encontrar el camino que vaya de hasta arriba hasta abajo cuya suma de valores sea máxima.

Al ir de arriba hacia abajo tenemos dos opciones en cada paso, así que tenemos $2^{11}$ posibles caminos. Esto no son demasiadas posibilidades y se pueden hacer fácilmente con una búsqueda exhaustiva. Sin embargo, este es un algoritmo que toma tiempo exponencial en la cantidad de renglones y no sería factible para cuando tenemos más renglones.

Una forma de mejorar este procedimiento es usando un algoritmo voraz. Pero hay que ser muy cuidadosos. Si hacemos un algoritmo voraz que de arriba hacia abajo siempre seleccione la mejor opción, es posible que falle, pues puede que por tomar la dirección del número más grande en un paso local, acabemos descartando la posibilidad de tener un número muy grande más adelante. Por ejemplo, siguiendo esta heurística, en la siguiente pirámide iríamos en el primer paso a la derecha, hacia el $54$, pero ya nunca podríamos tomar el $99$ de la esquina inferior izquierda que nos ayuda a maximizar la suma:

<code>[10]
[36 54]
[99 20 24] </code>

Sin embargo, eso no quiere decir que *ningún* algoritmo voraz funcione. A veces simplemente no hemos elegido el correcto. En este problema conviene mucho más realizar un algoritmo voraz de abajo hacia arriba. Para cada una de las entradas de la penúltima fila, ¿qué es lo mejor que puedo hacer después? Por ejemplo, en la pirámide chiquita de ejemplo, si ya llegamos al $36$ entonces lo mejor que puedo acumular a partir de ahí es $36+99=135$. Si ya llegamos al $54$, entonces lo mejor que puedo acumular desde ahí es $54+24=78$. De esta forma, podemos reemplazar el problema a ver cuál es el mejor camino en la pirámide

<code>[10]
[135 78] </code>

A partir de aquí es claro lo que hay que hacer: del $10$ ir al $135$ y de ahí hacer lo mejor posible a partir de ahí, que ya sabemos que es seguir el camino que de $135$. Esta misma idea se puede generalizar para la pirámide con $12$ filas y para una cantidad abritraria $n$ de filas:

- En el penúltimo renglón escribimos lo mejor que podemos hacer.
- De ahí, podemos decir qué es lo mejor que podemos hacer en el antepenúltimo.
- Seguimos así sucesivamente hasta el primero.
- Para recuperar el mejor camino, simplemente en cada paso hacemos lo mejor, pero considerado de esta forma.

Veamos la implementación

In [2]:
# Esta es una función auxiliar para leer la
# cadena de caracteres que tenemos y pasarla a una
# lista de listas de Python con la que podamos trabajar
# mejor.

entrada='''[7116]
[2675 8480]
[4356 6635 9218]
[7772 5841 2088 5391]
[4167 7727 3335 8931 4326]
[3838 2437 3248 9461 7437 6341]
[2117 5132 4482 1541 5000 8745 3782]
[6343 8811 6752 7523 2144 7855 9078 6472]
[1717 1943 8715 4741 3475 9590 7878 6717 4730]
[1683 1507 6681 1496 9129 7566 8605 3997 8064 7240]
[4668 9965 6544 1470 6365 8740 8637 6981 5703 9535 1509]
[7196 9964 7924 6509 8146 6239 4603 9728 1090 2069 8021 3227]'''

lineas=entrada.split('\n')
lista_buena=[]
for j in lineas:
    lista_buena.append([int(k) for k in j[1:-1].split(' ')])

for linea in lista_buena:
    print(linea)

[7116]
[2675, 8480]
[4356, 6635, 9218]
[7772, 5841, 2088, 5391]
[4167, 7727, 3335, 8931, 4326]
[3838, 2437, 3248, 9461, 7437, 6341]
[2117, 5132, 4482, 1541, 5000, 8745, 3782]
[6343, 8811, 6752, 7523, 2144, 7855, 9078, 6472]
[1717, 1943, 8715, 4741, 3475, 9590, 7878, 6717, 4730]
[1683, 1507, 6681, 1496, 9129, 7566, 8605, 3997, 8064, 7240]
[4668, 9965, 6544, 1470, 6365, 8740, 8637, 6981, 5703, 9535, 1509]
[7196, 9964, 7924, 6509, 8146, 6239, 4603, 9728, 1090, 2069, 8021, 3227]


In [3]:
# Ahora, lo que haremos es comenzar desde la linea 11 (índice 10) e iremos cambiando las entradas,
# de acuerdo a lo mejor que podemos hacer después. Ya hechos esos cambios, vamos a la línea 10,
# luego a la 9, y así sucesivamente.

for k in range(10,-1,-1):
    for j in range(k+1):
        lista_buena[k][j]=lista_buena[k][j]+max(lista_buena[k+1][j],lista_buena[k+1][j+1])
        
for linea in lista_buena:
    print(linea)

[99733]
[80926, 92617]
[72408, 78251, 84137]
[61743, 68052, 71616, 74919]
[51812, 53971, 62211, 69528, 64923]
[47645, 46244, 44659, 58876, 60597, 59501]
[40792, 43807, 41411, 40245, 49415, 53160, 47708]
[29722, 38675, 36616, 36929, 38704, 44415, 43926, 38809]
[23329, 23379, 29864, 28849, 29406, 36560, 34848, 32337, 30350]
[21612, 21436, 21149, 16007, 24108, 25931, 26970, 20706, 25620, 24796]
[14632, 19929, 14468, 9616, 14511, 14979, 18365, 16709, 7772, 17556, 9530]
[7196, 9964, 7924, 6509, 8146, 6239, 4603, 9728, 1090, 2069, 8021, 3227]


Con esto tenemos que el mejor camino tiene suma $99733$. Observa que el algoritmo corre en milisegundos. Aún no hemos dicho cómo reportar el camino, sino solamente el máximo que obtenemos. Esta parte queda como tarea moral. El análisis de tiempo y la correctitud también quedan como tarea moral.

## Divide y vencerás

Es partir un problema en problemas más pequeños, que no necesariamente sean instancias del mismo problema. Algunas formas en las que sucede esto es:

- Partiendo correctamente el problema en funciones auxiliares que sean conceptualmente más fáciles de crear y fáciles de utilizar.
- Resolviendo el problema para una familia de instancias y luego usar estas instancias para resolver las demás.
- Resolver el problema por casos.
- Resolver el problema de manera recursiva.

### Multiplicación binaria

Supongamos que tenemos dos números binarios $x$ y $y$ de $n$ dígitos, y queremos multiplicarlos. Por conveniencia, asumimos que su largo es potencia de 2 (aunque el caso general no es muy diferente). Luego, partimos a ambos en partes izquierda y derecha, de tamaño $n/2$:

$$
\begin{align}
x &= x_L \cup x_R = 2^{n/2}x_L + x_R\\
y &= y_L \cup y_R = 2^{n/2}y_L + y_R\\
\end{align}
$$

Por ejemplo, si $x=10110110_2$, entonces:

$$
\begin{align}
x_L &= 1011_2\\
x_R &= 0110_2\\
x &= 2^4\times 1011_2 + 0110_2
\end{align}
$$

Por lo tanto, el producto de $x$ y $y$ puede escribirse como:

$$
\begin{align}
xy &= (2^{n/2}x_L+x_R)(2^{n/2}y_L+y_R)\\
&= 2^nx_Ly_L + 2^{n/2}(x_Ly_R + x_Ry_L) + x_Ry_R
\end{align}
$$

Las multiplicaciones por potencias de 2 son sencillas (simplemente bit-shifts hacia la izquierda). Por otro lado, hay cuatro multiplicaciones de números de tamaño $n/2$: $x_Ly_L, x_Ry_L, x_Ly_R, x_R,y_R$. Podemos resolverlas haciendo cuatro llamadas recursivas a nuestra función, el caso base siendo cuando ambos números tienen un solo bit.

Escribiendo entonces el algoritmo:

In [197]:
def binary_pair(x, y):
    xb = bin(x).replace('0b', '')
    yb = bin(y).replace('0b', '')
    maxlen = max(len(xb), len(yb))
    xb = xb.rjust(maxlen, '0')
    yb = yb.rjust(maxlen, '0')
    return xb, yb

In [189]:
def binary_mul(x, y):
    assert len(x) == len(y), "Los números no tienen el mismo largo!"
    
    n = len(x)
    if n == 1:
        if x == '0' or y == '0':
            return '0'
        else:
            return '1'
    
    xl, xr = x[:n//2], x[n//2:]
    yl, yr = y[:n//2], y[n//2:]
    
    xlyl = int(binary_mul(xl, yl), 2)
    xryl = int(binary_mul(xr, yl), 2)
    xlyr = int(binary_mul(xl, yr), 2)
    xryr = int(binary_mul(xr, yr), 2)

    res = (xlyl<<n) + ((xlyr + xryl)<<(n//2)) + (xryr)
    return bin(res).replace('0b', '')

In [198]:
a, b = binary_pair(10, 8)
binary_mul(a, b)

'1010000'

In [200]:
int('1010000', 2)

80

Haciendo el análisis de complejidad, esto nos da una ecuación recursiva de la forma:

$$
T(n) = 4T\left(\frac{n}{2}\right) + O(n)
$$

Resolviendo utilizando el teorema maestro, obtenemos que la complejidad de la función es $O(n^2)$, la misma que si hiciéramos multiplicación "de primaria" (dígito por dígito). ¿Cómo podemos mejorarla?

Podemos aplicar un truco atribuido a (para variar) Gauss: él se dio cuenta que si consideramos el producto de dos números complejos:

$$
(a+bi)(c+di) = ac-bd + (bc+ad)i
$$

En principio parece requerir de cuatro multiplicaciones. Sin embargo, en realidad puede ser hecho con tan solo tres: $ac$, $bd$, y $(a+b)(c+d)$, ya que:

$$
bc+ad = (a+b)(c+d) - ac - bd
$$

Aplicándolo entonces a nuestro algoritmo, recordemos que tenemos la fórmula:

$$
xy = 2^nx_Ly_L + 2^{n/2}(x_Ly_R + x_Ry_L) + x_Ry_R
$$

Aplicando el truco de Gauss:

$$
x_Ly_R + x_Ry_L = (x_R+x_L)(y_R+y_L) - x_Ry_R - x_Ly_L
$$

Con lo cual obtenemos:

In [209]:
def binary_mul_2(x, y):
    assert len(x) == len(y), "Los números no tienen el mismo largo!"

    n = len(x)
    if n == 1:
        if x == '0' or y == '0':
            return '0'
        else:
            return '1'
    
    xl, xr = x[:n//2], x[n//2:]
    yl, yr = y[:n//2], y[n//2:]
    
    p1 = int(binary_mul_2(xl, yl), 2)
    p2 = int(binary_mul_2(xr, yr), 2)
    
    s1 = int(xl, 2) + int(xr, 2)
    s2 = int(yl, 2) + int(yr, 2)
    s1, s2 = binary_pair(s1, s2)
    p3 = int(binary_mul_2(s1, s2), 2)

    res = (p1<<n) + ((p3-p1-p2) << (n//2)) + p2
    return bin(res).replace('0b', '')

In [211]:
a, b = binary_pair(10, 8)
# binary_mul_2(a, b)

In [205]:
int('1000000', 2)

64

## Algoritmos recursivos

Es una situación especial de la heurística de divide y conquista, en la cual ponemos a la instancia grande un problema en términos de instancias pequeñas del *mismo* problema.

Muchos lenguajes de programación permiten hacer cosas del siguiente estilo:

```
definir resolver(instancia grande):
    decir qué hacer si estamos en el caso base
    hacer cosas para obtener instancias pequeñas
    resolver(instancias pequeñas)
    hacer cosas para combinar soluciones de instancias pequeñas
    regresar resultado
```
    
Aquí la función `resolver` se cita a sí misma, de manera muy parecida a como las sucesiones recursivas, como la de Fibonacci, están en términos de ellas mismas. Para que el algoritmo esté bien definido, la función debe decir que hacer con uno (o más) casos base. Veamos un par de ejemplos muy sencillos en Python:
- Uno en donde definimos la función "multiplicación por $3$" en términos de la función suma para los números naturales.
- Otro en donde definimos la función factorial.

In [6]:
def multi_3(n):
    if n==0:
        #Este es el "caso base" en donde decimos que multiplicar por cero da cero
        return 0
    else:
        #En esta linea es en la que hacemos recursión
        anterior=multi_3(n-1)
        return 3+anterior

print(multi_3(8))

def factorial(n):
    if n==0:
        return 1
    else:
        return n*(factorial(n-1))
    
print(factorial(100))

24
93326215443944152681699238856266700490715968264381621468592963895217599993229915608941463976156518286253697920827223758251185210916864000000000000000000000000


**Problema 15.** Escribe un algoritmo recursivo que cree una lista de todas las permutaciones de $n$ elementos.

**Problema 16.** Escribe un algoritmo recursivo que decida si una palabra es palíndroma o no, es decir, que diga si la palabra se lee igual al derecho que al revés.

**Problema 15.** Escribe un algoritmo recursivo que cree una lista de todas las permutaciones de $n$ elementos.

Hagamos una lista de las permutaciones para poquitos elementos.

$n=1$

$1$

$n=2$

$12, 21$

$n=3$

$123,132,213,231,312,321$

$n=4$

?

Esbozo:
- Cuando tenemos un elemento, regresamos el elemento.
- Cuando tenemos $n$ elementos, primero hacemos las permutaciones de $n-1$ elementos y luego en cada una de ellas ponemos el $n$-ésimo elemento en cada posición.


In [21]:
def permutaciones(lista):
    if len(lista)==1:
        return([lista])
    else:
        anteriores=permutaciones(lista[:-1])
        ultimo=lista[-1]
        nuevas=[]
        for anterior in anteriores:
            for j in range(len(anterior)+1):
                nueva=anterior[:j]+[ultimo]+anterior[j:]
                nuevas.append(nueva)
        return(nuevas)

for j in permutaciones(['naranja','manzana','pera']):
    print(j)
    
for j in permutaciones([1,2,3,4]):
    print(''.join([str(d) for d in j]))

['pera', 'manzana', 'naranja']
['manzana', 'pera', 'naranja']
['manzana', 'naranja', 'pera']
['pera', 'naranja', 'manzana']
['naranja', 'pera', 'manzana']
['naranja', 'manzana', 'pera']
4321
3421
3241
3214
4231
2431
2341
2314
4213
2413
2143
2134
4312
3412
3142
3124
4132
1432
1342
1324
4123
1423
1243
1234


**Problema 16.** Escribe un algoritmo recursivo que decida si una palabra es palíndroma o no, es decir, que diga si la palabra se lee igual al derecho que al revés.

Para resolverlo en términos recursivos, debemos pensar en los casos base que tenemos. Pensaremos en que el caso base consiste de las palabras de o bien $1$ caracter, o bien ningún caracter. En ambos casos, estas palabras son palíndromas.

Si tenemos una palabra más larga, es decir, con tres o más caracteres, una cosa que podemos hacer es comparar el primero con el último y ver si son iguales o no. Si no son iguales, entonces la palabra ya no fue palíndroma. Si sí son iguales, entonces el problema se reduce a que la palabra quitando el primero y el último sea palíndroma.

In [28]:
def palindroma(palabra):
    if len(palabra)==0 or len(palabra)==1:
        return True
    if palabra[0]!=palabra[-1]:
        return False
    else:
        return palindroma(palabra[1:-1])
    
print(palindroma('reconocer'))
print(palindroma('alegría'))
print(palindroma('a'))
print(palindroma(''))
print(palindroma('tassat'))
print(palindroma('tatsat'))

True
False
True
True
True
False


## Búsqueda combinatoria y backtrack

Cuaderno adicional de Jupyter

## El teorema maestro

En mucho algoritmos del estilo de divide y conquista se hace una recursión del siguiente estilo

`problema(n):
    dividir el problema en a sub-problemas de tamaño b/n
    resolver problema para cada uno de ellos (recursión)
    combinar las respuestas
`

El teorema maestro ayuda a saber cuánto tiempo se tardan este tipo de algoritmos bajo ciertas hipótesis sobre $a$, $b$ y el tiempo de dividir el problema en subproblemas y de combinar las respuestas.

**Teorema.** Supongamos que tenemos una función que satisface la siguiente ecuación recursiva: $$T(n)=aT(n/b)+f(n).$$

en donde $a\geq 1$ y $b>1$ son constantes y $f(n)$ es una función positiva. Definamos $d=\log_b a=\log a / \log b$, al cual le llamaremos el **exponente crítico**. Entonces, tenemos los siguientes tres casos:

1) Si $f(n)=O(n^{d-\epsilon})$ para alguna constante $\epsilon>0$, entonces $T(n)=\Theta(n^d)$.

2) Si $f(n)=\Theta(n^d \log ^k n)$ para alguna $k\geq 0$, entonces $T(n)=\Theta(n^d\log^{k+1}n)$.

3) Si $f(n)=\Omega(n^{d+\epsilon})$ para alguna constante $\epsilon>0$ y además $f(n)$ satisface la **condición de regularidad** $af(n/b)<cf(n)$ para alguna constante $c<1$ y $n$ suficientemente grande, entonces $T(n)=\Theta(f(n))$.


**Ejemplo.** Usa el teorema maestro para resolver asintóticamente las siguiente recursiones. Hay una de ellas a la que no se le puede aplicar el teorema. Di cuál es y por qué.

a) $T(n)=3T(n/2)+n^2$.

b) $T(n)=4T(n/2)+n^2$.

c) $T(n)=2^nT(n/2)+n^n$.

d) $T(n)=16T(n/4)+n$.

a) En efecto $a=3\geq1$, $b=2> 1$ y $f(n)=n^2$, así que las hipótesis iniciales se cumplen. En este problema, el exponente crítico es $d=\log 3/ \log 2 \approx 1.585$. Notemos que 
$$f(n)=n^2=\Omega(n^2)=\Omega(n^{d+\epsilon}).$$ 

Además, tenemos que $3f(n/2)=\frac{3}{4}n^2<\frac{4}{5}n^2$, por lo que se cumple la regularidad con $c=4/5$. Así, estamos en el caso (3) del teorema maestro. Por lo tanto, tenemos que $T(n)=\Theta(n^2)$.

b) En efecto $a=4\geq1$, $b=2>1$ y $f(n)=n^2$ es positiva, así que las hipótesis iniciales se cumplen. En este problema, el exponente crítico es $d=\log 4/ \log 2 = 2$. Notemos que 

$$f(n)=n^2=\Theta(n^d).$$ 

Así, estamos en el caso (2) del teorema maestro, con $k=0$. Por lo tanto, tenemos que $T(n)=\Theta(n^2\log n)$.

c) Notemos que $a=2^n$, que no es una constante, de modo que no podemos aplicar el teorema maestro.

d) En efecto $a=16\geq 1$, $b=4>1$ y $f(n)=n$ es positiva, así que las hipótesis iniciales se cumplen. En este problema, el exponente crítico es $d=\log 16/ \log 4 = 2$. Notemos que 

$$f(n)=n=O(n^d).$$



Así, estamos en el caso (1) del teorema maestro y por lo tanto $T(n)=O(n^2)$.

In [4]:
import numpy as np

print(np.log(3)/np.log(2))
print(np.log(4)/np.log(2))
print(np.log(16)/np.log(4))

1.5849625007211563
2.0
2.0


**Ejercicio.** Resuelve las siguiente recursiones usando el teorema maestro o explica por qué no se puede usar. 10, 13, 16, 19

a) $T(n)=16T(n/4)+n!$.

b) $T(n)=3T(n/3)+\sqrt{n}$.

c) $T(n)=3T(n/3)+n/2$.

d) $T(n)=64T(n/8)-n^2\log n$.

Revisar respuestas en https://people.csail.mit.edu/thies/6.046-web/master.pdf

Cuando estamos ordenando por recursión, lo que hacemos es partir el problema de $n$ números en $2$ problemas con $n/2$ números. La división y recombinación toma tiempo lineal, así que el tiempo total es $$T(n)=2T(n/2)+cn.$$

Notemos que $a=b=2>1$ y que $cn$ es positiva, de modo que podemos usar el teorema maestro. El exponente crítico es $d=\log 2 / \log 2 = 1$. Tenemos que $f(n)=cn=O(n^d)$, de modo que estamos en el caso (2) del teorema maestro. Entonces $T(n)=\Theta(n\log n)$.

Cuando estamos haciendo búsqueda binaria, lo que hacemos es partir el problema en un problema de $n/2$ números y para hacer esto necesitamos tiempo constante. Así que el tiempo de ejecución es recursivamente $$T(n)=T(n/2)+f(n).$$

Tenemos $a=1\geq 1$, y $b=2>2$. Además la función $f(n)$ es positiva y $O(1)$. El exponente crítico es $d=\log 1 \ log 2 = 0$ y tenemos entonces que $f(n)$ es comparable a $n^d=1$. Estamos de nuevo en el caso 2 del teorema maestro y por lo tanto el tiempo total de ejecución satisface $T(n)=\Theta(\log n)$.




## Programación dinámica

Pensemos que queremos calcular los términos de la sucesión de Fibonacci usando la computadora. Recordemos que la sucesión de Fibonacci está definida por $F_0=0$, $F_1=1$ y para cada $n\geq 0$ se tiene que $F_{n+2}=F_{n+1}+F_{n}$.

Una posible forma de hacerlo es mediante recursión. Podemos escribir un algoritmo que haga lo siguiente:

`def fibonacci(n):
    si n=0, regresar 0
    si n=1, regresar 1
    si n>=2, regresar fibonacci(n-1)+fibonacci(n-2)`
    
Veamos que esto funciona correctamente.

Los primeros Fibonaccis son 0,1,1,2,3,5,8,13,21,34,55,89,144,...

In [1]:
def fibonacci(n):
    if n==0:
        return 0
    if n==1:
        return 1
    return fibonacci(n-1)+fibonacci(n-2)

In [10]:
print(fibonacci(37))

24157817


Notemos que este algoritmo es exponencial pues hay varios subproblemas que estamos resolviendo varias veces y no estamos aprovechando que ya los resolvimos. En este problema muy particular, nos conviene mucho más ir almacenando la respuesta a subproblemas que ya resolvimos.

Esto lo podemos hacer de varias formas, por ejemplo, podríamos ir almacenando los números de Fibonacci en una lista de Python.

In [16]:
lista_fib=[0,1]
def fibonacci_cache(n,lista_fib):
    if len(lista_fib)>=n+1:
        return(lista_fib[n])
    else:
        nuevo_fib=fibonacci_cache(n-1,lista_fib)+fibonacci_cache(n-2,lista_fib)
        lista_fib.append(nuevo_fib)
        return nuevo_fib
    
fibonacci_cache(1000,lista_fib)

43466557686937456435688527675040625802564660517371780402481729089536555417949051890403879840079255169295922593080322634775209689623239873322471161642996440906533187938298969649928516003704476137795166849228875

Notemos que ahora el tiempo es nada más lineal, pues no es necesario entrar a la recursión tantas veces. Sin embargo, estamos pagando en espacio una cantidad $O(n)$ pues el objeto lista_fib tiene que ir almacenando a todos los Fibonaccis.

Podemos mejorar este algoritmo todavía más pues muy pronto dejamos de utilizar los primeros valores de la sucesión de Fibonacci para calcular los más grandes. Por ejemplo, para $F_5$ ya no necesitamos acordarnos de $F_0,F_1,F_2$

In [20]:
def fib_dp(n):
    a=0
    b=1
    for j in range(n):
        a,b=b,a+b
    return(a)

print(fib_dp(10000))

3364476487643178326662161200510754331030214846068006390656476997468008144216666236815559551363373402558206533268083615937373479048386526826304089246305643188735454436955982749160660209988418393386465273130008883026923567361313511757929743785441375213052050434770160226475831890652789085515436615958298727968298751063120057542878345321551510387081829896979161312785626503319548714021428753269818796204693609787990035096230229102636813149319527563022783762844154036058440257211433496118002309120828704608892396232883546150577658327125254609359112820392528539343462090424524892940390170623388899108584106518317336043747073790855263176432573399371287193758774689747992630583706574283016163740896917842637862421283525811282051637029808933209990570792006436742620238978311147005407499845925036063356093388383192338678305613643535189213327973290813373264265263398976392272340788292817795358057099369104917547080893184105614632233821746563732124822638309210329770164805472624384237486241145309381220656491403

**Problema.** Dado un entero no negativo $n$ y un entero $0\leq k \leq n$, calcular el coeficiente binomial $\binom{n}{k}$.

Pensemos en cómo resolver el problema para encontrar $\binom{500}{37}$

Un algoritmo recursivo que use la fórmula de Pascal sin ideas de caché toma demasiado tiempo.

In [14]:
def binomial(n,k):
    if k==0 or k==n:
        return 1
    else:
        return binomial(n-1,k) + binomial(n-1,k-1)
    
print(binomial(500,37))

20708500


Agregando ideas de caché, se puede calcular mucho más rápido.

In [19]:
Binom=[]
for j in range(501):
    nuevo_renglon=(j+1)*[0]
    nuevo_renglon[0]=1
    nuevo_renglon[-1]=1
    Binom.append(nuevo_renglon)
    
def binomial_cache(n,k,Binom):
    if Binom[n][k] == 0:
        Binom[n][k] = binomial_cache(n-1,k,Binom) + binomial_cache(n-1,k-1,Binom)
        return Binom[n][k]
    else:
        return Binom[n][k]
    
print(binomial(500,37,Binom))

134914722808517751536999098076641485009511775957661594000


*Reto.* Implementar un algoritmo que calcule coeficientes binomiales en tiempo $O(n^2)$ y espacio $O(n)$.

Dada una secuencia de números $a_1,a_2,a_3,a_4,\ldots,a_n$ una sub-secuencia consiste de tomar algunos de ellos de izquierda a derecha.

**Ejemplo.** Si tenemos a la secuencia $$10,15,8,4,2,3,1,9,12,21,5,7,$$ una posible subsecuencia es $$8,4,1,9,5.$$

Una secuencia es creciente cuando sus elementos de izquierda a derecha están en orden creciente.

**Ejemplo.** La secuencia $$10,15,18,21,35$$ está en orden creciente. La secuencia $$10,15,35,21,18$$ no está en orden creciente pues $35$ está a la izquierda de $18$ pero $35>18$.


**Problema.** Dada una secuencia $a_1,\ldots,a_n$, encontrar la subsecuencia creciente más grande.

Para plantear este problema de manera recursiva, nos conviene mucho más plantear un problema un poquito más general.

**Problema.** Dada una secuencia $a_1,\ldots,a_n$ y un índice $j$, encontrar la subsecuencia creciente más grande que termina en la posición $j$.

Este es un mejor problema, pues se puede resolver en términos recursivos. La subsecuencia más grande que termina en la posición $j$ es de tamaño $1$ si $a_j$ es menor que todos los anteriores y si es mayor que alguno de los anteriores entonces es uno más que la subsecuencia más grande anterior y que se pueda extender con $a_j$.

Implementemos esto con programación dinámica, almacenando las respuestas de $1$ a $n$.

In [33]:
secuencia=[10,15,8,4,2,3,1,9,12,21,5,7]
auxiliar=[]
padres=[]

for j in range(len(secuencia)):
    nuevo=1
    padre=-1
    for k in range(j):
        if secuencia[k]<secuencia[j] and auxiliar[k]+1>nuevo:
            nuevo=auxiliar[k]+1
            padre=k
    auxiliar.append(nuevo)
    padres.append(padre)
    
print(auxiliar)
print(padres)

mayor_long=0
mayor_long_ind=-1
for j in range(len(auxiliar)):
    if auxiliar[j]>mayor_long:
        mayor_long_ind=j
        mayor_long=auxiliar[j]

print('La subsecuencia más grande termina en el índice {} y es de longitud {}'.format(mayor_long_ind,mayor_long))

subsecuencia=[]
indice=mayor_long_ind

while indice!=-1:
    subsecuencia=[secuencia[indice]]+subsecuencia
    indice=padres[indice]
    
print('Una posible subsecuencia más grande es {}'.format(subsecuencia))

[1, 2, 1, 1, 1, 2, 1, 3, 4, 5, 3, 4]
[-1, 0, -1, -1, -1, 4, -1, 5, 7, 8, 5, 10]
La subsecuencia más grande termina en el índice 9 y es de longitud 5
Una posible subsecuencia más grande es [2, 3, 9, 12, 21]


*Reto.* Hacer un algoritmo que encuentre todas las subsecuencias crecientes de longitud máxima.

## Métodos probabilísticos (*)