# Heurísticas de creación de algoritmos

En general, tenemos dos tipos de problemas algorítmicos.: 

- **Optimización.** Queremos encontrar un mínimo o un máximo para un problema en cierto **espacio de estados**
- **Decisión.** Queremos responder de sí/no también para un problema en cierto espacio de estados

No todos los problemas de algoritmos son así, pero una cantidad muy grande de los que son intersantes sí. Por ejemplo, insertar un elemento en una lista no está intentando optimizar ni decidir nada. Pero hay algunos problemas que ya hemos vito de este estilo. El problema de buscar un elemento en un diccionario es un problema de decisión: dado un diccionario $D$ y un elemento $x$, lo que queremos responder es si $x$ está en $D$. 

Veamos algunos ejemplos más: 

- **Resolver un Sudoku.** Dadas entradas en un tablero de Sudoku, decidir si hay una solución que lo complete o no. También, decidir si esta solución es única o no. 
- **Brazo robótico que une circuitos.** Dados puntos en el plano, queremos encontrar un ciclo hamiltoniano de longitud mínima que los recorre. 
- **Decidir el número cromático de una gráfica.** Dada una gráfica $G$ queremos encontrar la mínima cantidad posible de colores necesarios para poder dar una buena coloración.
- **Determinar el número de clique de una gráfica.** Dada una gráfica $G$ queremos encontrar la máxima cantidad posible de vértices que forman una gráfica completa. 
- **Determinar si una gráfica es bipartita o no.** Dada una gráfica $G$, ver si existe una partición de sus vértices en conjuntos $A$ y $B$ de mode que las únicas aristas vayan de $A$ a $B$. 

El primero y último son algoritmos de decisión, mientras que los demás son algoritmos de optimización. 

## Espacio de estados
En un problema de decisión o de optimización, es muy importante que quede claro el **espacio de estados**, es decir, todas las posibles configuraciones/entradas que debemos considerar para poder resonder la pregunta. Para ello, en problemas de aplicación es muy importante decidir cómo estamos modelando el problema. 

Espacios de estados típicos en varios de estos problemas son: 

- Todas las permutaciones de $n$ elementos
- Todos los conjuntos de $n$ elementos
- Todas las configuraciones de $n$ puntos en el plano
- Todas los números del $1$ al $n$
- Para cierta $k$, todos subconjuntos de tamaño $k$ de $n$ elementos
- Todos los vectores de $m$ elementos tomados de un conjunto de $n$ elementos

**Ejemplo.** Dada una lista de $n$ números, queremos:

- Decidir si hay dos de ellos cuya suma es $1000$
- Decidir cuáles dos de ellos tienen la suma más pequeña

El primer problema es un problema de decisión. El segundo es un problema  de optimización. Notemos que ambos problemas tienen como espacio de estados a los subconjuntos de $2$ elementos de un cocnjunto de $n$ elementos. 

Hay otros problemas que tienen espaciones de estados más complicados, o m´sa particulares al problema. Por ejemplo, consideremos los siguientes dos problemas: 

**Ejemplo.** 

- ¿Será posible colocar 15 caballos de ajedrez en un problema sin que se ataquen entre sí?
- ¿Cuál es el máximo número de caballos de ajedrez que se pueden poner en un tablero de ajedrez sin que se ataquen entre sí?
- ¿Será posible colocar $3$ torres, $5$ caballos y  $4$ alfiles sin que se ataquen entre sí? 


# Heurísticas algorítmicas

Ya que tenemos un problema algortítmico de decisión o de optimización y entendemos bien cuál es el espacio de estados que debemos estudiar, lo siguiente es saber dónde en ese espacio de estados se encuentra la solución óptima o bien, la instancia que cumple lo que queremos. 

Hay muchas formas de resolver este tipo de problemas algorítmicos, pero en transcurso de la historia del análisis de algoritmos, estas formas se han agrupado en **heurísticas** generales que ayudan en muchas situaciones.

A continuación ponemos algunas:

- Explorar todo el esapcio de estados (fuerza bruta): consiste en estudiar todos los elementos del espacio de estados uno por uno para ver si son el óptimo/cumplen la propiedad que queremos.
- Explorar el espacio de estados de manera inteligente: consiste en estudiar parcialmente el espacio de estados, descartando con suficiente anticipación las exploraciones que ya no serán exitosas. 
- Explorar el espacio de estados de manera voraz (greedy)
- Reducir el espacio de estados con argumentos de simetría
- Dividir el problema que queremos en problemas más pequeños que sean más sencillos de resolver. 
- Explotar una estructura recursiva de los objetos del problema para poner soluciones a instancias grandes en términos de soluciones de instancias más pequeñas
- Programación dinámica: hacer lo anterior con mucho más cuidado para no repetir múltiples veces el cómputo para casos pequeños

## Exploración exhaustiva
Consiste en explorar todo el espacio de estados para buscar el valor óptimo o el testigo. Es una técnica básica, pero que a veces es la única con la que cocntamos. Usualmente es la única opción en problemas con muy poca estructura, o en probelams en donde queremos asegurarnso de pasar por todas las posibilidades. 

También se le conoce como "fuerza bruta", o como "explorar por completo el espacio de estados". 

### Problema 1
¿De cuántas formas se pueden poner a $10000$ como suma de cuadrados de dos números enteros positivos? ¿En cuál de las expresiones $x^2 + y^2 = 10000$ se minimiza $3x + 5y -1$. 

Para el Problema 1, el espacio de estados que queremos explorar son las parejas $(x,y)$ con $x$ y $y$ en el intervalo $[1,99]$. Una exploración exhaustiva verifica todos los casos posbiles. Haremos esto en Python haciendo dos ciclos.

In [5]:
# Primero, la exporación exhaustiva para ver quienes son todas las parejas
cuantos = 0
cuales = []
for x in range(1,100):
    for y in range(1,100):
        if x**2 + y**2 == 10000:
            cuantos += 1
            cuales += [(x,y)]
print(cuantos)
print(cuales)

# Ahora, hagamos otra exploración para ver en qué pareja se minimiza 3x+5y-1
minimo = 100000000
for pair in cuales:
    x = pair[0]
    y = pair[1]
    if 3*x + (5*y) -1:
        minimo = 3*x + (5*y) - 1
        optimo = (x, y)

print(minimo)
print(optimo)

4
[(28, 96), (60, 80), (80, 60), (96, 28)]
427
(96, 28)


Pensemos que el Problema 1 se generaliza para dos números $x$ y $y$ que queremos que su cuadrado sume $n$. En este caso, el espacio de estados sería, de acuerdo a nuestra estrategia anterior, que $x$ y $y$ estén en ${1,2, \ldots, \lceil \sqrt{n} \rceil}$

En el primer ciclo estamos ccorriend por $O(\sqrt{n})$ elementos y el que está anidado también corre por $O(\sqrt{n})$ así que estos ciclos anidados corren en tiempo $O(n)$. Con este tiempo se puede tanto determinar cuáles parejas son, como determinar cuál es el mínimo de la expresión $3x+5y-1$ sujeta a las condiciones $x^2 + y^2 =n$ y $x,y$  enteros.

### Problema 2

Se tomas tres enteros $a$, $b$ y $c$ en el intervalo $[1, 100 ]$. ¿Para cuáles de ellos al valor de $a^2 + 2b^2 + 3c^2 - 2ab -5bc -7ca$ es mínimo?

In [9]:
def funcion(a, b, c):
    return (a**2 + 2*b**2 + 3*c**2-2*a*b-5*b*c-7*c*a)

minimo = 10000000
for a in range(1,101):
    for b in range(1, 101):
        for c in range(1, 101):
            F = funcion(a,b,c)
            if F < minimo:
                minimo = F
                optimo = (a,b,c)

print(minimo)
print(optimo)

-80000
(100, 100, 100)


Este problema se presta mucho a una exploración exhaustiva total, pues no hay tanta simetría en las variables $x,y,z$. Si el problema fuera para números en el intervalo $[1,\ldots,n]$ entonces el algoritmo de acá arriba ccorre en tiempo $O(n^3)$.

### Problema 3.
¿Cuál es la palabra más larga en español que tenga únicamente cuatro vocales? 

Tomaremos como espacio de estados la lista en <a href="http://www.gwicks.net/dictionaries.html"> este sitio </a>

Vamos a hacer una exploración exhaustiva palabra por palabra para determinar cuáles tienen exactamente cuatro palabras y ver cuáles de ellas es la más grande. 


In [2]:
vocales = 'aeiouáéíóúAEIOUÁÉÍÓÚüÜ'
def contarvocales(palabra):
    cuenta = 0
    for j in palabra:
        if j in vocales:
            cuenta += 1
    return cuenta

print(contarvocales('Hola mundo!'))
print(contarvocales('Esta oración tiene acentos'))
print(contarvocales('PIngüinos y MurCIELAgos'))

4
12
9


In [16]:
vocales = 'aeiouáéíóúAEIOUÁÉÍÓÚüÜ'
lista = open('espanol.txt', 'r', encoding='ISO-8859-1')
linea = lista.readline()
maximo = 0
while linea:
    limpio = linea.split(' ')[0]
    if contarvocales(limpio) == 4:
        if len(linea) > maximo:
            maximo = len(limpio)
            mejor = limpio
    linea = lista.readline()

print(maximo)
print(mejor)

13
yuxtapondrán



**Problema 4.** ¿Existe alguna palabra en español que use exactamente diez vocales y diez consonantes? Si sí, ¿cuántas hay?

In [7]:
lista = open('espanol.txt', encoding='ISO-8859-1')
linea = lista.readline()
testigos = []
vocs = 10
consonantes = 20
while linea:
    limpio = linea[:-1].split(' ')[0]
    if contarvocales(limpio) == vocs and len(limpio) == consonantes:
        testigos.append(limpio)
    linea = lista.readline()

print(f'Hay {len(testigos)} palabras con {vocs} vocales y {consonantes} consonantes.')
for t in testigos:
    print(t)
lista.close()

Hay 2 palabras con 10 vocales y 20 consonantes.
desnacionalizaciones
impermeabilizaríamos


Consideremos el siguiente problema que se parece al anterior, pero en vez de ser de decisión es de optimización:

**Problema.** Encontrar el mayor entero $k$ tal que en español hay una palabra que use exactamente $k$ vocales y $k$ consonantes. 

Observemos que podemos resolver este problema de optimización resolviendo varias instancias del siguiente problema de decisión:

**Problema.** Dado un entero $k$, determinar si en español hay una palabra que use exactamente $k$ vocales y $k$ consonantes.
 
 Aunque a veces este estrategia es lo mejor para algunos problemas, hay otros problemas en los que hay mejores formas de resolver la versión de optimización. 


**Problema 5.** Las letras $a,b,c,d,e,f,g, h, i, j$ representan dígitos distintos, ¿para cuántas elecciones tenemos que $\frac{abcde}{fghij}$ es un número entero? Aquí $abcde$ y $fghij$ son los números de cinco dígitos obtenidos de concatenar los dígitos correspondientes. 

Aquí hay que decidir cuidadosamente el espacio de estados. Si elegimos como espacio de estados que cada letra tome cada una de las 10 posibilidades que tiene, y luego verificamos duplicados y luego procesamos, se tendrán que verificar $\approx 10^{10}$ casos. Esto es demasiado, pues son 10 mil millones de casos. 

¿Queremos que sean todas las permutaciones posibles? Son $10!=3628800$. Está bien, no son tantísimas. Pero este sería un tiempo imposible para permutaciones de más números. 

In [11]:
def perms(lista):
    L = len(lista)
    if L == 1: 
        return [lista]
    else:
        old = perms(lista[:-1])
        last = lista[-1]
        new = []
        for k in range(L):
            for perm in old:
                to_add = perm[:k] + [last] + perm[k:]
                new.append(to_add)
        return new

numeros = list(range(1, 11))
permutaciones = perms(numeros)
print(len(permutaciones))

3628800


In [13]:
soluciones = []
for pi in permutaciones:
    first = [str(j) for j in pi[:5]]
    last = [str(j) for j in pi[5:]]
    a = int(''.join(first))
    b = int(''.join(last))
    if a % b == 0:
        soluciones.append((a,b))
    
print(f'Hay {len(soluciones)} soluciones')

Hay 21 soluciones


## Exploración exhaustiva recortada

Consiste en dejar de explorar posibilidades que ya no se pueden extender a posibilidades exitosas. Esto no es lo miso que reducir el espacio de estados. Tampoco quiere decir que no exploremos todas las posibilidades. Consiste en dar argumetnos para que nuestro algoritmo revise menos casos y siga dando la respuesta correcta. 

Retomemos uno de los problemas de la sección anterior:

### Problema 1
¿De cuántas formas se pueden poner a $10000$ como suma de cuadrados de dos números enteros positivos? ¿En cuál de las expresiones $x^2 + y^2 = 10000$ se minimiza $3x + 5y -1$. 

Recortemos el espacio de estados a partir de las siguientes dos observaciones:
- Ambos $x$ y $y$ tiene que se pares
- Si $x$ ya está dada, no tiene chiste mover $y$ por todos sus valores posibles de $1$ a $100$ pues por tamaño ya solo puede tenre pocas posibilidades.

$y$ ya solo puede ser a lo mucho $\approx{\sqrt{10000 - x^2}}$. Esto ahorra algunos pasos- 

Los otros problemas 

In [14]:
soluciones = []
for x in range(1, 101):
    for y in range(1, int((10000-x**2)**(0.5)+1)):
        if x**2 + y**2 == 10000:
            soluciones.append((x,y))
print(soluciones)

[(28, 96), (60, 80), (80, 60), (96, 28)]


## Problemas de exploración exhaustiva recortada

Pongamos otros cuantos problemas que se pueden estudiar usando un recorte de espacio de estados. 

**Problema 6.** Tenemos que encontrar todas la parejas de palabras $x$ y $y$ en español que sean diferentes y que $x y$ tenga en total 9 caracteres. 

**Problema 7.** Queremos encontrar para cuantas parejas $x$ y $y$ de palabras en español sucede que cada una de ellas tiene por lo menos cinco letras y las últimas cinco letras de la primera son iguales a las primeras cinco letras de la última. 

**Problema 8.** Tenemos el sigiuente arreglo de números $$[4,1,7,4,2,6,5,7,1,8,4,9,1,4,1,5,7,2,8,3,6]$$
 Queremos determinar de cuántas formas se pueden elegir algunos de estos números de forma consecutiva de modeo que sumen $18$.

 **Problema 9.** Un 

**Problema 6.** Tenemos que encontrar todas la parejas de palabras $x$ y $y$ en español que sean diferentes y que $x \quad y$ tenga en total 9 caracteres. 

Podemos pensar el espacio de estados como todas las parejas de palabras en español y procesar cada una de ellas. Si lo exploramos de manera directa esto toma tiempo cuadrático en la cantidad de palabras en español. Al procesar cada posibilidad seguro que cubrimos todas, pero parece que hay cierta pérdida de tiempo pues las palabras grandes las estamos considerando en muchas parejas que van a fallar, es decir, las estamos considerando de manera innecesaria (palabras grandes tienen más de 7 letras). 

Mejor, podemos usar tiempo lineal en descartar las palabras grandes y luego usar itempo cuadrático en una lista mucho más corta. 


In [16]:
lista = open('espanol.txt', 'r', encoding='ISO-8859-1')
linea = lista.readline()
cortas = []
while linea:
    limpio = linea[:-1].split(' ')[0]
    if len(limpio) <= 7:
        cortas.append(limpio)
    linea = lista.readline()
print(len(cortas))

32974


Ya tenemos la lista de palabras cortas. Con esta lista ahora sí podríamos hacer una exploración exhaustiva. Como hay 1024 millones de casos a verificar, esto tardaría $\approx 1024$ en terminar. ¿Cómo podemos seguir reduciendo el espacio de estados? Agreguemos una idea de ordenar la lista de palabras por su longitud

In [19]:
cortas = sorted(cortas, key=lambda x: len(x))
print(cortas[:70])

# A continuación se muestra una búsqueda recortada
soluciones = 0
for j in cortas:
    for k in cortas:
        if len(j) + len(k) == 8: #no es 9 porque necesitamos contar el espacio vacío entre las dos palabras
            soluciones += 1
        if len(j) + len(k) > 8:
            break
print(soluciones)

['', '', '', 'a', 'b', 'c', 'd', 'e', 'f', 'g', 'h', 'i', 'j', 'k', 'l', 'm', 'n', 'o', 'p', 'q', 'r', 's', 't', 'u', 'v', 'w', 'x', 'y', 'z', 'ñ', 'al', 'as', 'ay', 'be', 'ce', 'ch', 'cu', 'da', 'de', 'dé', 'di', 'el', 'en', 'es', 'ex', 'fb', 'fe', 'fu', 'ha', 'he', 'ii', 'in', 'ir', 'iv', 'ja', 'je', 'la', 'le', 'lo', 'me', 'mg', 'mi', 'mí', 'ml', 'ni', 'no', 'oh', 'oí', 'os', 'pe']
7099844


Acá arriba recortamos la búsqueda en cuanto estuvimos seguros de que ya no habría soluciones. Esto nos dejó todavía con un algoritmo potencialmente cuadrático en $O(n^2)$ pero con un mejor factor constante que permitió correrlo en pocos segundos.

**Problema 9.** Una **matriz mágica sencilla** consiste de una matriz de $3 \times 3$, la suma de las entradas en cada fila es un cierto número $x$ y la suma de las entradas en cada columna es es ese mismo número $x$. Las entradas deben ser los números del $1$ al $9$ sin repetir. ¿Cuántas matrices mágicas existen?

Lo primero que tenemos que hacer es decidir quién será nuestro espacio de estados. Como los números no se repiten, podemos pensar en permutaciones. Esto en total nos da un espacio de estados de 9! elementos a verificar. Para hacer esto, tomamos la función auxiliar de permutaciones que hicimos arriba

La permutacion $[a_1, \ldots, a_9]$ la pensaremos como la matriz
$$\begin{pmatrix} a_1 & a_2 & a_3 \\ a_4 & a_5 & a_6 \\ a_7 & a_8 & a_9 \end{pmatrix}$$

In [21]:
numeros = list(range(1,11))
permutaciones = perms(numeros)
print(len(permutaciones))

3628800


Observación: la suma de todos los números del 1 al 9 es $45$. De este modo, la suma e ncada fila y en cada colmna debe ser igual a $15$. Esto nos permite comparar la suma de cada fila y columna no entre sí, sino entre ellas y un número constante. Esto nos permite poner la conddición de que la matriz sea mágina a ciertas sumas igualadas a 15.

In [26]:
soluciones = 0
for j in permutaciones:
    #si pasan las sumas que queremos
    soluciones += 1
print(soluciones)

3628800


## Recortes del espacio de estados con simetrías

Es usar simetrías en el espacio de estados y el problmea planteado para reducir la exploración