# 1 Introducción
El objetivo de este capítulo es ver los conceptos básicos de programación que luego utilizaremos a lo largo de todo el curso. Esto incluye ver tanto los datos que vamos a manejar, como las instrucciones que operan sobre ellos, así como las técnicas básicas de programación.
Para la implementación de los algoritmos que vamos a ver utilizaremos el lenguaje Python, sin perjuicio de que los conceptos que veremos son independientes del lenguaje específico utilizado.

En primer lugar, veremos algunos de los tipos de datos básicos de Python.
Las variables cambian de tipo dinámicamente según el tipo del valor que tengan en un instante dado.

## Datos numéricos
Python distingue entre números enteros (``int``) y números de punto flotante (``float``).

In [None]:
n=5 # int
print(n, type(n))
x=3.14 # float
print(x, type(x))

5 <class 'int'>
3.14 <class 'float'>


Sobre estos datos se pueden ejecutar las operaciones aritméticas habituales.

In [None]:
print(n+1)
print(n/2) # noten la diferencia con Python 2.7
print(n//2) # división entera
print(x**2)

6
2.5
2
9.8596


## Datos lógicos
Los valores de verdad son `True` y `False`. Las operaciones lógicas se indican con palabras en lugar de símbolos.

In [None]:
t=True
f=False
print(t and f)
print(t and not f)
print(n>0)

False
True
True


## Strings
Los strings se escriben entre comillas simples o dobles, y existen muchas operaciones definidas para ellos.

In [None]:
h="Hola"
print(h)
print(len(h))
m='mundo'
print(h + " " + m)
print(h.upper())

Hola
4
Hola mundo
HOLA


## Listas
Una lista es una secuencia de datos, posiblemente de distintos tipos, de largo variable.

In [None]:
L=[3,2,1]
print(L)
L.append(0)
print(L)
x=L.pop()
print(L)
print(x)

[3, 2, 1]
[3, 2, 1, 0]
[3, 2, 1]
0


Los elementos de la lista se indexan partiendo desde cero.

In [None]:
print(L[0])
print(L[2])
print(L[-1]) # contando desde el extremo derecho

3
1
1


Una lista se puede construir en base a iterar una fórmula:

In [None]:
C = [n**2 for n in range(1,7)]
print(C)

[1, 4, 9, 16, 25, 36]


Una lista se puede recorrer a través de sus subíndices:

In [None]:
for i in range(0,len(C)):
    print(C[i])

1
4
9
16
25
36


O bien iterando sobre los elementos de la lista:

In [None]:
for v in C:
    print(v)

1
4
9
16
25
36


## Funciones predefinidas
Hay funciones que están disponibles para ser utilizadas:

In [None]:
import math
a=3
b=4
c=math.sqrt(a**2+b**2)
print(c)

5.0


## Funciones
Uno puede definir sus propias funciones:

In [None]:
def hipotenusa(a,b):
    import math
    c=math.sqrt(a**2+b**2)
    return c
print(hipotenusa(3,4))

5.0


## Expresiones condicionales
Una expresión de la forma
```python
valor_si_verdadero if condicion else valor_si_falso
```
permite por ejemplo definir funciones por tramos, como por ejemplo:

$$
|x| =
\begin{cases}
-x & \text{si } x<0 \\
x & \text{en caso contrario}
\end{cases}
$$

In [None]:
def valor_absoluto(x):
    return -x if x<0 else x
print(valor_absoluto(-5), valor_absoluto(5))

5 5


## Diccionarios
Un diccionario es similar a una lista, pero los elementos se indexan con datos no necesariamente numéricos. Por ejemplo, supongamos que queremos convertir "piedra", "papel" y "tijera" a una representación numérica 0, 1, 2, respectivamente:

In [None]:
p_a_n = {"piedra":0, "papel":1, "tijera":2} # para convertir de palabra a número
print(p_a_n["papel"])

1


La conversión inversa se puede hacer simplemente con una lista:

In [None]:
n_a_p = ["piedra", "papel", "tijera"] # para convertir de número a palabra
print(n_a_p[1])

papel


Con esto podemos hacer una función en que el programa juegue "cachipún" contra el usuario:

In [None]:
def juega():
    from random import randint
    programa=randint(0,2)
    usuario=p_a_n[input("¿piedra, papel o tijera? ")]
    resultado="Empate" if programa==usuario else\
        "Gana Usuario" if (programa+1)%3==usuario else "Gana Programa"
    print("Usuario juega", n_a_p[usuario])
    print("Programa juega", n_a_p[programa])
    print("Resultado:", resultado)

In [None]:
juega()

¿piedra, papel o tijera? piedra
Usuario juega piedra
Programa juega tijera
Resultado: Gana Usuario


## Instrucción condicional: if
La instrucción `if` permite elegir entre distintas alternativas de instrucciones a ejecutar.

In [None]:
# Encontrar el máximo entre dos valores
def max2(a, b):
    if a>b:
        m=a
    else:
        m=b
    return m
print(max2(3,7))

7


Esto se puede generalizar a 3 valores, pero el resultado no es muy elegante:

In [None]:
# Encontrar el máximo entre tres valores
def max3(a, b, c):
    if a>b:
        if a>c:
            m=a
        else:
            m=c
    else:
        if b>c:
            m=b
        else:
            m=c
    return m
print(max3(4,3,7))

7


Una mejor alternativa la podemos obtener si vamos obteniendo aproximaciones sucesivas al máximo:

In [None]:
# Encontrar el máximo entre dos valores
def max2(a, b):
    m=a
    if b>m:
        m=b
    return m
print(max2(3,7))

7


Esto se generaliza de manera mucho más simple a tres (o más) valores:

In [None]:
# Encontrar el máximo entre tres valores
def max3(a, b, c):
    m=a
    if b>m:
        m=b
    if c>m:
        m=c
    return m
print(max3(4,3,7))

7


Cuando hay preguntas encadenadas, se puede usar la cláusula `elif` (abreviatura de `else if`, pero que no abre un nuevo nivel de indentación):

In [None]:
# Dice si un año dado es bisiesto
def es_bisiesto(a):
    if a%400==0:   # Los múltiplos de 400 siempre son bisiestos
        b=True
    elif a%100==0: # Los demás múltiplos de 100 no son bisiestos
        b=False
    elif a%4==0:   # De los restantes, los múltiplos de 4 son bisiestos
        b=True
    else:          # Cualquier otro año no es bisiesto
        b=False
    return b
print(es_bisiesto(1900), es_bisiesto(2000), es_bisiesto(2020))

False True True


## Instrucciones iterativas: for
La instrucción `for` itera con una variable que toma valores de una lista dada. A menudo, esa lista se especifica mediante `range`.
Ilustraremos su uso generalizando los algoritmos que vimos antes para encontrar el máximo de un conjunto de dos o tres números, al caso de un conjunto con un número cualquiera de elementos:

In [None]:
# Encuentra el máximo de una lista a
def maximo(a):
    m=a[0]
    # Al comenzar cada iteración, se cumple que m==max(a[0],...,a[k-1])
    for k in range(1,len(a)):
        if a[k]>m:
            m=a[k]
    return m
print(maximo([25, 42, 93, 17, 54, 28]))

93


El comentario que aparece junto al `for` describe lo que se llama el **invariante** del ciclo, y es muy útil para poder argumentar la correctitud del programa, así como para poder ayudar a su diseño.

El invariante una afirmación lógica que debe ser verdadera cada vez que se intenta iniciar una nueva iteración, lo cual incluye tanto la primera vez como el último intento, en que se detecta que el rango ya se ha agotado y el ciclo termina.

* La validez del invariante la primera vez la deben asegurar las instrucciones previas al ciclo, que se llaman instrucciones de *inicialización*. En este ejemplo, al comenzar el ciclo se tiene que $k=1$, y por lo tanto trivialmente se cumple que $m=\max(a[0])$.

* Las instrucciones al interior del ciclo (el "cuerpo de ciclo") parten de la premisa de que el invariante se cumple al inicio, y deben garantizar que se cumpla al final (para dejar todo listo para la próxima iteración). Esto se llama _preservar el invariante_. En este ejemplo, para asegurar que $m=\max(a[0],\ldots,a[k])$ sabiendo que ya era cierto que $m=\max(a[0],\ldots,a[k-1])$, se debe modificar $m$ solo en el caso de que $a[k]$ sea mayor que $m$, o dejarlo igual si no.

* Cuando se detecta que el rango se ha agotado, el invariante igualmente se cumple, y ambas cosas juntas deben asegurar que haya logrado el objetivo final deseado. En este ejemplo, cuando $k$ llega a ser igual a $len(a)$, el invariante implica que $m=\max(a[0],\ldots,a[len(a)-1])$, o sea, es el máximo de toda la lista.

---

### Ejercicio 1.1

La función ``maximo`` hace $n-1$ comparaciones de elementos para encontrar el máximo de un conjunto de tamaño $n$.

Supongamos que se desea escribir una función ``minmax`` que al ser llamada con una lista de números, retorne un par ordenado (tupla) ``(min,max)``, con el mínimo y el máximo elemento del conjunto, respectivamente. Escriba a continuación esa función haciendo dos pasadas sobre los datos: una para encontrar el mínimo y otra para encontrar el máximo, y pruébela sobre una lista de ejemplo.

In [None]:
def minmax(a):
    # escribir la función aquí

    return(minimo,maximo)

# Probarla acá

La función anterior debería hacer $2n-2$ comparaciones de elementos ($2n-3$ si se evita comparar el elemento seleccionado en la primera pasada). ¿Será posible encontrar el mínimo y el máximo haciendo muchas menos comparaciones?

¡La respuesta es que sí! Veámoslo con un ejemplo. Para simplificar, supongamos que la lista es de largo par:

$$
[45,21,34,67,55,89,44,12]
$$

Luego comparemos cada elemento que está en una posición par con su vecino de la derecha, e intercambiémoslos de modo que el par quede en orden ascendente (recuerde que las posiciones comienzan desde cero):

$$
[21,45,34,67,55,89,12,44]
$$

Luego hagamos una pasada solo sobre las posiciones pares para encontrar el mínimo ($12$), y otra pasada solo entre las posiciones impares para encontrar el máximo ($89$). ¡Listo!

Programe este nuevo algoritmo, pruébelo y diga cuántas comparaciones hace en total:

---

In [None]:
def minmax(a):
    # escribir la función aquí

    return(minimo,maximo)

# Probarla acá

---

## Instrucciones iterativas: while
La instrucción `while` ejecuta instrucciones mientra la condición especificada sea verdadera:

In [None]:
# Dice si un número dado es primo o no
def es_primo(n):
    if n==2:
        return True # 2 es primo
    if n%2==0:
        return False # ningún otro par es primo
    k=3
    while k**2<=n: # no es necesario buscar posibles factores más allá de sqrt(n)
        if n%k==0:
            return False # n es divisible por k => no es primo
        k+=2 # probamos solo los impares
    # si no se encontró ningún factor menor que raíz de n, es primo
    return True
print(es_primo(2), es_primo(7), es_primo(9), es_primo(79823492843), es_primo(79823492869))

True True False False True


## Ejemplo de programación con invariantes: particionar un conjunto

Supongamos que se tiene un conjunto de datos en una lista $a[0],\ldots,a[n-1]$ y un valor de corte $p$, y se desea reordenar los datos dentro de la lista, de modo que queden a la izquierda todos los que son menores que $p$, y a la derecha los que son mayores. Por simplicidad, supondremos que en la lista no hay ningún valor igual a $p$. Este es un problema cuya utilidad veremos más adelante, cuando estudiemos el algoritmo de ordenación Quicksort.

La solución clásica para este problema es la de **Hoare**, el autor de Quicksort, y se basa en ir identificando elementos menores o mayores que $p$, y moviéndolos hacia el extremo izquierdo o derecho de la lista, según corresponda. Esto corresponde al siguiente invariante:

![particio-Hoare](https://github.com/ppoblete/AED/blob/master/particion-Hoare.png?raw=1)

En este invariante, $i$ y $j$ son los primeros elementos desconocidos (esto es, aún no identificados como menores o mayores), viniendo desde cada extremo.

In [None]:
def particionHoare(a,p):
    # retorna el punto de corte, el número de elementos <p y la lista particionada
    n=len(a)
    (i,j)=(0,n-1) #inicialmente todos los elementos son desconocidos
    while i<=j: # aún quedan elementos desconocidos
        if a[i]<p:
            i+=1
        elif a[j]>p:
            j-=1
        else:
            (a[i],a[j])=(a[j],a[i]) # intercambio
            i+=1
            j-=1
    return (p,i,a)

Para ayudarnos a verificar que la partición se realiza correctamente, definiremos una función auxiliar:

In [None]:
def verifica_particion(t): # imprime y chequea partición
    (p,m,a)=t
    # p=punto de corte, m=número de elementos <p, a=lista completa particionada
    print(a[0:m],p,a[m:])
    print("Partición OK" if (m==0 or max(a[0:m])<p) and (m==len(a) or min(a[m:])>p)
          else "Error")

In [None]:
verifica_particion(particionHoare([73,21,34,98,56,37,77,65,82,15,36],50))

[36, 21, 34, 15, 37] 50 [56, 77, 65, 82, 98, 73]
Partición OK


In [None]:
verifica_particion(particionHoare([73,21,34,98,56,37,77,65,82,15,36],0))

[] 0 [73, 21, 34, 98, 56, 37, 77, 65, 82, 15, 36]
Partición OK


In [None]:
verifica_particion(particionHoare([73,21,34,98,56,37,77,65,82,15,36],100))

[73, 21, 34, 98, 56, 37, 77, 65, 82, 15, 36] 100 []
Partición OK


---

### Ejercicio 1.2

Existe un algoritmo alternativo, que resulta en una codificación más sencilla. Este algoritmo, debido a **Lomuto**, se basa en el siguiente invariante:

![particion-Lomuto](https://github.com/ppoblete/AED/blob/master/particion-Lomuto.png?raw=1)

En este algoritmo, en cada iteración, si $a[j]<p$, se intercambian $a[i]$ con $a[j]$ y se incrementa $i$, porque ahora hay un elemento más en el grupo de los menores que $p$. Después de esto, se incrementa $j$, *incondicionalmente* (¿por qué es correcto hacer eso?).

Programe la partición de Lomuto en el recuadro siguiente y pruébela.

In [None]:
def particionLomuto(a,p):
    # retorna el punto de corte, el número de elementos <p y la lista particionada

    # escribir acá el algoritmo de partición de Lomuto

    return (p,i,a)

In [None]:
verifica_particion(particionLomuto([73,21,34,98,56,37,77,65,82,15,36],50))

In [None]:
verifica_particion(particionLomuto([73,21,34,98,56,37,77,65,82,15,36],0))

In [None]:
verifica_particion(particionLomuto([73,21,34,98,56,37,77,65,82,15,36],100))

---

## Ejemplo de programación con invariantes: Calcular $y = x^n$

Supongamos que no tuviéramos una operación de elevación a potencia, y que necesitáramos calcular $x^n$ para $n$ entero no negativo.
El algoritmo obvio es calcular $x*x*\cdots *x$ ($n$ veces):

In [None]:
def potencia(x, n):
    y=1
    for k in range(0,n):
        y*=x
    return y

In [None]:
print(potencia(2,10))

1024


El invariante, esto es, lo que se cumple al comenzar cada nueva iteración es $y = x^k$. Así, al inicio, cuando $k=0$, se tiene $y=1$ (inicialización), y al término, cuando $y=n$, se tiene la condición final buscada. La preservación del invariante consiste en multiplicar $y$ por $x$, porque así se sigue cumpliendo el invariante cuando $k$ se incrementa en $1$.

Este algoritmo ejecuta $n$ multiplicaciones para calcular $x^n$ y, si tomamos en cuenta todo lo que hace, es evidente que demora un tiempo proporcional a $n$, lo cual escribiremos $O(n)$ y lo leeremos "del orden de $n$". (Más adelante definiremos precisamente esta notación, y veremos que podríamos ser más precisos todavía al describir el tiempo que demora un algoritmo)

¿Será posible calcular una potencia de manera más eficiente?

Para ver cómo podríamos mejorar el algoritmo, comenzaremos por reescribirlo de modo que la variable $k$ vaya disminuyendo en lugar de ir aumentando, usando para ello la instrucción `while`:

In [None]:
def potencia(x, n):
    y=1
    k=n
    while k>0:
        y*=x
        k-=1
    return y

In [None]:
print(potencia(2,10))

1024


El invariante en este caso sería $y = x^{n-k}$ o, lo que es lo mismo, $y * x^k = x^n$.

El reescribirlo de esta manera nos permite hacer el siguiente truco: vamos a introducir una variable $z$, cuyo valor inicial es $x$, y reformular el invariante como $y * z^k = x^n$ y preservarlo aprovechando que $y*z^k = (y*z)*z^{k-1}$:

In [None]:
def potencia(x, n):
    y=1
    k=n
    z=x
    while k>0:
        y*=z
        k-=1
    return y

In [None]:
print(potencia(2,10))

1024


Este cambio podría parecer ocioso, pero gracias a él ahora tenemos un grado adicional de libertad: en efecto, podemos modificar la variable $z$ en la medida que eso no haga que el invariante deje de cumplirse.

En particular, una oportunidad de hacer esto aparece cuando $k$ es par. En ese caso, como $z^n=(z^2)^{n/2}$, si elevamos $z$ al cuadrado y al mismo tiempo dividimos $k$ a la mitad, ambos cambios se complementan para hacer que el invariante se preserve. El algoritmo resultante se llama el *algoritmo binario*.

In [None]:
def potencia(x, n):
    y=1
    k=n
    z=x
    while k>0:
        if k%2==0: # caso k par
            z=z*z
            k//=2
        else:      # caso k impar
            y*=z
            k-=1
    return y

In [None]:
print(potencia(2,10))

1024


Este algoritmo admite todavía una pequeña optimización. Cuando $k$ se divide por $2$, no solo se preserva el invariante, sino que además $k$ sigue siendo $>0$, y por lo tanto no es necesario en ese caso volver a preguntar por la condición del `while`. El algoritmo queda como sigue:

In [None]:
def potencia(x, n):
    y=1
    k=n
    z=x
    while k>0:
        while k%2==0: # caso k par
            z=z*z
            k//=2
        y*=z # aquí estamos seguros que k es impar
        k-=1
    return y

In [None]:
print(potencia(2,10))

1024


Este algoritmo (en cualquiera de las dos últimas versiones) se llama el *algoritmo binario*, y es mucho más eficiente que el algoritmo inicial. Cada vez que se da el caso par, $k$ disminuye a a mitad, y eso ocurre al menos la mitad de las veces. Pero si $k$ comienza con el valor $n$, la operación de dividir por $2$ se puede ejecutar a lo más $\log_2{n}$ veces, por lo tanto el tiempo total de ejecución es $O(\log_2{n})$, en lugar de $O(n)$.

Decimos que el algoritmo original era de tiempo lineal, y que el algoritmo binario es de tiempo logarítmico. Para $n$ grande, la diferencia de eficiencia es muy grande en favor del algoritmo binario.

Una observación importante es que para que el algoritmo binario funcione, solo es necesario que $x$ $y$, $z$ pertenezcan a un conjunto para el cual hay definida una operación multiplicativa que sea asociativa y que tenga un elemento neutro. Por lo tanto, este algoritmo no solo sirve para elevar a potencia números enteros o reales, sino que además, por ejemplo, para calcular potencias de *matrices*.

### ¿Por qué se llama "algoritmo binario"?

Existe una relación muy interesante entre el funcionamiento de este algoritmo y la representación binaria del número $n$.

Para quienes no lo recuerden (o lo estén viendo por primera vez), cuando un número se escribe en base $10$, por ejemplo, el número $2019$, esto significa

$$
(2019)_{10} = 2 \cdot 10^3 + 0 \cdot 10^2 + 1 \cdot 10^1 + 9 \cdot 10^0
$$

De manera análoga, un número escrito en base $2$, por ejemplo $110101$ significa

$$
(110101)_2 = 1 \cdot 2^5 + 1 \cdot 2^4 + 0 \cdot 2^3 + 1 \cdot 2^2 + 0 \cdot 2^1 + 1 \cdot 2^0
$$

lo cual equivale a 53 en decimal.

Más en general, un número puede estar escrito en base $b$:

$$
(\ldots d_3 d_2 d_1 d_0)_b = \sum_{k \ge 0}{d_k b^k}
$$

donde $0\le d_k \le b-1$ para todo $k$.

Volviendo ahora al problema de calcular $y=x^n$, consideremos como ejemplo de $n=53$.
Si escribimos el exponente en binario, tenemos que

$$
\begin{align}
x^{53} &= x^{(110101)_2}\\
  &=x^{1 \cdot 2^5 + 1 \cdot 2^4 + 0 \cdot 2^3 + 1 \cdot 2^2 + 0 \cdot 2^1 + 1 \cdot 2^0}\\
  &=x^{2^5}\cdot x^{2^4}\cdot x^{2^2}\cdot x^{2^0}\\
  &=x^{32}\cdot x^{16}\cdot x^{4}\cdot x^{1}\\
\end{align}
$$

Como vemos, el valor final calculado es el producto de los $x$ elevados a aquellas potencias de 2 que corresponden exactamente adonde hay un dígito $1$ en la representación binaria del número $n$. Veremos que eso es exactamente lo que hace al algoritmo.

Si examinamos el algoritmo, en su primera versión, podemos ver que su estado se puede representar por una terna $(k,z,y)$, la cual tiene el valor inicial $(n,x,1)$. En cada iteración tenemos dos casos:

Caso $k$ par:
$$
(k,z,y) \rightarrow (\frac{k}{2},z^2,y)
$$

Caso $k$ impar:
$$
(k,z,y) \rightarrow (k-1,z,yz)
$$

Estas reglas adquieren una forma mucho muy simple si el número $k$ se considera escrito en binario. En esta base un número es *par* si termina en $0$ y es *impar* si termina en 1. Además, restarle $1$ a un número impar es equivalente a sustituir el $1$ de más a la derecha por un $0$, y dividir por $2$ un número par es equivalente a eliminar el $0$ de más a la derecha.

Con esto, podemos reformular nuestras reglas, suponiendo que el número $k$ se escribe en binario en la forma $(\alpha X)_2$, donde $X$ es el dígito de más a la derecha y $\alpha$ es la secuencia de dígitos que lo preceden. Entonces

Caso $k$ terminado en $0$:
$$
((\alpha 0)_2,z,y) \rightarrow ((\alpha)_2,z^2,y)
$$

Caso $k$ terminado en $1$:
$$
((\alpha 1)_2,z,y) \rightarrow ((\alpha 0)_2,z,yz)
$$

En palabras: la variable $z$ va tomando sucesivamente los valores $x^1,x^2,x^4,x^8,\ldots$, y el valor final calculado es $x$ elevado a la suma aquellas potencias que corresponden exactamente adonde hay un dígito $1$ en la representación binaria del número $n$.

La siguiente tabla muestra la ejecución del algoritmo para $n=53$:

| $k$ | $z$ | $y$ |
| --- | --- | --- |
| $(110101)_2$ | $x^1$ | $1$ |
| $(110100)_2$ | $x^1$ | $x^1$ |
| $(11010)_2$ | $x^2$ | $x^1$ |
| $(1101)_2$ | $x^4$ | $x^1$ |
| $(1100)_2$ | $x^4$ | $x^{1+4}=x^5$ |
| $(110)_2$ | $x^8$ | $x^{1+4}=x^5$ |
| $(11)_2$ | $x^{16}$ | $x^{1+4}=x^5$ |
| $(10)_2$ | $x^{16}$ | $x^{1+4+16}=x^{21}$ |
| $(1)_2$ | $x^{32}$ | $x^{1+4+16}=x^{21}$ |
| $(0)_2$ | $x^{32}$ | $x^{1+4+16+32}=x^{53}$ |


## Ejemplo de programación con invariantes: Evaluación de un polinomio

Supongamos que se tiene un polinomio

$$
P(x) = \sum_{0<=k<=n}{a_k x^k}
$$

y se desea calcular su valor en un punto dado $x$.

Una solución trivial se puede obtener directamente de la fórmula anterior:

In [None]:
def evalp(a,x):
    """Evalúa en el punto x el polinomio cuyos coeficientes son a[0], a[1],...
    Retorna el valor calculado
    """
    P=0
    for k in range(0,len(a)):
        # Invariante: P=a[0]+a[1]*x+...+a[k-1]*x**(k-1)
        P += a[k]*x**k
    return P

Podemos probar esta función evaluando el polinomio

$$
P(x) = 5+2x-3x^2+4x^3
$$

en el punto $x=2$:

In [None]:
print(evalp([5,2,-3,4],2))

29


El problema es que este algoritmo puede ser ineficiente. Si el sistema calcula ``x**k`` de manera simple, el tiempo total de ejecución sería del orden de $n^2$, y si lo calcula usando el algoritmo binario, el tiempo sería del orden de $n\log{n}$. Veremos que esto se puede reducir a tiempo lineal.

Para esto, vamos a introducir una variable adicional, digamos $y$, que almacene el valor de $x^k$ necesario para cada iteración. Para preservar este invariante, al final de cada vuelta del ciclo debemos dejarla multiplicada por $x$, para que tenga el valor correcto al iniciarse la siguiente iteración:

In [None]:
def evalp(a,x):
    """Evalúa en el punto x el polinomio cuyos coeficientes son a[0], a[1],...
    Retorna el valor calculado
    """
    P=0
    y=1
    for k in range(0,len(a)):
        # Invariante: P=a[0]+a[1]*x+...+a[k-1]*x**(k-1) and y=x**k
        P += a[k]*y
        y *= x
    return P

In [None]:
print(evalp([5,2,-3,4],2))

29


---

### Ejercicio 1.3

Un polinomio se puede evaluar en tiempo lineal sin necesidad de una variable auxiliar si observamos que $P(x)$ se puede factorizar como:

$$
P(x) = a_0 +x(a_1+x(\cdots+x(a_{n-1}+x(a_n))\cdots))
$$

Por ejemplo,

$$
\begin{align}
P(x) &= 5+2x-3x^2+4x^3\\
 &=5+x(2+x(-3+x(4)))
\end{align}
$$

Programe un algoritmo iterativo que evalúe el polinomio utilizando esta idea. Comience desde el paréntesis más interno y vaya avanzando hacia la izquierda. Indique cuál es el invariante que utiliza. El algoritmo resultante se llama la **Regla de Horner**.

In [None]:
def evalp(a,x):
    """Evalúa en el punto x el polinomio cuyos coeficientes son a[0], a[1],...
    utilizando la Regla de Horner
    Retorna el valor calculado
    """
    # Escriba aquí su algoritmo

    return P

In [None]:
print(evalp([5,2,-3,4],2))

---

## Numpy y Arreglos

Numpy es la principal biblioteca para computación científica en Python.

Una de las características de Numpy es que provee arreglos multidimensionales de alta eficiencia. Mientras la gran flexibilidad de las listas de Python puede hacer que no sea muy eficiente el acceso a elementos específicos, los arreglos de Numpy aseguran el acceso a cada elemento en tiempo constante. Por esa razón, utilizaremos estos arreglos cuando necesitemos asegurar la eficiencia de la implementación de los algoritmos.


In [None]:
import numpy as np

a = np.array([6.5, 5.2, 4.6, 7.0, 4.3])
print(a[2])

4.6


In [None]:
print(len(a))

5


Hay varias formas de crear arreglos inicializados con ceros, unos, valores constantes o valores aleatorios.

In [None]:
b = np.ones(10)
print(b)

[1. 1. 1. 1. 1. 1. 1. 1. 1. 1.]


In [None]:
c = np.zeros(7,dtype=int)
print(c)

[0 0 0 0 0 0 0]


En los dos ejemplos anteriores mostramos la diferencia que se produce al explicitar el tipo de datos del arreglo. En el primero, obtenemos el *default*, que es flotante, mientras en el segundo forzamos a que sea entero.

In [None]:
c = np.full(5, 2)
print(c)

[2 2 2 2 2]


In [None]:
d = np.random.random(6)
print(d)

[0.96086121 0.31006032 0.78951795 0.14162147 0.72680238 0.03081408]


También es posible crear y manejar arreglos de varias dimensiones.

In [None]:
a = np.array([[1,2,3],[4,5,6]])
print(a)

[[1 2 3]
 [4 5 6]]


In [None]:
print(a[0,2])

3


In [None]:
(m,n)=np.shape(a)
print(m,n)

2 3


In [None]:
b = np.zeros((3,3))
print(b)

[[0. 0. 0.]
 [0. 0. 0.]
 [0. 0. 0.]]


In [None]:
c = np.eye(3)
print(c)

[[1. 0. 0.]
 [0. 1. 0.]
 [0. 0. 1.]]


## Ejemplos de programación con invariantes: Ordenación

## Ordenación por inserción

Supongamos que se tiene un arreglo $a$, de tamaño $n$, y queremos reordenar los datos almacenados en su interior de modo que queden en orden ascendente.

El método de **Ordenación por Inserción** se basa en formar en el sector izquierdo del arreglo un subconjunto ordenado, en el cual se van insertando uno por uno los elementos restantes. Para la inicialización, comenzamos con un subconjunto ordenado de tamaño 0, y el proceso termina cuando el subconjunto ordenado llega a tener tamaño $n$. El invariante se puede visualizar como:

![insercion](https://github.com/ppoblete/AED/blob/master/insercion.png?raw=1)

La variable $k$ indica el tamaño del subconjunto ordenado. Equivalentemente, $k$ es el subíndice del primer elemento todavía no ordenado, y que será el que se insertará en esta oportunidad.

In [None]:
# Ordenación Por Inserción
def ordena_insercion(a):
    n=len(a)
    for k in range(0,n):
        insertar(a,k)

Este algoritmo todavía no es ejecutable, porque falta definir la función `insertar`, que se encarga de tomar $a[k]$ e insertarlo entre los anteriores. La forma más simple de hacer esto es a través de intercambios sucesivos:

In [None]:
# Insertar a[k] entre los elementos anteriores preservando el orden ascendente (versión 1)
def insertar(a, k):
    j=k # señala la posición del elemento que está siendo insertado
    while j>0 and a[j]<a[j-1]:
        (a[j], a[j-1]) = (a[j-1], a[j])
        j-=1

Para poder probar este algoritmo, generemos un arreglo con números aleatorios y ordenémoslo:

In [None]:
a = np.random.random(6)
print(a)
ordena_insercion(a)
print(a)

[0.21698872 0.31136108 0.0676283  0.6468421  0.4082596  0.78409654]
[0.0676283  0.21698872 0.31136108 0.4082596  0.6468421  0.78409654]


Si observamos el algoritmo de inserción, podemos ver que en los intercambios siempre uno de los dos elementos involucrados es el que se está insertando, el cual pasa por muchos lugares provisorios hasta llegar finalmente a su ubicación definitiva. Esto sugiere que podemos ahorrar trabajo si en lugar de hacer todos esos intercambios, sacamos primero el elemento a insertar hacia una variable auxiliar, luego vamos moviendo los restantes elementos hacia la derecha, y al final movemos directamente el nuevo elemento desde la variable auxiliar hasta su posición definitiva:

In [None]:
# Insertar a[k] entre los elementos anteriores preservando el orden ascendente (versión 2)
def insertar(a, k):
    b=a[k] # b almacena transitoriamente al elemento a[k]
    j=k # señala la posición del lugar "vacío"
    while j>0 and b<a[j-1]:
        a[j]=a[j-1]
        j-=1
    a[j]=b

In [None]:
a = np.random.random(6)
print(a)
ordena_insercion(a)
print(a)

[0.63169534 0.51338201 0.75754562 0.11005649 0.81951851 0.5797447 ]
[0.11005649 0.51338201 0.5797447  0.63169534 0.75754562 0.81951851]


Para analizar la eficiencia de este algoritmo, podemos considerar varios casos:
* Mejor caso: Si el arreglo ya viene ordenado, el ciclo de la función `insertar` termina de inmediato, así que esa función demora tiempo constante, y el proceso completo demora tiempo $O(n)$, lineal en $n$.
* Peor caso: Si el arreglo viene originalmente en orden decreciente, el ciclo de la función `insertar` hace el máximo de iteraciones ($k$), y la suma de todos esos costos da un total de $O(n^2)$, cuadrático en $n$.
* Caso promedio: Si el arreglo viene en orden aleatorio, el número promedio de iteraciones que hace el ciclo de la función `insertar` es aproximadamente $k/2$, y la suma de todos esos costos igual da un total de $O(n^2)$. Esto es, el costo promedio también es cuadrático.

## Ordenación por Selección

El método de **Ordenación por Selección** se basa en extraer el máximo elemento y moverlo hacia el extremo derecho del arreglo, y repetir este proceso entre los elementos restantes hasta que todos hayan sido extraídos. El invariante se puede visualizar como:

![ord-seleccion](https://github.com/ppoblete/AED/blob/master/seleccion.png?raw=1)

La variable $k$ indica el tamaño del subconjunto que todavía falta por procesar. Equivalentemente, es el subíndice del primer elemento que ya pertenece al subconjunto ordenado.

In [None]:
# Ordenación por Selección
def ordena_seleccion(a):
    n=len(a)
    for k in range(n,1,-1): # Paramos cuando todavía queda 1 elemento "desordenado" (¿por qué está bien eso?)
        j=pos_maximo(a,k) # Encuentra posición del máximo entre a[0],...,a[k-1]
        (a[j],a[k-1])=(a[k-1],a[j])

In [None]:
# Encuentra posición del máximo entre a[0],...,a[k-1]
def pos_maximo(a, k):
    j=0 # j señala la posición del máximo
    for i in range(1,k):
        if a[i]>a[j]: # Encontramos un nuevo máximo
            j=i
    return j

Nuevamente, probamos nuestro algoritmo con un arreglo aleatorio:

In [None]:
a = np.random.random(6)
print(a)
ordena_seleccion(a)
print(a)

[0.91088675 0.55781357 0.6422284  0.80222542 0.49612172 0.32394811]
[0.32394811 0.49612172 0.55781357 0.6422284  0.80222542 0.91088675]


En este algoritmo, siempre se recorre todo el conjunto de tamaño $k$ para encontrar el máximo, de modo que la suma de todos estos costos de un total de $O(n^2)$, en todos los casos.

Más adelante veremos que hay maneras mucho más eficientes de calcular el máximo de un conjunto, una vez que se ha encontrado y extraído el máximo la primera vez.

Piensen por ejemplo en un típico torneo de tenis, en donde los jugadores se van eliminando por rondas, hasta que en la final queda solo un jugador invicto: el campeón. Si hay $n$ jugadores, ese proceso requiere exactamente $n-1$ partidos. **Pero** una vez que se ha jugado todo ese torneo, hagamos un experimento mental y pensemos que habría sucedido si el primer día el campeón no hubiera podido jugar por alguna causa. Para determinar quién habría resultado campeón en esas circunstancias (o sea, para encontrar al subcampeón), **no sería necesario repetir todo el torneo, sino solo volver a jugar los partidos en los que habría participado el campeón**. Ese número de partidos es mucho menor a $n$, y en realidad no es difícil ver que es logarítmico. Y eso puede repetirse para encontrar al tercero, al cuarto, etc., siempre con el mismo costo logarítmico.

Si sumamos todos esos costos, da un total de $O(n\log{n})$, en el peor caso.

Lo anterior es una "demostración de factibilidad" de que existen algoritmos de ordenación de costo $O(n\log{n})$, más eficientes que $O(n^2)$. Más adelante en el curso veremos algoritmos prácticos que alcanzan esta eficiencia.

## Ordenación de la Burbuja

Este algoritmo se basa en ir haciendo pasadas sucesivas de izquierda a derecha sobre el arreglo, y cada vez que encuentra dos elementos adyacentes fuera de orden, los intercambia. Así, el arreglo va quedando cada vez "más ordenado", hasta que finalmente esté totalmente ordenado.

Analizando el efecto de una pasada de izquierda a derecha, vemos que, aparte de los pequeños desórdenes que pueda ir arreglando por el camino, una vez que el algoritmo se encuentra con el máximo, los intercambios lo empiezan a trasladar paso a paso hacia la derecha, hasta que finalmente queda en el extremo derecho del arreglo. Eso significa que ya ha llegado a su posición definitiva, y no necesitamos volver a tocarlo. Por lo tanto, el algoritmo puede ignorar esos elementos al extremo derecho, los que por construcción están ordenados y son mayores que todos los de la izquierda. Esto lo podemos visualizar como:

![ord-seleccion](https://github.com/ppoblete/AED/blob/master/seleccion.png?raw=1)

¡El mismo invariante que la Ordenación por Selección! Sin embargo, el algoritmo resultante es distinto.

In [None]:
# Ordenación de la Burbuja (versión 1)
def ordena_burbuja(a):
    n=len(a)
    k=n # número de elementos todavía desordenados
    while k>1:
        # Hacer una pasada sobre a[0],...,a[k-1]
        # intercambiando elementos adyacentes desordenados
        for j in range(0,k-1):
            if a[j]>a[j+1]:
                (a[j],a[j+1])=(a[j+1],a[j])
        # Disminuir k
        k-=1

In [None]:
a = np.random.random(6)
print(a)
ordena_burbuja(a)
print(a)

[0.67980575 0.47893026 0.29847223 0.97584905 0.07176052 0.9138015 ]
[0.07176052 0.29847223 0.47893026 0.67980575 0.9138015  0.97584905]


Este algoritmo demora siempre tiempo $O(n^2)$, ¡incluso si se le da para ordenar un arregla que ya viene ordenado!

No cuesta mucho introducir una variable booleana que señale si en una pasada no se ha hecho ningún intercambio, y usar esa variable para terminar el proceso cuando eso ocurre. Pero hay una manera mejor de modificar el algoritmo para aumentar su eficiencia.

Para esto, introducimos una variable $i$ que recuerda el punto donde se hizo el último intercambio (el cual habría sido entre $a[i-1]$ y $a[i]$. Si a partir de ese punto ya no se encontraron elementos fuera de orden, eso quiere decir que $a[i-1]<a[i]$ y luego a partir de ahí todos los elementos están ordenados, **hasta el final del arreglo**. Por lo tanto, el invariante se preserva si hacemos $k=i$.

¿Qué pasa si no hubo ningún intercambio? Para este caso, si le damos a la variable $i$ el valor inicial cero, al hacer $k=i$ tendríamos $k=0$ y el proceso terminaría automáticamente. El algoritmo resultante es el siguiente:

In [None]:
# Ordenación de la Burbuja (versión 2)
def ordena_burbuja(a):
    n=len(a)
    k=n # número de elementos todavía desordenados
    while k>1:
        # Hacer una pasada sobre a[0],...,a[k-1]
        # intercambiando elementos adyacentes desordenados
        i=0
        for j in range(0,k-1):
            if a[j]>a[j+1]:
                (a[j],a[j+1])=(a[j+1],a[j])
                i=j+1 # recordamos el lugar del último intercambio
        # Disminuir k
        k=i

In [None]:
a = np.random.random(6)
print(a)
ordena_burbuja(a)
print(a)

[0.20877349 0.71209819 0.30996714 0.91145577 0.3479466  0.08197456]
[0.08197456 0.20877349 0.30996714 0.3479466  0.71209819 0.91145577]


Este algoritmo aprovecha mejor el orden previo que puede trar el arreglo, y en particular ordena arreglos ordenados en tiempo lineal. Pero tanto su peor caso como su caso promedio siguen siendo cuadráticos.

## Recursividad

El poder escribir funciones que se llamen a sí mismas es una herramienta muy poderosa de programación. Veremos algunos ejemplos de aplicaciones de este concepto, y más adelante veremos cómo puede conducir al diseño de algoritmos muy eficientes.

## Ejemplo: Calcular $y=x^n$
Revisemos nuevamente este problema, pero ahora desde un punto de vista recursivo. Una potencia se puede definir recursivamente de la siguiente manera:

$$
x^n =
\begin{cases}x * x^{n-1} & \mbox{si }n>0 \\
1 & \mbox{si }n=0
\end{cases}
$$

lo cual se puede implementar directamente como una función recursiva:

In [None]:
def potencia(x,n):
    if n==0:
        return 1
    else:
        return x * potencia(x,n-1)

In [None]:
print(potencia(2,10))

1024


El algoritmo resultante demora tiempo $O(n)$, pero  puede mejorarse si el caso $n$ par lo tratamos aparte:

$$
x^n =
\begin{cases}
\left(x^2\right)^{n/2} & \mbox{si }n>0\mbox{, par} \\
x * x^{n-1} & \mbox{si }n>0\mbox{, impar} \\
1 & \mbox{si }n=0
\end{cases}
$$

y la función que lo implementa es:

In [None]:
def potencia(x,n):
    if n==0:
        return 1
    elif n%2==0:
        return potencia(x*x,n//2)
    else:
        return x * potencia(x,n-1)

In [None]:
print(potencia(2,10))

1024


El resultado es el algoritmo binario, que demora tiempo $O(\log{n})$, en versión recursiva.

## Recursividad vs. Iteración
Todo algoritmo iterativo puede escribirse recursivamente. En particular, cualquier ciclo de la forma
```python
while C:
    A
```
puede implementarse como
```python
def f():
    if C:
        A
        f()
f()
```
Por cierto, en la llamada recursiva se le debe entregar a la función el contexto en que habría operado en la siguiente iteración del ciclo.

Por ejemplo, si queremos imprimir uno por uno los elementos de un arreglo $a$, una forma iterativa de hacerlo sería:

In [None]:
def imprimir(a):
    k=0
    while k<len(a):
        print(a[k])
        k+=1

In [None]:
a=np.random.random(6)
imprimir(a)

0.7033836563496955
0.6452018723083637
0.7390309665914873
0.7347873655983367
0.7866498089752649
0.6219100789368107


En forma recursiva, esto queda como:

In [None]:
def imprimir(a):
    imprimir_recursivo(a,0)

def imprimir_recursivo(a,k): # imprimir desde a[k] en adelante
    if k<len(a):
        print(a[k])
        imprimir_recursivo(a,k+1)

In [None]:
a=np.random.random(6)
imprimir(a)

0.48983219759773877
0.32335914035360247
0.9701200719987955
0.6556528043143391
0.5783404506167958
0.7588468412552624


Este proceso es reversible: cuando una función recursiva lo último que hace es llamarse a sí misma, lo que se llama "recursividad a la cola" ("*tail recursion*"), eso se puede reemplazar por un `while`:

In [None]:
def imprimir(a):
    imprimir_recursivo(a,0)

def imprimir_recursivo(a,k): # imprimir desde a[k] en adelante, ahora NO recursivo
    while k<len(a): # reemplazó a "if k<len(a):"
        print(a[k])
        k+=1 # reemplazó a "imprimir_recursivo(a,k+1)"

In [None]:
a=np.random.random(6)
imprimir(a)

0.5879986363022844
0.22292489446199648
0.3649081383243461
0.0760636478498492
0.6282506237409337
0.9933423327883073


Pero ahora la función `imprimir_recursivo` es llamada desde un único lugar, con k=0, y por lo tanto, en ese lugar podemos sustituir la llamada por el código de la función, con lo que el resultado es:

In [None]:
def imprimir(a):
    # Esto reemplaza a "imprimir_recursivo(a,0)"
    k=0
    while k<len(a): # reemplazó a "if k<len(a):"
        print(a[k])
        k+=1 # reemplazó a "imprimir_recursivo(a,k+1)""

In [None]:
a=np.random.random(6)
imprimir(a)

0.2796059938546853
0.7140250823437458
0.27114927650914356
0.1913138660755075
0.3131581564588708
0.13509564673494912


¡Con lo cual hemos vuelto al punto de partida!

Sin embargo, esto solo funciona para eliminar la "recursividad a la cola". Si hay llamadas recursivas que **no** son lo último que ejecuta la función, no pueden eliminarse con esta receta, y como veremos más adelante, requerirá el uso de una estructura llamada una "pila" (*stack*).

El siguiente ejemplo ilustra un caso en que esto ocurre.

## Ejemplo: Torres de Hanoi

![Torres de Hanoi](https://github.com/ppoblete/AED/blob/master/ColorHanoi.jpg?raw=1)

Este puzzle consiste en trasladar $n$ discos desde la estaca 1 a la estaca 3, respetando siempre las dos reglas siguientes:
* Solo se puede mover de a un disco a la vez, y
* Nunca puede haber un disco más grande sobre uno más chico
Esto se puede resolver recursivamente de la siguiente manera:

![Torres de Hanoi](https://github.com/ppoblete/AED/blob/master/hanoi.gif?raw=1)

Para mover $n$ discos desde $a$ hasta $c$ (usando la estaca $b$ como auxiliar):
* Primero movemos (recursivamente) $n-1$ discos desde la estaca $a$ a la estaca $b$
* Una vez despejado el camino, movemos 1 disco desde $a$ hasta $c$
* Finalmente, movemos de nuevo (recursivamente) los $n-1$ discos, ahora desde $b$ hasta $c$ (usando $a$ como auxiliar)

El caso base es $n=0$, en cuyo caso no se hace nada.

In [None]:
def Hanoi(n, a, b, c): # Mover n discos desde "a" a "c", usando "b" como auxiliar
    if n>0:
        Hanoi(n-1, a, c, b)
        print(a, "-->", c) # Mueve 1 disco desde "a" hasta "c"
        Hanoi(n-1, b, a, c)

In [None]:
Hanoi(4, 1, 2, 3)

1 --> 2
1 --> 3
2 --> 3
1 --> 2
3 --> 1
3 --> 2
1 --> 2
1 --> 3
2 --> 3
2 --> 1
3 --> 1
2 --> 3
1 --> 2
1 --> 3
2 --> 3


Este algoritmo es muy claro y bastante intuitivo. Si aplicamos la regla de eliminación de "recursividad a la cola", lo que resulta es un algoritmo equivalente, pero mucho menos trivial de entender:

In [None]:
def Hanoi(n, a, b, c): # Mover n discos desde "a" a "c", usando "b" como auxiliar
    while n>0: # reemplaza a "if n>0:"
        Hanoi(n-1, a, c, b)
        print(a, "-->", c) # Mueve 1 disco desde "a" hasta "c"
        n-=1
        (a,b)=(b,a) # reemplaza a "Hanoi(n-1, b, a, c)"

In [None]:
Hanoi(3, 1, 2, 3)

1 --> 3
1 --> 2
3 --> 2
1 --> 3
2 --> 1
2 --> 3
1 --> 3


¿Puede usted dar una explicación intuitiva de por qué funciona este algoritmo?

## Diagramas de Estados

Consideremos una instrucción iterativa con un invariante "I", que se inicializa con instrucciones "B", con condición de continuación "C", con un cuerpo del ciclo consistente de instrucciones "A" y con el objetivo de lograr que se cumpla una afirmación lógica "F". Esto tendría la estructura siguiente:
```python
B
while C: # invariante I
    A
    
# al terminar se debería cumplir F
```

Anotando con un poco más de precisión, podemos identificar lo que se cumple en cada punto:
```python
B
# aquí se cumple el invariante "I" por primera vez
while C:
    # aquí se cumple "I and C"
    A
    # acá se debe cumplir nuevamente "I"
    
# al terminar el ciclo se cumple "I and not C"
# y eso debe implicar que se cumple F
```

Esto se puede visualizar de manera más sencilla en un **diagrama de estados** como el siguiente:

![Diagrama de Estados 1](https://github.com/ppoblete/AED/blob/master/state-diagram-1.png?raw=1)

En este diagrama:
* Los estados (círculos) representan el estado del proceso en ese momento, descrito por la afirmación lógica correspondiente. En un ciclo, esa afirmación lógica es lo que hemos llamado invariante.
* Un doble círculo representa a un estado final.
* Las flechas pueden llevar como rótulo un "if" con una condición, que debe cumplirse para que se siga esa flecha, y también pueden estar rotuladas con una instrucción (o un bloque de instrucciones), que se ejecuta al hacer esa transición.

Una ventaja de modelar un algoritmo en base a un diagrama de estados es que no estamos restringidos solo a los diagramas simples que corresponden a ciclos `while`, sino que podemos construir diagramas mucho más complejos, con múltiples estados y transiciones.

Piensen por ejemplo en cómo modelar el funcionamiento de un **cajero automático**:

* El cajero está originalmente en un estado inicial, que es además el estado al cual regresa cada vez que concluye la atención de un cliente.
* Cuando llega un cliente e inserta su tarjeta, el cajero debe verificar que la tarjeta es legible y si no es, debe devolverla con un mensaje de error y volver al estado inicial.
* Si la tarjeta es legible, debe pedir que ingrese el PIN y pasar a otro estado en que espera que el cliente ingrese dicha clave.
* Si la clave es incorrecta, debe pedir que la ingrese de nuevo y seguir en ese estado. Pero eso tiene un límite, porque si el usuario comete muchos errores, el cajero debe dar un mensaje de error, retener la tarjeta y volver al estado inicial.
* Si la clave es correcta, debe mostrar un menú de posibles operaciones y esperar que el cliente seleccione una.
* Si el cliente selecciona "Retirar dinero", debe pasar a otro estado en que le pregunta el monto que quiere sacar.
* Etc., etc., etc.,

En realidad, el diagrama de estados de un cajero automático es enorme, porque en cada estado hay múltiples opciones que conducen a realizar acciones y trasladarse a otros estados. Además, hay "timeouts" que interrumpen el proceso si una operación se demora demasiado. El diagrama de estados es la herramienta que permite modelar este tipo de procesos complejos.



## Ejemplo: Contar palabras

Supongamos que tenemos un string que contiene una frase y queremos contar cuántas palabras contiene. Para simplificar, supondremos que una palabra es cualquier secuencia de caracteres distintos de un espacio en blanco. Por ejemplo, el string
```python
"    Algoritmos y    Estructuras  de   Datos   "
```
contiene 5 palabras.

Para resolver este problema, iremos examinando uno a uno los caracteres del string, y para cada uno deberemos decidir si ese caracter es el comienzo de una nueva palabra o no. Esto depende de si estábamos FUERA de una palabra (en cuyo caso sí es el inicio y hay que incrementar el contador de palabars) o si estábamos DENTRO de una palabra (en cuyo caso no se incrementa).

Esto sugiere tener un diagrama de estados con dos estados (FUERA y DENTRO), más un tercer estado final FIN, al que se llega cuando se agota el string.

El siguiente diagrama modela este proceso, donde el caracter que se está examinando en cada momento es $s[k]$. Para simplificar, suponemos que las transiciones hacia FIN tienen prioridad. Además, como en cada transición se examina un nuevo caracter, dejaremos implícita la inicialización $k=0$ y el incremento $k+=1$ que hay después de cada transición.

![Diagrama de Estados 2](https://github.com/ppoblete/AED/blob/master/state-diagram-2.png?raw=1)

Una vez modelado el proceso mediante un diagrama de estados, debemos escribirlo en forma de un programa. Veremos a continuación que **hay más de una manera de hacerlo**:

In [None]:
# Contar palabras, versión 1 con variables de estado
def contar_palabras(s):
    np=0
    estado="FUERA"
    for k in range(0,len(s)):
        if estado=="FUERA":
            if s[k]!=' ':
                np+=1
                estado="DENTRO"
        else: # estado=="DENTRO"
            if s[k]==' ':
                estado="FUERA"
    return np

In [None]:
s=input("Escriba frase: ")
print("Hay", contar_palabras(s), "palabras")

Escriba frase: Hola    como    estan
Hay 3 palabras


In [None]:
# Contar palabras, versión 2 con variables de estado
def contar_palabras(s):
    np=0
    estado="FUERA"
    for k in range(0,len(s)):
        if s[k]==' ':
            estado="FUERA"
        else: # s[k]!=' '
            if estado=="FUERA":
                np+=1
            estado="DENTRO"
    return np

In [None]:
s=input("Escriba frase: ")
print("Hay", contar_palabras(s), "palabras")

Escriba frase:        Hola como      estan     
Hay 3 palabras


In [None]:
# Contar palabras, versión sin variables de estado
def contar_palabras(s):
    np=0
    k=0
    while k<len(s):
        # Estamos en el estado FUERA
        if s[k]!=' ':
            np+=1
            k+=1
            # Ahora estamos en el estado DENTRO
            while k<len(s) and s[k]!=' ':
                k+=1
            if k==len(s):
                break
            # Por descarte, s[k]==' '
        k+=1
    return np

In [None]:
s=input("Escriba frase: ")
print("Hay", contar_palabras(s), "palabras")

---

### Ejercicio 1.4

Se le llama "Camel Case" a la convención de escribir una frase sin espacios, pero marcando el inicio de cada palabra poniendo su primera letra en mayúscula. Por ejemplo, la frase
```
"  Algoritmos y    estructuras de   datos   "
```
transformada a Camel Case queda así:
```
"AlgoritmosYEstructurasDeDatos"
```

Escriba una función que transforme a Camel Case y pruébela:

In [None]:
def CamelCase(s):
    """Retorna un string conteniendo la versión Camel Case del string s"""
    # escriba aquí su algoritmo

In [None]:
print(CamelCase("    Algoritmos y    estructuras de   datos   "))

---