# Caso de estudio: Juego de palabras
Este tema presenta un caso de estudio, que consiste en resolver rompecabezas de palabras buscando palabras que tengan ciertas propiedades. Por ejemplo, encontraremos los palíndromos más largos en inglés y buscaremos palabras cuyas letras aparezcan en orden alfabético. Y presentaré otro plan de desarrollo de programas: la reducción a un problema previamente resuelto.

## Lectura de listas de palabras
Para los ejercicios de este tema necesitamos una lista de palabras en inglés. Hay muchas listas de palabras disponibles en la Web, pero la más adecuada para nuestro propósito es una de las listas de palabras recopiladas y contribuidas al dominio público por Grady Ward como parte del proyecto del léxico Moby (ver http://wikipedia.org/wiki/Moby_Project). Es una lista de palabras que se consideran válidas en los crucigramas y otros juegos de palabras. 
En la colección Moby, el nombre del archivo es 113809of.fic; en este curso tienes una copia con el nombre más simple de words.txt.

Este archivo está en texto plano, así que puedes abrirlo con un editor de texto, pero también puedes leerlo desde Python. La función integrada open toma el nombre del archivo como parámetro y devuelve un **objeto de archivo** que puede utilizar para leer el archivo.

In [None]:
f_in = open('words.txt')

*f_in* es un nombre común para un objeto de archivo utilizado para la entrada. El objeto de archivo proporciona varios métodos de lectura, incluida la línea de lectura, que lee los caracteres del archivo hasta que llega a una nueva línea y devuelve el resultado como una cadena:

In [None]:
f_in.readline()

La primera palabra en esta lista en particular es "aa", que es una especie de lava. La secuencia \n representa un espacio en blanco, una nueva línea, que separa esta palabra de la siguiente.

El objeto de archivo guarda un registro de su posición en el archivo, de modo que si vuelve a llamar a readline, obtendrá la siguiente palabra:

In [None]:
f_in.readline()

La siguiente palabra es "aah", que es una palabra perfectamente legítima, así que deja de poner esa cara. O, si es el caracter de final de línea lo que te molesta, podemos deshacernos de él con en método *strip* para cadenas de caracteres:

In [None]:
line = f_in.readline()
word = line.strip()
word

También puedes utilizar un objeto de archivo como parte de un bucle. Este programa lee words.txt e imprime cada palabra, una por línea:

In [None]:
f_in = open('words.txt')
for line in f_in:
    word = line.strip()
    print(word)
f_in.close()

O mejor, separadas por espacios:

In [None]:
f_in = open('words.txt')
for line in f_in:
    word = line.strip()
    print(word,end=" ")
f_in.close()

Es importante que te fijes que al acabar el bucle cerramos el fichero porque ya no lo vamos a necesitar más.

## Ejercicios
Hay soluciones para estos ejercicios en la siguiente sección. 

### Ejercicio P2-1.
Escribe un programa que lea words.txt e imprima sólo las palabras con más de 20 caracteres (sin contar los espacios en blanco).

### Ejercicio P2-2.
En 1939 Ernest Vincent Wright publicó una novela de 50.000 palabras llamada Gadsby que no contiene la letra "e". Puesto que "e" es la letra más común en inglés, no es fácil de hacer. De hecho, es difícil construir un pensamiento solitario sin usar el símbolo más común. Es un proceso lento al principio, pero con precaución y horas de entrenamiento se puede obtener gradualmente la habilidad.

Escribe una función llamada _has\_no\_e_ que devuelve _True_ si la palabra dada no tiene la letra "e" en ella.

Modifica tu programa de la sección anterior para imprimir sólo las palabras que no tienen "e" y calcula el porcentaje de las palabras de la lista que no tienen "e".

### Ejercicio P2-3.
Escribe una función llamada a *avoids* que tome una palabra y una cadena de letras prohibidas, y que devuelva _True_ si la palabra no usa ninguna de las letras prohibidas.

Modifica tu programa de la sección anterior para imprimir sólo las palabras que no tienen "e" y crea una nueva que encuentre aquellas palabras que no contienen ninguno de los caracteres de una lista prohibida. Debe devolver el porcentaje de palabras que no contienen la lista proibidad. ¿Puedes encontrar una combinación de cinco letras prohibidas que excluya el menor número de palabras?

### Ejercicio P2-4.

Escribe una función llamada *uses_only* que reciba una palabra y una cadena de letras, y que devuelva _True_ si la palabra contiene sólo letras en la lista. ¿Puedes hacer una oración usando sólo las letras acefhlo? ¿Además de "Hoe alfalfa"?

### Ejercicio P2-5.

Escribe una función llamada *uses_all* que reciba una palabra y una cadena de letras requeridas, y que devuelva _True_ si la palabra usa todas las letras requeridas al menos una vez. ¿Cuántas palabras hay que usan todas las vocales aeiou? ¿Y aeiouy?

### Ejercicio P2-6.
Escribe una función llamada *is_abecedarian* que devuelve _True_ si las letras de una palabra aparecen en orden alfabético (las letras dobles también valen como orden alfabético). ¿Cuántas palabras abecedarias hay?

## Bucles con índices
Vamos a crear la funcion *is_abecedarian* que indica si una determinada palabra tiene todas sus letras en orden alfabético-

Para *is_abecedarian* tenemos que comparar las letras adyacentes, lo que es un poco difícil con un bucle de for:

In [None]:
def is_abecedarian(word):
    previous = word[0]
    for c in word:
        if c < previous:
            return False
        previous = c
    return True

Una alternativa es utilizar la recursión:

In [None]:
def is_abecedarian(word):
    if len(word) <= 1:
        return True
    if word[0] > word[1]:
        return False
    return is_abecedarian(word[1:])

Otra opción es usar un bucle while:

In [None]:
def is_abecedarian(word):
    i = 0
    while i < len(word)-1:
        if word[i+1] < word[i]:
            return False
        i = i+1
    return True   

El bucle comienza en i=0 y termina cuando i=len(word)-1. Cada vez que pasa por el bucle, compara el i-ésimo carácter (que se puede considerar como el carácter actual) con el i+1er carácter (que se puede considerar como el siguiente).

Si el siguiente carácter es menor que (alfabéticamente antes) el actual, entonces hemos descubierto una ruptura en la tendencia abecedaria, y retornamos _False_.

Si llegamos al final del bucle sin encontrar un fallo, entonces la palabra pasa la prueba. Para convencerse de que el bucle termina correctamente, considera un ejemplo como "flossy". La longitud de la palabra es 6, por lo que la última vez que se ejecuta el bucle es cuando i es 4, que es el índice del penúltimo carácter. En la última iteración, compara el penúltimo caracter con el último, que es lo que queremos.

Aquí hay una versión de is_palindrome (ver Ejercicio P2-3) que usa dos índices: uno empieza por el principio y sube; el otro empieza por el final y baja.

In [None]:
def is_palindrome(word):
    i = 0
    j = len(word)-1
    while i<j:
        if word[i] != word[j]:
            return False
        i = i+1
        j = j-1
    return True

O podríamos reducir a un problema previamente resuelto y escribir:

In [None]:
def is_palindrome(word):
    return is_reverse(word, word) # Tienes que copiar is_reverse del notebook anterior

Usando is_reverse del tema anterior.

## Depuración
Probar los programas es difícil. Las funciones de este tema son relativamente fáciles de probar porque puede comprobar los resultados a mano. Aún así, está entre difícil e imposible elegir un conjunto de palabras que comprueben todos los posibles errores.

Tomando _has_no_e_ como ejemplo, hay dos casos obvios para comprobar: las palabras que tienen una 'e' deberían devolver _False_, y las palabras que no deberían devolver _Ture_. No deberías tener problemas para encontrar alguna palabra de cada tipo.

En cada caso, hay algunos subcasos menos obvios. Entre las palabras que tienen una "e", debes probar las palabras con una "e" al principio, al final y en algún lugar en el medio. Debes probar palabras largas, palabras cortas y palabras muy cortas, como la cadena vacía. La cadena vacía es un ejemplo de un **caso especial**, que es uno de los casos no obvios en los que a menudo se esconden errores.

Además de los casos de prueba que generes, también puedes probar tu programa con una lista de palabras como words.txt. Al escanear la salida, es posible que pueda detectar errores, pero ten cuidado: puedes detectar un tipo de error (palabras que no deben incluirse, pero que lo son) y no otro (palabras que deben incluirse, pero que no lo son).

En general, las pruebas pueden ayudarle a encontrar errores, pero no es fácil generar un buen conjunto de casos de prueba, e incluso si lo haces, no puedes estar seguro de que tu programa sea correcto. Según un legendario informático:

Las pruebas del programa pueden ser usadas para mostrar la presencia de errores, pero nunca para mostrar su ausencia! (Edsger W. Dijkstra)

## Glosario
- *fichero objeto*: Un valor que representa un archivo abierto.
- *reducción a un problema previamente resuelto*: Una forma de resolver un problema expresándolo como una instancia de un problema previamente resuelto.
- *caso especial: Un caso de prueba que es atípico o no obvio (y menos probable que se maneje correctamente).

## Ejercicios
### Ejercicio P2-7.
Esta pregunta se basa en un Puzzle que fue transmitido en el programa de radio Car Talk (http://www.cartalk.com/content/puzzlers):

Este problema sólo funciona con el diccionario en inglés. Busca una palabra con tres letras dobles consecutivas. Como ejemplo te diré un par de palabras que casi lo cumplen, pero no lo hacen. Por ejemplo: "committee',  c-o-m-m-i-t-t-e-e. Sería genial si no fuera por la "i" que se cuela por en medio. O Mississippi: M-i-s-s-i-s-s-i-p-p-i. Si pudieras quitar esos i's intermedios, funcionaría. Pero hay una palabra que tiene tres pares de letras consecutivos y que yo sepa, esta puede ser la única palabra. Es posible que haya 500 más, pero sólo puedo pensar en una. ¿Cuál es la palabra? Escribe un programa para encontrarla.

### Ejercicio P2-8.
Aquí hay otro Car Talk Puzzler (http://www.cartalk.com/content/puzzlers):

"El otro día estaba conduciendo por la autopista y me fijé en mi cuentakilómetros. Como la mayoría de los odómetros, muestra seis dígitos, en kilómetros enteros solamente. Así que, si mi coche tuviera 300.000 kilómetros, por ejemplo, vería 3-0-0-0-0-0.

"Lo que vi ese día fue muy interesante. Noté que los últimos 4 dígitos eran palindrómicos; es decir, se leen lo mismo hacia adelante que hacia atrás. Por ejemplo, 5-4-4-5 es un palíndromo, así que en mi cuentakilómetros podría poner 3-1-5-4-4-5.

"Un kilómetro después, los últimos 5 números eran palindrómicos. Por ejemplo, podría haber leído 3-6-5-4-5-6. Un kilómetro después de eso, los 4 números del medio de 6 eran palindrómicos. ¿Y estás listo para esto? Una kilómetro más tarde, los 6 eran palindrómicos!

"La pregunta es, ¿qué había en el odómetro cuando miré por primera vez?" 

Escribe un programa Python que pruebe todos los números de seis dígitos e imprime cualquier número que satisfaga estos requisitos.

### Ejercicio P2-9.

Aquí hay otro rompecabezas de Car Talk que puedes resolver con una búsqueda (http://www.cartalk.com/content/puzzlers):

"Recientemente tuve una visita a mi madre y nos dimos cuenta de que los dos dígitos que componen mi edad cuando se revierte son su edad. Por ejemplo, si ella tiene 73 años, yo tengo 37. Nos preguntábamos con qué frecuencia ha ocurrido esto a lo largo de los años, pero nos desviamos con otros temas y nunca llegamos a una respuesta".

"Cuando llegué a casa me di cuenta de que los dígitos de nuestras edades han sido reversibles seis veces hasta ahora. También me di cuenta de que si teníamos suerte, volvería a ocurrir en unos pocos años, y si teníamos mucha suerte, volvería a ocurrir una vez más. En otras palabras, habría ocurrido 8 veces en total. Así que la pregunta es, ¿cuántos años tengo ahora?"

Escribe un programa Python que busque soluciones para este Puzzle. Sugerencia: puede que encuentres útil el método de cadenas zfill.