# Capítulo 12 - Tuplas

Uma tupla é uma sequência de valores. Os valores podem ser de qualquer tipo, e podem ser indexados por números inteiros, portanto, nesse sentido, as tuplas são muito parecidas com as listas. A diferença importante é que as tuplas são imutáveis.

Sintaticamente, uma tupla é uma lista de valores separados por vírgulas:

In [1]:
t = 'a', 'b', 'c', 'd', 'e'

Embora não seja sempre necessário, é comum colocar tuplas entre parênteses:

In [2]:
t = ('a', 'b', 'c', 'd', 'e')

Para criar uma tupla com um único elemento, é preciso incluir uma vírgula final:

In [3]:
t1 = 'a',
type(t1)

tuple

In [4]:
# Um único valor entre parênteses não é uma tupla:
t2 = ('a')
type(t2)

str

In [5]:
# Outra forma de criar uma tupla é com a função integrada tuple. 
# Sem argumentos, cria uma tupla vazia:
t3 = tuple()
type(t3)

tuple

In [6]:
# Se os argumentos forem uma sequência (string, lista ou tupla), 
# o resultado é uma tupla com os elementos da sequência:
t = tuple('lupins')
t

('l', 'u', 'p', 'i', 'n', 's')

In [7]:
# A maior parte dos operadores de lista também funciona em tuplas. 
# O operador de colchetes indexa um elemento:
t = ('a', 'b', 'c', 'd', 'e')
t[0]

'a'

In [8]:
# E o operador de fatia seleciona vários elementos:
t[1:3]

('b', 'c')

In [9]:
# Entretanto, se tentar alterar um dos elementos da tupla, vai receber um erro:
t[0] = 'A'

TypeError: 'tuple' object does not support item assignment

In [10]:
# Como tuplas são imutáveis, você não pode alterar os elementos, mas pode substituir uma tupla por outra:
t = ('A',) + t[1:]
t
# Essa instrução faz uma nova tupla e então a atribui a t.

('A', 'b', 'c', 'd', 'e')

In [11]:
# Os operadores relacionais funcionam com tuplas e outras sequências:
(0, 1, 2) < (0, 3, 4)

True

In [12]:
(0, 1, 2000000) < (0, 3, 4)

True

In [13]:
# Muitas vezes, é útil trocar os valores de duas variáveis. 
# Com a atribuição convencional, é preciso usar uma variável temporária. 
# Por exemplo, trocar a e b.
a = tuple('abc')
b = tuple('xyz')

temp = a
a = b
b = temp

a

('x', 'y', 'z')

In [14]:
# Essa solução é trabalhosa; a atribuição de tuplas é mais elegante:
a = tuple('abc')
b = tuple('xyz')

a, b = b, a

print(a, b)

('x', 'y', 'z') ('a', 'b', 'c')


In [15]:
# De forma geral, o lado direito pode ter qualquer tipo de sequência (string, lista ou tupla). 
# Por exemplo, para dividir um endereço de email em um nome de usuário e um domínio, você poderia escrever:

addr = 'virginiasatyro@gmail.com'
uname, domain = addr.split('@')

print(uname, domain)

virginiasatyro gmail.com


In [16]:
# A função integrada divmod toma dois argumentos e devolve uma tupla de dois valores: o quociente e o resto. 
# Você pode guardar o resultado como uma tupla:
t = divmod(7, 3)
t

(2, 1)

In [17]:
# Ou usar a atribuição de tuplas para guardar os elementos separadamente:
quot, rem = divmod(7, 3)

print(quot, rem)

2 1


In [18]:
# Aqui está um exemplo de função que retorna uma tupla:
def min_max(t):
  return min(t), max(t)

In [19]:
# As funções podem receber um número variável de argumentos. 
# Um nome de parâmetro que comece com * reúne vários argumentos em uma tupla. 
# Por exemplo, printall recebe qualquer número de argumentos e os exibe:
def printall(*args):
    print(args)

printall(1, 2.0, '3')

(1, 2.0, '3')


In [20]:
# O complemento de reunir é espalhar. 
# Por exemplo, o divmod recebe exatamente dois argumentos; ele não funciona com uma tupla:

t = (7, 3)
divmod(t)

TypeError: divmod expected 2 arguments, got 1

In [21]:
# No entanto, se você espalhar a tupla, aí funciona:
divmod(*t)

(2, 1)

Muitas das funções integradas usam tuplas com argumentos de comprimento variável. Por exemplo, `max` e `min` podem receber qualquer número de argumentos:

In [22]:
max(1, 2, 3)

3

In [23]:
# Mas sum, não:
sum(1, 2, 3)

TypeError: sum() takes at most 2 arguments (3 given)

In [24]:
# Como exercício, escreva uma função chamada sumall que receba qualquer número de argumentos e retorne a soma deles.
def sumall(*args):
    total = 0
    for num in args:
        total += num
    return total

sumall(1, 2, 3, 4, 5)

15

`zip` é uma função integrada que recebe duas ou mais sequências e devolve uma lista de tuplas onde cada tupla contém um elemento de cada sequência. O nome da função tem a ver com o zíper, que se junta e encaixa duas carreiras de dentes.

In [25]:
s = 'abc' 
t = [0, 1, 2]
zip(s, t)

<zip at 0x21b1bdbed80>

In [26]:
for pair in zip(s, t):
  print(pair)

('a', 0)
('b', 1)
('c', 2)


In [27]:
# Se quiser usar operadores e métodos de lista, você pode usar um objeto zip para fazer uma lista:
list(zip(s, t))

[('a', 0), ('b', 1), ('c', 2)]

In [2]:
# Você pode usar a atribuição de tuplas em um loop for para atravessar uma lista de tuplas:
t = [('a', 0), ('b', 1), ('c', 2)]
for letter, number in t:
    print(number, letter)

0 a
1 b
2 c


In [3]:
# Os dicionários têm um método chamado items que devolve uma sequência de tuplas, onde cada tupla é um par chave-valor:
d = {'a':0, 'b':1, 'c':2}
t = d.items()
t

dict_items([('a', 0), ('b', 1), ('c', 2)])

In [4]:
# O resultado é um objeto dict_items, que é um iterador que percorre os pares chave-valor. 
# Você pode usá-lo em um loop for, desta forma:
for key, value in d.items():
    print(key, value)

a 0
b 1
c 2


In [5]:
# Indo em outra direção, você pode usar uma lista de tuplas para inicializar um novo dicionário:
t = [('a', 0), ('c', 2), ('b', 1)]
d = dict(t)
d

{'a': 0, 'c': 2, 'b': 1}

Em muitos contextos, os tipos diferentes de sequências (strings, listas e tuplas) podem ser usados de forma intercambiável. **Então, como escolher uma em vez da outra?**

Para começar com o óbvio, as strings são mais limitadas que outras sequências porque os elementos têm de ser caracteres. Também são imutáveis. Se precisar da capacidade de alterar caracteres em uma string (em vez de criar outra string) você pode querer usar uma lista de caracteres.

*As listas são mais comuns que as tuplas, principalmente porque são mutáveis*. Mas há alguns casos em que você pode preferir tuplas:

1. Em alguns contextos, como em uma instrução `return`, é sintaticamente mais simples criar uma tupla que uma lista.

2. Se quiser usar uma sequência como uma chave de dicionário, é preciso usar um tipo imutável como uma tupla ou string.

3. Se estiver passando uma sequência como um argumento a uma função, usar tuplas reduz o potencial de comportamento inesperado devido a alias.

Como tuplas são imutáveis, elas não fornecem métodos como `sort` e `reverse`, que alteram listas existentes. Porém, o Python fornece a função integrada `sorted`, que recebe qualquer sequência e retorna uma nova lista com os mesmos elementos ordenados, e `reversed`, que recebe uma sequência e retorna um iterador que percorre a lista em ordem reversa.


--------------

As listas, os dicionários e as tuplas são exemplos de estruturas de dados; neste capítulo estamos começando a ver estruturas de dados compostas, como as listas de tuplas ou dicionários que contêm tuplas como chaves e listas como valores. As estruturas de dados compostas são úteis, mas são propensas ao que chamo de erros de forma; isto é, erros causados quando uma estrutura de dados tem o tipo, tamanho ou estrutura incorretos. Por exemplo, se você estiver esperando uma lista com um número inteiro e eu der apenas o número inteiro (não em uma lista), não vai funcionar.

Para ajudar a depurar esses tipos de erro, escrevi um módulo chamado structshape, que fornece uma função, também chamada structshape, que recebe qualquer tipo de estrutura de dados como argumento e retorna uma string, que resume sua forma. 

In [6]:
"""
This module provides one function, structshape(), which takes
an object of any type and returns a string that summarizes the
"shape" of the data structure; that is, the type, size and
composition.

This module is part of Swampy, a suite of programs available from
allendowney.com/swampy.

Copyright 2012 Allen B. Downey
Distributed under the GNU General Public License at gnu.org/licenses/gpl.html.

"""

from __future__ import print_function

def structshape(ds, pending=None):
    """Returns a string that describes the shape of a data structure.

    ds: any Python object

    Returns: string
    """
    if pending is None:
        pending = set()

    if id(ds) in pending:
        return 'infinity'

    pending = pending | set([id(ds)])

    typename = type(ds).__name__

    # handle sequences
    sequence = (list, tuple, set, frozenset, type(iter('')))
    if isinstance(ds, sequence):
        t = []
        for i, x in enumerate(ds):
            t.append(structshape(x, pending))
        rep = '%s of %s' % (typename, listrep(t))
        return rep

    # handle dictionaries
    elif isinstance(ds, dict):
        keys = set()
        vals = set()
        for k, v in ds.items():
            keys.add(structshape(k, pending))
            vals.add(structshape(v, pending))
        rep = '%s of %d %s->%s' % (typename, len(ds), 
                                   setrep(keys), setrep(vals))
        return rep

    # handle other types
    else:
        if hasattr(ds, '__class__'):
            return ds.__class__.__name__
        else:
            return typename


def listrep(t):
    """Returns a string representation of a list of type strings.

    t: list of strings

    Returns: string
    """
    if len(t) == 0:
        return 'empty'

    current = t[0]
    count = 0
    res = []
    for x in t:
        if x == current:
            count += 1
        else:
            append(res, current, count)
            current = x
            count = 1
    append(res, current, count)
    return setrep(res)


def setrep(s):
    """Returns a string representation of a set of type strings.

    s: set of strings

    Returns: string
    """
    rep = ', '.join(s)
    if len(s) == 1:
        return rep
    else:
        return '(' + rep + ')'
    return 


def append(res, typestr, count):
    """Adds a new element to a list of type strings.

    Modifies res.

    res: list of type strings
    typestr: the new type string
    count: how many of the new type there are

    Returns: None
    """
    if count == 1:
        rep = typestr
    else:
        rep = '%d %s' % (count, typestr)
    res.append(rep)


if __name__ == '__main__':
    t = []
    print(structshape(t))

    t = [1,2,3]
    print(structshape(t))

    t2 = [[1,2], [3,4], [5,6]]
    print(structshape(t2))

    t3 = [1, 2, 3, 4.0, '5', '6', [7], [8], 9]
    print(structshape(t3))

    class Point:
        """trivial object type"""

    t4 = [Point(), Point()]
    print(structshape(t4))

    s = set('abc')
    print(structshape(s))

    lt = zip(t, s)
    print(structshape(lt))

    d = dict(lt)        
    print(structshape(d))

    it = iter('abc')
    print(structshape(it))

    t = []
    t.append(t)
    print(structshape(t))

list of empty
list of 3 int
list of 3 list of 2 int
list of (3 int, float, 2 str, 2 list of int, int)
list of 2 Point
set of 3 str
zip
dict of 3 int->str
str_ascii_iterator of 3 str
list of infinity


In [7]:
t = [1, 2, 3]
structshape(t)

'list of 3 int'

In [8]:
t2 = [[1,2], [3,4], [5,6]]
structshape(t2)

'list of 3 list of 2 int'

In [9]:
t3 = [1, 2, 3, 4.0, '5', '6', [7], [8], 9]
structshape(t3)

'list of (3 int, float, 2 str, 2 list of int, int)'

In [10]:
s = 'abc'
lt = list(zip(t, s))
structshape(lt)

'list of 3 tuple of (int, str)'

In [11]:
d = dict(lt)
structshape(d)

'dict of 3 int->str'

## Glossário

- **tupla**:
    - Sequência imutável de elementos.

- **atribuição de tupla**:
    - Atribuição com uma sequência no lado direito e uma tupla de variáveis à esquerda. O lado direito é avaliado e então seus elementos são atribuídos às variáveis à esquerda.

- **gather**:
    - Operação para montar uma tupla com argumento de comprimento variável.

- **scatter**:
    - Operação para tratar uma sequência como uma lista de argumentos.

- **objeto zip**:
    - O resultado de chamar uma função integrada zip; um objeto que se repete por uma sequência de tuplas.

- **iterador**:
    - Objeto que pode se repetir por uma sequência, mas que não oferece operadores de lista e métodos.

- **estrutura de dados**:
    - Coleção de valores relacionados, muitas vezes organizados em listas, dicionários, tuplas etc.

- **erro de forma**:
    - Erro causado pelo fato de o valor ter a forma incorreta; isto é, tipo ou tamanho incorreto.


## Exercícios

### Exercício 12.1

Escreva uma função chamada `most_frequent` que receba uma string e exiba as letras em ordem decrescente de frequência. Encontre amostras de texto de vários idiomas diferentes e veja como a frequência das letras varia entre os idiomas. Compare seus resultados com as tabelas em http://en.wikipedia.org/wiki/Letter_frequencies.

Solução: http://thinkpython2.com/code/most_frequent.py.

In [12]:
def most_frequent(str):
  letter_dic = {}
  for letter in str:
    print(letter)
    if letter in letter_dic:
      letter_dic[letter] += 1
    else:
      letter_dic[letter] = 1

  #for i in letter_dic:
  #  print(i, letter_dic)
  ordered = dict(sorted(letter_dic.items(), key=lambda item: item[1], reverse=True))
  print(ordered)

  return 0

most_frequent('paralelepipedo')

p
a
r
a
l
e
l
e
p
i
p
e
d
o
{'p': 3, 'e': 3, 'a': 2, 'l': 2, 'r': 1, 'i': 1, 'd': 1, 'o': 1}


0

In [13]:
# versão do autor https://greenteapress.com/thinkpython/code/most_frequent.py
def make_histogram(s):
    """Make a map from letters to number of times they appear in s.

    s: string

    Returns: map from letter to frequency
    """
    hist = {}
    for x in s:
        hist[x] = hist.get(x, 0) + 1
    return hist

def most_frequent(s):
    """Sorts the letters in s in reverse order of frequency.

    s: string

    Returns: list of letters
    """
    hist = make_histogram(s)

    t = []
    for x, freq in hist.items():
        t.append((freq, x))

    t.sort(reverse=True)

    res = []
    for freq, x in t:
        res.append(x)

    return res

most_frequent('paralelepipedo')

['p', 'e', 'l', 'a', 'r', 'o', 'i', 'd']

### Exercício 12.2

Mais anagramas!

1. Escreva um programa que leia uma lista de palavras de um arquivo (veja “Leitura de listas de palavras”, na página 133) e imprima todos os conjuntos de palavras que são anagramas.

Aqui está um exemplo de como a saída pode parecer:

```
        ['deltas', 'desalt', 'lasted', 'salted', 'slated', 'staled']
        ['retainers', 'ternaries']
        ['generating', 'greatening']
        ['resmelts', 'smelters', 'termless']
```
        
Dica: você pode querer construir um dicionário que mapeie uma coleção de letras a uma lista de palavras que podem ser soletradas com essas letras. A pergunta é: como representar a coleção de letras de forma que possa ser usada como uma chave?

2. Altere o programa anterior para que exiba a lista mais longa de anagramas primeiro, seguido pela segunda mais longa, e assim por diante.

3. No Scrabble, um “bingo” é quando você joga todas as sete peças na sua estante, junto com uma peça no tabuleiro, para formar uma palavra de oito letras. Que coleção de oito letras forma o maior número possível de bingos? Dica: há sete.

Solução: http://thinkpython2.com/code/anagram_sets.py.

In [14]:
# ordena as letras de uma palavra
def sort_letters(str):
  str_list = []
  for s in str:
    str_list.append(s)
  
  str_sorted = ''.join(sorted(str_list))
  print(str_sorted)

  return str_sorted

# sort_letters('deltas')

In [15]:
with open('words.txt') as fin:
    anagram_dict = {}

    for line in fin:
        word = line.strip()
        key = sort_letters(word)
        anagram_dict.setdefault(key, []).append(word)

aa
aah
aadeh
aaghin
aahs
aal
aaiil
aaiils
aals
aaadkrrv
aaadkrrsv
aadflorw
aadelorsvw
aas
aaeglosv
aaeglossv
aab
aaabc
aaabcs
aabci
aabck
aabcsu
aabcessu
aabft
aaabk
aaabks
aabelno
aabelnos
aabmp
aabeempr
aabeemprs
aabmps
aabdnno
aabddenno
aabdginnno
aabdemnnnot
aabdemnnnost
aabdnnos
aabs
aabes
aabdes
aabdelsy
aabeemnst
aabeemnsst
aabers
aaberss
aabess
aabhs
aabdehs
aabehss
aabghins
aabgins
aaabbelt
aabet
aabdet
aabeemntt
aabeemnstt
aabert
aaberst
aabest
aabgint
aabist
aabeisst
aabort
aaborst
aabistt
aabeisstt
aabiortt
aabiorstt
aaabilx
aabeilx
aabbceis
aabbcy
aaabbilt
abbe
abbes
abbess
abbeesss
abbey
abbesy
abbot
abbceiost
abbcoty
abbost
aabbeeirtv
aabbdeeirtv
aabbeeirstv
aabbegiinrtv
aabbeiinortv
aabbeiinorstv
aabcdeit
aabcddeit
aabcdeist
aabcdgiint
aabcdiinot
aabcdiinost
abdemno
abdemnos
aabdimno
aabdilmno
aabdillmnoy
abcdeu
abcddeu
abcdensu
abcdentu
abcdeenstu
abcdesu
abcdginu
abcdtu
abcddetu
abcdgintu
abcdortu
abcdeorstu
abcdorstu
abcdstu
aabem
abde
abeel
abeels
abeklmos
abeklmoss

In [16]:
print(sort_letters('deltas'))
print('adelst', anagram_dict['adelst'])

adelst
adelst
adelst ['deltas', 'desalt', 'lasted', 'salted', 'slated', 'staled']


In [17]:
# remover do dicionario se não houver anagramas
def as_list(v):
    return v if isinstance(v, (list, tuple, set)) else [v]

multi_anagram_dict = {}
multi_anagram_dict = [key for key, value in anagram_dict.items() if len(as_list(value)) > 1]


In [18]:
multi_anagram_dict

['aah',
 'aadeh',
 'aal',
 'aals',
 'aab',
 'aaabcs',
 'aabs',
 'aabeemnst',
 'aabgins',
 'aaberst',
 'aabort',
 'aaborst',
 'abbe',
 'abbes',
 'aabem',
 'abde',
 'abeklmos',
 'abet',
 'abest',
 'aabelstt',
 'abeertt',
 'abeerstt',
 'abeortt',
 'abeorstt',
 'abdehorr',
 'abehorrr',
 'abehorrrs',
 'abghinorr',
 'abdei',
 'abddei',
 'abdeirs',
 'abdeis',
 'aabdelt',
 'aabgilnt',
 'abel',
 'abelr',
 'abels',
 'abelst',
 'abilns',
 'abelntu',
 'abelnstu',
 'abilnotu',
 'abilnostu',
 'abhmo',
 'abhmos',
 'abo',
 'aabdor',
 'abdeo',
 'abdeos',
 'abort',
 'abdeort',
 'abeorrt',
 'abeorrst',
 'abginort',
 'aborst',
 'abos',
 'abdnosu',
 'aabcert',
 'aabcdeert',
 'aabceginrt',
 'aabcerst',
 'abdegir',
 'abddegir',
 'abdegirs',
 'abdggiinr',
 'abirs',
 'abceiss',
 'abbeorrs',
 'abbeorrss',
 'abinooprst',
 'aabcerrstt',
 'abesu',
 'abdesu',
 'abersu',
 'aberssu',
 'abtu',
 'abstu',
 'aby',
 'abdey',
 'abginy',
 'absy',
 'abssy',
 'aacdir',
 'aaacdinr',
 'aaacdinrs',
 'aacdirs',
 'aaceinr',
 'aace

In [19]:
print(sort_letters('deltas'))
print('aal', anagram_dict['aal'])

adelst
adelst
aal ['aal', 'ala']


In [20]:
i = 0
for key in anagram_dict:
    if i < 20:
      print(key, anagram_dict[key])
      i = i + 1

aa ['aa']
aah ['aah', 'aha']
aadeh ['aahed', 'ahead']
aaghin ['aahing']
aahs ['aahs']
aal ['aal', 'ala']
aaiil ['aalii']
aaiils ['aaliis']
aals ['aals', 'alas']
aaadkrrv ['aardvark']
aaadkrrsv ['aardvarks']
aadflorw ['aardwolf']
aadelorsvw ['aardwolves']
aas ['aas']
aaeglosv ['aasvogel']
aaeglossv ['aasvogels']
aab ['aba', 'baa']
aaabc ['abaca']
aaabcs ['abacas', 'casaba']
aabci ['abaci']


In [21]:
def print_anagram_sets_in_order(dict):
    # make a list of (length, word pairs)
    list_anagrams = []
    for v in dict.values():
        if len(v) > 1:
            list_anagrams.append((len(v), v))

    # sort in ascending order of length
    list_anagrams.sort()

    # print the sorted list
    for x in list_anagrams:
        print(x)

print_anagram_sets_in_order(anagram_dict)

(2, ['aah', 'aha'])
(2, ['aahed', 'ahead'])
(2, ['aal', 'ala'])
(2, ['aals', 'alas'])
(2, ['aba', 'baa'])
(2, ['abacas', 'casaba'])
(2, ['abas', 'baas'])
(2, ['abasement', 'entamebas'])
(2, ['abasing', 'bisnaga'])
(2, ['abaters', 'abreast'])
(2, ['abator', 'rabato'])
(2, ['abators', 'rabatos'])
(2, ['abbe', 'babe'])
(2, ['abbes', 'babes'])
(2, ['abeam', 'ameba'])
(2, ['abelmosk', 'smokable'])
(2, ['abetter', 'beretta'])
(2, ['abetters', 'berettas'])
(2, ['abettor', 'taboret'])
(2, ['abettors', 'taborets'])
(2, ['abhorred', 'harbored'])
(2, ['abhorrer', 'harborer'])
(2, ['abhorrers', 'harborers'])
(2, ['abhorring', 'harboring'])
(2, ['abide', 'abied'])
(2, ['abided', 'baddie'])
(2, ['abides', 'biased'])
(2, ['ablated', 'datable'])
(2, ['ablating', 'bangtail'])
(2, ['ablins', 'blains'])
(2, ['abluent', 'tunable'])
(2, ['abluents', 'unstable'])
(2, ['ablution', 'abutilon'])
(2, ['ablutions', 'abutilons'])
(2, ['abmho', 'abohm'])
(2, ['abmhos', 'abohms'])
(2, ['abo', 'boa'])
(2, ['aboard',

Solução do autor:


In [22]:
def signature(s):
    """Returns the signature of this string, which is a string
    that contains all of the letters in order.
    """
    t = list(s)
    t.sort()
    t = ''.join(t)
    return t

In [23]:
def all_anagrams(filename):
    """Finds all anagrams in a list of words.

    filename: string filename of the word list

    Returns: a map from each word to a list of its anagrams.
    """
    d = {}
    for line in open(filename):
        word = line.strip().lower()
        t = signature(word)

        if t not in d:
            d[t] = [word]
        else:
            d[t].append(word)
    return d

In [24]:
def print_anagram_sets(d):
    """Prints the anagram sets in d.

    d: map from words to list of their anagrams
    """
    for v in d.values():
        if len(v) > 1:
            print(len(v), v)

In [25]:
def print_anagram_sets_in_order(d):
    """Prints the anagram sets in d in decreasing order of size.

    d: map from words to list of their anagrams
    """

    # make a list of (length, word pairs)
    t = []
    for v in d.values():
        if len(v) > 1:
            t.append((len(v), v))

    # sort in ascending order of length
    t.sort()

    # print the sorted list
    for x in t:
        print(x)

In [26]:
def filter_length(d, n):
    """Select only the words in d that have n letters.

    d: map from word to list of anagrams
    n: integer number of letters

    Returns: new map from word to list of anagrams
    """
    res = {}
    for word, anagrams in d.items():
        if len(word) == n:
            res[word] = anagrams
    return res

In [35]:
if __name__ == '__main__':
    anagram_dict = {}
    anagram_dict = all_anagrams('words.txt')
    
    metatese_test(anagram_dict)
    # a solucao deu levemente diferente da do autor, pois os valores associados as chaves podem ser múltiplos

{'aah': ['aha'], 'aal': ['ala'], 'aals': ['alas'], 'aba': ['baa'], 'abas': ['baas'], 'abbe': ['babe'], 'abbes': ['babes'], 'bate': ['beta'], 'beat': ['beta'], 'bates': ['betas', 'tabes'], 'beast': ['beats'], 'beats': ['betas'], 'abide': ['abied'], 'able': ['bale'], 'bale': ['blae'], 'abler': ['baler'], 'ables': ['bales'], 'abmho': ['abohm'], 'abmhos': ['abohms'], 'abode': ['adobe'], 'abodes': ['adobes'], 'tabu': ['tuba'], 'tabus': ['tubas'], 'aby': ['bay'], 'abyed': ['bayed'], 'abying': ['baying'], 'abys': ['bays'], 'accouter': ['accoutre'], 'accouters': ['accoutres'], 'cade': ['dace'], 'acers': ['acres'], 'acres': ['cares'], 'cares': ['carse', 'races'], 'achier': ['cahier'], 'acid': ['caid'], 'cadi': ['caid'], 'acids': ['caids'], 'cadis': ['caids'], 'acme': ['came'], 'came': ['mace'], 'acmes': ['cames'], 'cames': ['maces'], 'acne': ['cane'], 'acned': ['caned'], 'acnes': ['canes'], 'acre': ['care'], 'care': ['race'], 'acred': ['arced', 'cared'], 'arced': ['raced'], 'cared': ['raced'], 

Solução do autor:

In [36]:
def word_distance(word1, word2):
    """Computes the number of differences between two words.

    word1, word2: strings

    Returns: integer
    """
    assert len(word1) == len(word2)

    count = 0
    for c1, c2 in zip(word1, word2):
        if c1 != c2:
            count += 1

    return count

In [41]:
if __name__ == '__main__':
    d = all_anagrams('words.txt')
    metathesis_pairs(d)

aah aha
aal ala
aals alas
aba baa
abas baas
abbe babe
abbes babes
bate beta
beat beta
bates betas
bates tabes
beast beats
beats betas
abide abied
able bale
bale blae
abler baler
ables bales
abmho abohm
abmhos abohms
abode adobe
abodes adobes
tabu tuba
tabus tubas
aby bay
abyed bayed
abying baying
abys bays
accouter accoutre
accouters accoutres
cade dace
acers acres
acres cares
cares carse
cares races
achier cahier
acid caid
cadi caid
acids caids
cadis caids
acme came
came mace
acmes cames
cames maces
acne cane
acned caned
acnes canes
acre care
care race
acred arced
acred cared
arced raced
cared raced
act cat
actin antic
actins antics
action cation
actions cations
castor costar
acts cats
cast cats
ad da
add dad
adds dads
pated taped
adman daman
maned menad
maned named
adze daze
adzes dazes
aerologies areologies
aerology areology
hereat reheat
aetheric hetaeric
aft fat
age gae
aged egad
aged gaed
rages sager
ages gaes
agger eggar
agger gager
aggers eggars
aggers gagers
sagger seggar
sagg

### Exercício 12.4

Aqui está outro quebra-cabeça do programa Car Talk (http://www.cartalk.com/content/puzzlers):

Qual é a palavra inglesa mais longa, que permanece uma palavra inglesa válida, conforme vai removendo suas letras, uma após a outra?

Agora, as letras podem ser retiradas do fim ou do meio, mas você não pode reajustar nenhuma delas. Cada vez que remove uma letra, você acaba com outra palavra inglesa. Se fizer isto, eventualmente você acabará com uma letra e isso também será uma palavra inglesa; uma encontrada no dicionário. Quero saber qual é a palavra mais longa e quantas letras tem?

Vou dar um pequeno exemplo modesto: Sprite. Ok? Você começa com sprite, tira uma letra do interior da palavra, tira o r, e ficamos com a palavra spite, então tiramos o e do fim, ficamos com spit, tiramos o s, ficamos com pit, it e I.

Escreva um programa que encontre todas as palavras que podem ser reduzidas desta forma, e então encontre a mais longa.

Este exercício é um pouco mais desafiador que a maioria, então aqui estão algumas sugestões:

1. Você pode querer escrever uma função que receba uma palavra e calcule uma lista de todas as palavras que podem ser formadas retirando uma letra. Esses são os “filhos” da palavra.

2. Recursivamente, uma palavra é redutível se algum de seus filhos for redutível. Como caso base, você pode considerar a string vazia redutível.

3. A lista de palavras que forneci, words.txt, não contém palavras de uma letra só. Portanto, você pode querer acrescentar “I”, “a”, e a string vazia.

4. Para melhorar o desempenho do seu programa, você pode querer memorizar as palavras conhecidas por serem redutíveis.

Solução: http://thinkpython2.com/code/reducible.py.

Solução do autor:

In [2]:
def make_word_dict(filename):
    d = dict()
    for line in open(filename):
        word = line.strip().lower()
        d[word] = word
    
    for letter in ['a', 'i', '']:
        d[letter] = letter

    return d

In [3]:
def children(word, word_dict):
    """Returns a list of all words that can be formed by removing one letter.

    word: string

    Returns: list of strings
    """
    res = []
    for i in range(len(word)):
        child = word[:i] + word[i+1:]
        if child in word_dict:
            res.append(child)
    return res

In [4]:
memo = {}
memo[''] = ['']
def is_reducible(word, word_dict):
    """If word is reducible, returns a list of its reducible children.

    Also adds an entry to the memo dictionary.

    A string is reducible if it has at least one child that is 
    reducible.  The empty string is also reducible.

    word: string
    word_dict: dictionary with words as keys
    """
     # if have already checked this word, return the answer
    if word in memo:
        return memo[word]

    # check each of the children and make a list of the reducible ones
    res = []
    for child in children(word, word_dict):
        t = is_reducible(child, word_dict)
        if t:
            res.append(child)

    # memoize and return the result
    memo[word] = res
    return res

In [5]:
def all_reducible(word_dict):
    """Checks all words in the word_dict; returns a list reducible ones.

    word_dict: dictionary with words as keys
    """
    res = []
    for word in word_dict:
        t = is_reducible(word, word_dict)
        if t != []:
            res.append(word)
    return res

In [6]:
def print_trail(word):
    """Prints the sequence of words that reduces this word to the empty string.

    If there is more than one choice, it chooses the first.

    word: string
    """
    if len(word) == 0:
        return
    print (word)
    t = is_reducible(word, word_dict)
    print_trail(t[0])

In [7]:
def print_longest_words(word_dict):
    words = all_reducible(word_dict)

    # use DSU to sort by word length
    t = []
    for word in words:
        t.append((len(word), word))
    t.sort(reverse=True)

    # print the longest 5 words
    for length, word in t[0:5]:
        print_trail(word)
        print ('\n')

In [8]:
if __name__ == '__main__':
    word_dict = make_word_dict('words.txt')
    print_longest_words(word_dict)

complecting
completing
competing
compting
comping
coping
oping
ping
pig
pi
i


twitchiest
witchiest
withiest
withies
withes
wites
wits
its
is
i


stranglers
strangers
stranger
strange
strang
stang
tang
tag
ta
a


staunchest
stanchest
stanches
stances
stanes
sanes
anes
ane
ae
a


restarting
restating
estating
stating
sating
sting
ting
tin
in
i




In [10]:
count = 0
for word in word_dict:
  if count < 30:
    print(word)
    count = count + 1

aa
aah
aahed
aahing
aahs
aal
aalii
aaliis
aals
aardvark
aardvarks
aardwolf
aardwolves
aas
aasvogel
aasvogels
aba
abaca
abacas
abaci
aback
abacus
abacuses
abaft
abaka
abakas
abalone
abalones
abamp
abampere
