*Think Python 3e*の印刷版と電子書籍版は、[Bookshop.org](https://bookshop.org/a/98697/9781098155438)および[Amazon](https://www.amazon.com/_/dp/1098155432?smid=ATVPDKIKX0DER&_encoding=UTF8&tag=oreilly20-20&_encoding=UTF8&tag=greenteapre01-20&linkCode=ur2&linkId=e2a529f94920295d27ec8a06e757dc7c&camp=1789&creative=9325)から注文できます。

In [None]:
from os.path import basename, exists

def download(url):
    filename = basename(url)
    if not exists(filename):
        from urllib.request import urlretrieve

        local, _ = urlretrieve(url, filename)
        print("Downloaded " + str(local))
    return filename

download('https://github.com/AllenDowney/ThinkPython/raw/v3/thinkpython.py');
download('https://github.com/AllenDowney/ThinkPython/raw/v3/diagram.py');

import thinkpython

# タプル

この章では、もう一つの組み込み型であるタプルを紹介し、リストや辞書とタプルの連携方法について説明します。また、タプルの代入方法や、可変長引数リストを持つ関数に便利な機能であるパッキングとアンパッキングの演算子についても紹介します。

演習では、タプルをリストや辞書と組み合わせて使い、より多くの言葉のパズルを解いたり、効率的なアルゴリズムを実装したりします。

一つ注意しておきたいのは、「タプル」という言葉の発音には二通りがあることです。ある人々は "tuh-ple" と発音し、"supple" と韻を踏みます。しかし、プログラミングの文脈では、多くの人々は "too-ple" と発音し、"quadruple" と韻を踏みます。

## タプルはリストに似ています

タプルは値のシーケンスです。値は任意の型であり、それらは整数でインデックス付けされるため、タプルはリストによく似ています。重要な違いは、タプルが不変であることです。

タプルを作成するには、カンマで区切られた値のリストを書くことができます。

In [None]:
t = 'l', 'u', 'p', 'i', 'n'
type(t)

必須ではないが、タプルを括弧で囲むのが一般的である。

In [None]:
t = ('l', 'u', 'p', 'i', 'n')
type(t)

単一要素のタプルを作成するには、最後にカンマを含める必要があります。

In [None]:
t1 = 'p',
type(t1)

括弧で囲まれた単一の値はタプルではありません。

In [None]:
t2 = ('p')
type(t2)

タプルを作成するもう一つの方法は、組み込み関数`tuple`を使用することです。引数を指定しない場合、空のタプルが作成されます。

In [None]:
t = tuple()
t

引数がシーケンス（文字列、リストまたはタプル）の場合、結果はそのシーケンスの要素を含むタプルになります。

In [None]:
t = tuple('lupin')
t

`tuple`は組み込み関数の名前であるため、変数名として使用することは避けるべきです。

ほとんどのリスト演算子はタプルでも機能します。例えば、ブラケット演算子は要素をインデックスします。

In [None]:
t[0]

スライス演算子は要素の範囲を選択します。

In [None]:
t[1:3]

「+」演算子はタプルを結合します。

In [None]:
tuple('lup') + ('i', 'n')

`*` 演算子は、タプルを指定された回数だけ複製します。

In [None]:
tuple('spam') * 2

`sorted` 関数はタプルに対しても機能しますが、結果はタプルではなく、リストになります。

In [None]:
sorted(t)

`reversed` 関数はタプルにも使えます。

In [None]:
reversed(t)

結果は `reversed` オブジェクトであり、これをリストやタプルに変換することができます。

In [None]:
tuple(reversed(t))

これまでの例に基づくと、タプルはリストと同じように見えるかもしれません。

## しかし、タプルは不変です

ブラケット演算子を使用してタプルを変更しようとすると、`TypeError` が発生します。

In [None]:
%%expect TypeError
t[0] = 'L'

タプルには、リストを変更するメソッド（`append`や`remove`など）が一切ありません。

In [None]:
%%expect AttributeError

t.remove('l')

「属性」とは、オブジェクトに関連付けられた変数またはメソッドのことを指します。このエラーメッセージは、タプルに `remove` という名前のメソッドが無いことを意味しています。

タプルは不変であるため、ハッシュ可能です。つまり、辞書のキーとして使用することができます。例えば、次の辞書は整数にマップされる2つのタプルをキーとして含んでいます。

In [None]:
d = {}
d[1, 2] = 3
d[3, 4] = 7

辞書のタプルを次のように確認できます。

In [None]:
d[1, 2]

また、タプルを参照する変数がある場合、それをキーとして使用することができます。

In [None]:
t = (3, 4)
d[t]

タプルは辞書内の値としても使用できます。

In [None]:
t = tuple('abc')
d = {'key': t}
d

## タプルの代入

代入の左側に変数のタプルを、右側に値のタプルを置くことができます。

In [None]:
a, b = 1, 2

値は左から右に変数に割り当てられます。この例では、`a` は `1` の値を取得し、`b` は `2` の値を取得します。結果を次のように表示できます。

In [None]:
a, b

一般的に、代入の左側がタプルの場合、右側は文字列、リスト、タプルなど、どんな種類のシーケンスでもかまいません。例えば、メールアドレスをユーザー名とドメインに分割するには、次のように書くことができます。

In [None]:
email = 'monty@python.org'
username, domain = email.split('@')

`split` からの戻り値は2つの要素を持つリストです。最初の要素は `username` に、2番目の要素は `domain` に割り当てられます。

In [None]:
username, domain

左側の変数の数と右側の値の数は同じでなければなりません。そうでない場合は `ValueError` が発生します。

In [None]:
%%expect ValueError
a, b = 1, 2, 3

タプルの代入は、2つの変数の値を入れ替えたいときに便利です。通常の代入を使用する場合、次のように一時変数を使う必要があります。

In [None]:
temp = a
a = b
b = temp

それはうまくいきますが、タプル代入を使うことで、一時変数を使用せずに同じことができます。

In [None]:
a, b = b, a

これは、右側のすべての式が代入の前に評価されるため、機能します。

また、`for` 文でタプル代入を使用することもできます。たとえば、辞書のアイテムをループするには、`items` メソッドを使用します。

In [None]:
d = {'one': 1, 'two': 2}

for item in d.items():
    key, value = item
    print(key, '->', value)

ループを通過するたびに、`item` にはキーと対応する値を含むタプルが割り当てられます。

このループは次のように簡潔に書くことができます：

In [None]:
for key, value in d.items():
    print(key, '->', value)

ループを通過するたびに、キーと対応する値が直接`key`と`value`に割り当てられます。

## タプルを戻り値として使用する

厳密に言えば、関数は一つの値しか返せませんが、もしその戻り値がタプルであれば、複数の値を返しているのと同じ効果があります。例えば、2つの整数を除算して商と余りを計算したい場合、`x//y`を計算してから`x%y`を計算するのは非効率です。それらを同時に計算する方が良いです。

組み込み関数 `divmod` は2つの引数を取り、商と余りの2つの値を持つタプルを返します。

In [None]:
divmod(7, 3)

タプルの要素を2つの変数に格納するために、タプル代入を使用できます。

In [None]:
quotient, remainder = divmod(7, 3)
quotient

In [None]:
remainder

これはタプルを返す関数の例です。

In [None]:
def min_max(t):
    return min(t), max(t)

`max` と `min` は、シーケンス内の最大要素と最小要素を見つける組み込み関数です。  
`min_max` は両方を計算し、2つの値を持つタプルを返します。

In [None]:
min_max([2, 4, 1, 3])

次のように結果を変数に代入できます。

In [None]:
low, high = min_max([2, 4, 1, 3])
low, high

## 引数のパッキング

関数は可変個の引数を取ることができます。
`*`演算子を先頭に付けたパラメータ名は、引数をタプルに**パック**します。
例えば、次の関数は任意の数の引数を取り、それらの算術平均、すなわち合計を引数の数で割ったものを計算します。

In [None]:
def mean(*args):
    return sum(args) / len(args)

パラメータには任意の名前を付けることができますが、`args`が一般的です。
関数は次のように呼び出すことができます。

In [None]:
mean(1, 2, 3)

値のシーケンスを持っていて、それらを関数に複数の引数として渡したい場合、`*`演算子を使用してタプルを**アンパック**することができます。例えば、`divmod`は正確に2つの引数を取ります。もしタプルをパラメータとして渡すと、エラーが発生します。

In [None]:
%%expect TypeError
t = (7, 3)
divmod(t)

タプルは2つの要素を含んでいても、1つの引数としてカウントされます。しかし、タプルをアンパックすると、2つの引数として扱われます。

In [None]:
divmod(*t)

パッキングとアンパッキングは、既存の関数の動作を適応させたい場合に便利です。例えば、この関数は任意の数の引数を取り、最も低い値と最も高い値を削除し、残りの平均を計算します。

In [None]:
def trimmed_mean(*args):
    low, high = min_max(args)
    trimmed = list(args)
    trimmed.remove(low)
    trimmed.remove(high)
    return mean(*trimmed)

まず、`min_max` を使用して、最小要素と最大要素を見つけます。
次に、`args` をリストに変換して、`remove` メソッドを使用できるようにします。
最後に、リストをアンパックして、要素を単一のリストではなく、別々の引数として `mean` に渡します。

以下は、その効果を示す例です。

In [None]:
mean(1, 2, 3, 10)

In [None]:
trimmed_mean(1, 2, 3, 10)

このような「トリムされた」平均は、主観的な審査が行われるダイビングや体操などのスポーツで使用され、他の審判の得点から大きく逸脱する審判の影響を軽減するために用いられます。

## Zip

タプルは、2つのシーケンスの要素をループする際に、それぞれの要素に対して操作を行う場合に役立ちます。例えば、2つのチームが7試合のシリーズで対戦し、それぞれの試合結果を2つのリストに記録したとしましょう。それぞれのリストは各チームの得点を表しています。

In [None]:
scores1 = [1, 2, 4, 5, 1, 5, 2]
scores2 = [5, 5, 2, 2, 5, 2, 3]

各チームが何試合勝ったか見てみましょう。 `zip`を使いますが、これは2つ以上のシーケンスを取り、シーケンスの要素をジッパーの歯のように組み合わせた**zipオブジェクト**を返す組み込み関数です。

In [None]:
zip(scores1, scores2)

シーケンス内の値をペアでループするために、zipオブジェクトを使用できます。

In [None]:
for pair in zip(scores1, scores2):
     print(pair)

ループを通過するたびに、`pair` にはスコアのタプルが割り当てられます。したがって、スコアを変数に割り当てて、次のように最初のチームの勝利数を数えることができます。

In [None]:
wins = 0
for team1, team2 in zip(scores1, scores2):
    if team1 > team2:
        wins += 1

wins

残念ながら、第一チームは試合で3勝しかできず、シリーズに敗れました。

2つのリストがあり、ペアのリストを作成したい場合は、`zip`と`list`を使用することができます。

In [None]:
t = list(zip(scores1, scores2))
t

結果はタプルのリストなので、最後の試合の結果をこのように取得できます:

In [None]:
t[-1]

キーのリストと値のリストがある場合、`zip`と`dict`を使用して辞書を作成することができます。例えば、アルファベットの各文字をその位置にマッピングする辞書を作成する方法は以下の通りです。

In [None]:
letters = 'abcdefghijklmnopqrstuvwxyz'
numbers = range(len(letters))
letter_map = dict(zip(letters, numbers))

これで文字を調べて、アルファベットの中でのその位置を知ることができます。

In [None]:
letter_map['a'], letter_map['z']

このマッピングでは、`'a'` のインデックスは `0` で、`'z'` のインデックスは `25` です。

シーケンスの要素とそのインデックスをループで処理する必要がある場合、組み込み関数 `enumerate` を使用することができます。

In [None]:
enumerate('abc')

結果として得られるのは、**enumerateオブジェクト**です。これはペアのシーケンスをループで処理するもので、各ペアはインデックス（0から始まる）と与えられたシーケンスからの要素を含みます。

In [None]:
for index, element in enumerate('abc'):
    print(index, element)

## 比較とソート

比較演算子はタプルや他のシーケンスと一緒に使うことができます。例えば、タプルで `<` 演算子を使うと、各シーケンスの最初の要素から比較を始めます。もしそれらが等しい場合は、次の要素のペアを比較し、そうして続けていき、異なる要素のペアが見つかるまで比較を続けます。

In [None]:
(0, 1, 2) < (0, 3, 4)

その後の要素は考慮されません -- たとえそれらが非常に大きくても。

In [None]:
(0, 1, 2000000) < (0, 3, 4)

このようなタプルの比較方法は、タプルのリストをソートしたり、最小または最大を見つけたりするのに便利です。  
例として、単語の中で最も一般的な文字を見つけてみましょう。  
前の章では、`value_counts`という関数を書きました。これは、文字列を受け取り、各文字からそれが現れる回数へのマッピングを返す辞書を生成します。

In [None]:
def value_counts(string):
    counter = {}
    for letter in string:
        if letter not in counter:
            counter[letter] = 1
        else:
            counter[letter] += 1
    return counter

こちらが文字列 'banana' の結果です。

In [None]:
counter = value_counts('banana')
counter

3つのアイテムしかない場合、最頻出の文字が `'a'` であることが容易にわかります。この文字は3回現れています。しかし、アイテムがもっと多い場合は、自動的に並べ替えることが役に立ちます。

`counter` からアイテムを取得する方法は以下の通りです。

In [None]:
items = counter.items()
items

結果はタプルのリストのように振る舞う`dict_items`オブジェクトであり、このようにソートすることができます。

In [None]:
sorted(items)

デフォルトの動作では、各タプルの最初の要素を使用してリストをソートし、同点の場合には2番目の要素を使用します。

しかし、最も高いカウントの項目を見つけるには、リストをソートするのに2番目の要素を使用したいです。
それには、タプルを受け取り、その2番目の要素を返す関数を書くことで実現できます。

In [None]:
def second_element(t):
    return t[1]

その後で、その関数を `sorted` のオプション引数である `key` に渡すことができます。この `key` は各項目のソートキーを計算するためにこの関数を使用することを示しています。

In [None]:
sorted_items = sorted(items, key=second_element)
sorted_items

ソートキーはリスト内のアイテムの順序を決定します。  
最も少ない数の文字が最初に現れ、最も多い数の文字が最後に現れます。  
この方法で最も一般的な文字を見つけることができます。

In [None]:
sorted_items[-1]

最大値のみを求める場合、リストをソートする必要はありません。  
`max` 関数を使用することができ、これにはオプション引数として `key` を指定できます。

In [None]:
max(items, key=second_element)

文字の出現回数が最も少ないものを見つけるには、同じように `min` を使うことができます。

辞書を反転させるには、キーと値を入れ替えて新しい辞書を作成します。ただし、辞書内のキーは一意である必要がありますが、値は一意である必要がありません。したがって、ある値に複数のキーが対応する場合もあります。この問題を解決するために、元の辞書のキーをリストとして保持する新しい辞書を作成します。

例として、「parrot」に含まれる文字数を数えて辞書を作成し、それを反転させる方法を次に示します：

1. 初めに、「parrot」に含まれる各文字を数えて、元の辞書を作成します。たとえば、1回出現する文字と2回出現する文字があります。
   ```python
   word_count = {
       'p': 1,
       'a': 1,
       'r': 2,
       'o': 1,
       't': 1
   }
   ```

2. 次に、この辞書を反転させるための新しい辞書を作成します。値をキーとして使用し、それに対応する元のキーをリストとして格納します。
   ```python
   inverted_dict = {}
   for letter, count in word_count.items():
       if count not in inverted_dict:
           inverted_dict[count] = [letter]
       else:
           inverted_dict[count].append(letter)
   ```

3. 結果として、反転された辞書は以下のようになります：
   ```python
   inverted_dict = {
       1: ['p', 'a', 'o', 't'],
       2: ['r']
   }
   ```

この方法で、元の辞書を反転させて、値から元のキーのリストを取得できるようになりました。この技法は、値が一意ではない場合に有効です。

In [None]:
d =  value_counts('parrot')
d

この辞書を反転させると、結果は `{1: ['p', 'a', 'o', 't'], 2: ['r']}` になります。これは、1回現れる文字が `'p'`、`'a'`、`'o'`、`'t'` であり、2回現れる文字が `'r'` であることを示しています。

以下の関数は辞書を受け取り、新しい辞書としてその逆を返します。

In [None]:
def invert_dict(d):
    new = {}
    for key, value in d.items():
        if value not in new:
            new[value] = [key]
        else:
            new[value].append(key)
    return new

`for`文は、辞書`d`のキーと値をループします。
もし値が新しい辞書にまだ含まれていない場合、その値が追加され、単一の要素を持つリストが関連付けられます。
そうでなければ、その値は既存のリストに追加されます。

これを次のようにテストできます。

In [None]:
invert_dict(d)

そして、私たちは期待していた結果を得ます。

これは、辞書の中の値がリストになっている最初の例です。
これからもっと見ていきます！

## デバッグ

リスト、辞書、タプルは**データ構造**です。
この章では、タプルのリストや、タプルをキーとして持ちリストを値として持つ辞書のような、複合データ構造を見始めます。
複合データ構造は便利ですが、データ構造が間違った型、大きさ、または構造を持っているときに起こるエラーが発生しやすいです。
たとえば、関数が整数のリストを期待しているときに、単なる整数（リストに入っていないもの）を渡すと、おそらく正しく機能しません。

この種のエラーをデバッグするために、私は `structshape` というモジュールを書きました。
このモジュールは、任意の種類のデータ構造を引数として受け取り、その構造を要約する文字列を返す関数 `structshape` を提供します。
<https://raw.githubusercontent.com/AllenDowney/ThinkPython/v3/structshape.py> からダウンロードできます。

In [None]:
download('https://raw.githubusercontent.com/AllenDowney/ThinkPython/v3/structshape.py');

それを次のようにインポートできます。

In [None]:
from structshape import structshape

こちらは簡単なリストの例です。

In [None]:
t = [1, 2, 3]
structshape(t)

こちらがリストのリストです。

In [None]:
t2 = [[1,2], [3,4], [5,6]]
structshape(t2)

リストの要素が同じ型でない場合、`structshape`はそれらを型別にグループ化します。

In [None]:
t3 = [1, 2, 3, 4.0, '5', '6', [7], [8], 9]
structshape(t3)

リストのタプルをこちらに提供してください。翻訳が必要な箇所についてお手伝いします。

In [None]:
s = 'abc'
lt = list(zip(t, s))
structshape(lt)

こちらは、整数を文字列にマッピングする3項目の辞書です。

In [None]:
d = dict(lt)
structshape(d)

データ構造の管理に問題がある場合、`structshape`が役立ちます。

## 用語集

**pack（パック）:**
複数の引数をタプルにまとめること。

**unpack（アンパック）:**
タプル（または他のシーケンス）を複数の引数として扱うこと。

**zipオブジェクト:**
組み込み関数`zip`を呼び出した結果で、タプルのシーケンスをループするのに使用できる。

**enumerateオブジェクト:**
組み込み関数`enumerate`を呼び出した結果で、タプルのシーケンスをループするのに使用できる。

**sort key（ソートキー）:**
コレクションの要素をソートするために使用される値、または値を計算する関数。

**データ構造:**
特定の操作を効率的に実行するために組織化された値の集まり。

## エクササイズ

In [None]:
# This cell tells Jupyter to provide detailed debugging information
# when a runtime error occurs. Run it before working on the exercises.

%xmode Verbose

### 仮想アシスタントに尋ねる

この章の練習問題は前の章より難しいかもしれませんので、仮想アシスタントの助けを借りることを推奨します。
より難しい質問をしたとき、最初の試みで答えが正しくないことがあるかもしれませんが、これを機会に良いプロンプトを作成し、適切な修正を行う練習をしましょう。

一つの戦略として、大きな問題を簡単な関数で解決できる部分に分けることを考えてみてください。
仮想アシスタントに関数を書いてテストするよう依頼しましょう。
そしてそれらが動作したら、元の問題の解決策を求めてください。

以下の練習問題の中には、使用するデータ構造やアルゴリズムについての提案をしている場合があります。
問題に取り組む際にこれらの提案が役立つかもしれませんし、仮想アシスタントに渡す良いプロンプトでもあります。

### 演習

この章で、タプルはハッシュ可能であるため辞書のキーとして使用でき、ハッシュ可能である理由はそれが不変であるからだと述べました。
しかし、それは常に正しいわけではありません。

タプルがリストや辞書のような可変の値を含む場合、そのタプルはもはやハッシュ可能ではありません。なぜなら、ハッシュ可能ではない要素を含んでいるからです。例として、整数のリストを2つ含むタプルを示します。

In [None]:
list0 = [1, 2, 3]
list1 = [4, 5]

t = (list0, list1)
t

`t[1].append(6)`

In [None]:
# Solution goes here

`t` はミュータブルなオブジェクト (例えば、リストや辞書など) だと仮定すると、Pythonではそのようなオブジェクトはハッシュ可能ではないため、辞書のキーとして使用することはできません。そのため、`t` がミュータブルな場合、辞書のキーとして使用しようとすると `TypeError` が発生します。以下はその例です。

例えば、`t` がリストである場合：

```python
t = [1, 2, 3]  # ミュータブルなオブジェクト
my_dict = {t: "some value"}  # TypeErrorが発生する
```

この場合、`TypeError: unhashable type: 'list'` というエラーが出ます。リストはハッシュ不可のため、辞書のキーとして使うことはできません。

In [None]:
# Solution goes here

このトピックについてもっと知りたい場合は、バーチャルアシスタントに「Pythonのタプルは常にハッシュ可能ですか？」と尋ねてください。

### 演習

この章では、各文字をアルファベット内のそのインデックスにマッピングする辞書を作成しました。

In [None]:
letters = 'abcdefghijklmnopqrstuvwxyz'
numbers = range(len(letters))
letter_map = dict(zip(letters, numbers))

例えば、`'a'`のインデックスは`0`です。

In [None]:
letter_map['a']

他の方向に進むには、リストのインデックスを使用できます。たとえば、インデックス`1`にある文字は`'b'`です。

In [None]:
letters[1]

To implement the `shift_word` function for a Caesar cipher, we'll follow these steps:

1. Create a list that represents the alphabet so that we can easily determine the position of each letter.
2. Loop through each character in the string, determine its position in the alphabet, and then apply the shift using the modulus operator to properly wrap around the alphabet.
3. Construct the encoded word by collecting each shifted character and join them into a new string.

Here's how you can implement this:

```python
def shift_word(word, shift):
    # All lowercase letters in the alphabet
    letters = 'abcdefghijklmnopqrstuvwxyz'
    encoded_word = []
    
    for char in word:
        if char in letters:
            # Find the index of the char in the alphabet
            original_position = letters.index(char)
            # Calculate new position with shift, using modulus operator for wrapping
            new_position = (original_position + shift) % 26
            # Get the new character from the alphabet
            new_char = letters[new_position]
            # Append the new character to the list
            encoded_word.append(new_char)
        else:
            # If the character is not in the alphabet (e.g., a space), leave it unchanged
            encoded_word.append(char)
    
    # Use join to convert list of characters back to a string
    return ''.join(encoded_word)

# Testing the function
print(shift_word("cheer", 7))  # Should output 'jolly'
print(shift_word("melon", 16)) # Should output 'cubed'
```

This function should work successfully for lowercase letters and shifts the word correctly as per the Caesar cipher rules. The use of the modulus operator ensures that we wrap around to the start of the alphabet when needed.

このアウトラインを使用して始めることができます。

In [None]:
def shift_word(word, n):
    """Shift the letters of `word` by `n` places.

    >>> shift_word('cheer', 7)
    'jolly'
    >>> shift_word('melon', 16)
    'cubed'
    """
    return None

In [None]:
# Solution goes here

In [None]:
shift_word('cheer', 7)

In [None]:
shift_word('melon', 16)

あなたの関数をテストするには、`doctest`を使用することができます。

In [None]:
from doctest import run_docstring_examples

def run_doctests(func):
    run_docstring_examples(func, globals(), name=func.__name__)

run_doctests(shift_word)

```python
def most_frequent_letters(s):
    # Remove spaces from the string and convert to lowercase
    s = s.replace(" ", "").lower()
    
    # Create a dictionary to count the frequency of each letter
    frequency_dict = {}
    
    for letter in s:
        if letter in frequency_dict:
            frequency_dict[letter] += 1
        else:
            frequency_dict[letter] = 1

    # Sort the letters based on frequency in decreasing order
    sorted_letters = sorted(frequency_dict.items(), key=lambda x: x[1], reverse=True)
    
    # Print the letters in decreasing order of frequency
    for letter, frequency in sorted_letters:
        print(letter)

# Example usage:
most_frequent_letters("Hello World")
```

This function will process the string "Hello World", count the frequency of each letter, and print them sorted by frequency in descending order.

この関数のアウトラインを使用して、始めることができます。

In [None]:
def most_frequent_letters(string):
    return None

In [None]:
# Solution goes here

この例であなたの機能をテストします。

In [None]:
most_frequent_letters('brontosaurus')

関数が動作するようになったら、次のコードを使用して、プロジェクト・グーテンベルクからダウンロードできる『ドラキュラ』の中で最も一般的な文字を印刷することができます。

In [None]:
download('https://www.gutenberg.org/cache/epub/345/pg345.txt');

In [None]:
string = open('pg345.txt').read()
most_frequent_letters(string)

Zim's sequence of "ETAONRISH" represents the most frequently used letters in the English language in descending order. When analyzing letter frequency in a specific text like *Dracula*, the order might slightly differ due to the author's style, vocabulary choice, and thematic elements. Common variations could include shifts in the positions of certain letters, such as 'H' or 'I', depending on the author's usage patterns. To determine the exact sequence in *Dracula*, one would need to perform a letter frequency analysis on the text itself and then compare the results to Zim's sequence.

### エクササイズ

以前のエクササイズでは、2つの文字列がアナグラムであるかどうかをテストするために、両方の単語の文字をソートし、ソートされた文字が同じかどうかを確認しました。
今回は問題を少し難しくしましょう。

単語のリストを受け取り、アナグラムとなる単語のセットをすべて出力するプログラムを書きます。
出力は次のようになるかもしれません：

```
['deltas', 'desalt', 'lasted', 'salted', 'slated', 'staled']
['retainers', 'ternaries']
['generating', 'greatening']
['resmelts', 'smelters', 'termless']
```

ヒント：単語リストの各単語について、文字をソートしてそれを再度文字列に結合します。このソートされた文字列から、それがアナグラムである単語のリストへのマッピングを行う辞書を作成します。

以下のセルは`words.txt`をダウンロードし、単語をリストに読み込みます。

In [None]:
download('https://raw.githubusercontent.com/AllenDowney/ThinkPython/v3/words.txt');

In [None]:
word_list = open('words.txt').read().split()

以前に使用した `sort_word` 関数をこちらでご紹介します。

In [None]:
def sort_word(word):
    return ''.join(sorted(word))

In [None]:
# Solution goes here

アナグラムのリストの中で最も長いものを見つけるには、次の関数を使用できます。この関数は、キーが文字列で、値が単語のリストであるキーと値のペアを受け取ります。そして、そのリストの長さを返します。

In [None]:
def value_length(pair):
    key, value = pair
    return len(value)

この関数をソートキーとして使用し、最も長いアナグラムのリストを見つけることができます。

In [None]:
anagram_items = sorted(anagram_dict.items(), key=value_length)
for key, value in anagram_items[-10:]:
    print(value)

アナグラムを持つ最長の単語を知りたい場合、以下のループを使用していくつかを表示することができます。

In [None]:
longest = 7

for key, value in anagram_items:
    if len(value) > 1:
        word_len = len(value[0])
        if word_len > longest:
            longest = word_len
            print(value)

```python
def word_distance(word1, word2):
    return sum(1 for a, b in zip(word1, word2) if a != b)

# Example usage:
# result = word_distance("hello", "hxllo")
# This would return 1 since the words differ by the second letter.
```

この関数は、与えられた2つの単語の異なる文字の位置数を返します。`zip`を使用して、2つの単語の対応する文字をループし、異なる文字のペアがあればカウントします。

以下は、関数のアウトラインと、その関数をチェックするために使用できるdoctestの一例です。

```python
def your_function_name(args):
    """
    ここに関数の説明を書きます。

    >>> your_function_name(test_input1)
    expected_output1

    >>> your_function_name(test_input2)
    expected_output2
    """
    # 関数の実装をここに書きます
```

doctestを使うことで、関数の説明の中で実際の入力と期待される出力を示すことができます。そして、`doctest`モジュールを使って関数をテストすることができます。このテストは、関数が正しく動作するかどうかを確認するのに便利です。

In [None]:
def word_distance(word1, word2):
    """Computes the number of places where two word differ.

    >>> word_distance("hello", "hxllo")
    1
    >>> word_distance("ample", "apply")
    2
    >>> word_distance("kitten", "mutton")
    3
    """
    return None

In [None]:
# Solution goes here

In [None]:
from doctest import run_docstring_examples

def run_doctests(func):
    run_docstring_examples(func, globals(), name=func.__name__)

run_doctests(word_distance)

### 演習

「メタセシス」とは、単語内の文字を入れ替えることです。
2つの単語が「メタセシスペア」を形成するのは、`converse` と `conserve` のように、2文字を入れ替えることで一方を他方に変換できる場合です。
単語リスト内のすべてのメタセシスペアを見つけるプログラムを書いてください。

ヒント: メタセシスペアの単語は、お互いのアナグラムでなければなりません。

クレジット: この演習は <http://puzzlers.org> の例に触発されています。

In [None]:
# Solution goes here

### 演習

これは本に載っていないボーナス課題です。  
この章の他の演習よりも難易度が高いため、バーチャルアシスタントに助けを求めるか、数章読み進めた後で挑戦すると良いでしょう。

以下はCar Talkのパズラーの一例です（<http://www.cartalk.com/content/puzzlers>）：

> 英単語を1文字ずつ削除していくとき、最も長く有効な英単語はどれでしょうか？
>
> 文字は端からでも真ん中からでも削除できますが、並び替えはできません。
> 毎回1文字削除するたびに、別の有効な英単語になります。
> そうして続けていくと、最終的には1文字の英単語になり、それも辞書に載っている単語なわけです。
> 最も長い単語とその文字数を教えてください。
>
> 小さな例を挙げましょう：Spriteです。Spriteを使い始め、単語の内部から1文字削除します。
> rを取り除くと、spiteという語が残ります。次に末尾からeを取り除くと、spitが残ります。
> sを取り除くと、pitが残り、次にit、そして最後にIです。

このように削減できるすべての単語を見つけ、その中で最も長いものを探すプログラムを書いてください。

この演習は他の演習より少し難しいので、以下の提案を参考にしてください：

1. 特定の単語を受け取り、1文字削除してできるすべての単語のリストを計算する関数を書きましょう。これらは単語の「子供」となります。

2. 再帰的に、いずれかの子供が削減可能であれば、その単語も削減可能です。  
   ベースケースとして、空の文字列を削減可能とみなすことができます。

3. 今使っている単語リストには1文字の単語が含まれていません。  
   したがって「I」と「a」を追加する必要があるかもしれません。

4. プログラムのパフォーマンスを向上させるために、削減可能と既知の単語をメモ化することを検討するとよいでしょう。

In [None]:
# Solution goes here

In [None]:
# Solution goes here

In [None]:
# Solution goes here

In [None]:
# Solution goes here

In [None]:
# Solution goes here

『Think Python: 第3版』(https://allendowney.github.io/ThinkPython/index.html)

著作権 2024 [Allen B. Downey](https://allendowney.com)

コードライセンス: [MITライセンス](https://mit-license.org/)

テキストライセンス: [クリエイティブ・コモンズ 表示-非営利-継承 4.0 国際](https://creativecommons.org/licenses/by-nc-sa/4.0/)