*Think Python 第3版* のプリント版および電子書籍版は、[Bookshop.org](https://bookshop.org/a/98697/9781098155438)と[Amazon](https://www.amazon.com/_/dp/1098155432?smid=ATVPDKIKX0DER&_encoding=UTF8&tag=oreilly20-20&_encoding=UTF8&tag=greenteapre01-20&linkCode=ur2&linkId=e2a529f94920295d27ec8a06e757dc7c&camp=1789&creative=9325)からご注文いただけます。

In [None]:
from os.path import basename, exists

def download(url):
    filename = basename(url)
    if not exists(filename):
        from urllib.request import urlretrieve

        local, _ = urlretrieve(url, filename)
        print("Downloaded " + str(local))
    return filename

download('https://github.com/AllenDowney/ThinkPython/raw/v3/thinkpython.py');
download('https://github.com/AllenDowney/ThinkPython/raw/v3/diagram.py');

import thinkpython

# リスト

この章では、Python の最も便利な組み込み型の一つであるリストについて解説します。また、オブジェクトについてさらに学び、複数の変数が同じオブジェクトを参照すると何が起こるかについても理解を深めます。

章末の演習では、単語リストを作成し、それを使って回文やアナグラムのような特別な単語を探します。

## リストはシーケンスです

文字列と同様に、**リスト**も値のシーケンスです。文字列では、値は文字ですが、リストでは任意の型にすることができます。
リストの中の値は**要素**と呼ばれます。

新しいリストを作成する方法はいくつかありますが、最も簡単なのは要素を角括弧（`[` と `]`）で囲むことです。
例えば、ここに2つの整数からなるリストがあります。

In [None]:
numbers = [42, 123]

そして、こちらが3つの文字列のリストです。

In [None]:
cheeses = ['Cheddar', 'Edam', 'Gouda']

リストの要素は同じ型である必要はありません。次のリストは、文字列、浮動小数点数、整数、さらには別のリストも含んでいます。

In [None]:
t = ['spam', 2.0, 5, [10, 20]]

リスト内に別のリストが存在する場合、それは**ネスト**されています。

要素が含まれていないリストは空のリストと呼ばれ、空のブラケット `[]` を使って作成できます。

In [None]:
empty = []

`len` 関数はリストの長さを返します。

In [None]:
len(cheeses)

空のリストの長さは「0」です。

In [None]:
len(empty)

以下の図は、`cheeses`、`numbers`、および `empty` の状態図を示しています。

In [None]:
from diagram import make_list, Binding, Value

list1 = make_list(cheeses, dy=-0.3, offsetx=0.17)
binding1 = Binding(Value('cheeses'), list1)

list2 = make_list(numbers, dy=-0.3, offsetx=0.17)
binding2 = Binding(Value('numbers'), list2)

list3 = make_list(empty, dy=-0.3, offsetx=0.1)
binding3 = Binding(Value('empty'), list3)

In [None]:
from diagram import diagram, adjust, Bbox

width, height, x, y = [3.66, 1.58, 0.45, 1.2]
ax = diagram(width, height)
bbox1 = binding1.draw(ax, x, y)
bbox2 = binding2.draw(ax, x+2.25, y)
bbox3 = binding3.draw(ax, x+2.25, y-1.0)

bbox = Bbox.union([bbox1, bbox2, bbox3])
#adjust(x, y, bbox)

リストは、外側に「リスト」という言葉があり、内側に番号付きの要素がある箱で表されます。

## リストは変更可能です

リストの要素を読み取るには、ブラケット演算子を使用できます。
最初の要素のインデックスは「0」です。

In [None]:
cheeses[0]

文字列とは異なり、リストはミュータブルです。代入文の左側にブラケット演算子が現れると、そのリストの要素に代入が行われます。

In [None]:
numbers[1] = 17
numbers

`numbers` の第二要素が、かつての `123` から `17` に変更されました。

リストのインデックスは文字列のインデックスと同様に機能します：

- 任意の整数式をインデックスとして使用できます。

- 存在しない要素を読み取ろうとしたり書き込もうとしたりすると、`IndexError` が発生します。

- インデックスが負の値の場合、リストの末尾から逆向きにカウントされます。

`in` 演算子はリスト上でも機能します。リスト内の任意の場所に指定された要素が存在するかどうかを確認します。

In [None]:
'Edam' in cheeses

In [None]:
'Wensleydale' in cheeses

リストには別のリストを含めることができますが、ネストされたリストは単一の要素として数えられます。そのため、次のリストには4つの要素しかありません。

In [None]:
t = ['spam', 2.0, 5, [10, 20]]
len(t)

`10`はネストされたリストの要素であり、`t`の要素ではないため、`t`の要素とみなされません。

In [None]:
10 in t

## リストのスライス

スライス演算子は、文字列と同様にリストにも適用できます。
次の例では、4つの文字からなるリストの2番目と3番目の要素を選択します。

In [None]:
letters = ['a', 'b', 'c', 'd']
letters[1:3]

最初のインデックスを省略すると、スライスは最初から始まります。

In [None]:
letters[:2]

2番目を省略すると、スライスは最後まで行きます。

In [None]:
letters[2:]

そのため、両方を省略すると、スライスはリスト全体のコピーになります。

In [None]:
letters[:]

リストをコピーする別の方法は、`list`関数を使うことです。

In [None]:
list(letters)

`list`は組み込み関数の名前であるため、変数名として使用するのは避けるべきです。

## リスト操作

`+` 演算子はリストを連結します。

In [None]:
t1 = [1, 2]
t2 = [3, 4]
t1 + t2

`*` 演算子はリストを指定された回数だけ繰り返します。

In [None]:
['spam'] * 4

リストには他の数学的演算子は使えませんが、組み込み関数`sum`を使うと要素を合計することができます。

In [None]:
sum(t1)

「min」と「max」は最小要素と最大要素を見つけます。

In [None]:
min(t1)

In [None]:
max(t2)

## リストメソッド

Pythonはリストに対して操作を行うメソッドを提供しています。例えば、`append`メソッドは新しい要素をリストの末尾に追加します。

In [None]:
letters.append('e')
letters

`extend`はリストを引数として受け取り、そのリストのすべての要素を追加します。

In [None]:
letters.extend(['f', 'g'])
letters

リストから要素を削除する方法は2つあります。削除したい要素のインデックスが分かっている場合は、`pop`を使用できます。

In [None]:
t = ['a', 'b', 'c']
t.pop(1)

戻り値は削除された要素です。そして、リストが変更されたことを確認できます。

In [None]:
t

削除したい要素が分かっているが、そのインデックスがわからない場合は、`remove` を使用できます。

In [None]:
t = ['a', 'b', 'c']
t.remove('b')

`remove` の返り値は `None` ですが、リストが変更されたことを確認できます。

In [None]:
t

リストにない要素を要求した場合、それはValueErrorです。

In [None]:
%%expect ValueError

t.remove('d')

## リストと文字列

文字列は文字の並びであり、リストは値の並びですが、文字のリストは文字列と同じではありません。
文字列から文字のリストに変換するには、`list` 関数を使用できます。

In [None]:
s = 'spam'
t = list(s)
t

`list` 関数は、文字列を個々の文字に分解します。
文字列を単語に分割したい場合は、`split` メソッドを使用できます。

In [None]:
s = 'pining for the fjords'
t = s.split()
t

**デリミター**と呼ばれるオプションの引数は、単語の境界として使用する文字を指定します。次の例では、ハイフンをデリミターとして使用しています。

In [None]:
s = 'ex-parrot'
t = s.split('-')
t

文字列のリストがある場合、それらを連結して単一の文字列にするには、`join` を使用できます。`join` は文字列メソッドなので、デリミタで呼び出し、リストを引数として渡す必要があります。

In [None]:
delimiter = ' '
t = ['pining', 'for', 'the', 'fjords']
s = delimiter.join(t)
s

この場合、デリミタはスペース文字なので、`join`は単語の間にスペースを挿入します。
スペースを入れずに文字列を結合するには、デリミタとして空文字列 `''` を使用できます。

## リストのループ処理

リストの要素をループで処理するには、`for`文を使用できます。

In [None]:
for cheese in cheeses:
    print(cheese)

たとえば、`split`を使用して単語のリストを作成した後で、それらをループするために`for`を使用できます。

In [None]:
s = 'pining for the fjords'

for word in s.split():
    print(word)

空のリストに対する `for` ループでは、インデントされた文は一度も実行されません。

In [None]:
for x in []:
    print('This never happens.')

## リストのソート

Pythonにはリストの要素をソートするための組み込み関数`sorted`が用意されています。

In [None]:
scramble = ['c', 'a', 'b']
sorted(scramble)

元のリストは変更されていません。

In [None]:
scramble

`sorted`はリストだけでなく、あらゆる種類のシーケンスで機能します。このようにして、文字列内の文字をソートすることができます。

In [None]:
sorted('letters')

この結果はリストです。
リストを文字列に変換するには、`join` を使用できます。

In [None]:
''.join(sorted('letters'))

区切り文字として空の文字列を使用すると、リストの要素がその間に何も挟まずに結合されます。

申し訳ありませんが、文が途中で終わっているようです。続けて記入していただければ、正確に日本語へ翻訳いたします。

In [None]:
a = 'banana'
b = 'banana'

`a` と `b` の両方が文字列を指していることはわかっていますが、それらが*同じ*文字列を指しているかどうかはわかりません。
以下の図に示されるように、考えられる状態は2つあります。

In [None]:
from diagram import Frame, Stack

s = 'banana'
bindings = [Binding(Value(name), Value(repr(s))) for name in 'ab']
frame1 = Frame(bindings, dy=-0.25)

binding1 = Binding(Value('a'), Value(repr(s)), dy=-0.11)
binding2 = Binding(Value('b'), draw_value=False, dy=0.11)
frame2 = Frame([binding1, binding2], dy=-0.25)

stack = Stack([frame1, frame2], dx=1.7, dy=0)

In [None]:
width, height, x, y = [2.85, 0.76, 0.17, 0.51]
ax = diagram(width, height)
bbox = stack.draw(ax, x, y)
# adjust(x, y, bbox)

左側の図では、`a` と `b` は異なるオブジェクトで、同じ値を持っています。右側の図では、`a` と `b` は同じオブジェクトを指しています。2つの変数が同じオブジェクトを指しているかどうかを確認するには、`is` 演算子を使用できます。

In [None]:
a = 'banana'
b = 'banana'
a is b

この例では、Pythonは1つの文字列オブジェクトしか作成しておらず、`a`と`b`はどちらもそれを参照しています。
しかし、2つのリストを作成すると、2つのオブジェクトが生成されます。

In [None]:
a = [1, 2, 3]
b = [1, 2, 3]
a is b

状態図はこのようになります。

In [None]:
t = [1, 2, 3]
binding1 = Binding(Value('a'), Value(repr(t)))
binding2 = Binding(Value('b'), Value(repr(t)))
frame = Frame([binding1, binding2], dy=-0.25)

In [None]:
width, height, x, y = [1.16, 0.76, 0.21, 0.51]
ax = diagram(width, height)
bbox = frame.draw(ax, x, y)
# adjust(x, y, bbox)

この場合、2つのリストは同じ要素を持っているため「**等価**」だと言えますが、同じオブジェクトではないため「**同一**」ではありません。2つのオブジェクトが同一である場合、それらは等価でもありますが、等価であるからといって必ずしも同一であるとは限りません。

## エイリアス

`a`があるオブジェクトを参照しているときに`b = a`と代入すると、両方の変数が同じオブジェクトを参照します。

In [None]:
a = [1, 2, 3]
b = a
b is a

それでは、状態遷移図はこのようになります。

In [None]:
t = [1, 2, 3]
binding1 = Binding(Value('a'), Value(repr(t)), dy=-0.11)
binding2 = Binding(Value('b'), draw_value=False, dy=0.11)
frame = Frame([binding1, binding2], dy=-0.25)

In [None]:
width, height, x, y = [1.11, 0.81, 0.17, 0.56]
ax = diagram(width, height)
bbox = frame.draw(ax, x, y)
# adjust(x, y, bbox)

変数がオブジェクトと関連付けられることを**参照**（reference）と呼びます。
この例では、同じオブジェクトに対して2つの参照があります。

1つ以上の参照を持つオブジェクトは複数の名前を持つことになるため、そのオブジェクトは**エイリアスされている**（aliased）と言います。
エイリアスされたオブジェクトが可変である場合、一方の名前で行った変更はもう一方にも影響します。
この例では、オブジェクト`b`が参照するものを変更すると、同時にオブジェクト`a`が参照するものも変更されます。

In [None]:
b[0] = 5
a

したがって、`a`がこの変更を「見る」と言うことができます。この動作は有用であることもありますが、エラーが発生しやすいです。一般的に、可変オブジェクトを扱う際にはエイリアシングを避ける方が安全です。

文字列のような不変オブジェクトの場合、エイリアシングはそれほど問題にはなりません。この例では：

In [None]:
a = 'banana'
b = 'banana'

`a`と`b`が同じ文字列を参照しているかどうかは、ほとんど違いを生みません。

## リストの引数

リストを関数に渡すと、関数はそのリストの参照を受け取ります。関数がリストを変更すると、呼び出し元にもその変更が反映されます。例えば、`pop_first`はリストメソッド`pop`を使ってリストの最初の要素を削除します。

In [None]:
def pop_first(lst):
    return lst.pop(0)

このように使用できます。

In [None]:
letters = ['a', 'b', 'c']
pop_first(letters)

戻り値は、リストから削除された最初の要素です。これは、修正されたリストを表示することで確認できます。

In [None]:
letters

この例では、パラメータ `lst` と変数 `letters` は同じオブジェクトの別名であるため、状態図は次のようになります。

In [None]:
lst = make_list('abc', dy=-0.3, offsetx=0.1)
binding1 = Binding(Value('letters'), draw_value=False)
frame1 = Frame([binding1], name='__main__', loc='left')

binding2 = Binding(Value('lst'), draw_value=False, dx=0.61, dy=0.35)
frame2 = Frame([binding2], name='pop_first', loc='left', offsetx=0.08)

stack = Stack([frame1, frame2], dx=-0.3, dy=-0.5)

In [None]:
width, height, x, y = [2.04, 1.24, 1.06, 0.85]
ax = diagram(width, height)
bbox1 = stack.draw(ax, x, y)
bbox2 = lst.draw(ax, x+0.5, y)
bbox = Bbox.union([bbox1, bbox2])
adjust(x, y, bbox)

オブジェクトへの参照を引数として関数に渡すと、一種のエイリアスが作成されます。関数がそのオブジェクトを変更した場合、その変更は関数が終了した後も持続します。

## 単語リストの作成

前章では、ファイル `words.txt` を読み込み、特定の条件を持つ単語（例えば、文字 `e` を含むもの）を検索しました。しかし、ファイルを何度も読み込むのは効率的ではありません。ファイルを一度だけ読み込み、単語をリストに入れる方が良いです。以下のループはその方法を示しています。

In [None]:
download('https://raw.githubusercontent.com/AllenDowney/ThinkPython/v3/words.txt');

In [None]:
word_list = []

for line in open('words.txt'):
    word = line.strip()
    word_list.append(word)

len(word_list)

ループの前に、`word_list`は空のリストで初期化されます。ループが回るたびに、`append`メソッドによって単語が末尾に追加されます。ループが終了すると、リストには113,000語以上が含まれています。

同じことを行うもう一つの方法は、`read`を使用してファイル全体を文字列として読み込むことです。

In [None]:
string = open('words.txt').read()
len(string)

結果は、100万文字を超える単一の文字列です。`split`メソッドを使用して、それを単語のリストに分割することができます。

In [None]:
word_list = string.split()
len(word_list)

たとえば、リストに`'demotic'`が含まれているかどうかを確認するために、`in`演算子を使用できます。

In [None]:
'demotic' in word_list

しかし、`'contrafibularities'`は違います。

In [None]:
'contrafibularities' in word_list

「それについて私は不快感を持っていると言わざるを得ません。」

## デバッグ

ほとんどのリストメソッドは引数を変更し、`None`を返すことに注意してください。
これは、新しい文字列を返し、元の文字列をそのままにする文字列メソッドとは反対です。

次のように文字列コードを書くのに慣れている場合は:

In [None]:
word = 'plumage!'
word = word.strip('!')
word

このようにリストのコードを書くのは魅力的です：

In [None]:
t = [1, 2, 3]
t = t.remove(3)           # WRONG!

`remove`はリストを変更し、`None`を返すので、次に`t`で行う操作は失敗する可能性があります。

In [None]:
%%expect AttributeError

t.remove(2)

このエラーメッセージには説明が必要です。オブジェクトの**属性**とは、そのオブジェクトに関連付けられた変数やメソッドのことです。この場合、`t`の値が`None`であり、これは`NoneType`オブジェクトで、`remove`という名前の属性を持っていないので、結果として`AttributeError`が発生します。

このようなエラーメッセージが表示されたら、プログラムを遡って、リストメソッドを誤って呼び出していないか確認するべきです。

## 用語集

**リスト:**
 値のシーケンスを含むオブジェクト。

**要素:**
 リストや他のシーケンス内の値の1つ。

**ネストリスト:**
 他のリストの要素として含まれるリスト。

**デリミタ:**
 文字列をどこで分割するかを示すために使用される文字または文字列。

**同等:**
 同じ値を持つこと。

**同一:**
 同じオブジェクトであること（同等であることを意味する）。

**参照:**
 変数とその値の間の関連。

**エイリアス化:**
 1つのオブジェクトに複数の変数が参照している場合、そのオブジェクトはエイリアス化されている。

**属性:**
 オブジェクトに関連付けられた名前付きの値の1つ。

## 練習問題

In [None]:
# This cell tells Jupyter to provide detailed debugging information
# when a runtime error occurs. Run it before working on the exercises.

%xmode Verbose

### バーチャルアシスタントに聞いてみる

この章では、「contrafibularities」や「anaspeptic」といった言葉を使用しましたが、実際には英語の単語ではありません。これらは、イギリスのテレビ番組 *Black Adder* のシーズン3、エピソード2「Ink and Incapability」で使われた言葉です。

しかし、ChatGPT 3.5（2023年8月3日バージョン）にこれらの言葉の出典を尋ねた際、最初はモンティパイソンから来たと主張し、後にトム・ストッパードの戯曲 *Rosencrantz and Guildenstern Are Dead* から来たと主張しました。

現在聞いてみると、違う結果になるかもしれません。しかし、この例は、バーチャルアシスタントが常に正確ではないということを思い出させてくれます。したがって、結果が正しいかどうかを確認する必要があります。経験を積むことで、バーチャルアシスタントがどの質問に対して信頼性の高い回答を提供できるのかという感覚を得ることができます。この例では、一般的なウェブ検索により、これらの言葉の出典をすぐに特定できるでしょう。

この章の練習問題で行き詰まった場合は、バーチャルアシスタントに助けを求めることを検討してください。まだ学んでいない機能を使用した結果が出た場合、VA に「役割」を割り当てることができます。

例えば、質問をする前に「役割：基本的なPythonプログラミングのインストラクター」と入力してください。その後は、基本的な機能のみを使った回答を受け取れるはずです。それでもまだ学んでいない機能が出てくる場合は、「基本的なPython機能のみを使って書いてもらえますか？」と追いかけることができます。

```python
def is_anagram(word1, word2):
    return sorted(word1) == sorted(word2)
```

こちらのコードは、2つの単語がアナグラムであるかどうかを確認する関数 `is_anagram` を示しています。この関数は、2つの文字列を受け取り、その文字列の各文字をソートします。ソートした結果が一致する場合、2つの単語はアナグラムであるため、関数は `True` を返します。そうでない場合は、`False` を返します。

あなたを始めさせるために、ここに doctests を含む関数のアウトラインがあります。

In [None]:
def is_anagram(word1, word2):
    """Checks whether two words are anagrams.

    >>> is_anagram('tops', 'stop')
    True
    >>> is_anagram('skate', 'takes')
    True
    >>> is_anagram('tops', 'takes')
    False
    >>> is_anagram('skate', 'stop')
    False
    """
    return None

In [None]:
# Solution goes here

関数をテストするために `doctest` を使用できます。

In [None]:
from doctest import run_docstring_examples

def run_doctests(func):
    run_docstring_examples(func, globals(), name=func.__name__)

run_doctests(is_anagram)

`takes` のアナグラムを見つけるためには、文字を並び替えて意味のある単語を作成する必要があります。以下は `takes` のアナグラムの例です：

1. stake (ステーク)
2. skate (スケート)

これらは `takes` から作成できるアナグラムの例です。

In [None]:
# Solution goes here

### エクササイズ

Pythonは、「reversed」という名前の組み込み関数を提供しています。この関数は、リストや文字列のような要素のシーケンスを引数として取り、要素が逆順に格納された`reversed`オブジェクトを返します。

In [None]:
reversed('parrot')

リスト内の要素を逆順にしたい場合は、`list`関数を使うことができます。

In [None]:
list(reversed('parrot'))

または、それらを文字列にしたい場合は、`join`メソッドを使用できます。

In [None]:
''.join(reversed('parrot'))

このようにして単語を反転させる関数を書くことができます。

In [None]:
def reverse_word(word):
    return ''.join(reversed(word))

パリンドローム（回文）は、前後に同じように綴られる単語のことです。例えば、「noon」や「rotator」があります。以下に、そのような単語かどうかを判定する関数 `is_palindrome` の実装を示します。これは入力された文字列がパリンドロームであれば `True` を、そうでなければ `False` を返します。

```python
def is_palindrome(s):
    # 文字列を逆にして、元の文字列と比較します
    return s == s[::-1]

# 使用例
print(is_palindrome("noon"))      # 出力: True
print(is_palindrome("rotator"))   # 出力: True
print(is_palindrome("hello"))     # 出力: False
```

この関数は、文字列をスライスし逆順にして、それが元の文字列と一致するかどうかをチェックすることで、パリンドロームかどうかを確認します。

関数のアウトラインと、その関数をチェックするために使えるdoctestが欲しいということですね。具体的にどのような関数を考えているのか教えていただけますか？関数の内容や期待する動作について詳しい情報をいただければ、それに応じた翻訳を提供することができます。

In [None]:
def is_palindrome(word):
    """Check if a word is a palindrome.

    >>> is_palindrome('bob')
    True
    >>> is_palindrome('alice')
    False
    >>> is_palindrome('a')
    True
    >>> is_palindrome('')
    True
    """
    return False

In [None]:
# Solution goes here

In [None]:
run_doctests(is_palindrome)

以下のループを使用して、7文字以上の単語リスト内のすべての回文を見つけることができます。

In [None]:
for word in word_list:
    if len(word) >= 7 and is_palindrome(word):
        print(word)

```python
def reverse_sentence(sentence):
    # Split the sentence into words
    words = sentence.split()
    
    # Reverse the order of the words
    reversed_words = words[::-1]
    
    # Join the reversed words into a new sentence
    reversed_sentence = ' '.join(reversed_words)
    
    # Capitalize the first word and make other words lowercase
    final_sentence = reversed_sentence.capitalize()
    
    return final_sentence

# Example usage:
# Input: "Reverse this sentence"
# Output: "Sentence this reverse"
```

日本語訳:
```python
def reverse_sentence(sentence):
    # 文を単語に分割する
    words = sentence.split()
    
    # 単語の順序を逆にする
    reversed_words = words[::-1]
    
    # 逆順にした単語を新しい文として結合する
    reversed_sentence = ' '.join(reversed_words)
    
    # 最初の単語を大文字にし、他の単語を小文字にする
    final_sentence = reversed_sentence.capitalize()
    
    return final_sentence

# 使用例:
# 入力: "Reverse this sentence"
# 出力: "Sentence this reverse"
```

開始するために、以下にドックテスト付きの関数のアウトラインを示します。

In [None]:
def reverse_sentence(input_string):
    '''Reverse the words in a string and capitalize the first.

    >>> reverse_sentence('Reverse this sentence')
    'Sentence this reverse'

    >>> reverse_sentence('Python')
    'Python'

    >>> reverse_sentence('')
    ''

    >>> reverse_sentence('One for all and all for one')
    'One for all and all for one'
    '''
    return None

In [None]:
# Solution goes here

In [None]:
run_doctests(reverse_sentence)

### 練習問題

`total_length`という関数を作成し、文字列のリストを引数に取り、文字列の総文字数を返します。
`word_list`の単語の総文字数は$902{,}728$であるべきです。

In [None]:
# Solution goes here

In [None]:
# Solution goes here

[Think Python: 第3版](https://allendowney.github.io/ThinkPython/index.html)

著作権 2024 [Allen B. Downey](https://allendowney.com)

コードライセンス: [MITライセンス](https://mit-license.org/)

テキストライセンス: [クリエイティブ・コモンズ 表示 - 非営利 - 継承 4.0 国際](https://creativecommons.org/licenses/by-nc-sa/4.0/)