# 4. Pythonのデータ型（コレクション編）
***
<a id="Collection"></a>
### データ型をまとめるコレクションの紹介
***
Pythonのデータ型のうち、複数のデータ型をひとまとめにして扱えるコレクションを紹介します。
## 4.1. はじめに
***
本節では次の4つを扱います。リスト（``list``）、タプル（``tuple``）、辞書（``dict``）と集合（``set``）を扱います。
<a id="Collection-list"></a>
## 4.2. リスト（list）
***
リストはコレクションの1つです。複数の型のデータをひとまとめにできます。

リストを定義するには角括弧（``[ ]``）を使い、含める要素をカンマ（``,``）で区切ります（:numref:`define-list`）。
<a id="define-list"></a>
#### リスト4.1 リストの定義

In [4]:
['spam', 'egg', 0.5]

['spam', 'egg', 0.5]

リストも文字列と同様に、結合やスライスが使えます（[リスト4.2](#use-list)）。

<a id="use-list"></a>
#### リスト4.2 リストの基本的な使い方

In [66]:
['spam', 'ham'] + ['egg']              # リストの結合

['spam', 'ham', 'egg']

In [67]:
['spam'] * 5                           # リストの繰り返し

['spam', 'spam', 'spam', 'spam', 'spam']

In [68]:
['spam', 'ham', 'egg'][0]              # リストの0番目を取得する

'spam'

In [69]:
['spam', 'ham', 'egg'][1:]             # リストのスライス(1番目以降)

['ham', 'egg']

In [70]:
len(['spam', 'ham', 'egg'])            # リストの長さ

3

In [71]:
'ham' in ['spam', 'ham', 'egg']        # リストに特定の文字列が含まれるか

True

<a id="Collection-for"></a>

### 4.2.1. for文
***
リストは、 ``for`` 文の繰り返し用変数として使えます（[リスト4.3](#for-list)）。

<a id="for-list"></a>
#### リスト4.3 for文とリスト

for animal in ['cat', 'dog', 'snake']:
    print(animal)

### ヒント
[listのfor文での繰り返し動作を確認](http://pythontutor.com/live.html#code=for%20animal%20in%20%5B'cat',%20'dog',%20'snake'%5D%3A%0A%20%20%20%20print%28animal%29&cumulative=false&curInstr=7&heapPrimitives=false&mode=display&origin=opt-live.js&py=3&rawInputLstJSON=%5B%5D&textReferences=false)

<a id="Collection-append"></a>

### 4.2.2. 要素の追加
***
リストに要素を追加するには、 ``.append()`` メソッドを使います。
``.append()`` メソッドはリストの末尾に要素を追加します（[リスト4.4](#list-append)）。

<a id="list-append"></a>
#### リスト4.4 リストへの要素追加

In [11]:
animals = ['cat', 'dog', 'snake']

In [12]:
animals.append('elephant')

In [13]:
animals

['cat', 'dog', 'snake', 'elephant']

リストは変更可能なオブジェクトです。
``.append()`` メソッドによって、 ``animals`` というリストの内容が変更されます。

#### ヒント

[listへの要素の追加の動作を確認 ](http://pythontutor.com/live.html#code=animals%20%3D%20%5B'cat',%20'dog',%20'snake'%5D%0Aanimals.append%28'elephant'%29%0Aprint%28animals%29&cumulative=false&curInstr=0&heapPrimitives=false&mode=display&origin=opt-live.js&py=3&rawInputLstJSON=%5B%5D&textReferences=false)

<a id="comprehension"></a>
### 4.2.3. リスト内包表記
***
リスト内包表記はリストの定義方法の1つです。
比較的複雑なリストの定義を、シンプルに記述できます。

``for`` 文の例として ``animals`` リストから各文字列の長さの一覧を作ります（[リスト4.5](#general-for)）。

<a id="general-for"></a>
#### リスト4.5 一般的なfor文

In [14]:
ret = []
for animal in animals:
    ret.append(len(animal))
ret

[3, 3, 5, 8]

:numref:`general-for` をリスト内包表記に置き換えると、 [リスト4.6](#list-comprehension) のようになります。

<a id="list-comprehension"></a>
#### リスト4.6 リスト内包表記

In [15]:
 [len(animal) for animal in animals]

[3, 3, 5, 8]

3行で記述していたコードが1行になりました。内包表記を使うと簡潔に記述できることがわかったと思います。
最初は見慣れないかもしれませんが、徐々に慣れていくと良いと思います。

リストの定義時に、角括弧（``[ ]``）の内部に ``for`` を書きます。
``for ＜変数名＞ in`` の部分は通常の ``for`` 文と同じです。

``for`` の左側でひとつひとつ取り出した要素（ここでは ``animal``）を使い、リストの各要素を作ります。[リスト4.6](#list-comprehension) の場合、 ``len(animal)`` の結果が各要素になります。

リスト内包表記は、条件文や複数回のループ処理も記述できます。
複雑にしすぎると、かえって可読性を落としますので、ほどほどに使用することをおすすめします。複雑になりすぎる場合はループ処理で書きましょう。
リスト内包表記の仲間に、辞書(後述)を生成する辞書内包表記や、セット(後述)を生成するセット内包表記やジェネレータ式(本チュートリアルでは取り扱わない)などもあります。
内包表記はPythonの強力な機能の1つなのでぜひ覚えておくとよいでしょう。

他にも役に立つ書き方があるので、Pythonのドキュメントを参考にしてください。

* リストの内包表記 https://docs.python.org/ja/3/tutorial/datastructures.html#list-comprehensions

<a id="substitute"></a>
### 4.2.4. 複数変数への代入
***
リストのようなシーケンス型から他のデータ型に値を代入する際、複数の変数への代入を一度に行えます（[リスト4.7](#multi-substitute)）。

<a id=multi-substitute></a>
#### リスト4.7 シーケンス型から複数変数への代入

In [16]:
dog, cat = ['dog', 'cat']
dog

'dog'

In [17]:
cat

'cat'

複数の変数への代入は、右辺が文字列や後述するタプルの場合でも可能です。

たとえば文字列を ``.split()`` メソッドで分割し、それぞれの変数へ代入すると便利です。
 HTTPのAuthorizationヘッダーをauth_type、auth_stringに分割する処理は以下のように書けます。

#### splitメソッドと各要素個別の代入

In [72]:
authorization_header = 'Bearer ABCDEF'
auth_type, auth_string = authorization_header.split(' ', 1)

   ``.split()`` メソッドの第2引数に ``1`` を指定することで、最大1度しか分割しないよう指定しています。
   右辺の要素数が左辺の変数の数より多いか、少ない場合エラー (ValueError) になります。

<a ip="Collection-tuple"></a>
## 4.3. タプル（tuple）
***
タプルはリストと同じコレクションの1つです。

タプルを定義するには括弧（``( )``）を使い、含める要素をカンマ（``,``）で区切りで並べます（[リスト4.7](#define-tuple)）。

<a id="define-tuple"></a>
#### リスト4.7 タプルの定義

In [19]:
('spam', 'ham', 4)

('spam', 'ham', 4)

タプルもリスト、文字列と同様に、結合やスライスが使えます（[リスト4.8](#use-tuple)）。

<a id="use-tuple"></a>
#### リスト4.8 タプルの基本的な使い方

In [73]:
('spam', 'ham') + ('egg',)             # タプルの結合

('spam', 'ham', 'egg')

In [74]:
('spam',) * 5                          # タプルの繰り返し

('spam', 'spam', 'spam', 'spam', 'spam')

In [75]:
('spam', 'ham', 'egg')[0]              # タプルの0番目を取得する

SyntaxError: invalid character in identifier (<ipython-input-75-f564230ea982>, line 1)

In [76]:
('spam', 'ham', 'egg')[1:]             # タプルのスライス(1番目以降)

('ham', 'egg')

In [77]:
len(('spam', 'ham', 'egg'))            # タプルの長さ

3

In [78]:
'ham' in ('spam', 'ham', 'egg')        # タプルに特定の文字列が含まれるか

True

要素が1つのタプルを定義する際にもカンマが必要な点に注意してください。
これは、処理の優先順位を決める括弧と区別するためです（[リスト4.9](#single-tuple)）。

<a id="single-tuple"></a>
#### リスト4.9 1要素のタプル

In [34]:
('spam',)

('spam',)

In [35]:
('spam')

'spam'

また、括弧を省略してタプルを定義できます（[リスト4.10](#omit-parenthesis-tuple)）。

<a id="omit-parenthesis-tuple"></a>
#### リスト4.10 括弧を省略したタプル
'dog', 'cat'

<a id="immutable"></a>
### 4.3.1.リストとの違いと使いどころ
***
リストと違いタプルは不変（immutable）な値です。
リストの ``.append()`` のような破壊的な操作は存在しません。
``.append()`` のような処理を行いたい場合は、タプルの結合により新しいタプルを作るしかありません。

タプルは、関数の戻り値や不変としたい設定用の値に使います。

関数からタプルを返すと、簡単に複数の値を戻り値として返すことができます。

シーケンス（リスト、タプルや文字列）を受け取り、初めの要素と残りの要素に分割する関数を、 [リスト4.11](#return-tuple) に示します。

<a id="return-tuple"></a>
#### リスト4.11 タプルを返す関数

In [36]:
def head_splitter(seq):
     return seq[0], seq[1:]

head, tail = head_splitter(['head', 'body', 'tail'])
head

'head'

In [37]:
tail

['body', 'tail']

戻り値の順番に意味が必要になるため、要素の多いタプルを返すのは避けましょう（[リスト4.12](#many-return-value)）。

<a id="many-return-value"></a>
#### リスト4.12 要素数の多いタプルを返す関数

In [38]:
def bad_implementation():
    return 'username', 'user_password', 'user_id', 'user_permission1', 'user_permission2'

username, user_password, user_id, user_permission1, user_permission2 = bad_implementation()

:ref:`many-return-value` のような場合、辞書（後述）、専用のクラスのインスタンス、名前付きタプルなどで返しましょう
（クラスの定義方法、名前付きタプルについては、本チュートリアルでは説明しません）。

<a id="Collection-dict"></a>
## 4.4. 辞書（dict）
***
辞書もリスト、タプルと同じコレクションです。

辞書はリストとは違い、各要素に順番を持ちません。代わりにキー（key）と、対応する値（value）を持ちます。

辞書を定義するには波括弧（``{}`` )で各要素を囲み、コロン（``:``）でキーと値を書きます（[リスト4.13](#guide-dict)）。
値と次のキーの間はカンマ（``,``）で区切ります。

<a id="guide-dict"></a>
#### リスト4.13 辞書

In [39]:
user_info = {'user_name': 'taro', 'last_name': 'Yamada'}
user_info

{'user_name': 'taro', 'last_name': 'Yamada'}

:numref:`guide-dict` の ``user_info`` から ``'user_name'`` の値を取り出す処理は、 [リスト4.14](#get-dict-value) になります。

<a id="get-dict-value"></a>
#### リスト4.14 辞書からの値の取り出し

In [40]:
user_info['user_name']

'taro'

既存の辞書に値を設定するには、 ``辞書[＜キー＞]`` に直接代入します（[リスト4.15](#set-dict-value)）。

<a id="set-dict-value"></a>
#### リスト4.15 辞書への値の設定

In [41]:
user_info['first_name'] = 'Taro'
user_info

{'user_name': 'taro', 'last_name': 'Yamada', 'first_name': 'Taro'}

<a id="Collection-in"></a>
### 4.4.1. in
***
辞書内にキーが存在しているかどうかを調べるには、 ``in`` を使います（[リスト4.16](#dict-in)）。

<a id="dict-in"></a>
#### リスト4.16 辞書のin

In [42]:
'user_name' in user_info

True

In [43]:
'bio' in user_info

False

<a id="Collection-get"></a>
### 4.4.2. .get()メソッド
***
辞書から値を取得するときに、キーが存在しない場合はエラー(KeyError)になります（[リスト4.17](#dict-keyerror)）。

<a id="dict-keyerror"></a>
#### リスト4.17 存在しないキーの参照

In [44]:
user_info['bio']

KeyError: 'bio'

``.get()`` メソッドで取得すると、キーが存在しない場合には ``None`` が返されます（[リスト4.18](#get-from-dict)）。

<a id="get-from-dict"></a>
#### リスト4.18 存在しないキーへのget

In [45]:
user_info.get('user_name')

'taro'

In [46]:
bio = user_info.get('bio')
print(bio)

None


``None`` は、Pythonの組み込み定数の1つで、何も値がないことを表します。

インタープリタは ``None`` を表示しないので、明示的に ``print`` 関数を使っています。

値が存在しないときに ``None`` 以外の値を返したい場合には、 ``.get()`` メソッドの第2引数に返したい値を指定します。
``'bio'`` の値が取れない場合に空文字列（``''``）としたい場合は、 [リスト4.19](#get-with-default) のように書きます。

<a id="get-with-default"></a>
#### リスト4.19 デフォルト値付きのget

In [47]:
user_info.get('bio', '')

''

<a id="Collection-for"></a>
### 4.4.3. for文
***
辞書を ``for`` 文の繰り返し用変数として使用すると、変数にはキーが入ります([リスト4.20](#dict-for))。

<a id="dict-for"></a>
#### リスト4.20 辞書を使用したfor文

In [79]:
user_info = {'user_name': 'taro', 'last_name': 'Yamada'}
for key in user_info:
    print(key)
    print(user_info[key])

user_name
taro
last_name
Yamada


 #### ヒント
 [辞書のfor文の動作を確認](http://pythontutor.com/live.html#code=user_info%20%3D%20%7B'user_name'%3A%20'taro',%20'last_name'%3A%20'Yamada'%7D%0Afor%20key%20in%20user_info%3A%0A%20%20%20%20print%28key%29%0A%20%20%20%20print%28user_info%5Bkey%5D%29%0A&cumulative=false&curInstr=0&heapPrimitives=false&mode=display&origin=opt-live.js&py=3&rawInputLstJSON=%5B%5D&textReferences=false)

### 4.4.4. .keys()メソッド、.values()メソッド、.items()メソッド
***
すべてのキー、値の要素をリストで取得するには、 ``.keys()`` 、 ``.values()`` 、 ``.items()`` メソッドを使います。

* ``.keys()``: すべてのキーを取得
* ``.values()``: すべての値を取得
* ``.items()``: すべてのキーと値を、要素が2つのタプルで取得

たとえば、辞書内のすべてのキーと値を取得するには、 [リスト4.21](#get-all-items) のようにします。

<a id="get-all-items"></a>
#### リスト4.21 辞書内のすべてのキーと値を取得

In [51]:
d = {'foo': 'spam', 'bar': 'ham'}
d.items()

dict_items([('foo', 'spam'), ('bar', 'ham')])

``.items()`` の結果を ``for`` 文に渡せば、辞書内のすべての値を使った繰り返し処理を書けます。

``for`` 文の変数名を2つ指定することで、要素が2つのタプルからキーと値をそれぞれの変数に一度で受け取れます（[リスト4.22](#for-with-dict-items)）。

<a id="for-with-dict-items"></a>
#### リスト4.22 for文で辞書のキーと値を使う

In [80]:
d = {'foo': 'spam', 'bar': 'ham'}
for key, value in d.items():
     print(key, value)  

foo spam
bar ham


各メソッドの戻り値はイテレータブルオブジェクトです。

### コラム: イテレータブルオブジェクト
***
   ``.keys()`` 、 ``.values()`` 、 ``.items()`` の戻り値の型はリストやタプルではなく ``dict_items`` ですが、 ``for`` 文でデータを取り出すことができます。Pythonの ``for`` 文は、「イテレータブルオブジェクト」という連続したデータ構造を表すオブジェクトであれば扱えるため、このような動きになります。

<a id="Collection-set"></a>

## 4.5. 集合（set）
***
集合型（set）はコレクション型の1つです。

リストやタプルのように値しか持ちませんが、順序も持ちません。

1つの集合内には同じ値が1つしか存在できません。そのため、一意な値を管理する際に非常に役立ちます。

ただし、辞書のキーと同じように、集合内には不変の値しか持てません。

集合は波括弧（``{ }``）で囲んだ中に、要素をカンマ（``,``）で区切って指定して定義します（[リスト4.23](#define-set)）。

<a id="define-set"></a>
#### リスト4.23 集合の定義

In [57]:
{'spam', 'ham'}

{'ham', 'spam'}

In [58]:
{'spam', 'spam', 'spam'}

{'spam'}

<a id="Collection-add"></a>
### 4.5.1. .add()メソッド
***
集合に要素を追加するには ``.add()`` メソッドを使います。
追加したい要素を引数に渡して呼び出します（[リスト4.24](#set-add-method)）。

<a id="set-add-method"></a>
#### リスト4.24 集合への要素の追加

In [59]:
unique_users = {'dog', 'cat'}
unique_users.add('snake')
unique_users

{'cat', 'dog', 'snake'}

集合の要素数も ``len()`` 関数で取得できます（[リスト4.25](#len-with-set)）。

<a id="len-with-set"></a>
#### リスト4.25 集合によるユニーク数管理

In [60]:
len(unique_users)

3

In [61]:
unique_users.add('snake')
unique_users.add('snake')
unique_users.add('snake')
len(unique_users)

3

[リスト4.25](#len-with-set) で要素が2つの ``unique_users`` という集合を定義し、後に要素を追加しています。
ここで ``unique_users`` の要素数は3です。
[リスト4.25](#len-with-set) では、集合内にすでに存在する ``'snake'`` という要素を ``.add()`` で3 回追加していますが、 ``len()`` 関数の結果は変わりません。

このように、集合では一意な値が適切に管理されていることがわかります。

<a id="Collection-product"></a>
### 4.5.2. 集合の積と和
***
2つの集合から集合の積を取り、両方の集合に存在する要素の集合を取得できます。

この場合、2つの集合に対してAND（``&``）演算子を使います（[リスト4.26](#product-of-sets)）。

<a id=:product-of-sets></a>
#### リスト4.26 2集合の積

In [64]:
allowed_permissions = {'edit', 'view'}
requested_permissions = {'view', 'delete'}
allowed_permissions & requested_permissions

{'view'}

[リスト4.26](#product-of-sets)では、アプリケーションから許可された権限の一覧 ``allowed_permissions`` を使って、ユーザに要求された権限 ``requested_permissions`` のフィルタリングを行う状況を想定しています。
結果としてユーザに許可された権限は ``'view'`` のみとなりました。
<a id="Collection-sum"></a>
集合の和も取得できます。
両方の集合を合わせた集合を取得できます。
2つの集合に対してOR（``¦``）演算子を使います（[リスト4.27](#sum-of-sets)）。

<a id="sum-of-sets"></a>
#### リスト4.27 2つの集合の和

In [65]:
editor = {'edit', 'comment'}
reviewer = {'comment', 'approve'}
editor | reviewer

{'approve', 'comment', 'edit'}

[リスト4.27](#sum-of-sets) では、``editor`` と ``reviewer`` はロール（役割）を想定しています。
この2つのロールを持つユーザは、``'edit'``、``'comment'`` と ``'approve'`` の権限を持つことを算出しました。

## 4.6. まとめ
***
データ型をひとまとめにして扱えるコレクションを紹介しました。
実現したいことに合わせたコレクションを選択しましょう。