# SECTION 04 その他のデータ型を理解する
- このセクションで学ぶこと
  - タプルの概要
  - タプルの利⽤⽅法と利⽤例
  - タプルからタプルへの代⼊(アンパック代⼊)
  - タプルやリストを扱う関数
  - セットの概要
  - セット型の操作
  - 辞書型の概要
  - 辞書型の操作
  - 辞書型のメソッド
  - コラム: 基本的な型と制御がプログラミングの中⼼

## タプルの概要
- 複数の異なるデータをまとめて管理するための型。リストに似ているが「不変オブジェクト」。データ構造を作る
- 出席簿を例としたリストとの使い分け
  - タプル: 各⽣徒のデータ(名前、⾝⻑、体重)
  - リスト: ⽣徒1, ⽣徒2, ⽣徒3, ...

## タプルの利⽤⽅法
- 少カッコ()内に各要素をコンマ区切りで並べる。リストと同じ
- 要素へのアクセスはインデックス番号を使う
- 要素は上書きできない
- 要素数は変更できない

In [2]:
taro = ('taro', 180, 80)
print(type(taro))
print(taro[1])

<class 'tuple'>
180


In [3]:
taro = ('taro', 180, 80)
taro[0] = 'jiro'

TypeError: 'tuple' object does not support item assignment

In [4]:
del taro[1]

TypeError: 'tuple' object doesn't support item deletion

## タプルの利⽤例
- 表の列(構成が決まっている)をタプルとする
- 表の⾏(⻑さが変わる)をリストとする

In [6]:
taro = ('taro', 180, 80)
jiro = ('jiro', 170, 70)
saburo = ('saburo', 160, 60)
list1 = [taro, jiro, saburo]
sum_height = 0
for person in list1:
    sum_height += person[1]
print(sum_height/len(list1))

170.0


## タプルからタプルへの代⼊
- 「アンパック代⼊」を使うとタプルに含まれる変数群に右側のタプルの要素をまとめて代⼊できる
- 左辺のカッコは省略できる。例「a, b, c = (1, 2, 3)」
- for⽂の変数や関数の返り値にタプルを使うことが多い

In [7]:
(name, height, weight) = ('taro', 180, 80)
print(height)

180


In [8]:
taro = ('taro', 180, 80)
jiro = ('jiro', 170, 70)
saburo = ('saburo', 160, 60)
list1 = [taro, jiro, saburo]
sum_height = 0
for (name, height, weight) in list1:
    sum_height += height
print(sum_height/len(list1))

170.0


## タプルやリストを扱う関数
- 「enumerate関数」でリストの要素をタプル形式にしてインデックス番号を与える
- 「zip関数」で複数のリストを束ねてタプル形式のリストにする

In [9]:
list1 = ['a', 'b', 'c', 'd', 'e']
enum_object = enumerate(list1)
print(list(enum_object))

[(0, 'a'), (1, 'b'), (2, 'c'), (3, 'd'), (4, 'e')]


In [11]:
list1 = ['a', 'b', 'c']
for (index, item) in enumerate(list1):
    print('{} : {}'.format(index, item))

0 : a
1 : b
2 : c


## セットの概要
- 順序と重複がない複数の要素を保持するデータ構造
- 要素を追加、削除することができるが、Listと異なり同じ要素を2つ持つことはできず、要素の順序もない
- set()で空のセットオブジェクトを作成する

## セット型の操作
- セットオブジェクトの作成⽅法
  - set()
  - {'elem1', 'elem2', 'elem3'}
- 宣⾔⽅法が後述する辞書型とほぼ同じなので注意。特に「{}」はセット型ではなく辞書型のオブジェクトが⽣成されるのはよく間違えるポイント

In [12]:
set1 = set()
type(set1)

set

In [13]:
set2 = {'elem1', 'elem2', 'elem3'}
type(set2)

set

## セット型の操作
- addメソッド: 要素を追加
- removeメソッド: 要素を削除
- popメソッド: 要素をランダムに取り出し(取り出すとなくなる)
- in演算⼦: 要素が存在するかチェック。リストより⾼速

In [14]:
set1 = {'A', 'B', 'C'}
'A' in set1

True

In [15]:
'D' in set1

False

In [16]:
set1.remove('B')
set1

{'A', 'C'}

In [17]:
a = set1.pop()
a

'A'

In [18]:
set1

{'C'}

## 辞書型の概要
- セットと似ているが要素は「キー(key)」と「バリュー(value)」を持つ。キーは重複できないがバリューは重複できる
- キーを指定してバリューを取得/更新する
- 同じキーで要素を追加するとバリューが上書きされる

In [19]:
fruits_dict = dict()
fruits_dict['apple'] = 'red'
fruits_dict['banana'] = 'yellow'
fruits_dict

{'apple': 'red', 'banana': 'yellow'}

In [20]:
fruits_dict['apple']

'red'

## 辞書型の操作
- 辞書オブジェクトの作成⽅法
  - dict()
  - {}
  - {key1:value1, key2:value2, ...}
- セット型と使う記号が同じ中括弧。違いは要素がキーとバリューのペアになっていることのみ
- キーの型は⽂字列が⼀般的だが他の型(数値など)も使える

In [21]:
fruits_dict = {'apple':'red', 'banana':'yellow'}
type(fruits_dict)

dict

In [22]:
fruits_dict2 = {}
type(fruits_dict)

dict

## 辞書型の操作 (2/3)
- 辞書オブジェクトからのバリューの取得
  - 書式: OBJECT[KEY]
- 辞書オブジェクトへの要素の追加
  - 存在しないキー: 新しいキーとバリューのペアが登録される
  - 存在するキー: キーの対となるバリューが更新される
  - 書式: OBJECT[KEY] = VALUE

In [23]:
fruits_dict = {'apple':'red', 'banana':'yellow'}
fruits_dict['apple']

'red'

In [24]:
fruits_dict['apple'] = 'green'
fruits_dict['apple']

'green'

## 辞書型の操作
- in演算⼦: キーの存在確認
- 存在しないキーのバリューを取得しようとするとエラーになる
- キーの存在が不明な場合は事前にin演算⼦か後述のgetメソッドを使うこと

In [25]:
fruits_dict = {'apple':'red', 'banana':'yellow'}
'apple' in fruits_dict

True

In [26]:
'grape' in fruits_dict

False

In [27]:
fruits_dict['grape']

KeyError: 'grape'

## 辞書型のメソッド
- keys: キーの⼀覧をリスト形式で返す
- values: バリューの⼀覧をリスト形式で返す
- items: 「キーとバリューのタプル」をリスト形式で返す
- itemsはforループでの利⽤に便利

In [28]:
a = {'apple':'red', 'banana':'yellow'}
a.keys()

dict_keys(['apple', 'banana'])

In [29]:
a.values()

dict_values(['red', 'yellow'])

In [30]:
a.items()

dict_items([('apple', 'red'), ('banana', 'yellow')])

## 辞書型のメソッド
- 辞書型をforループで全て処理する操作
  - for⽂のin演算⼦に辞書オブジェクトを与える: keyでループ
  - for⽂のin演算⼦にitemsメソッドを与える: keyとvalueでループ

In [31]:
fruits_dict = {'apple':'red', 'banana':'yellow'}
for key in fruits_dict:
    print(key)

apple
banana


In [32]:
fruits_dict = {'apple':'red', 'banana':'yellow'}
for (key, value) in fruits_dict.items():
    print('{} : {}'.format(key, value))

apple : red
banana : yellow


## 辞書型のメソッド
- get: キーを指定してバリューを取得する。キーが存在しない場合はデフォルト値を取得
- デフォルト値を指定しない場合はNoneがデフォルト値
- デフォルト値を取得しても元の辞書オブジェクトに変化なし
- 似た関数にsetdefaultがある(割愛)

In [33]:
page_counter = {}
value = page_counter.get('/hello.html', 0)
print(value)
print(page_counter)

0
{}


## 辞書型のメソッド 
- getメソッドを使うことでカウンターのような実装を簡単に実現できる
- 複雑な初期化処理が必要な場合はin演算⼦を使って以下のような実装をすることを推奨
  - 存在しない場合: 初期化処理をして辞書オブジェクトに代⼊
  - 存在する場合: 辞書オブジェクトから取得

In [34]:
page_counter = {}
page_counter['/page_a.html'] = page_counter.get('/page_a.html', 0) + 1
page_counter['/page_a.html'] = page_counter.get('/page_a.html', 0) + 1
page_counter['/page_b.html'] = page_counter.get('/page_b.html', 0) + 1
print(page_counter)

{'/page_a.html': 2, '/page_b.html': 1}


## コラム: 基本的な型と制御がプログラミングの中⼼
- Pythonプログラミングの基本は以下となる
  - ライブラリにある処理はライブラリに任せる
  - ライブラリを使うプログラムは⾃分で作る(貼り合わせ)
- 後者はこの章までに学んだ基本的な型(数値、⽂字列、リスト、タプル、セット、辞書型)を基本的な制御(if, for, while)で操作するのが上級者でもおよそコードの8割以上と思われる
- すでに学んだ関数や今後学ぶクラスや例外処理などは上記のベーシックなプログラムを整理するためのもの。⾼度なプログラミングテクニックを学ぶ前に基礎を抑えるのが⼤事
- フルスクラッチで素材から開発するのではなく、ライブラリという「レゴの出来合いのパーツ」をスマートに⾃分のコードで張り合わせて作品を作るのがPython流のプログラミング

## コラム: 著者の型の使い分け
- タプル: 引数や返り値で値をまとめる
- リスト: 可変⻑の複数の要素を管理するために使う。なにかをループ処理するときに使う第⼀候補。要素探索が遅いので注意
- セット: 要素の存在チェックが必要な場合にリスト代替で使う
- 辞書型: リストに似た使い⽅だが、要素をすばやく検索できる必要がある場合に使う。辞書型のキーは「データベースでいう主キーやインデックス」で、それを使って該当エントリを素早く抜き出すようなイメージ。Pythonプログラミングでは辞書型が⾮常に便利なので使いこなそう。
- 余談：辞書型とListの特徴をあわせ持つ 「順序付き辞書(OrderedDict)」などの変種もある

## 演習
- 数値のリストを受け取り、そこから最⼩値と最⼤値を同時に返す関数 get_min_max を作成し、その関数の返り値の最⼩値と最⼤値をそれぞれ別の⾏でコンソールに出⼒してください。
- リスト型での要素の探索に⽐べて、セット型での要素の探索が⾼速である理由をインターネットで調べてください。
- 数値のリストを受け取り、各数値が何回出現したかをカウントする関数を辞書型を使って作成してください。返り値は{数値1:出現数1, 数値2:出現数2, ...}という形式とします。
- 上記関数の出⼒をforループでキーとバリューのペアごとに「'{} : {}'.format(key, value)」というフォーマットでプリント出⼒してください。