#  lambdaやmapなどの便利なPython記法

</span>

- **[1.1 lambda式の基礎](#1.1-lambda式の基礎)**
    - **[1.1.1 無名関数の作成](#1.1.1-無名関数の作成)**
    - **[1.1.2 lambdaによる計算](#1.1.2-lambdaによる計算)**
    - **[1.1.3 ifを用いたlambda](#1.1.3-ifを用いたlambda)**
<br><br>
- **[1.2 lambda式の利用](#1.2-lambda式の利用)**
    - **[1.2.1 listの分割（split）](#1.2.1-listの分割（split）)**
    - **[1.2.2 listの分割（re.split）](#1.2.2-listの分割（re.split）)**
    - **[1.2.3 高階関数（map）](#1.2.3-高階関数（map）)**
    - **[1.2.4 filter](#1.2.4-filter)**
    - **[1.2.5 sorted](#1.2.5-sorted)**
<br><br>
- **[1.3 リスト内包表記](#1.3-リスト内包表記)**
    - **[1.3.1 リストの生成](#1.3.1-リストの生成)**
    - **[1.3.2 if文を用いたループ](#1.3.2-if文を用いたループ)**
    - **[1.3.3 複数配列の同時ループ](#1.3.3-複数配列の同時ループ)**
    - **[1.3.4 多重ループ](#1.3.4-多重ループ)**
<br><br>
- **[1.4 辞書オブジェクト](#1.4-辞書オブジェクト)**
    - **[1.4.1 defaultdict](#1.4.1-defaultdict)**
    - **[1.4.2 要素の追加](#1.4.2-要素の追加)**
    - **[1.4.3 Counter](#1.4.3-Counter)**
<br><br>
- **[1.5 添削問題](#1.5-添削問題)**

***

## 1.1 lambda式の基礎

### 1.1.1 無名関数の作成

Pythonで関数を作成する際には
```python
# 例: x^2を出力する関数pow1(x)
def pow1(x):
    return x ** 2 
```

として関数を定義しますが、以下の **無名関数(lambda式)** を用いることでコードを簡素化できます。
```python
# pow1(x)と同じ働きを持つ無名関数pow2
pow2 = lambda x: x ** 2
```

lambda式を用いることで、式を`pow2`という **変数** に格納できます。
***
lambda式の構造は

    lambda (引数): (返り値)
    
となっており、上記の`pow2`では引数 `x` を `x**2` にして返すことを意味しています。

lambda式に引数を渡して実際に計算する場合は、
```python
# pow2に引数aを渡して、計算結果をbに格納する
b = pow2(a)
```

とすればよく、`def`によって作成された関数と同様に使えます。

#### 問題

引数$a$に対する以下の関数を作成し、$a=4$の際の返り値をそれぞれ出力して下さい。
- `def` を用いて $2a^2 - 3a + 1$ を出力する関数 `func1`
- `lambda` を用いて $2a^2 - 3a + 1$ を出力する関数 `func2`

In [3]:
# 代入する引数a
a = 4

# defを用いてfunc1を作成して下さい
def func1(a):
    return 2 * a ** 2 - 3 * a + 1


# lambdaを用いてfunc2を作成して下さい
func2 = lambda a: 2 * a ** 2 - 3 * a + 1

# 返り値の出力
print(func1(a))
print(func2(a))

21
21


#### ヒント

```python
def function(引数):
    return 返り値

function = lambda 引数: 返り値
```

#### 解答

In [None]:
# 代入する引数a
a = 4

# defを用いてfunc1を作成して下さい
def func1(x):
    return 2 * x**2 - 3*x + 1

# lambdaを用いてfunc2を作成して下さい
func2 = lambda x: 2 * x**2 - 3*x + 1

# 返り値の出力
print(func1(a))
print(func2(a))

***

### 1.1.2 lambdaによる計算

lambda式で多変数の関数を作成したい時には、
```python
# 例: ２つの引数を足し合わせる関数add1
add1 = lambda x, y: x + y
```

とします。

lambda式は「無名関数の作成」の章のように変数に格納できますが、変数に格納せずとも利用することができます。例えば上記の`add1`のようなlambda式に２つの引数 `3, 5` を代入した結果が直接欲しければ、
```python
(lambda x, y: x + y)(3, 5)
# 出力結果
8
```
とすることで値が得られます。

このままでは全く意味が無い上にむしろ手間が増えただけですが、この「変数に格納する」= **「関数に名前を付けて定義する」** 必要が無いことは、関数の利用を大幅に簡単にします。

#### 問題

引数$(x, y, z)$に対する以下の関数を作成し、$(x, y, z)=(5, 6, 2)$の際の返り値をそれぞれ出力して下さい。
- `def` を用いて $xy + z$ を出力する関数 `func3`
- `lambda` を用いて $xy + z$ を出力する関数 `func4`

In [6]:
# 代入する引数x, y, z
x = 5
y = 6
z = 2

# defを用いてfunc3を作成して下さい
def func3 (x, y, z):
    return x * y + z


# lambdaを用いてfunc4を作成して下さい
func4 = lambda x, y, z: x * y + z

# 出力
print(func3(x, y, z))
print(func4(x, y, z))

32
32


#### ヒント

```python
lambda 引数１, 引数２, 引数３, … : 返り値
```

#### 解答例

In [None]:
# 代入する引数x, y, z
x = 5
y = 6
z = 2

# defを用いてfunc3を作成して下さい
def func3(x, y, z):
    return x*y + z

# lambdaを用いてfunc4を作成して下さい
func4 = lambda x, y, z: x*y + z

# 出力
print(func3(x, y, z))
print(func4(x, y, z))

***

### 1.1.3 ifを用いたlambda

lambdaはdefによる関数と異なり、返り値の部分には式のみ入れることができます。<br>
例えばdefによる関数では、
```python
# "hello."と出力する関数
def say_hello():
    print("hello.")
```

といった処理が可能でしたが、これをlambdaで表現することはできません。
***
ただし、ifを用いた条件分岐に関しては三項演算子という手法を用いることでlambdaでも作成することができます。<br>
例えば
```python
# 引数が3未満ならば2を掛け、3以上ならば3で割って5で足す関数
def lower_three1(x):
    if x < 3:
        return x * 2
    else:
        return x/3 + 5
```
上記の関数をlambdaで表現すると、
```python
# lower_three1と同じ関数
lower_three2 = lambda x: x * 2 if x < 3 else x/3 + 5
```
このように書くことができます。三項演算子の表記は以下のようになっています。
```python
条件を満たす時の処理 if 条件 else 条件を満たさない時の処理
```
このように、lambda以外にも様々な場面でコードの節約をすることができます。

#### 問題

lambdaを用いて以下の関数を作成し、引数$a$に対する返り値を出力して下さい。
- $a$が10以上30未満ならば$a^2 - 40a + 350$を、それ以外なら$50$を返す関数`func5`

In [None]:
# 代入する引数a1, a2
a1 = 13
a2 = 32

# lambdaを用いてfunc5を作成して下さい


# 返り値の出力
print(func5(a1))
print(func5(a2))

#### ヒント

- 三項演算子を使います。
```python
    func = lambda 引数 : 条件を満たす時の処理 if 条件 else 条件を満たさない時の処理
```

#### 解答例

In [None]:
# 代入する引数a1, a2
a1 = 13
a2 = 32

# lambdaを用いてfunc5を作成して下さい
func5 = lambda x: x**2 - 40*x + 350 if x >= 10 and x < 30 else 50

# 返り値の出力
print(func5(a1))
print(func5(a2))

***

## 1.2 lambda式の利用

### 1.2.1 listの分割（split）

文字列を空白やスラッシュなどで切り分けたいときには、`split`関数を使います。
例えば下記のように英文を空白で区切って単語のリストにすることができます。
```python
# 切り分けたい文字列
test_sentence = "this is a test sentence."
# splitでリストにする
test_sentence.split(" ")
# 出力結果
["this", "is", "a", "test", "sentence."] 
```
***
`split`の使い方は
```python
切り分けたい文字列.split("区切る記号", 区切る回数)
```
となっており、区切る回数を指定することで先頭から何回区切るかを指定することができます。

#### 問題

- `"My name is ○○"` という構造を持っている文字列`self_data`を切り分け、 `"○○"` の部分を抜き出して出力して下さい。

In [5]:
# 自己紹介文が入っている文字列self_data
self_data = "My name is Yamada"

# self_dataを切り分けて、listを作成して下さい。
contexts = self_data.split(" ")

# "○○"の部分を出力して下さい。
print(contexts[len(contexts ) - 1])

Yamada


#### ヒント

- 空白で切り分ける必要があるため、`split`関数を使います。
- `split`で切り分けられた文字列は`list`で返されます。

#### 解答

In [6]:
# 自己紹介文が入っている文字列self_data
self_data = "My name is Yamada"

# self_dataを切り分けて、listを作成して下さい。
word_list = self_data.split(" ")

# "○○"の部分を出力して下さい。
print(word_list[3])

Yamada


***

### 1.2.2 listの分割（re.split）

標準の`split`関数では一度に複数の記号で切り分けることができません。一度に複数の記号で文字列を切り分ける際には`re`モジュールの`re.split`関数を用います。
```python
# reモジュールのインポート
import re
# 切り分けたい文字列
test_sentence = "this,is a.test,sentence"
# ","と" "と"."で切り分け、リストにする
re.split("[, .]", test_sentence)
# 出力結果
["this", "is", "a", "test", "sentence"]
```
***
`re.split`の使い方は
```python
re.split("[区切る記号]", 区切りたい文字列)
```
となっており、(区切る記号)の部分に上記のように複数指定することで、一度に複数の記号で切り分けられます。

#### 問題

- `"年/月/日_時:分"`という構造を持っている文字列`time_data`を切り分け、"月"の部分と"時"の部分を抜き出して出力して下さい。

In [7]:
import re
# 時間データが入っている文字列time_data
time_data = "2017/4/1_22:15"

# time_dataを切り分けて、listを作成して下さい。
contexts = re.split("[/_:]", time_data)
# "月"と"時"の部分を出力して下さい。
print("月{0} -　時{1}".format(contexts[1], contexts[3]))


月4 -　時22


#### ヒント

- `"/"`と`"_"`と`":"`で切り分ける必要があるため、`re.split`関数を使います。
- `re.split`で切り分けられた文字列は`list`で返されます。

#### 解答

In [None]:
import re
# 時間データが入っている文字列time_data
time_data = "2017/4/1_22:15"

# time_dataを切り分けて、listを作成して下さい。
time_list = re.split("[/_:]",time_data)

# "月"と"時"の部分を出力して下さい。
print(time_list[1])
print(time_list[3])

***

### 1.2.3 高階関数（map）

Pythonの関数の中には、他の関数を引数とする関数があります。そのような関数を **高階関数** とよびます。`list`の各要素に関数を適用したい場合は、`map`関数を用います。<br>
例えば`a = [1, -2, 3, -4, 5]`という配列の各要素の絶対値を取るには`for`ループを用いて
```python
# forループで関数適用
new = []
for x in a:
    new.append(abs(x))
```
と書けますが、`map`を用いることで
```python
# mapで関数適用
list(map(abs, a))
# 出力結果
[1, 2, 3, 4, 5]
```
と簡潔に書くことができます。
***
`map`の使い方は
```python
# イテレータ(計算の方法を格納)を返す 計算はしない
map(適用したい関数, 配列)

# listに格納する方法
list(map(関数, 配列))
```
となります。<br>
ここで、イテレータとは複数の要素を順番に取り出す機能をもったクラスを指します。
この要素を順番に取り出す機能を使うことで`for`ループを用いる場合より実行時間を短くすることができるので、膨大な要素を持つ配列に関数を適用させたい場合は`map`関数を用いるようにしましょう。

#### 問題

- `"年/月/日_時:分"`という構造を持っている文字列を要素に持つ配列`time_list`を切り分け、"時"の部分を整数として配列にまとめ、出力して下さい。

In [10]:
import re
# 配列time_list
time_list = [
    "2006/11/26_2:40",
    "2009/1/16_23:35",
    "2014/5/4_14:26",
    "2017/8/9_7:5",
    "2017/4/1_22:15"
]
# 文字列から"時"を取り出す関数を作成して下さい
def convert(item):
    return int(re.split("[/_:]", item)[3])

# 上で作った関数を用いて各要素の"時"を取り出し、配列にして下さい
result = list(map(convert,  time_list))

print(result)
# 出力して下さい


[2, 23, 14, 7, 22]


#### ヒント

- 文字列から`"時"`を切り分ける関数は **listの分割（re.split）** を参考にして下さい。
```python
list(map(関数, 配列))
```

- 切り分けただけではデータ型は文字列になってしまうので、`int()` を用いて型を変更しましょう。

#### 解答例

In [None]:
import re
# 配列time_list
time_list = [
    "2006/11/26_2:40",
    "2009/1/16_23:35",
    "2014/5/4_14:26",
    "2017/8/9_7:5",
    "2017/4/1_22:15"
]
# 文字列から"時"を取り出す関数を作成して下さい
get_hour = lambda x: int(re.split("[/_:]",x)[3]) # int()でstring型をint型に替える

# 各要素の"時"を取り出して配列にして下さい
hour_list = list(map(get_hour, time_list))

# 出力して下さい
print(hour_list)

***

### 1.2.4 filter

listの各要素から条件を満たす要素だけを取り出したいときは`filter`関数を用います。<br>
例えば`a = [1, -2, 3, -4, 5]`という配列から正の要素を取り出すには`for`ループを用いて
```python
# forループでフィルタリング
new = []
for x in a:
    if x > 0:
        new.append(x)
```
と書けますが、`filter`を用いることで
```python
# filterでフィルタリング
list(filter(lambda x: x>0, a))
# 出力結果
[1, 3, 5]
```
と書くことができます。
***
`filter`の使い方は
```python
# イテレータ
filter(条件となる関数, 配列)

# listに格納
list(filter(関数, 配列))
```
となります。ここで（条件となる関数）というのは、`lambda x: x>0` のように入力に対して`True/False`を返す関数のことをいいます。

#### 問題

- `time_list`内の`"月"`の部分が1以上から6以下となっている要素を抜き出し、配列にして出力して下さい。

In [19]:
import re
# time_list..."年/月/日_時:分"
time_list = [
    "2006/11/26_2:40",
    "2009/1/16_23:35",
    "2014/5/4_14:26",
    "2017/8/9_7:5",
    "2017/4/1_22:15"
]
# 文字列の"月"が条件を満たすときにTrueを返す関数を作成して下さい
func = lambda t: int(re.split("[/_:]", t)[1]) <= 6

# 上で作った関数を用いて条件を満たす要素を抜き出し、配列にして下さい
result = list(filter(func, time_list))

# 出力して下さい
print(result)

['2009/1/16_23:35', '2014/5/4_14:26', '2017/4/1_22:15']


#### ヒント

- `"月"`は`re.split`によって取得して下さい。

#### 解答例

In [None]:
import re
# time_list..."年/月/日_時:分"
time_list = [
    "2006/11/26_2:40",
    "2009/1/16_23:35",
    "2014/5/4_14:26",
    "2017/8/9_7:5",
    "2017/4/1_22:15"
]
# 文字列の"月"が条件を満たすときにTrueを返す関数を作成して下さい
is_first_half = lambda x: int(re.split("[/_:]", x)[1]) - 7 < 0

# 上で作った関数を用いて条件を満たす要素を抜き出し、配列にして下さい
first_half_list = list(filter(is_first_half, time_list))

# 出力して下さい
print(first_half_list)

***

### 1.2.5 sorted

`list`をソートするには`sort`関数がありますが、より複雑な条件でソートをしたい時には`sorted`関数を使います。

例えば要素数2の配列を要素に持つ配列(入れ子の配列)について各要素中の第二要素が昇順になるようにソートをかけたければ
```python
# 入れ子の配列
nest_list = [
    [0, 9],
    [1, 8],
    [2, 7],
    [3, 6],
    [4, 5]
]
# 第二要素をキーとしてソート
sorted(nest_list, key=lambda x: x[1])
# 出力結果
[[4, 5], [3, 6], [2, 7], [1, 8], [0, 9]]
```
とします。
***
`sorted`の使い方は
```python
# キーを設定してソート
sorted(ソートしたい配列, key=キーとなる関数, reverse=True または False)
```
となります。ここでの（キーとなる関数）とは何を昇順にソートするかのことで、`lambda x: x[n]`とすることで第`n`要素を昇順にソートすることができます。`reverse`を`True`にすることで降順にソートできます。

#### 問題

- `"時"`の部分が昇順になるように`time_data`をソートし、出力して下さい。
- `time_data`は`time_list`を`[年, 月, 日, 時, 分]`に分割した配列です。

In [21]:
# time_data...[年, 月, 日, 時, 分]
time_data = [
    [2006, 11, 26,  2, 40],
    [2009,  1, 16, 23, 35],
    [2014,  5,  4, 14, 26],
    [2017,  8,  9,  7,  5],
    [2017,  4,  1, 22, 15]
]
# "時"をキーとしてソートし、配列にして下さい
result = sorted(time_data, key=lambda x: x[3], reverse=False)

# 出力して下さい
print(result)

[[2006, 11, 26, 2, 40], [2017, 8, 9, 7, 5], [2014, 5, 4, 14, 26], [2017, 4, 1, 22, 15], [2009, 1, 16, 23, 35]]


#### ヒント

- ソートには `sorted` を使いましょう。
```python
ソートされた配列 = sorted(ソートしたい配列, key=lambda)
```

#### 解答例

In [None]:
# time_data...[年, 月, 日, 時, 分]
time_data = [
    [2006, 11, 26,  2, 40],
    [2009,  1, 16, 23, 35],
    [2014,  5,  4, 14, 26],
    [2017,  8,  9,  7,  5],
    [2017,  4,  1, 22, 15]
]
# "時"をキーとしてソートし、配列にして下さい
sort_by_time = sorted(time_data, key=lambda x: x[3])

# 出力して下さい
print(sort_by_time)

***

## 1.3 リスト内包表記

### 1.3.1 リストの生成

**高階関数（map）** では`map`を用いた配列の生成方法を紹介しましたが、`map`は本来イテレータの作成に特化しており、`list`関数で配列にする時点で計算時間が増えてしまいます。

そのため`map`と同様の手法で単純に配列を生成したいのであれば`for`ループの **リスト内包表記** を用います。<br>
例えば`a = [1, -2, 3, -4, 5]`という配列の各要素の絶対値を取るには
```python
# リスト内包表記で各要素の絶対値をとる
[abs(x) for x in a]
# 出力結果
[1, 2, 3, 4, 5]
```
と書くことができます。リスト内包表記によって
```python
# mapでlist作成
list(map(abs, a))
# 出力結果
[1, 2, 3, 4, 5]
```
とした場合よりも括弧の数を見て簡潔に書けているといえます。
***
リスト内包表記による配列の作成方法は
```python
[適用したい関数(要素) for 要素 in 適用する元の配列]
```
となります。

イテレータを作成する際は`map`、直接配列が欲しい時はリスト内包表記と、使い分けるといいでしょう。

#### 問題

- 計測時間(分)を要素に持つ配列`minute_data`について、経過時間を[時, 分]に換算した配列を作成し、出力して下さい。
- 例えば`minute_data = [75, 120, 14]`なら、<br>`[[1, 15], [2, 0], [0, 14]]`という配列を作成します。

In [23]:
# minute_data、単位は分
minute_data = [30, 155, 180, 74, 11, 60, 82]

# 分を[時, 分]に換算する関数を作成して下さい
def convert(minutes):
    return  [minutes // 60,  minutes % 60 ]

# リスト内包表記を用いて所定の配列を作成して下さい
result = [convert(item) for item in minute_data]

# 出力して下さい
print(result)

[[0, 30], [2, 35], [3, 0], [1, 14], [0, 11], [1, 0], [1, 22]]


#### ヒント

- 換算する関数の返り値は配列にしましょう。
- 75分は60で割ると1あまり15。 よって75分は1時間15分。 これを`lambda`で表現します。

#### 解答

In [None]:
# minute_data、単位は分
minute_data = [30, 155, 180, 74, 11, 60, 82]

# 分を[時, 分]に換算する関数を作成して下さい
h_m_split = lambda x: [x // 60, x % 60]

# リスト内包表記を用いて所定の配列を作成して下さい
h_m_data = [h_m_split(x) for x in minute_data]

# 出力して下さい
print(h_m_data)

***

### 1.3.2 if文を用いたループ

リスト内包表記の中に条件分岐をさせることで、`filter`関数と同様の操作をすることができます。<br>
例えば`a = [1, -2, 3, -4, 5]`という配列から正の要素を取り出すには
```python
# リスト内包表記フィルタリング(後置if)
[x for x in a if x > 0]
# 出力結果
[1, 3, 5]
```
と書けます。後置`if`の使い方は
```python
[適用したい関数(要素) for 要素 in フィルタリングしたい配列 if 条件]
```
となります。単に条件を満たす要素を取り出したいだけなら、（適用したい関数(要素)）の部分を単に（要素）と書きます。

この書き方は **ifを用いたlambda** で紹介した **三項演算子** とは別物なので、注意しましょう。<br>
三項演算子を用いると条件を満たさない要素についても何かしらの処理をするのに対し、`if`を後置することで条件を満たさない要素を無視することができます。

#### 問題

- `minute_data`を[時, 分]に換算した際に[時, 0]となる、つまり分の端数が出ない要素を抜き出して配列にし、出力して下さい。
- 例えば`minute_data = [75, 120, 14]`なら、<br>`[120]`という配列を作成します。

In [24]:
# minute_data、単位は分
minute_data = [30, 155, 180, 74, 11, 60, 82]

# リスト内包表記を用いて所定の配列を作成して下さい
result = [x for x in minute_data if x % 60 == 0 ]

# 出力して下さい
print(result)

[180, 60]


#### ヒント

- 60で割ったあまりが0となる数でフィルタリングします。 

#### 解答例

In [None]:
# minute_data、単位は分
minute_data = [30, 155, 180, 74, 11, 60, 82]

# リスト内包表記を用いて所定の配列を作成して下さい
just_hour_data = [x for x in minute_data if x % 60 == 0 ]

# 出力して下さい
print(just_hour_data)

***

### 1.3.3 複数配列の同時ループ

複数の配列を並列にループさせたいときは`zip`関数を用います。<br>
例えば`a =[1, -2, 3, -4, 5], b = [9, 8, -7, -6, -5]`という配列を同時にループさせるには
```python
# zipを用いた並列ループ
for x, y in zip(a, b):
    print(x, y)
# 出力結果
1 9
-2 8
3 -7
-4 -6
5 -5
```
とします。

リスト内包表記でも同様に`zip`を用いて複数の配列を並列に処理することができます。
```python
# リスト内包表記で並列に処理
[x**2 + y**2 for x, y in zip(a, b)]
# 出力結果
[82, 68, 58, 52, 50]
```

#### 問題

- `hour`と`minute`の配列から、分換算した値の配列を作成して出力して下さい。
- **リストの作成** の問題で行ったことと逆の操作をします。

In [29]:
# 時間データhour, 分データminute
hour = [0, 2, 3, 1, 0, 1, 1]
minute = [30, 35, 0, 14, 11, 0, 22]

# 時, 分を引数に、分に換算する関数を作成して下さい
converter =lambda h, m: h * 60 + m

# リスト内包表記を用いて所定の配列を作成してください
result = [converter(h, m) for h, m in zip (hour, minute)]

# 出力して下さい
print (result)

[30, 155, 180, 74, 11, 60, 82]


#### ヒント

- 引数が２つの関数は
```python
lambda x, y: 返り値
```
- 分に換算するには 時×60 + 分 を計算します。

#### 解答例

In [None]:
# 時間データhour, 分データminute
hour = [0, 2, 3, 1, 0, 1, 1]
minute = [30, 35, 0, 14, 11, 0, 22]

# 時, 分を引数に、分に換算する関数を作成して下さい
h_m_combine = lambda x, y: x*60 + y

# リスト内包表記を用いて所定の配列を作成してください
minute_data1 = [h_m_combine(x, y) for x, y in zip(hour, minute)]

# 出力して下さい
print(minute_data1)

***

### 1.3.4 多重ループ

同時にループするには`zip`を用いましたが、ループ中にループをするには
```python
a =[1, -2, 3]
b = [9, 8]
# 二重ループ
for x in a:
    for y in b:
        print(x, y)
# 出力結果
1 9
1 8
-2 9
-2 8
3 9
3 8
```
とします。リスト内包表記では
```python
# リスト内包表記で二重ループ
[[x, y] for x in a for y in b]
# 出力結果
[[1, 9], [1, 8], [-2, 9], [-2, 8], [3, 9], [3, 8]]
```
と書きます。`for`文を単純に二回並べて書くことで二重ループになります。

#### 問題

- 二進数で３桁目を示す`fours_place`と２桁目を示す`twos_place`、１桁目を示す`ones_place`を用いて、十進数で0から7までの数を配列にして出力して下さい。
- 例えば`fours_place = 1, twos_place = 0, ones_place = 1`ならば、これは二進数で`101`を意味するので十進数で`5`となります。

In [33]:
# 二進数の桁
fours_place = [0, 1]
twos_place  = [0, 1]
ones_place  = [0, 1]

# リスト内包表記の多重ループを用いて0から7までの整数を計算し、配列にして下さい
results = [ four*4 + two*2 + one for four in fours_place for two in twos_place for one in ones_place]
#            results.append( "{0}{1}{2}".format(four, two, one))

# 出力して下さい
print(results)


[0, 1, 2, 3, 4, 5, 6, 7]


#### ヒント

- 十進数なら、<br>`(３桁目の数) * 10**2 + （２桁目の数） * 10 + （１桁目の数）`<br>
二進数なら、上記の `*10**2`を ` *2**2`に、` *10`を ` *2`にすれば良いです。
- `fours_place`と`twos_place`、`ones_place`の三重ループをつくります。

#### 解答例

In [34]:
# 二進数の桁
fours_place = [0, 1]
twos_place  = [0, 1]
ones_place  = [0, 1]

# リスト内包表記の多重ループを用いて0から7までの整数を配列にして下さい
digit = [x*4 + y*2 + z for x in fours_place for y in twos_place for z in ones_place]

# 出力して下さい
print(digit)

[0, 1, 2, 3, 4, 5, 6, 7]


***

## 1.4 辞書オブジェクト

### 1.4.1 defaultdict

Pythonの辞書型のオブジェクトは新たなkeyを追加するために毎回そのkeyの初期化が必要になるため、面倒です。<br>
例えばリストlstの要素をkey、同じ値を持つ要素の出現回数をvalueとして辞書に格納しようとすると、
```python
# 辞書に要素の出現回数を記録
d = {}
lst = ["foo", "bar", "pop", "pop", "foo", "popo"]
for key in lst:
    # dにkeyが存在するかしないかで場合分け
    if key in d:
        d[key] += 1
    else:
        d[key] = 1
print(d)

"""
# 出力結果
{'foo': 2, 'bar': 1, 'pop': 2, 'popo': 1}
"""
```
とせねばならず、条件分岐が必要になります。

そこで、`collections`モジュールの`defaultdict`クラスを用いることでこの問題を解決します。
***
`defaultdict`クラスは
```python
from collections import defaultdict

d = defaultdict(valueの型)
```
として定義します。（valueの型）の部分には`int`や`list`を入れます。

定義したオブジェクトは標準の辞書型オブジェクト同様に使えます。`defaultdict`で上記と同様の処理を書くと
```python
# 辞書に要素の出現回数を記録
d = defaultdict(int)
lst = ["foo", "bar", "pop", "pop", "foo", "popo"]
for key in lst:
    d[key] += 1
print(d)

"""
# 出力結果
defaultdict(< class 'int'>, {'foo': 2, 'bar': 1, 'pop': 2, 'popo': 1})
"""
```

となり、条件分岐をせずとも要素の数え上げができていることがわかります。

#### 問題

- 以下の文字列`description`に出現する文字をkeyとし、その出現回数をvalueとした辞書を作成して下さい。辞書をvalueの降順にソートし、上位10要素を出力して下さい。
- 辞書は`defaultdict`によって定義して下さい。

In [55]:
from collections import defaultdict 
# 文字列description
description = \
"Artificial intelligence (AI, also machine intelligence, MI) is " + \
"intelligence exhibited by machines, rather than " + \
"humans or other animals (natural intelligence, NI)."

# defaultdictを定義して下さい
d = defaultdict(int)

# 文字の出現回数を記録して下さい
for i in description:
    d[i] += 1
print(d.items())
# ソートし、上位10要素を出力して下さい
print (sorted(d.items(), key= lambda x: x[1], reverse=True)[:10])

dict_items([('A', 2), ('r', 6), ('t', 10), ('i', 17), ('f', 1), ('c', 7), ('a', 11), ('l', 12), (' ', 20), ('n', 14), ('e', 18), ('g', 4), ('(', 2), ('I', 3), (',', 4), ('s', 5), ('o', 3), ('m', 4), ('h', 7), ('M', 1), (')', 2), ('x', 1), ('b', 2), ('d', 1), ('y', 1), ('u', 2), ('N', 1), ('.', 1)])
[(' ', 20), ('e', 18), ('i', 17), ('n', 14), ('l', 12), ('a', 11), ('t', 10), ('c', 7), ('h', 7), ('r', 6)]


#### ヒント

- `defaultdict`のvalueは`int`型です。
- 文字列は一文字ずつループしましょう（空白も含みます）。
- ソートをするために、`辞書.items()`で`(key, value)`の配列を取得します。
- ソートは`sorted`関数を用いると楽です。今回は降順にソートするので `reverse` を `True` にしましょう。以下を用いて出力してください。
```python
sorted(辞書.items(), key=lambdaで配列の第二要素を指定, reverse=True)
```

#### 解答例

In [46]:
from collections import defaultdict 
# 文字列description
description = \
"Artificial intelligence (AI, also machine intelligence, MI) is " + \
"intelligence exhibited by machines, rather than " + \
"humans or other animals (natural intelligence, NI)."

# defaultdictを定義して下さい
char_freq = defaultdict(int)

# 文字の出現回数を記録して下さい
for i in description:
    char_freq[i] += 1
    
# ソートし、上位10要素を出力して下さい
# sorted関数は、sorted(ソート対象、ソートに使うkey、ソートオプション）で呼び出します
# ソートオプションはreverse=Trueで降順にしています。

# ソートに使うkeyはitemsを指定して（アルファベット、出現回数）のリスト形式で取り出し、
# lambdaで「リストの二番目」、つまり出現回数を、x[1]として指定しています

# [:10]の部分はスライス表記(https://aidemy.net/courses/3010/exercises/By_WF3IsLlf)です。
# [開始インデックス:終了インデックス]で、終了インデックスを指定し、
# 上位10要素を抜き出しています。
print(sorted(char_freq.items(), key=lambda x: x[1], reverse=True)[:10])

[(' ', 20), ('e', 18), ('i', 17), ('n', 14), ('l', 12), ('a', 11), ('t', 10), ('c', 7), ('h', 7), ('r', 6)]
[(' ', 20), ('e', 18), ('i', 17), ('n', 14), ('l', 12), ('a', 11), ('t', 10), ('c', 7), ('h', 7), ('r', 6)]


***

### 1.4.2 value内の要素の追加

今度は
```python
defaultdict(list)
```
と定義し、`list`型のvalueを持つ辞書を定義してみます。

valueが`list`型なので、`辞書[key].append(要素)`とすることでvalueに要素を追加することができます。これも、標準の辞書型オブジェクトでは
```python
# 辞書にvalueの要素を追加
d ={}
price = [
    ("apple", 50),
    ("banana", 120),
    ("grape", 500),
    ("apple", 70),
    ("lemon", 150),
    ("grape", 1000)
]
for key, value in price:
    # keyの存在で条件分岐
    if key in d:
        d[key].append(value)
    else:
        d[key] = [value]
print(d)
# 出力結果
{"apple": [50, 70], "banana": [120], "grape": [500, 1000], "lemon": [150]}
```
と、一手間かかりますが、`defaultdict`ではこの条件分岐が不要になります。

これを利用することで、keyによってvalueをまとめることができます。

#### 問題

- `defaultdict`を用いて上記の例と同様の処理を行い、辞書を作成して下さい。作成した辞書の各valueについて平均値をとり、配列にして出力して下さい。

In [44]:
from collections import defaultdict
# まとめたいデータprice...(名前, 値段)
price = [
    ("apple", 50),
    ("banana", 120),
    ("grape", 500),
    ("apple", 70),
    ("lemon", 150),
    ("grape", 1000)
]
# defaultdictを定義して下さい
d = defaultdict(list)

# 上記の例と同様にvalueの要素に値段を追加して下さい
for key, value in price:
    d[key].append(value)

result = [sum(x) / len(x) for x in d.values()]
# 各valueの平均値を計算し、配列にして出力して下さい
print(result)

[60.0, 120.0, 750.0, 150.0]


#### ヒント

- `defaultdict`のvalueは`list`型です。
- 基本は標準の辞書型と同様に追加すればよいですが、こちらは条件分岐が要りません。
- 各valueは`int`が格納されている`list`なので、平均値をとるには
```python
sum(value) / len(value)
```
としましょう。
- 各valueの平均値の計算はリスト内包表記でまとめて行うといいです。その際の（適用する元の配列）は`辞書.values()`によって取得できます。

#### 解答例

In [43]:
from collections import defaultdict
# まとめたいデータprice
price = [
    ("apple", 50),
    ("banana", 120),
    ("grape", 500),
    ("apple", 70),
    ("lemon", 150),
    ("grape", 1000)
]
# defaultdictを定義して下さい
d = defaultdict(list)

# 上記の例と同様にvalueの要素に値段を追加して下さい
for key, value in price:
        d[key].append(value)

# 各valueの平均値を計算し、配列にして出力して下さい
print([sum(x) / len(x) for x in d.values()])

[60.0, 120.0, 750.0, 150.0]


***

### 1.4.3 Counter

`collections`モジュールには`defaultdict`クラス以外にもいくつかのデータ格納クラスがあります。

ここで紹介する`Counter`クラスは、`defaultdict`と同様に辞書型のオブジェクトと同様に使用することができますが、より **要素の数え上げ** に特化したクラスになっています。

`Counter`クラスを用いて **defaultdict** で説明した例題と同様に単語をkey、出現回数をvalueとした辞書を作成するには
```python
# Counterのインポート
from collections import Counter
# 辞書に要素の出現回数を記録
lst = ["foo", "bar", "pop", "pop", "foo", "popo"]
d = Counter(lst)

print(d)
# 出力結果
Counter({'foo': 2, 'pop': 2, 'bar': 1, 'popo': 1})
```
とするだけでよく、`for`ループを用いないので`defaultdict`よりも実行時間を短く簡潔に数え上げることができます。
***
`Counter`クラスは
```python
from collections import Counter

d = Counter(数え上げたいデータ)
```
として定義します。数え上げたいデータの部分には例えば単語を分解した配列や文字列、辞書などを書き込むことができます。
***
`Counter`クラスにはいくつかの数え上げを助ける関数が用意されています。<br>
- `most_common`関数は要素を頻度の降順にソートした配列を返します。
```python
# Counterに文字列を格納、文字の出現頻度を数え上げ
d = Counter("A Counter is a dict subclass for counting hashable objects.")
# 最も多い5要素を並べる
print(d.most_common(5))
# 出力結果
[(" ", 9), ("s", 6), ("o", 4), ("c", 4), ("a", 4)]
```
`most_common`関数の使い方は
```python
辞書.most_common(取得する要素数)
```
となります。`取得する要素数=1`とすると最頻の要素を返し、取得する要素数に何も書き込まないことで全ての要素をソートして返します。

#### 問題

- 同Chapter「**defaultdict**」と同様に以下の文字列`description`に出現する文字をkeyとし、その出現回数をvalueとした辞書を作成して下さい。辞書をvalueの降順にソートし、上位10要素を出力して下さい。
- 辞書は`Counter`によって定義して下さい。

In [38]:
from collections import Counter
# 文字列description
description = \
"Artificial intelligence (AI, also machine intelligence, MI) is " + \
"intelligence exhibited by machines, rather than " + \
"humans or other animals (natural intelligence, NI)."

# Counterを定義して下さい
d = Counter(description)
# ソートし、上位10要素を出力して下さい
print(d.most_common(10))

[(' ', 20), ('e', 18), ('i', 17), ('n', 14), ('l', 12), ('a', 11), ('t', 10), ('c', 7), ('h', 7), ('r', 6)]


#### ヒント

- ソートは`most_common`関数を用いましょう。
```python
辞書.most_common(取得する要素数)
```

#### 解答例

In [None]:
from collections import Counter
# 文字列description
description = \
"Artificial intelligence (AI, also machine intelligence, MI) is " + \
"intelligence exhibited by machines, rather than " + \
"humans or other animals (natural intelligence, NI)."

# Counterを定義して下さい
char_freq = Counter(description)

# ソートし、上位10要素を出力して下さい
print(char_freq.most_common(10))

***