# 第7回 データの入れ物

___
[![Open In Colab](https://colab.research.google.com/assets/colab-badge.svg)](https://colab.research.google.com/github/tsuboshun/begin-python/blob/gh-pages/_sources/workbook/lecture07.ipynb)

___

## この授業で学ぶこと

（このノートは準備中）

第4回の授業で、複数のデータをまとめるためのデータ型としてリスト型を紹介した。
Pythonにはリスト型の他にも、データの入れ物の役割を果たすデータ型がいくつか存在する。
今回はそれらの使い方を学ぶ。

## データの入れ物

リスト型のようにデータの入れ物の役割を果たす組み込み型として、他にも**辞書型**（**dict**）、**タプル型**（**tuple**）、**セット型**（**set**）などがある。
はじめのうちはリスト型と辞書型を使いこなすことが重要なので、これらに重点を置きつつ一通り説明する。
リスト型は改めての説明になるが、第4回の内容より一歩踏み込んで学ぶ。

### リスト型

第4回で学んだ通り、リストはデータを `,` で区切り、両端を `[]` で囲うことで作成できる。

In [None]:
x = [1, 2, 3, "four", 5]

インデックスによる要素のアクセス方法も確認しておこう。上の例で `"four"` や `5` を取り出すには、以下のようにインデックスを指定する。

In [None]:
x[3]

In [None]:
print(x[4])
print(x[-1])

#### 要素の追加と変更

今回新たに要素の追加方法を学ぶ。
よく使われるのが要素を末尾に追加する方法で、`append()` メソッドを用いる。
`append()` は、引数に渡されたデータをリストの末尾に追加する。

In [None]:
x.append(6)
x

要素を特定の位置に挿入するには `insert()` メソッドを用いる。`insert()` は、第一引数にインデックス、第二引数にデータを受け取る。

In [None]:
x.insert(0, "zero")
print(x)
x.insert(2, "1/2")
print(x)

末尾に他のリストを連結するには `extend()` メソッドを用いる。 `extend()`は、引数に渡されたリストを自身の末尾に連結する。

In [None]:
x.extend([7, 8])
x

リストの連結は `+` 演算子によっても実現できる。`extend()` メソッドと違って、新しいリストが作成されることに注意する。

In [None]:
y = x + [9, 10]
print(y)
print(x)  # x自身は変わらない

代入文により要素を変更することもできる。

In [None]:
x[0] = 0
print(x)
x[3] = '2'
print(x)

#### 要素の削除

要素を削除するには `pop()` または `remove()` メソッドを用いる。`pop()` メソッドは引数で指定したインデックスの要素をリストから削除し、その値を戻り値として返す。

In [None]:
elem = x.pop(3)
print(elem)
print(x)

`remove()` メソッドは引数で指定した値と同じ値の要素を検索し、（複数ある場合は）そのうち一番左の要素を削除する。戻り値はない。

In [None]:
print(x)
x.append("four")
print(x)
x.remove("four")
print(x)

#### スライス

リストに入っている要素のうち、連続した複数の要素を取り出すために用いられるのが**スライス**である。
整数 `i`、`j` を用いてリストに対して `[i:j]` と要素を指定すると、インデックスについて `i` から `j-1` までの要素を切り出すことができる。
`i` の前から `j` の前までと考えると覚えやすい。

`i` または `j` を省略することもできる。
`[:j]` は、インデックスについて最初から `j` の前までの要素を切り出す。
`[i:]` は、インデックスについて`i` の前から最後までの要素を切り出す。

以下にサンプルコードと図を示す。

In [None]:
x = [1, 2, 3, "four", 5]
print(x[1:4])
print(x[:4])
print(x[1:])

```{figure} ./pic/slice.png
---
width: 550px
name: index
---
スライスとインデックスの関係
```

**練習1**  
整数を要素とするリスト `x` が与えられるとき、そのうち偶数の要素のみからなるリスト `y` を作成しなさい。

In [None]:
# xの一例
x = [1, 2, 3, 4, 5]

**練習2**  
リスト `x` と整数 `i` が与えられるとき、リストの要素を `i` 回だけ右に回転させたリスト `y` を作成しなさい。ただし、`i` は 0以上 `len(x)` 以下とする。
例: リスト `[1, 2, 3, 4, 5]` を 2回回転させると、`[4, 5, 1, 2, 3]` になる。

In [None]:
# xの一例
x = [1, 2, 3, 4, 5]

**練習3**  
練習2のコードを、さらに任意の整数 `i` に対して正しく動くように修正しなさい。

In [None]:
# xの一例
x = [1, 2, 3, 4, 5]

### 辞書型

リストでは0から始まる整数インデックスをもとに要素にアクセスした。
辞書型は、自由に設定した**キー**（**key**）をもとに要素にアクセスできるようにしたデータ型である。
辞書型では要素のことを**値**（**value**）と呼ぶ。

```{figure} ./pic/dict.png
---
width: 450px
name: index
---
辞書型
```

辞書は、`:` を使ってキーと値のペアを指定し、各ペアを `,` で区切って、両端を `{}` で囲うことで作成できる。

In [None]:
x = {"apple": "りんご", "graph": "ぶどう", "peach": "もも"}

In [None]:
リストと同様に、値には `[]` を使ってアクセスできる。

In [None]:
print(x["apple"])
print(x["grape"])

リストと同様、値にはどのようなデータ型も使用できる。
ただし、キーには**イミュータブル**（**immutable**）なデータ型しか使用できない。

#### 要素の追加と変更

#### 要素の削除

### タプル型

### セット型

## 演習

In [None]:
pip install nltk

In [None]:
import nltk
alice = nltk.text.Text(nltk.corpus.gutenberg.words('carroll-alice.txt'))

In [None]:
dic = dict()
for a in alice:
    for e in a:
        key = e.lower()
        if key in dic:
            dic[key] += 1
        else:
            dic[key] = 1
    
# valueに基づいてキーをソートし、上位10個を取得
sorted_keys = sorted(dic, key=dic.get, reverse=True)[:10]

# 上位10個のキーを表示
print(sorted_keys)