# データの操作

<div name="html-admonition" style="font-size: 0.8em">
<input type="button" onclick="location.href='https://translate.google.com/translate?hl=&sl=ja&tl=en&u='+window.location;" value="Google translation" style="color:#ffffff;background-color:#008080; height:25px" onmouseover="this.style.background='#99ccff'" onmouseout="this.style.background='#008080'"/> in English or the language of your choice.
</div><br>

In [None]:
# 警告メッセージを非表示
import warnings
warnings.filterwarnings("ignore")

## 基本データ型の変換

次の４つの基本データ型を考えよう。
* 整数型
* 浮動小数点型
* 文字列型
* ブール型

ここでは，それぞれのデータ型を他のデータ系に変換する次の関数を紹介する。
* `int()`：整数型への変換
* `float()`：浮動小数点型への変換
* `str()`：文字列型への変換
* `bool()`：ブール型への変換（真偽値の確認）

### 整数型・浮動小数点型　→　浮動小数点型・整数型

In [None]:
f0 = 10.0
i0 = 10

`f0`を整数型へ，`i1`を浮動小数点型に変換してみよう。

In [None]:
int(f0), type( int(f0) )

In [None]:
float(i0), type( float(i0) )

### 文字列型　→　整数型・浮動小数点型

次に文字列を考えよう。

In [None]:
s0 = '10'

`int()`を使うと整数に変換できる。また`float()`関数を適用すると浮動小数点型に変換できる。

In [None]:
int(s0), type( int(s0) )

In [None]:
float(s0), type( type(s0) )

これを利用して次の演算が可能となる。

In [None]:
2 + int(s0), 2 + float(s0)

次に以下の文字列を考えよう。

In [None]:
s1 = '10.0'

まず`float()`を使って浮動小数点型に変換してみよう。

In [None]:
float(s1), type( float(s1) )

これにより算術演算が可能となる。

In [None]:
float(s1) // 3

一方で`int()`を使うとエラーが発生する。

In [None]:
int(s1)

直感的には，`s1`の小数点以下の`0`があるからである。この場合，整数型に変換するには次の２ステップ必要となる。
```
s1　→　浮動小数点型　→　整数型
```

In [None]:
int( float(s1) )

In [None]:
int( float(s1) ) ** 5

### 整数型・浮動小数点型　→　文字列型

文字列型への変換は簡単で，元の値をそのままクォテーション`''`に入れて返すことになる。

In [None]:
str(f0), str(i0)

### 整数型・浮動小数点型・文字列型　→　ブール型

この変換は既出の`bool()`を使い，対象となるデータのブール値（真偽値）の確認となる。即ち，対象となるオブジェクトが「空・無」かどうかを確かめるの使われる。

In [None]:
bool(100)

In [None]:
bool(0)

In [None]:
bool('神戸大学'), bool('')

## コンテナデータ型の操作

ここではコンテナデータ型の次の操作について説明する。
* 要素の抽出（アクセス）
* 要素の入れ替え
* 要素の削除
* 他のデータ型からリストへの変換
* 基本的なメソッド

### リスト

#### １つの要素の抽出

リスト、タプル及び文字列におけるインデックスとは、要素の位置を示す番号を意味し、`0`から始まる。
次の図は、リストの要素`A`，`B`，`C`...`F`を並べ、各要素に対応するインデックを示している。
左から数えると`0`，`1`，`2`...となり，右からは`-1`，`-2`，`-3`と数える。
```
   0   1   2   3   4   5  （左から数える） 
 +---+---+---+---+---+---+
 | A | B | C | D | E | F |
 +---+---+---+---+---+---+
  -6  -5  -4  -3  -2  -1　（右から数える）
```
上の図にあるリストを考えよう。

In [None]:
my_list = ['A', 'B', 'C', 'D', 'E', 'F']

`'A'`は`0`番目，`'B'`は`1`番目，`'C'`は`2`番目と数える。`A`を抽出したい場合は`[]`を使い`A`のインデックス`0`を指定する。

In [None]:
my_list[0]

`E`にアクセスしたい場合は，インデックス番号は`4`なので次のようになる。

In [None]:
my_list[4]

または右から数えたインデックス番号`-2`を使っても同じ結果となる。

In [None]:
my_list[-2]

#### 複数要素の抽出（その１）

次に複数の連続する要素を抽出したいとしよう。この場合は**スライシング**（slicing）と呼ばれ，`:`（コロン）を使う。`:`の左右にインデックス番号を置き要素を選択するが，次のルールに従う。
```
[＜start＞:＜end＞]
```
* `start`：最初のインデックス
* `end`：最後の**次の**インデックス

即ち，`:`の右側にあるインデックスの要素は抽出されない。例えば，`my_list`の１番目から３番目の要素を抽出したい場合は`1:4`となる。

In [None]:
my_list[1:4]

次のように書くとより直感的になるのではないだろうか。

In [None]:
my_list[1:3+1]

次のルールも覚えておこう。
* `:`の左側の番号を省略すると「`0`番目から」と解釈される。
* `:`右側を省略すると「最後まで」と解釈される。

次のコードは最初からスライスしている。

In [None]:
my_list[:3+1]

最後までスライスする場合は次のコードとなる。

In [None]:
my_list[3:]

では`:`の左右の番号を省略するとどうなるのだろう。「最初から最後まで」，即ち，全てとなり，リストのコピーを作成することと同じである。

In [None]:
your_list = my_list[:]
your_list

````{note}
`my_list`の`A`，`C`，`E`のように連続していない要素を同時に抽出したい場合はどうすれば良いだろうか。残念ながら，簡単な方法は用意されていない。しかし１つの方法として次のコードで要素のインデックス番号を指定してアクセスすることが可能である。
```
my_idx = [0,2,4]
[my_list[i] for i in my_idx]
```
１行目は`A`，`C`，`E`のインデックス番号のリストであり，２行目は後に説明する内包表記を使っている。
````

#### 複数要素の抽出（その２）

上の説明でのスライシングのインデックス番号は，`1,2,3,4`の様に**増分**は`1`となっている。実は，この増分も次のように設定することができる。
```
[＜start＞:＜end＞|＜step＞]
```
* `start`：最初のインデックス
* `end`：最後の**次の**インデックス
* `step`：増分（デフォルトは`1`）

`step`のデフォルトは`1`なので，設定しなければ増分は`1`となり，上で説明したスライシングとなる。ここでは`step`を指定した場合について触れる。次の例を考えよう。

In [None]:
lst = [0, 1, 2, 3, 4, 5, 6, 7, 8, 9]

`step`を`2`にすると，インデックス番号が一つおきとなり偶数だけが抽出される。

In [None]:
lst[::2]

ここでは`start`と`end`は指定されていないので，全てのインデックス番号が抽出の対象となっている。もちろん`step`を`3`にすると２つおきのインデックス番号の要素が抽出される。

In [None]:
lst[::3]

また`step`に負の整数を使うと，要素を逆に並べて結果を返すことになる。次の例は，全ての要素を逆に並べている。

In [None]:
lst[::-1]

もちろん`-2`にすると，逆順で一つおきの要素が抽出される。

In [None]:
lst[::-2]

#### ２次元リストの要素抽出

次の例は入れ子のケースである。

In [None]:
my_list2 = ['A', ['B', 'C'], ['D', 'E', 'F', 'G', 'H']]

この場合でも考え方は変わらない。例えば，`['B','C']`を抽出したいとしよう。`['B','C']`は`1`番目の要素として入っているので次のコードでアクセスできる。

In [None]:
element1 = my_list2[1]
element1

更に，`element1`の`B`を抽出したいとしよう。その場合も同じ考えで次のコードとなる。

In [None]:
element1[0]

また別々に書いたコードを続けて書いても同じ結果となる。

In [None]:
my_list[1][0]

もちろんスライシングも使える。`D`，`E`，`F`を抽出したい場合は次のコードとなる。

In [None]:
my_list2[-1][:2+1]

#### 要素の入れ替え

要素の入れ替え方法を説明するために，次のリスト`lst0`を作成しよう。

In [None]:
lst0 = [0, 1, 2 ,3, 4, 5]
lst0

`0`番目の要素は`0`だが，これを文字列`'Kobe'`に入れ替えてみよう。方法は簡単で，入れ替えたい要素を選び`=`の左辺に置き，右辺には新しい要素を配置し実行するだけである。次のコードとなる。

In [None]:
lst0[0] = 'Kobe'
lst0

右辺から読めば理解できる。「`Kobe`を`lst0[1]`に割り当てる」となり，これで「入れ替え」となる。この例の右辺は文字列だが，他のデータ型でも可能である。例えば，

In [None]:
lst0[1] = {'a':100}
lst0

スライシングを使い要素入れ替えも可能である。

In [None]:
lst0[-2:] = (40, 60)
lst0

この場合，左辺の要素数と右辺の要素数が同じになる必要がある。また右辺に辞書を置くとキーの値が割り当てられることになる。試してみよう。

In [None]:
lst0[-2:] = {'A':40, 'B':60}
lst0

#### 要素の削除

要素を削除するには色々な方法が用意されているが，最も簡単なのは`del`（deleteの略）を使うことだろう。`del`の後に削除したい要素を書き実行するだけである。例えば，

In [None]:
del lst0[0]
lst0

`Kobe`が削除されている。次の例はスライシングを使い`A`と`B`を削除している。

In [None]:
del lst0[-2:]
lst0

#### 他のコンテナデータ型からリストへの変換

* 関数`list()`を使う。

次のタプルを考えよう。

In [None]:
tpl = (1, 3.14, 'A')
tpl

`list()`を使うとリストに変換される。

In [None]:
list(tpl)

次に辞書を考えてみよう。

In [None]:
dic = {'a':1,'b':2,'c':3}
dic

この場合は，キーだけが抽出されリストが作成される。

In [None]:
list(dic)

````{note}
次のコードでも辞書のキーからリストを作成することができる。
```
list(dic.keys())
```
また辞書の値からリストを作成するには次のコードを使うことができる。
```
list(dic.values())
```
ここで`.keys()`と`.values()`は`dic`のメソッドと呼ばれるものであり，下でより詳しく説明する。
````

#### メソッド

全てのリストにはリスト自体に働きかける関数が備わっており，それをメソッドと呼ぶ。より詳細な説明は後に回すとして，ここではリストの最後に要素を追加する`append()`というメソッドを紹介する。空のリストを考えよう。

In [None]:
lst = []

次の構文となる。
```
lst.append(＜追加する要素＞)
```
ここで`.`はメソッドにアクセスするための記号であり，その後にメソッド`append()`を置く。では`100`を`lst`に追加してみよう。

In [None]:
lst.append(100)

何も表示されないが，`lst`は変更されている。`lst`を実行すると`100`が追加されていることが確認できる。

In [None]:
lst

次は`50`を追加しよう。

In [None]:
lst.append(50)

lst

`append()`以外にも色々なメソッドが備わっている。

### タプル

#### 説明

まず次の様に`tpl1`と`tpl2`を定義しよう。

In [None]:
tpl1 = (10, 20, 30, 40, ('a', 'b'))

In [None]:
tpl2 = ((1,2,3),
        (4,5,6),
        (7,8,9))

タプルのリストとの違いは，要素を変更できないということである。その他は殆ど同じなので，次のことが言える。
* １つの要素の抽出：リストと同じ
    * 例えば，`tpl1[0]`は`10`を返す。
* 複数要素の抽出（スライシング）：リストと同じ
    * 例えば，`tpl1[1:3+1]`は`(20, 30, 40)`を返す。
* ２次元タプルの要素抽出：リストと同じ
    * 例えば，`tpl[1][0]`は`4`を返す。
* 要素の入れ替え：不可
    * 例えば，`tpl[1] = 0`を実行するとエラーが発生する。
* 要素の削除：不可
    * 例えば，`del tpl[1]`を実行するとエラーが発生する。

#### 他のコンテナデータ型からリストへの変換

* 関数`tuple()`を使う。

この関数も`list()`と非常に似ている。次のリストを考えよう。

In [None]:
lst = [1, 3.14, 'A']
lst

In [None]:
tuple(lst)

辞書の場合はキーのタプルとなる。

In [None]:
dic = {'a':1,'b':2,'c':3}
tuple(dic)

````{note}
次のコードでも辞書のキーからタプルを作成することができる。
```
tuple(dic.keys())
```
また辞書の値からタプルを作成するには次のコードを使うことができる。
```
tuple(dic.values())
```
ここで`.keys()`と`.values()`は`dic`のメソッドと呼ばれるものであり，下でより詳しく説明する。
````

### 辞書

#### 要素の抽出

次の例を考えよう。

In [None]:
macro = {'inflation':2, 'unemployment':5, 'interest_rate': 3}

`0`番目の要素は`inflation`（インフレ）と`2`（％）には２つのペアであり，`1`番目の要素は`unemployment`（失業）と`5`（％）のペアとなっている。辞書の場合，要素にアクセスするには`0`や`1`のインデックス番号を使わずに，キーを指定しペアとなる値を抽出する。その際，リストとタプルと同じように`[]`を使う。`inflation`の`2`にアクセスしてみよう。

In [None]:
macro['inflation']

同様に`unemployment`の値にアクセスするには次の様にする。

In [None]:
macro['unemployment']

辞書にスライシングはない。

#### 入れ子の場合の抽出

次の例を考えよう。

In [None]:
dic2 = {'AB':{'a':1, 'b':2,}, 'C':[10, 20]}

次のコードで`AB`の値を抽出できることは理解できるだろう。

In [None]:
dic3 = dic2['AB']
dic3

更に，`b`の値`2`にアクセスしたいとしよう。その場合は，

In [None]:
dic3['b']

とすれば良い。２つのコードを一緒に書くと次の様になる。

In [None]:
dic2['AB']['b']

同じ要領で，`20`にアクセスしてみよう。

In [None]:
dic2['C'][1]

どれだけ入れ子になっていても`[]`を連続させることによって目的の要素にアクセスできることが分かると思う。

#### 値の入れ替え

辞書はキーと値のペアとなっているが，変更できるのは値だけである。方法はリストと同じで，`=`の左辺に変更したいキーを選び，右辺に変更後の値を配置し実行するだけである。例えば，`macro`にある`unemployment`の値を`10.5`に入れ替えてみよう。

In [None]:
macro['unemployment'] = 10.5
macro

#### 要素の削除

どうしてもキーを変更したい場合は，キー・値のペアを削除し，新たに追加することになる。例えば，`'unemployment':10.5`を`'失業率':10.5`に「変更」するには次のコードとなる。

In [None]:
del macro['unemployment']  # 1

macro['失業率'] = 10.5      # 2

macro                      # 3

* １行目で`'unemployment':10.5`を削除している，ここでの`del`はリストの要素を削除した際に使った同じ`del`である。
* ２行目で`'失業率':10.5`を追加している。
* ３行目は`macro`を実行して内容を表示している。

#### メソッド

リスト同様，全ての辞書には様々なメソッドが備わっている。ここでは２つを紹介する。
* `keys()`：キーを抽出するメソッド
* `values()`：値を抽出するメソッド

まず`macro`を使って`keys()`から考えよう。

In [None]:
mkey = macro.keys()
mkey

３つのキーが並んでいるのが確認できる。一方で表示の最初に`dict_keys`と書かれており，リストやタプルと異なる様である。データ型を確認してみよう。

In [None]:
type(mkey)

`dict_keys`というデータ型であり，やはりリストやタプルとは異なる。リストに変換するには関数`list()`を使えば良い。

In [None]:
list(mkey)

同様にタプルに変換するには`tuple()`を使う。

次にメソッド`values()`を考えよう。

In [None]:
mval = macro.values()

mval, type(mval)

`dict_values`というデータ型となっている。リストに変換するには次のコードとなる。

In [None]:
list(mval)

## 文字列の操作

### 文字の抽出

ここでは文字列型の次の操作について説明する。
* 要素の抽出（アクセス）
* 基本的なメソッド

`Python`の文字列には6つのアルファベット文字が，それぞれを

次の文字列を考えよう。

In [None]:
s = 'It is fun to learn Python!'

`s`にはアルファベットと半角スペースが使われているが，それぞれが要素となる文字列である。従って，リスト同様`[]`を使って文字を抽出することができる。`0`番目と最後の文字は次のコードでアクセスできる。

In [None]:
s[0], s[-1]

スライシングも使える。

In [None]:
s[3:10+1]

### 文字列は変更不可

タプル同様，文字列は変更不可となるため次の操作はできない。
* 要素の入れ替え
* 要素の削除

`s`の`Python`を`economics`に変更するには，新しい文字列を`s`に再割り当てすることになる。

In [None]:
s = 'It is fun to learn economics!'

### `list()`と`tuple()`を使う

文字列に`list()`や`tuple()`を使うと，１つの文字が要素となるリストもしくはタプルを返すことになる。

In [None]:
list('Python')

In [None]:
tuple('Python')

### メソッド

全ての文字列には色々なメソッドが準備されている。ここでは３つ紹介する。
* `split()`：デフォルトでは半角スペースで分割しリストを返す。
* `join()`：文字列を結合する。
* `replace()`：文字列を入れ替える。

`s`に`split()`を使ってみよう。

In [None]:
s.split()

デフォルトでは区切りに半角スペースが使われ，単語がリストの構成要素となっている。`()`に分割に使う文字列を指定することもできる。例えば，`is`で分割してみよう。

In [None]:
s.split('is')

この場合`is`が区切りとなり，`s`は２つに分かれている。

次に`join()`を説明しよう。次の構文となる。
```
'＜結合に使う文字列＞'.join(＜文字列が含まれるリスト・タプル＞)
```
まずリストを作成して説明しよう。

In [None]:
s_new = ['P','y','t','h','o','n']

In [None]:
'-'.join(s_new)

それぞれの文字が`-`で結合されているのがわかる。次も同じ結果を返す。

In [None]:
'-'.join('Python')

これは
```
'-'.join( list('Python') )
```
と同じことであり，`list()`が自動的に適応されていることが分かる。

`'-'.join(s_new)`の`s_new`の代わりに`s`を使ってみよう。

In [None]:
'-'.join(s)

半角スペースを含めて全ての文字の間に`-`が入っている。単語の間にだけ`-`が入るようにするには次のコードで可能である。

In [None]:
'-'.join( s.split() )

`s.split()`で単語からなるリストを作成した後に`join()`で結合している。

メソッド`replace()`を使っても同じ結果を得ることができる。

In [None]:
s.replace(' ', '-')

* 第１引数`' '`：入れ替える対象の文字列
* 第２引数`'-'`：入れ替える文字列

In [None]:
s.replace(' ', '😁').replace('!', '‼️')

## まとめ

**＜基本データ型の変換＞**

|   関数 | 動作  |
| ----------- | ------- |
| `list()` | リストへ変換 |
| `tuple()` | タプルへ変換 |
| `str()` | 文字列へ変換 |
| `bool()` | 真偽値の確認 |

**＜要素アクセス＞**

|     データ型 | 例       | 抽出方法 |
| ----------- | ------- |---|
| リスト | `x = [0,10,30]`    |  `x[1]`　→　`10` |
| タプル | `y = (0,10,30)`    |  `y[1]`　→　`10` |
| 辞書 | `z = {'a':0, 'b':10}` |  `z['b']`　→　`10` |

**＜スライシング＞**

|     データ型 | 例       | 抽出方法 |
| ----------- | ------- |---|
| リスト | `x = [0,10,20,30]`    |  `x[:2+1]`　→　`[0,10,20]` |
| リスト | `x = [0,10,20,30]`    |  `x[1:]`　→　`[10,20,30]` |
| リスト | `x = [0,10,20,30]`    |  `x[:]`　→　`[0,10,20,30]` |
| リスト | `x = [0,10,20,30]`    |  `x[::-1]`　→　`[30,20,10,0]` |

* 基本的にタプルも同じ

**＜値の入れ替え＞**

|     データ型 | 例       | 方法 |
| ----------- | ------- |---|
| リスト | `x = [0,10,30]`    |  `x[1]=100` |
| タプル | `y = (0,10,30)`    |  不可 |
| 辞書 | `z = {'a':0, 'b':10}` |  `z['b']=100` |



**＜要素の削除＞**

|     データ型 | 例       | 削除方法 |
| ----------- | ------- |---|
| リスト | `x = [0,10,30]` |  `del x[1]`　→　`[0,30]` |
| タプル | `y = (0,10,30)` |  不可 |
| 辞書 | `z = {'a':0,'b':10}` |  `del z['a']`　→　`{'b':10}` |

**＜メソッド＞**

|     データ型 |　例      | メソッド |
| ----------- | ------- |---|
| リスト | `x = [10]` |  `x.append(20)`　→　`[10,20]` |
| 辞書 | `x = {'a':0,'b':10}` |  `list( x.keys() )`　→　`['a','b']` |
| 辞書 | `x = {'a':0,'b':10}` |  `list( x.values() )`　→　`[0,10]` |
| 文字列 | `x = 'It is me!'` |  `x.split() )`　→　`['It','is','me!']` |
| 文字列 | `x = ['It','is','me!']` |  `'-'.join(x) )`　→　`'It-is-me.'` |
| 文字列 | `x = 'It is me!'` |  `x.replace(' ','-') )`　→　`'It-is-me.'` |