## Pythonのデータ 扱い方
**リスト型や、タプル型について、特に今までは何もツッコミを入れていなかったですが、**  
**ここではPythonのいろいろなデータの型をみていきます**

### リスト型について
**リスト型には、いくつかメソッドがあります。リストを`list`オブジェクトとして呼び出したとき、**  
**以下のようなメソッドが用意されています。**  
  
`list.append(x)`  
リストの末尾に要素を一つ追加します。`a[len(a):] = [x]` と同じです。  
  
`list.extend(iterable)`  
イテラブルのすべての要素を対象のリストに追加し、リストを拡張します。`a[len(a):] = iterable` と同じです。  
  
`list.insert(i, x)`  
指定した位置に要素を挿入します。第1引数は、リストのインデックスで、そのインデックスを持つ要素の直前に挿入が行われます。  
従って、 `a.insert(0, x)` はリストの先頭に挿入を行います。また `a.insert(len(a), x)` は `a.append(x)` と同じです。  
  
`list.remove(x)`  
リスト内で `x` と等しい値を持つ最初の要素を削除します。該当する要素がなければ `ValueError` が出力されます。  
  
`list.pop([i])`  
リスト内の指定された位置にある要素をリストから削除して、その要素を返します。  
インデックスが指定されなければ、 `a.pop()` はリストの末尾の要素を削除して返します。この場合も要素は削除されます。 
  
`list.clear()`  
リスト内の全ての要素を削除します。`del a[:]` と同じです。  
  
`list.index(x[, start[, end]])`
リスト内で `x` と等しい値を持つ最初の要素の位置を、ゼロから始まる添字で返します。  
該当する要素がなければ `ValueError` が送出されます。  
任意の引数である `start` と `end` はスライス記法として解釈され、リストの探索範囲を指定できます。  
返される添字は、`start` 引数からの相対位置ではなく、リスト全体の先頭からの位置になります。  
  
`list.count(x)`  
リストでの `x` の出現回数を返します。  
  
`list.sort(*, key=None, reverse=False)`  
リストの項目を、inplace演算 (元のデータを演算結果によって置き換える) でソートします。  
  
`list.reverse()`  
リストの要素を、inplace演算で逆順にします。    
  
`list.copy()`  
リスト内の要素をコピーします。`a[:]` と同じです。  

In [1]:
fruits = ['みかん', 'りんご', 'もも', 'ばなな', 'きゅうい', 'りんご', 'ばなな']

In [2]:
fruits.count('りんご')

2

In [3]:
fruits.count('なし')

0

In [4]:
fruits.index('ばなな')

3

In [5]:
fruits.index('ばなな', 4)

6

In [6]:
fruits.reverse()

In [7]:
fruits

['ばなな', 'りんご', 'きゅうい', 'ばなな', 'もも', 'りんご', 'みかん']

In [8]:
fruits.append('ぶどう')

In [9]:
fruits

['ばなな', 'りんご', 'きゅうい', 'ばなな', 'もも', 'りんご', 'みかん', 'ぶどう']

In [10]:
fruits.sort()

In [11]:
fruits

['きゅうい', 'ばなな', 'ばなな', 'ぶどう', 'みかん', 'もも', 'りんご', 'りんご']

In [12]:
fruits.pop()

'りんご'

In [13]:
fruits

['きゅうい', 'ばなな', 'ばなな', 'ぶどう', 'みかん', 'もも', 'りんご']

### [スタック](https://www.codereading.com/algo_and_ds/ds/stack.html#:~:text=%E3%82%B9%E3%82%BF%E3%83%83%E3%82%AF%20%5BStack%5D,%E3%81%A6%E3%82%86%E3%81%8F%E3%80%8D%E3%81%A8%E3%81%84%E3%81%86%E6%84%8F%E5%91%B3%E3%81%A7%E3%81%99%E3%80%82&text=%E3%82%B9%E3%82%BF%E3%83%83%E3%82%AF%E3%81%AF%E6%99%82%E7%B3%BB%E5%88%97%E3%81%AB,%E4%BD%BF%E3%82%8F%E3%82%8C%E3%82%8B%E3%83%87%E3%83%BC%E3%82%BF%E6%A7%8B%E9%80%A0%E3%81%A7%E3%81%99%E3%80%82)としても使える、リスト型
**最後に入ったものが最初に出てゆく...時系列データを扱う際や、自然言語でもよく使う**

In [14]:
stack = [3, 4, 5]

In [15]:
stack.append(6)

In [16]:
stack.append(7)

In [17]:
stack

[3, 4, 5, 6, 7]

**`stack`というリストオブジェクトに, `append`によって新たに要素が追加されました**  
今度は、`pop`でリスト末尾を削除していくと、『スタック』な処理ができます。

In [18]:
stack.pop()

7

In [19]:
stack

[3, 4, 5, 6]

In [20]:
stack.pop()

6

In [21]:
stack.pop()

5

In [22]:
stack

[3, 4]

In [23]:
stack.pop()

4

In [24]:
stack.pop()

3

In [25]:
stack.pop()

IndexError: pop from empty list

In [26]:
stack

[]

**当然、リスト内に要素がなくなれば、`pop`しても要素がないよと怒られます**

### リストを、[キュー(queue)](http://www.cc.kyoto-su.ac.jp/~yamada/ap/queue.html)として扱う

In [27]:
from collections import deque

In [28]:
queue = deque(["猫A", "猫B", "猫C"])

In [29]:
queue.append("猫D")

In [30]:
queue

deque(['猫A', '猫B', '猫C', '猫D'])

In [31]:
queue.append("猫E")

In [32]:
queue

deque(['猫A', '猫B', '猫C', '猫D', '猫E'])

`queue`というキュー内は、リストが格納されている。そこに`append`で要素を追加することで、待ち行列の動作を再現しています

In [33]:
queue.popleft()

'猫A'

In [34]:
queue

deque(['猫B', '猫C', '猫D', '猫E'])

**`popleft`というメソッドを使うことで、先頭(リスト正面から見て、左(left))の要素を削除します**

In [35]:
queue.pop()

'猫E'

In [36]:
queue

deque(['猫B', '猫C', '猫D'])

**`collections.deque`については、また別途、標準モジュールの中で見ていきます...！**

### リストの内包表記
リスト内包表記を使うことで、コードを綺麗にまとめることができます。例として、  
まずは内包表記せず、`for`で二乗の計算をリストの中に格納する処理をプログラムで表現します。

In [37]:
squares = []

In [38]:
for x in range(10):
    squares.append(x**2)

In [39]:
squares

[0, 1, 4, 9, 16, 25, 36, 49, 64, 81]

In [40]:
x

9

この時、最後に実行した`x`が残ってます。  
上記の`for`を用いた処理には、例えば、下２通りのやり方があります。

In [41]:
squares = list(map(lambda y: y**2, range(10)))

In [42]:
squares

[0, 1, 4, 9, 16, 25, 36, 49, 64, 81]

In [43]:
y

NameError: name 'y' is not defined

`lambda`を使うと、`lambda 引数: 返り値`を実行することができます。

In [44]:
def square(y):
    return y ** 2

In [45]:
lambda y: y ** 2

<function __main__.<lambda>(y)>

**`lambda`は、こんな感じで扱います。**  
一方で、リスト内包表記では...

In [46]:
squares = [z**2 for z in range(10)]

In [47]:
squares

[0, 1, 4, 9, 16, 25, 36, 49, 64, 81]

In [48]:
z

NameError: name 'z' is not defined

**上記の、`lambda`実行例と同じで、最後に実行された`z`については反映されません。**  
リスト内包表記内では、`for`や`if`も使えます。

In [50]:
[(x, y) for x in [1,2,3] for y in [3,1,4] if x != y]

[(1, 3), (1, 4), (2, 3), (2, 1), (2, 4), (3, 1), (3, 4)]

In [51]:
combs = []

In [52]:
for x in [1,2,3]:
    for y in [3,1,4]:
        if x != y:
            combs.append((x, y))

In [53]:
combs

[(1, 3), (1, 4), (2, 3), (2, 1), (2, 4), (3, 1), (3, 4)]

**リスト内包表記を使って、計算や結果を文字列型にしてみる**

In [54]:
from math import pi

In [55]:
[str(round(pi, i)) for i in range(1, 6)]

['3.1', '3.14', '3.142', '3.1416', '3.14159']

### ネスト(網)したリストの内包表記

In [66]:
matrix = [
    [1, 2, 3, 4],
    [5, 6, 7, 8],
    [9, 10, 11, 12],
]

In [67]:
[[row[i] for row in matrix] for i in range(4)]

[[1, 5, 9], [2, 6, 10], [3, 7, 11], [4, 8, 12]]

`matrix` という行列を転置しているプログラムを内包表記でネストして表現しています。  
これを"分解"すると下記のようなものになります。

In [68]:
transposed = []

In [69]:
for i in range(4):
    transposed.append([row[i] for row in matrix])

In [70]:
transposed

[[1, 5, 9], [2, 6, 10], [3, 7, 11], [4, 8, 12]]

これだと、まだ一つ目のネストを解いただけなので・・・

In [71]:
transposed = []

In [72]:
for i in range(4):
    transposed_row = []
    for row in matrix:
        transposed_row.append(row[i])
    transposed.append(transposed_row)

In [73]:
transposed

[[1, 5, 9], [2, 6, 10], [3, 7, 11], [4, 8, 12]]

ちなみに、下記のようなコードでも可能です。

In [74]:
list(zip(*matrix))

[(1, 5, 9), (2, 6, 10), (3, 7, 11), (4, 8, 12)]

### リストにおける `del` 文

In [76]:
a = [-1, 1, 66.25, 333, 333, 1234.5]

In [77]:
a[0]

-1

In [78]:
del a[0]

In [79]:
a

[1, 66.25, 333, 333, 1234.5]

In [80]:
a[2:4]

[333, 333]

In [81]:
del a[2:4]

In [82]:
a

[1, 66.25, 1234.5]

### タプルとシーケンス

In [83]:
t = 12345, 54321, 'hello!'

**当時は、きもいと思った上記の実行...これでもいけるんか〜いとなりました。今では便利っちゃ便利ですが。。。**

In [84]:
t[0]

12345

**どうなっているかというと、これがタプル型になっている、ということ**

In [85]:
t

(12345, 54321, 'hello!')

In [86]:
# ネスト(網)してみる
u = t, (1, 2, 3, 4, 5)

In [87]:
u

((12345, 54321, 'hello!'), (1, 2, 3, 4, 5))

In [88]:
t[0]

12345

In [89]:
t[0] = 88888

TypeError: 'tuple' object does not support item assignment

タプル型とリスト型は似ていますが、当然異なるものです。  
  
タプルは『不変』で、複数の型の要素から構成することもでき、  
要素はアンパック操作やインデックスで操作することが多いです。  
  
一方、リストは『可変』で、要素はたいてい同じ型の、つまりリストで構成します。(もちろん例外もあるけれど)

In [90]:
v = ([1, 2, 3], [3, 2, 1])

In [91]:
v

([1, 2, 3], [3, 2, 1])

タプル内の要素を、それぞれリストで格納することもできます

In [91]:
empty = ()

In [92]:
empty

()

In [93]:
single = 'hello', 

In [94]:
single

('hello',)

In [95]:
len(empty)

0

In [96]:
len(single)

1

**アンパック(解凍)については、次のように実行することができます**

In [97]:
t

(12345, 54321, 'hello!')

In [98]:
x, y, z = t

In [99]:
x

12345

In [100]:
y

54321

In [101]:
z

'hello!'

### 集合型(`set`)

集合 (`set`) を扱うためのデータ型もあります。  
集合とは、重複する要素をもたない、順序づけられていない要素の集まりです。   
set オブジェクトは、和 (union)、積 (intersection)、差 (difference)、対称差 (symmetric difference)といった数学的な演算もサポートしています。

In [102]:
basket = {'りんご', 'りんご', 'りんご', 'いちご', 'みかん', 'ばなな', 'みかん'}

In [108]:
basket

{'いちご', 'ばなな', 'みかん', 'りんご'}

In [109]:
print(basket)

{'りんご', 'いちご', 'ばなな', 'みかん'}


**重複を削除した、ユニークな要素のみが取り出されます**

In [110]:
'orange' in basket

False

In [111]:
'みかん' in basket

True

ちなみに文字列をそのまま`set`すると...

In [112]:
a = set('abracadabra')

In [113]:
a

{'a', 'b', 'c', 'd', 'r'}

In [114]:
b = set('alacazam')

In [115]:
b

{'a', 'c', 'l', 'm', 'z'}

`set`は、集合を体現しているので、集合の演算が可能です。

In [116]:
a - b

{'b', 'd', 'r'}

In [117]:
a | b

{'a', 'b', 'c', 'd', 'l', 'm', 'r', 'z'}

In [118]:
a & b

{'a', 'c'}

In [119]:
a ^ b

{'b', 'd', 'l', 'm', 'r', 'z'}

### 辞書型 (`dict`)

もう一つ、有用な型が Python に組み込まれています。それは 辞書 (dictionary) です。  
辞書はPython以外の他の言語にも存在します。ある範囲の数でインデックス化(要素化)されている一連の要素(リストとか)と異なり、  
辞書は キー (`key`) でインデックス化されています。このキーは何らかの変更不能な型になります。  
  
文字列、数値は常にキーにすることができます。  
タプルは、文字列、数値、その他のタプルのみを含む場合はキーにすることができます。  
直接、あるいは間接的に変更可能なオブジェクトを含むタプルは、キーにできません。またリストをキーとして使うことはできません。  
  
これは、リストにスライスやインデクス指定の代入を行ったり、 `append()` や `extend()` のようなメソッドを使うと、  
置き換えることができるためです。(キーは、変更不能な型でないといけないため)
  
辞書は キー(`key`): 値(`value`) のペアの集合であり、キーが (辞書の中で)一意でなければならない、と考えます。  
波括弧のペア: {} は、空の辞書を生成します。  
  
カンマで区切られた `key`: `value` のペアを波括弧ペアの間に入れると、  
辞書の初期値となる `key`: `value` が追加されます; この表現方法は出力時に辞書が書き出されるのと同じ方法です。  
  
辞書での主な操作は、ある値を何らかのキーを付けて記憶することと、キーを指定して値を取り出すことです。   
`del` で `key`: `value` のペアを削除することもできます。  
  
すでに使われているキーを使って値を記憶すると、以前そのキーに関連づけられていた値は参照できなくなります。  
存在しないキーを使って値を取り出そうとするとエラーになります。  

In [124]:
cat = {'猫A': 1, '猫B': 2}

In [125]:
cat

{'猫A': 1, '猫B': 2}

辞書に、新たなキーと値のペアを追加するには...

In [126]:
cat['猫C'] = 3

In [127]:
cat

{'猫A': 1, '猫B': 2, '猫C': 3}

In [128]:
cat['猫B']

2

In [129]:
del cat['猫C']

In [130]:
cat

{'猫A': 1, '猫B': 2}

In [131]:
cat['猫D'] = 4

In [132]:
cat

{'猫A': 1, '猫B': 2, '猫D': 4}

In [133]:
list(cat)

['猫A', '猫B', '猫D']

In [134]:
sorted(cat)

['猫A', '猫B', '猫D']

In [135]:
'猫A' in cat

True

In [137]:
'猫A' not in cat

False

In [138]:
dict([('猫E', 5), ('猫F', 6), ('猫G', 7)])

{'猫E': 5, '猫F': 6, '猫G': 7}

In [139]:
{x: x**2 for x in (2, 4, 6)}

{2: 4, 4: 16, 6: 36}

In [142]:
dict(猫E=5,猫F=6, 猫G=7)

{'猫E': 5, '猫F': 6, '猫G': 7}

### 辞書を使うと、ループが楽になるテクニックなどなど

In [148]:
cats = {'猫A': 'めちゃ可愛い', '猫B': '素っ気なくて生意気'}

In [149]:
for k, v in cats.items():
    print(k, v)

猫A めちゃ可愛い
猫B 素っ気なくて生意気


In [150]:
for i, v in enumerate(['猫A', '猫B', '猫C']):
    print(i, v)

0 猫A
1 猫B
2 猫C


In [151]:
questions = ['名前', '性格', '好きな色']

In [152]:
answers = ['佐藤それがし', '素直で謙虚', '青']

In [154]:
for q, a in zip(questions, answers):
    print('あなたの{0}?  それは、{1}です'.format(q, a))

あなたの名前?  それは、佐藤それがしです
あなたの性格?  それは、素直で謙虚です
あなたの好きな色?  それは、青です


In [155]:
for i in reversed(range(1, 10, 2)):
    print(i)

9
7
5
3
1


In [156]:
basket = ['りんご', 'りんご', 'りんご', 'いちご', 'みかん', 'ばなな', 'みかん']

In [157]:
for i in sorted(basket):
    print(i)

いちご
ばなな
みかん
みかん
りんご
りんご
りんご


In [158]:
basket = ['りんご', 'りんご', 'りんご', 'いちご', 'みかん', 'ばなな', 'みかん']

In [159]:
for f in sorted(set(basket)):
    print(f)

いちご
ばなな
みかん
りんご


ときどきループ内でリストを変更したい誘惑に駆られるでしょうが、  
代わりに新しいリストを作ってしまうほうがより簡単で安全なことが、ままあります

In [160]:
import math

In [161]:
raw_data = [56.2, float('NaN'), 51.7, 55.3, 52.5, float('NaN'), 47.8]

In [162]:
filtered_data = []

In [163]:
for value in raw_data:
    if not math.isnan(value):
        filtered_data.append(value)

In [164]:
filtered_data

[56.2, 51.7, 55.3, 52.5, 47.8]

# 説明したいことはたくさんありますが、いったんここまでにします...！