# 5. データ構造

## 5.1. リスト型についてもう少し

In [1]:
fruits = ['orange', 'apple', 'pear', 'banana', 'kiwi', 'apple', 'banana']

In [2]:
fruits.count('apple')

2

In [3]:
fruits.index('banana')

3

In [4]:
fruits.reverse()
fruits

['banana', 'apple', 'kiwi', 'banana', 'pear', 'apple', 'orange']

In [5]:
fruits.append('grape')
fruits

['banana', 'apple', 'kiwi', 'banana', 'pear', 'apple', 'orange', 'grape']

In [6]:
fruits.sort()
fruits

['apple', 'apple', 'banana', 'banana', 'grape', 'kiwi', 'orange', 'pear']

In [7]:
fruits.pop()

'pear'

### 5.1.1. リストをスタックとして使う

In [8]:
stack = [3, 4, 5]

In [9]:
stack.append(6)
stack

[3, 4, 5, 6]

In [10]:
stack.append(7)

In [11]:
stack

[3, 4, 5, 6, 7]

In [12]:
stack.pop()

7

In [13]:
stack

[3, 4, 5, 6]

In [14]:
stack.pop()

6

In [15]:
stack

[3, 4, 5]

In [16]:
stack.pop()

5

In [17]:
stack

[3, 4]

### 5.1.2. リストをキューとして使う

In [18]:
from collections import deque

queue = deque(['Eric','John','Michael'])
queue

deque(['Eric', 'John', 'Michael'])

In [19]:
queue.append('Terry')
queue

deque(['Eric', 'John', 'Michael', 'Terry'])

In [20]:
queue.append('Graham')
queue

deque(['Eric', 'John', 'Michael', 'Terry', 'Graham'])

In [21]:
queue.popleft()

'Eric'

In [22]:
queue

deque(['John', 'Michael', 'Terry', 'Graham'])

In [23]:
queue.popleft()

'John'

In [24]:
queue

deque(['Michael', 'Terry', 'Graham'])

### 5.1.3. リストの内包表記

In [25]:
squares = []

for x in range(10):
    squares.append(x**2)

squares

[0, 1, 4, 9, 16, 25, 36, 49, 64, 81]

In [26]:
squares = list(map(lambda x: x**2, range(10)))
squares

[0, 1, 4, 9, 16, 25, 36, 49, 64, 81]

In [27]:
squares = [x**2 for x in range(10)]
squares

[0, 1, 4, 9, 16, 25, 36, 49, 64, 81]

In [28]:
[(x, y) for x in [1, 2, 3] for y in [3, 1, 4] if x != y]

[(1, 3), (1, 4), (2, 3), (2, 1), (2, 4), (3, 1), (3, 4)]

In [29]:
combs = []
for x in [1, 2, 3]:
    for y in [3, 1, 4]:
        if x != y:
            combs.append((x,y))

combs

[(1, 3), (1, 4), (2, 3), (2, 1), (2, 4), (3, 1), (3, 4)]

In [30]:
vec = [-4, -2, 0, 2, 4]
vec

[-4, -2, 0, 2, 4]

In [31]:
[x*2 for x in vec]

[-8, -4, 0, 4, 8]

In [32]:
[x for x in vec if x >= 0]

[0, 2, 4]

In [33]:
[abs(x) for x in vec]

[4, 2, 0, 2, 4]

In [34]:
freshfruit = ['  banana', '  loganberry', 'passion fruit  ']
freshfruit

['  banana', '  loganberry', 'passion fruit  ']

In [35]:
[weapon.strip() for weapon in freshfruit]

['banana', 'loganberry', 'passion fruit']

In [36]:
[(x, x**2) for x in range(6)]

[(0, 0), (1, 1), (2, 4), (3, 9), (4, 16), (5, 25)]

In [37]:
# 多次元リストを平坦化
vec = [[1, 2, 3], [4, 5, 6], [7, 8, 9]]
[num for elem in vec for num in elem]

[1, 2, 3, 4, 5, 6, 7, 8, 9]

In [38]:
from math import pi
[str(round(pi, i) for i in range(1, 6))]

['<generator object <genexpr> at 0x10bc0af50>']

### 5.1.4. ネストしたリストの内包表記

In [39]:
matrix = [[1, 2, 3, 4], [5, 6, 7, 8], [9, 10, 11, 12],]

In [40]:
# matrixの行と列を入れ替え①
[[row[i] for row in matrix] for i in range(4)]

[[1, 5, 9], [2, 6, 10], [3, 7, 11], [4, 8, 12]]

In [41]:
# matrixの行と列を入れ替え②
transposed = []
for i in range(4):
    transposed.append([row[i] for row in matrix])
transposed

[[1, 5, 9], [2, 6, 10], [3, 7, 11], [4, 8, 12]]

In [42]:
# matrixの行と列を入れ替え③
transposed = []
for i in range(4):
    transposed_row = []
    for row in matrix:
        transposed_row.append(row[i])
    transposed.append(transposed_row)
    
transposed

[[1, 5, 9], [2, 6, 10], [3, 7, 11], [4, 8, 12]]

In [43]:
# matrixの行と列を入れ替え④
# 組み込み関数を使う方法（一番良い）
list(zip(*matrix))

[(1, 5, 9), (2, 6, 10), (3, 7, 11), (4, 8, 12)]

- [Python, zip関数の使い方: 複数のリストの要素をまとめて取得](https://note.nkmk.me/python-zip-usage-for/)

## 5.2. del 文

In [44]:
a = [-1, 1, 66.25, 333, 333, 1234.5]
a

[-1, 1, 66.25, 333, 333, 1234.5]

In [45]:
# indexを指定して要素を削除
del a[0]
a

[1, 66.25, 333, 333, 1234.5]

In [46]:
# スライスを使って要素を削除
del a[2:4]
a

[1, 66.25, 1234.5]

In [47]:
# スライスを使って全ての要素を削除
# del aでも可
del a[:]
a

[]

## 5.3. タプルとシーケンス

- タプルを書くときは必ずしも丸括弧で囲まなくてもいいですが、(タプルが大きな式の一部だった場合は) 丸括弧が必要な場合もある。

- タプルの要素を代入することはできない。

- タプルにリストのような変更可能型を含めることはできる。

- タプルは不変（immutable）。

In [48]:
# タプルのパック
t = 12345, 54321, 'hello!'

In [49]:
t[0]

12345

In [50]:
t

(12345, 54321, 'hello!')

In [51]:
# タプルのネスト
u = t, (1, 2, 3, 4 , 5)
u

((12345, 54321, 'hello!'), (1, 2, 3, 4, 5))

In [52]:
u[0][0]

12345

In [53]:
#タプルにリストを含める
v = ([1, 2, 3], [3, 2, 1])
v

([1, 2, 3], [3, 2, 1])

In [54]:
type(v)

tuple

In [55]:
type(v[0])

list

In [56]:
# 空のタプルは空の丸括弧ペアで構築できる。
# 一つの要素を持つタプルは、値の後ろにコンマを続けることで構築。
empty = ()
singleton = 'hello',

In [57]:
len(empty)

0

In [58]:
len(singleton)

1

In [59]:
singleton

('hello',)

In [60]:
# シーケンスのアンパック
# 等号の左辺に列挙されている変数が、右辺のシーケンスの長さと同じ数だけあることが要求される。
x, y, z = t

In [61]:
x

12345

In [62]:
y

54321

In [63]:
z

'hello!'

## 5.4. 集合型

In [64]:
basket = {'apple', 'orange', 'apple', 'pear', 'orange', 'banana'}
print(basket)

{'apple', 'banana', 'orange', 'pear'}


In [65]:
'orange' in basket 

True

In [66]:
'crabgrass' in basket

False

In [67]:
a = set('abracadabra')
b = set('alacazam')

In [68]:
a

{'a', 'b', 'c', 'd', 'r'}

In [69]:
b

{'a', 'c', 'l', 'm', 'z'}

In [70]:
# aのunique要素
a - b

{'b', 'd', 'r'}

In [71]:
# aまたはb
a | b

{'a', 'b', 'c', 'd', 'l', 'm', 'r', 'z'}

In [72]:
# aかつb
a & b

{'a', 'c'}

In [73]:
# aまたはb（重複を除く）
a ^ b

{'b', 'd', 'l', 'm', 'r', 'z'}

In [74]:
a = {x for x in 'abracadabra' if x not in 'abc'}
a

{'d', 'r'}

## 5.5. 辞書型 (dictionary)

- 辞書は キー(key): 値(value) のペアの集合。

- キーが (辞書の中で)一意でければならない。

In [75]:
tel = {'jack':4098, 'sape': 4139}
tel

{'jack': 4098, 'sape': 4139}

In [76]:
tel['guido'] = 4127
tel

{'jack': 4098, 'sape': 4139, 'guido': 4127}

In [77]:
tel['jack']

4098

In [78]:
del tel['sape']
tel

{'jack': 4098, 'guido': 4127}

In [79]:
tel['irv'] = 4127
tel

{'jack': 4098, 'guido': 4127, 'irv': 4127}

In [80]:
'''
辞書オブジェクトに対し list(d) を実行すると、
辞書で使われている全てのキーからなるリストをキーが挿入された順番で返します
'''
list(tel)

['jack', 'guido', 'irv']

In [81]:
# sortされたkeyのリスト
sorted(tel)

['guido', 'irv', 'jack']

In [82]:
'guido' in tel

True

In [83]:
'jack' not in tel

False

In [84]:
# dict() コンストラクタは、キーと値のペアのタプルを含むリストから辞書を作成
dict([('sape',4139),('guido',4127),('jack',4098)])

{'sape': 4139, 'guido': 4127, 'jack': 4098}

In [85]:
# 辞書内包表記を使って辞書を作成
{x: x**2 for x in (2,4,6)}

{2: 4, 4: 16, 6: 36}

In [86]:
# キーワード引数を使って辞書を作成
dict(sape=4139, guido=4127, jack=4098)

{'sape': 4139, 'guido': 4127, 'jack': 4098}

## 5.6. ループのテクニック

In [87]:
# 辞書に対してループを行う際、 items() メソッドを使い、キーとそれに対応する値を同時に取り出す。
knights = {'gallahad': 'the pure', 'robin': 'the brave'}
for k, v in knights.items():
    print(k, v)

gallahad the pure
robin the brave


In [88]:
# 上記でitems()を使わなかった場合　→　keyだけ取り出される
for i in knights:
    print(i)

gallahad
robin


In [90]:
# シーケンスにわたるループを行う際、 enumerate() 関数を使い、インデックスと要素を同時に取り出す。
# リストから、index番号付き要素を取得できる。
for i, v in enumerate(['tic', 'tac', 'toe']):
    print(i, v)

0 tic
1 tac
2 toe


- [Python, enumerateの使い方: リストの要素とインデックスを取得](https://note.nkmk.me/python-enumerate-start/)

In [91]:
# zip()を使って各要素を一組にできる。
questions = ['name', 'quest', 'favorite color']
answers = ['lancelot', 'the holy grail', 'blue']

for q, a in zip(questions, answers):
    print('What is your {0}? It is {1}.'.format(q, a))

What is your name? It is lancelot.
What is your quest? It is the holy grail.
What is your favorite color? It is blue.


In [95]:
# 逆方向にループ
for i in reversed(range(1, 10, 2)):
    print(i)

9
7
5
3
1


In [97]:
# ソートされた順番でループ
basket = ['apple', 'orange', 'apple', 'pear', 'orange', 'banana']
for f in sorted(set(basket)):
    print(f)

apple
banana
orange
pear


In [98]:
# 
import math

raw_data = [56.2, float('NaN'), 51.7, 55.3, 52.5, float('NaN'), 47.8]
filtered_data = []

for value in raw_data:
    if not math.isnan(value):
        filtered_data.append(value)
        
filtered_data

[56.2, 51.7, 55.3, 52.5, 47.8]

- [math.isnan(x)](https://docs.python.org/ja/3/library/math.html#math.isnan)

## 5.7. 条件についてもう少し

In [102]:
string1, string2, string3 = '', 'Trondheim', 'Hammer Dance'
non_null = string1 or string2 or string3
non_null

'Trondheim'

## 5.8. シーケンスとその他の型の比較

In [107]:
(1, 2, 3) < (1, 2, 4)

True

In [108]:
[1, 2, 3] < [1, 2, 4]

True

In [109]:
# ASCII順序
'ABC' < 'C' < 'Pascal' < 'Python'

True

In [110]:
(1, 2, 3, 4) < (1, 2, 4) 

True

In [111]:
(1, 2) < (1, 2, -1)

True

In [112]:
(1, 2, 3) == (1.0, 2.0, 3.0)

True

In [114]:
# ASCII順序を含む
(1, 2, ('aa', 'ab')) < (1, 2, ('abc', 'a'), 4)

True