# Python 基礎教學-資料結構

## 中正大學資管系 (20181014)

## 資料結構(容器)
* [列表 list -> []](https://realpython.com/python-lists-tuples/)
* [元組 tuple -> ()](https://realpython.com/python-lists-tuples/)
* [字典 dict -> {}](http://www.runoob.com/python/python-dictionary.html)
* [集合 set -> {}](http://www.iplaypython.com/jichu/set.html)

# list (串列)

當你有一系列的資料時，要怎麼表示？

- 一串數字？
- 一堆人名？

在 Python 裡，`list` 可以表示這種類型的資料  
`list` 就是一連串的資料，語法相當簡單：

- 用一對中括弧 `[]` 來代表一個 list 的開始與結束
- list 中的元素用逗號分隔

In [3]:
# 建立空串列
lists = []
lists.append(1)
print(lists)
lists.append(2)
print(lists)

[1]
[1, 2]


In [4]:
# 另一種建立空串列方式
lists = list()
lists.append(1)
print(lists)

[1]


List 的元素**可以是任何型別的資料**，包括 `list`，因此含有 `list` 的 `list` 是可能發生的情況

In [1]:
# 空串列可以放入各種不同型態的物件
a = 'a'
lists = [10.0, 'Hello World', a, [1,2,3]]
print(lists)
print(lists[0], lists[-1])

[10.0, 'Hello World', 'a', [1, 2, 3]]
10.0 [1, 2, 3]


list 內已經有取多內建的方法，方法可以在[官方網站查詢](https://docs.python.org/3/tutorial/datastructures.html)，以下舉例:

+ list.append() 增加一筆資料到最後一個位置
+ list.pop() 移除 list 內最後一筆資料, 或是指定哪個位置
+ list.insert(i, x) 將資料存入指定的 index 位置
+ list.remove(x) 移除 list 內某個值
+ list.index(x, [start, end]) 某個值的 index 位置

In [2]:
# 增加一筆資料到最後位置
lists.append(0)
print(lists)

[10.0, 'Hello World', 'a', [1, 2, 3], 0]


In [3]:
# 移出 list 最後一筆資料
lists.pop()
print(lists)

[10.0, 'Hello World', 'a', [1, 2, 3]]


In [7]:
# 放入一筆資料到 list 開頭
lists.insert(0, 20.0)
print(lists)

[20.0, 10.0, 'Hello World', 'a']


In [8]:
# 刪除 list 內 10.0
lists.remove(10.0)
print(lists)

[20.0, 'Hello World', 'a']


In [9]:
# 印出 list 20.0 的 index
print(lists.index(20.0))

0


In [10]:
# 串列作鏈結
list_a = ['Hello']
list_b = ['World']
list_a.extend(list_b)
print(list_a)

['Hello', 'World']


In [11]:
# 清空串列內所有的值
list_a.clear()
print(list_a)

[]


In [12]:
# 將串列做排序(小-->大)
lists = [5, 4, 2, 0, 3, 1]
lists.sort()
print(lists)

[0, 1, 2, 3, 4, 5]


In [13]:
# 使用 for loop 印出串列
for i in lists:
    print(i)

0
1
2
3
4
5


In [14]:
# 反轉串列
lists.reverse()
print(lists)

[5, 4, 3, 2, 1, 0]


In [15]:
# assign 串列值給變數
lists = ['this is a', 'this is b']

a, b = lists
print(a)
print(b)

this is a
this is b


In [20]:
# 串列是有序的
a = ['foo', 'bar', 'baz', 'qux']
b = ['baz', 'qux', 'bar', 'foo']
print(a == b)
print(a is b)

False
False


## 串列切片

![](images/slice.png)

In [5]:
#List elements can be accessed by index.
a = ['foo', 'bar', 'baz', 'qux', 'quux', 'corge']
print(a[0])
print(a[2])
print(a[5])

foo
baz
corge


如果嘗試讀取一個不存在的元素（位置超出該 list 的範圍），則會出現 **`IndexError`**

In [6]:
a[6] # 第 6 項並不存在於 a 中，最後一項是第 5 項

IndexError: list index out of range

## List - Slices 切片
**Slicing**：取得 list 中的「其中一部分」
- 只要第二個到第五個
- 只要前五個
- 只要最後五個
- 只要取得偶數位置的

In [7]:
# 取 2 到 5 個
a = ['foo', 'bar', 'baz', 'qux', 'quux', 'corge']
print(a[2:5])

['baz', 'qux', 'quux']


In [8]:
# 從負數來取 2 到 5 個
print(a[-5:-2])

['bar', 'baz', 'qux']


In [11]:
print(a[-5:-2] == a[1:4])

True


In [10]:
# 取前 5 個
print(a[:5])

['foo', 'bar', 'baz', 'qux', 'quux']


In [13]:
# 補充省略切片第一個索引就是從頭開始
print(a[:4], a[0:4])
print(a[2:], a[2:len(a)])

['foo', 'bar', 'baz', 'qux'] ['foo', 'bar', 'baz', 'qux']
['baz', 'qux', 'quux', 'corge'] ['baz', 'qux', 'quux', 'corge']


In [12]:
# 取偶數位置
print(a[::2])

['foo', 'baz', 'quux']


In [14]:
# 指定切片步幅
print(a[0:6:2])
print(a[1:6:2])
print(a[6:0:-2])

['foo', 'baz', 'quux']
['bar', 'qux', 'corge']
['corge', 'qux', 'bar']


In [25]:
# 切片結合
print(a[:4] + a[4:])
print(a[:4] + a[4:] == a)

['foo', 'bar', 'baz', 'qux', 'quux', 'corge']
True


In [27]:
# 使用切片反轉(等同 reverse)
print(a[::-1])

['corge', 'quux', 'qux', 'baz', 'bar', 'foo']


## 『串列切片練習』

In [28]:
# 切片步幅
lists = [0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10]
print(lists[0::1])
print(lists[0::2])
print(lists[0::3])

In [29]:
# 切片開頭
print(lists[0:])
print(lists[3:])

In [30]:
# 切片負數
print(lists[-1])

In [None]:
print(lists[::-1]) #lists.reverse()
print(lists[0:-10])

## 其他進階

In [31]:
# [:] list 與 string 差異, 對 list 而言 [:] 是 copy
s = 'foobar'
print(s[:])
print(s[:] is s)

foobar
True


In [32]:
a = ['foo', 'bar', 'baz', 'qux', 'quux', 'corge']
print(a[:])
print(a[:] is a)

['foo', 'bar', 'baz', 'qux', 'quux', 'corge']
False


In [33]:
# in, not 操作
print('qux' in a)
print('thud' not in a)

True
True


In [34]:
# concatenation(+), replication(*)
print(a + ['grault', 'garply'])
print(a * 2)

['foo', 'bar', 'baz', 'qux', 'quux', 'corge', 'grault', 'garply']
['foo', 'bar', 'baz', 'qux', 'quux', 'corge', 'foo', 'bar', 'baz', 'qux', 'quux', 'corge']


In [35]:
# len(), min(), max()
print(len(a))
print(min(a))
print(max(a))

6
bar
qux


## 巢狀的串列說明
```
x = ['a', ['bb', ['ccc', 'ddd'], 'ee', 'ff'], 'g', ['hh', 'ii'], 'j']
```
![](images/nested_list.png)

In [41]:
x = ['a', ['bb', ['ccc', 'ddd'], 'ee', 'ff'], 'g', ['hh', 'ii'], 'j']
print(x)
print(x[0], x[2], x[4])
print(x[1])
print(x[3])

['a', ['bb', ['ccc', 'ddd'], 'ee', 'ff'], 'g', ['hh', 'ii'], 'j']
a g j
['bb', ['ccc', 'ddd'], 'ee', 'ff']
['hh', 'ii']


In [43]:
print(x[1][0])
print(x[1][1])
print(x[1][2])
print(x[1][3])

bb
['ccc', 'ddd']
ee
ff


In [44]:
print(x[3][0])
print(x[3][1])

hh
ii


In [45]:
print(x[1][1])
print(x[1][1][0], x[1][1][1])

['ccc', 'ddd']
ccc ddd


In [46]:
print(x[1][1][-1])
print(x[1][1:3])
print(x[3][::-1])

ddd
[['ccc', 'ddd'], 'ee']
['ii', 'hh']


In [47]:
print(len(x))

5


In [48]:
print('ddd' in x)
print('ddd' in x[1])
print('ddd' in x[1][1])

False
False
True


## list v.s string (串列與字串)

In [38]:
# 直接對 string 操作
print('If Comrade Napoleon says it, it must be right.'[::-1])

.thgir eb tsum ti ,ti syas noelopaN edarmoC fI


In [39]:
strs = 'helloworld'
print(strs[0:5])
strs = list(strs)
print(strs)
strs = ''.join(strs)
print(strs)

hello
['h', 'e', 'l', 'l', 'o', 'w', 'o', 'r', 'l', 'd']
helloworld


# tuple

In [66]:
# tuple 元組：()

## tuple vs. list: 
#  1. tuple 生成後不可修改；list 生成後可以修改 (區別：記憶體能否動態配置)
#  2. tuple 的處理效能會優於 list，但 list 的彈性會優於 tuple

In [67]:
## 宣告方式
tup1 = ()
type(tup1)

tuple

In [68]:
tup2 = tuple()
type(tup2)

tuple

In [69]:
tup3 = ('physics', 'chemistry', 1997, 2000)
tup3

('physics', 'chemistry', 1997, 2000)

In [70]:
# tuple 2 list
list(tup1)     # tuple 2 list

[]

In [72]:
# list 2 tuple
tuple(tup1)     # list 2 tuple

()

# dict (字典)

字典顧名思義就是一個 key 對應一個 value，key 是唯一的。

語法剖析：
- 用一對大括弧 `{}` 來表示一個 dict 的開始與結束
- 每一個元素都是一組 key-value
- key 即是索引，每個索引對到一個值
- key 與 value 中間用冒號隔開，每組之間用逗號隔開

In [50]:
# 建立一個字典並且放入值
stores = {'apple': 10, 'cake': 5}
print(stores)

{'apple': 10, 'cake': 5}


In [51]:
# 新增一個值到字典
stores['orange'] = 10
print(stores)

{'apple': 10, 'cake': 5, 'orange': 10}


In [52]:
# 另一種新增職的方法
stores.setdefault('juice', 12)
print(stores)

{'apple': 10, 'cake': 5, 'orange': 10, 'juice': 12}


In [54]:
# 更改某一個字典 key 得值
stores.setdefault('apple', 12)
print(stores)
stores['apple'] = 12
print(stores)

{'apple': 10, 'cake': 5, 'orange': 10, 'juice': 12}
{'apple': 12, 'cake': 5, 'orange': 10, 'juice': 12}


In [56]:
# 取出某個 key 值得兩種方法
print(stores['apple'])
print(stores.get('apple'))

12
12


In [57]:
# 刪除某個 key 值接著把它新增回去
stores.pop('apple')
print(stores)
stores['apple'] = 12
print(stores)

{'cake': 5, 'orange': 10, 'juice': 12}
{'cake': 5, 'orange': 10, 'juice': 12, 'apple': 12}


In [58]:
# 將某個字典加入
stores.update({'beer': 20, 'win': 2})
print(stores)

{'cake': 5, 'orange': 10, 'juice': 12, 'apple': 12, 'beer': 20, 'win': 2}


In [59]:
# 刪除某個 key 值得另外一種方法
del stores['apple']
print(stores)

{'cake': 5, 'orange': 10, 'juice': 12, 'beer': 20, 'win': 2}


In [60]:
# 印出所有key 印出所有 values
print(stores.keys())
print(stores.values())

dict_keys(['cake', 'orange', 'juice', 'beer', 'win'])
dict_values([5, 10, 12, 20, 2])


In [61]:
# 使用 for loop 印出每個字典的 key, value
for k, v in stores.items():
    print(k, '-->', v)

cake --> 5
orange --> 10
juice --> 12
beer --> 20
win --> 2


In [62]:
# 字典裡的 value 可以為任何資料型態
user = {'Tom': ['M','16'], 'Mary': ['Female', '17']}
print(user)

{'Tom': ['M', '16'], 'Mary': ['Female', '17']}


# Set

In [63]:
# 建立兩個 set，一個為空一個有值
admins = set()
users = {'Smile', 'Tony','Happy','Sherry','Allen','Andy', 'Mars'}
print(type(users), users)

<class 'set'> {'Sherry', 'Andy', 'Allen', 'Mars', 'Happy', 'Smile', 'Tony'}


In [64]:
# 新增值到空 set
admins.add('ihc')
admins.add('Mars')

In [65]:
# 對 set 做運算子
print(admins & users)
print(admins | users)
print(admins ^ users)
print(admins - users)
print(users - admins)

{'Mars'}
{'ihc', 'Sherry', 'Andy', 'Allen', 'Mars', 'Happy', 'Smile', 'Tony'}
{'Sherry', 'ihc', 'Andy', 'Allen', 'Smile', 'Happy', 'Tony'}
{'ihc'}
{'Sherry', 'Andy', 'Allen', 'Happy', 'Smile', 'Tony'}
