這章節來討論以下主題
* 資料組與具名資料組
* 字典
* 清單與組
* 如何與為何擴充內建物件
* 三種佇列

# 空物件
---
讓我們從最基本的  
在前面章節看過許多次的  
曾經建構不少物件類別的 Object 開始  

In [3]:
o = object()
o.x = 5

AttributeError: 'object' object has no attribute 'x'

發現 object 物件並不能給予或初始化任何屬性  
這是 Python 預設的  
這麼做的目的是為了節省記憶體  
Python 允許物件具有含糊的屬性  
也需要一定數量的記憶體來紀錄每個物件有什麼屬性、屬性名稱與屬性的值  
  
假如 程式設計師 想要在自己創造的 class 物件中限制不得隨意創造屬性  
可以參考 `__slot__` 魔法


# 資料組與具名資料組
---
資料組 tuple  
資料組是可以依序儲存特定數量其他東西的物件  
他是不可變的  
我們不能在其身上新增、刪除或替換  
資料組不可變的特性的主要好處是我們可以用它做為字典的鍵(key)或其他需要有雜湊(hash)的地方  

In [6]:
# 建立資料組 tuple
stock = 'FB', 75.00, 75.03, 74.90
stock2 = ('FB', 75.00, 75.03, 74.90)

# 以上兩個方法都是建立 tuple
# 個人強烈建議 使用下方有括弧的
# 因為要將資料組用於其他物件中的話，括弧是必要的，不然直譯器不知道她是 tuple 還是參數

我們也可以用 slice 方法來讀取 tuple 內的資料

In [7]:
stock[1:3]

(75.0, 75.03)

這個範例同時展現了 tuple 的彈性與缺點   
那就是不可讀  
若程式上沒有註解或文件    
其他人不會知道 index 1, 2 存的是什麼資料   
我們來看看下一節 具名 tuple 的功用   

# 具名資料組
---
顧名思義  
就是給 tuple 的每個 index 賦予變數名稱  
方便描述這個資料組裡存的是什麼資料  

In [13]:
from collections import namedtuple
Stock = namedtuple("Stock","symbol, current, high, low")
stock = Stock("FB", 75.00, high=75.03, low=74.90)

namedtuple 接受兩個參數  
第一個是 具名資料組 的名稱  
第二個是 具名資料組的 屬性字串

In [12]:
print(stock)
print(stock.high)
symbol, current, high, low = stock
print(current)

Stock(symbol='FB', current=75.0, high=75.03, low=74.9)
75.03
75.0


# 字典
---
字典是很有用的容器  
能讓程式設計師直接將 物件 或 值 對應到 其他物件 或 其他值 上
   
字典對於以特定鍵物件(key)來查詢對應的值是非常有效率的  
字典可使用 dict() 或 {} 來建構



In [15]:
stocks = {
    "GOOG": (613.30, 625.86, 610.50),
    "MSFT": (30.25, 30.70, 30.19)
}

print(stocks["GOOG"])
print(stocks["RIM"])

(613.3, 625.86, 610.5)


KeyError: 'RIM'

如果鍵不在字典裡  
則會拋出錯誤(例外)  
我可以用 `get` 方法來處理

In [17]:
try:
    print(stocks["GOOG"])
    print(stocks["RIM"])
except Exception as e:
    print(stocks.get("RIM","NOT FOUND"))

(613.3, 625.86, 610.5)
NOT FOUND


更進一步  
可以用 `setdefault` 方法  
如果鍵在字典中  
則會回傳在字典中儲存的值  
若鍵不在字典中  
則會在字典中 建立一個鍵 並對應到與我們在 setdefault 方法中所給定的值參數  

In [18]:
print(stocks.setdefault("GOOG","invalid")) #會回傳GOOG的資料
print(stocks.setdefault("BBRY",(10.50, 10.62, 10.39))) #字典中沒有BBRY，建立一個BBRY並對應到(10.50, 10.62, 10.39)

(613.3, 625.86, 610.5)
(10.5, 10.62, 10.39)


另外三個非常有用的方法是  
`keys()`, `values()` 與 `items()`  
`keys()`會回傳字典裡所有的 鍵  
`values()`會回傳字典裡所有的 值  
`items()`則會回傳每個`(key, value)`

In [22]:
print(stocks.items())
for stock, values in stocks.items():
    print(f'{stock} last value is {values[0]}')

dict_items([('GOOG', (613.3, 625.86, 610.5)), ('MSFT', (30.25, 30.7, 30.19)), ('BBRY', (10.5, 10.62, 10.39))])
GOOG last value is 613.3
MSFT last value is 30.25
BBRY last value is 10.5


要更新字典裡某個鍵(key)的值時(value)  
如下作法  
只要直接賦予新的值給該 鍵   
就行了

In [24]:
stocks['GOOG'] = (597.63, 610.00, 596.28)
stocks['GOOG']

(597.63, 610.0, 596.28)

字串是常用的鍵  
不過我們也可以使用tuple、數字、自訂物件作為字典的鍵

In [25]:
random_keys = {}
random_keys["astring"] = "something"
random_keys[5] = "aninteger"
random_keys[25.2] = "floats work, too"
random_keys[("abc",123)] = "So do tuple"

class AnObject:
    def __init__(self,avalue) -> None:
        self.avalue = avalue

my_object = AnObject(14)
random_keys[my_object] = "We can even store objects"
my_object.avalue = 12
try:
    random_keys[[1,2,3]] = "we can't store lists though"
except Exception as e:
    print("unable to store list\n")

for key, value in random_keys.items():
    print(f"{key} has value {value}")

unable to store list

astring has value something
5 has value aninteger
25.2 has value floats work, too
('abc', 123) has value So do tuple
<__main__.AnObject object at 0x00000263AF857508> has value We can even store objects


# 字典使用案例
---
字典的變化非常且有無數用途  
他有兩種主要使用方式  
首先是以鍵代表相似物件的不同實例的字典; 例如股票字典  
  
第二種設計是每個鍵代表單一結構的某種面向字典
(這部分完全看不懂書在寫什麼呵呵)

# 使用 defaultdict
---
我們已經看過如何使用 `setdefault` 來設定不存在的鍵的預設值  
但若每次在查詢必須設定預設值會有點無聊  
如果我們要撰寫計算一個句子中字母出現的程式  
我們可以這麼做  

In [27]:
from pprint import pprint
def letter_frequency(sentence):
    frequencies = {}
    for letter in sentence:
        frequency = frequencies.setdefault(letter, 0)
        frequencies[letter] = frequency + 1
    return frequencies

# 每次存取字典時都要檢查是否已存在鍵
# 若沒有則設為 0 才開始做計算

pprint(letter_frequency('hello'))

{'e': 1, 'h': 1, 'l': 2, 'o': 1}


In [28]:
# 當每次遇到空鍵都要執行設為0的動作
# 我們可以使用 defaultdict 這個字典

from collections import defaultdict

def letter_frequency(sentence):
    # 呼叫 defaultdict 並以 int 作為建構元
    # 若是 dict 遇到空鍵值 會自動回傳 0
    frequencies = defaultdict(int)
    for letter in sentence:
        frequencies[letter] += 1
    return frequencies

pprint(letter_frequency('hello'))

defaultdict(<class 'int'>, {'h': 1, 'e': 1, 'l': 2, 'o': 1})


`defaultdict` 不只可以用 int  
也可以用 list  
也就是說遇到空鍵值，會回傳空的 list  
我們也可以自組函式帶入 `defaultdict` 中  



In [29]:
from collections import defaultdict

num_items = 0
def tuple_counter():
    global num_items
    num_items += 1
    return (num_items, [])

d = defaultdict(tuple_counter)


In [30]:
d['a'][1].append("hello")
d['b'][1].append('world')
d

defaultdict(<function __main__.tuple_counter()>,
            {'a': (1, ['hello']), 'b': (2, ['world'])})

# 計數器
---


In [36]:
from collections import Counter

# 直接使用 Counter 做字母計數
pprint(Counter('hello'))

responses = [
    'vanilla',
    'chocolate',
    'vanilla',
    'vanilla',
    'caramel',
    'strawberry',
    'vanilla'
]

# Counter 還有好用的 most_common 方法
# 根據計數做排序，在用參數選擇要幾個排名
# 再用index方式直接回傳計數最多的項目
pprint(f'The children vote for {Counter(responses).most_common(1)[0][0]} ice cream')

Counter({'l': 2, 'h': 1, 'e': 1, 'o': 1})
'The children vote for vanilla ice cream'


# 清單
---

清單 List 是 Python 資料結構中最不物件導向的物件  
清單的各式運算能將他們轉換成計算功能瑞士刀  
  
寫 Python 很難不用到清單  
我們會討論何時應該使用清單以及他的物件本質  
  
在 Python 中
清單通常用於儲存多個「相同」型別物件的實例，例如字串清單 or 數字清單  
或者是自訂物件清單  
  
清單在需要修改內容時，不管是插入某個位置或刪除也都很容易  
Python 的清單使用非常有效率且精密調整過的內部資料結構  
讓我們思考要儲存什麼而不是如何儲存  
  
清單也是物件  
以下是常用的方法  
`append(element)` 將元素加到清單後面  
`insert(index, element)` 將元素插入到指定位置  
`count(element)` 告訴我們元素在清單中出現幾次  
`index()` 告訴我們項目在清單中的索引位置  
`find()` 跟 `index()` 一樣，找不到則拋回 `-1 `   
`reverse()` 將清單倒轉  
`sort()`  排序，有相當複雜的物件導向行為，接下來討論這個  

# 清單排序
---
`sort()`不用參數就能做出排序  
依字母順序，大寫在小寫前  
數字由小到大  
  
如果我們想要將自訂物件放進清單中進行排序  
我們必須做一點工作  
`__lt__`這個特殊方法表「小於」  
應該要定義在類別中讓該類別的實例可以進行比較  
清單的 `sort` 方法會存取每個物件上的這個方法來判別位置  
此方法應該在我們的類別小於傳入的參數時回傳True  


In [1]:
class WeirdSortee:
    def __init__(self, string, number, sort_num):
        self.string = string
        self.number = number
        self.sort_num = sort_num
    
    def __lt__(self, object):
        if self.sort_num:
            return self.number < object.number
        return self.string < object.string
    
    def __repr__(self):
        return f"{self.string}:{self.number}"

In [5]:
a = WeirdSortee('a',4,True)
b = WeirdSortee('b',3,True)
c = WeirdSortee('c',2,True)
d = WeirdSortee('d',1,True)
l = [a,b,c,d]
print(l)
l.sort()
print(l)

for i in l:
    i.sort_num = False
l.sort()
print(l)

[a:4, b:3, c:2, d:1]
[d:1, c:2, b:3, a:4]
[a:4, b:3, c:2, d:1]


`__lt__` 方法是排序唯一要實作的方法  
在技術上  
該類別也應該實作類似的 `__gt__`、`__eq__`、`__ne__`、`__ge__`、`__le__`  
讓運算元 <、>、==、!=、>=、<= 也能運作  
我們也可以在實作 `__lt__`、`__eq__` 後套用 `@total_ordering` 裝飾器取得其餘功能

In [6]:
from functools import total_ordering

@total_ordering
class WeirdSortee:
    def __init__(self, string, number, sort_num) -> None:
        self.string = string
        self.number = number
        self.sort_num = sort_num
    
    def __lt__(self, object):
        if self.sort_num:
            return self.number < object.number
        return self.string < object.string
    
    def __repr__(self):
        return f"{self.string}:{self.number}"

    def __eq__(self, o: object) -> bool:
        return all((
            self.string == o.string, 
            self.number == o.number,
            self.sort_num == o.sort_num
        ))

若我們想要自訂排序  
`sort()` 可以選用 `key` 參數  
譬如我們想要將所有字串都轉成小寫在進行排序  

In [10]:
l = ['hello','HELP','Helo']
l.sort()
print(l)
l.sort(key=str.lower)
print(l)

['HELP', 'Helo', 'hello']
['hello', 'Helo', 'HELP']


有幾個排序鍵很普遍所以Python有提供讓我們不必自行撰寫  
舉例來說  
以非清單中第一個index項目來對資料組排序  
我們可以使用 `operator.itemgetter` 方法

In [12]:
from operator import itemgetter

l = [('h',4), ('n',6), ('o',5), ('p',1), ('t',3), ('y',2)]
l.sort(key=itemgetter(1))
l

[('p', 1), ('y', 2), ('t', 3), ('h', 4), ('o', 5), ('n', 6)]

# 集合
---


清單是個多才多藝的工具  
但他們想確保清單中物件的唯一性則沒有用處  
集合可以解決這個問題  
  
在 Python 中  
集合不只能儲存數字  
也可以儲存可雜湊的物件  
可雜湊物件是可作為字典鍵的相同物件  
因此清單和字典不能儲存在集合裡  
如同數學上的集合  
每個物件只能儲存一份  

In [2]:
song_library = [
    ("Phantom of The Opera", "Sarah Brightman"),
    ("Knocking On Heaven's Door", "Guns N' Roses"),
    ("Captain Nemo", "Sarah Brightman"),
    ("Patterns In the Ivy", "Opeth"), 
    ("November Rain", "Guns N' Roses"), 
    ("Beautiful", "Sarah Brightman"), 
    ("Mal's Song", "Vixy and Tony"), 
]

In [4]:
artists = set()
for song, artist in song_library:
    artists.add(artist)

print(artists)

{'Opeth', 'Vixy and Tony', "Guns N' Roses", 'Sarah Brightman'}


集合也可以像清單和字典一樣用內鍵語法  
使用大括弧 `{ }` 即可  
如果是一個鍵+冒號+值+逗點作為字典  
如果大括號內全部都是值並以逗點分隔  
就變成 set 了

我們可以觀察到  
set 印出來的東西可能與加入集合的順序不同  
是因為他們在雜湊中為了求效率而這樣排列  
因此集合也沒有索引值  
集合的目的就只是把東西分成兩群  
分為 集合內的東西 與 集合外的東西  
若想排序  
就必須把集合轉回清單  

In [5]:
'Opeth' in artists


True

In [6]:
for artist in artists:
    print(f'{artist} plays good music')

Opeth plays good music
Vixy and Tony plays good music
Guns N' Roses plays good music
Sarah Brightman plays good music


In [7]:
alphabetical = list(artists)
alphabetical.sort()
alphabetical

["Guns N' Roses", 'Opeth', 'Sarah Brightman', 'Vixy and Tony']

集合最常用的包括聯集交集與對稱差集  
範例如下  


In [11]:
my_artists = {'Opeth', 'Vixy and Tony', "Guns N' Roses", 'Sarah Brightman'}
auburns_artists = {"Nickelback", "Guns N' Roses", "Savage Garden"}

print(f'All: {my_artists.union(auburns_artists)}')
print(f'Both: {my_artists.intersection(auburns_artists)}')
print(f'Either but not both: {my_artists.symmetric_difference(auburns_artists)}')

All: {"Guns N' Roses", 'Savage Garden', 'Opeth', 'Vixy and Tony', 'Nickelback', 'Sarah Brightman'}
Both: {"Guns N' Roses"}
Either but not both: {'Opeth', 'Vixy and Tony', 'Savage Garden', 'Nickelback', 'Sarah Brightman'}


集合常用的還有判斷  
某集合是不是屬於某集合  
或是某集合是不是某集合的超集合  

In [20]:
my_artists = {'Opeth', 'Vixy and Tony', "Guns N' Roses", 'Sarah Brightman'}
bands = {"Guns N' Roses", "Opeth"}

def printsetfunction(x,y):
    print(f"{x} is to {y}")
    print(f"issuperset: {x.issuperset(y)}")
    print(f"issubet: {x.issubset(y)}")
    print(f"difference: {x.difference(y)}")
    print('*'*20)

printsetfunction(my_artists, bands)
printsetfunction(bands, my_artists)

{'Opeth', 'Vixy and Tony', "Guns N' Roses", 'Sarah Brightman'} is to {'Opeth', "Guns N' Roses"}
issuperset: True
issubet: False
difference: {'Vixy and Tony', 'Sarah Brightman'}
********************
{'Opeth', "Guns N' Roses"} is to {'Opeth', 'Vixy and Tony', "Guns N' Roses", 'Sarah Brightman'}
issuperset: False
issubet: True
difference: set()
********************


# 擴充內建
---
第三章稍微簡單討論過  
現在進一步討論細節  
當我們的內建物件想增加功能時  
我們可以建構新的物件  
或是繼承內建物件並加上或改寫方法  
  
物件中利用雙底線方法，稱為特殊方法    
可使整個程式變得更簡潔變得更沒那麼物件導向  
例如  

In [21]:
class SillyInt(int):
    def __add__(self, num):
        return 0

a = SillyInt(1)
b = SillyInt(2)
a + b

0

透過 `__add__` 讓物件在做相加時  
不必再透過呼叫方法  
而是利用 `+` 號即可  
使得整個更為簡單易懂

對所有特殊方法來說都是透過雙底線來實現  
例如我們想要使用 `x in myobj` 我們可以實作 `__contains__`  
若想要使用 `myobj[i] = value` 我們可以提供 `__setitem__` 語法  
若想要使用 `something = myobj[i]` 我們可以提供 `__getitem__` 語法  
在list類別中  
有33個這樣的特殊方法

In [22]:
dir(list)

['__add__',
 '__class__',
 '__contains__',
 '__delattr__',
 '__delitem__',
 '__dir__',
 '__doc__',
 '__eq__',
 '__format__',
 '__ge__',
 '__getattribute__',
 '__getitem__',
 '__gt__',
 '__hash__',
 '__iadd__',
 '__imul__',
 '__init__',
 '__init_subclass__',
 '__iter__',
 '__le__',
 '__len__',
 '__lt__',
 '__mul__',
 '__ne__',
 '__new__',
 '__reduce__',
 '__reduce_ex__',
 '__repr__',
 '__reversed__',
 '__rmul__',
 '__setattr__',
 '__setitem__',
 '__sizeof__',
 '__str__',
 '__subclasshook__',
 'append',
 'clear',
 'copy',
 'count',
 'extend',
 'index',
 'insert',
 'pop',
 'remove',
 'reverse',
 'sort']

想知道以上方法，可以使用 `help` 函式