字典型別是我們這系列學習的最後一個 Python 語法，  
他有時候比串列更適合處理某些情境：

# 字典 (dictionary)


<img src="https://cdn.pixabay.com/photo/2018/01/23/13/25/book-3101450_1280.jpg" width="30%"/>


- 字典用「成對的」大括號「`{}`」包住裡面的元素，元素間用「`,`」隔開
    - 在實務上會為了方便我們手動增加元素，最後面的元素也會加「`,`」
- 字典裡的每個元素是 key
- key 需要有對應的 value
- key 跟 value 的對應是用「`:`」表示
- key 需為不可變物件 (e.g. int、float、str)，且需唯一
    - 也就是說，同樣一個 key ，不會指到不同的 value



In [None]:
dict_example = {
    "A": 20,
    "B": 25,
    "C": 10,
}

### 字典的長度：有幾組元素
- 字典裡的每個元素是 key
- 簡單的說，有幾個 key 就有幾組元素

In [None]:
dict_example = {
    "A": 20,
    "B": 25,
    "C": 10,
}
print(len(dict_example))

3


### 字典的布林型別
- 可以判斷是否為空字典

In [None]:
dict_example = {
    "A": 20,
    "B": 25,
    "C": 10,
}
dict_empty = {}

print(bool(dict_example))
print(bool(dict_empty))

True
False


## 取得字典的資料
```python
字典[key]
```
字典以鍵值 key 去取資料 value，很像是串列可以用索引 index 去取這個索引值位置的 value

In [None]:
dict_example = {
    "A": 20,
    "B": 25,
    "C": 10,
}
print(dict_example["B"])

25


In [None]:
list_example = [20,25,10,]
print(list_example[1])

25


### 用不存在的 key 取用字典的資料

In [None]:
dict_example = {
    "A": 20,
    "B": 25,
    "C": 10,
}
print(dict_example["D"])

KeyError: 'D'

### [練習] 物流狀態查詢系統
網路購物通常可以用物流編號去查詢現在這個商品的寄送狀態，  
物流編號是唯一值，所以我們可以用物流編號當成字典的 key，對應到的物流狀態當成 value，  
來儲存所有的物流商品跟其物流狀態：
- 物流編號 TW92212567 的狀態為「賣家已寄出」
- 物流編號 TW92212568 的狀態為「賣家已寄出」
- 物流編號 TW92212569 的狀態為「到達物流中心」
- 物流編號 TW92212570 的狀態為「商品配送中」
- 物流編號 TW92212571 的狀態為「已送達」


請用字典取值的方式，印出物流編號 TW92212569 的物流狀態
```
到達物流中心
```

In [None]:
package_status_dict = {
    "TW92212567": "賣家已寄出",
    "TW92212568": "賣家已寄出",
    "TW92212569": "到達物流中心",
    "TW92212570": "商品配送中",
    "TW92212571": "已送達"
}
print(package_status_dict[_______])

#### [練習] 物流狀態查詢系統 - 模擬查詢介面
前面我們直接用指定的物流編號對字典取值，但我們真實世界中，物流編號是隨使用者輸入而更換，用以上的程式碼不夠彈性。  
回顧一下之前我們使用 [`input`](https://colab.research.google.com/drive/1l9fv5A2EThLIkUlVHA0VahgosnWKkTi7#scrollTo=zu8-NrcYinlJ) 讓使用者輸入資料，我們會貼一個命名標籤到我們想要查詢的資料上。  
  
這裡我們使用 `package_num` 當命名標籤，這個命名標籤綁定物流編號 TW92212569(字串)。  
請改寫我們原本的程式碼，改用標籤`package_num`去跟字典取值，也就是拿到物流編號 TW92212569 的物流狀態「到達物流中心」 ：

In [None]:
package_num = "TW92212569"
package_status_dict = {
    "TW92212567": "賣家已寄出",
    "TW92212568": "賣家已寄出",
    "TW92212569": "到達物流中心",
    "TW92212570": "商品配送中",
    "TW92212571": "已送達"
}
print(package_status_dict[_______])

如果用串列實作，程式碼會長的像這樣

In [None]:
package_status_list = [
    ["TW92212567", "賣家已寄出"],
    ["TW92212568", "賣家已寄出"],
    ["TW92212569", "到達物流中心"],
    ["TW92212570", "商品配送中"],
    ["TW92212571", "已送達"],
]
# 印出物流編號 TW92212569 的狀態
for package in package_status_list:
    package_num = package[0]
    package_status = package[1]
    if package_num == "TW92212569":
        print(package_status)

到達物流中心


### [補充練習] 計算庫存
水果庫存、價格都以字典型別儲存，  
請計算若水果都賣出後，可賺進多少錢？(答案是 `235`)  



In [None]:
stock={
    "banana":5,
    "apple":3,
    "orange":10,
}
price={
    "banana":5,
    "apple":20,
    "orange":15,
}

revenue = 0
revenue += stock["____"] * price["____"]
revenue += stock["____"] * price["____"]
revenue += stock["____"] * price["____"]
print(revenue)

## 更改字典的資料
字典是可變物件
```python
字典[key] = 物件
```

字典以鍵值 key 去指向資料， 如果 key 存在會指向新值。

In [None]:
dict_example = {
    "A": 20,
    "B": 25,
    "C": 10,
}
print(id(dict_example))
dict_example["C"] = 15
dict_example["B"] +=5     #  dict_example["B"] = dict_example["B"]+5
print(dict_example)
print(id(dict_example))

139768994820160
{'A': 20, 'B': 30, 'C': 15}
139768994820160


In [None]:
list_example = [20,25,10]
list_example[2] = 15
list_example[1] += 5       #  list_example[1] = list_example[1]+5
print(list_example)

[20, 30, 15]


字典以鍵值 key 去指向資料， 如果 key 不存在會加入此 key 與對應的 value。

In [None]:
dict_example = {
    "A": 20,
    "B": 25,
    "C": 10,
}
print(id(dict_example))
dict_example["D"] = 30
print(dict_example)
print(id(dict_example))

132711431870080
{'A': 20, 'B': 25, 'C': 10, 'D': 30}
132711431870080


In [None]:
list_example = [20,25,10]
list_example.append(30)
print(list_example)

[20, 25, 10, 30]


### [練習] 物流系統更新
物流系統總是會有新的物流商品加入，既有的商品的物流狀態也會更新。  
延續之前物流系統練習題，此系統有兩筆新的更動：  
- 物流編號 TW92212568 的狀態改為 「到達物流中心」
- 新增一筆物流編號 TW92212572，物流狀態為「賣家已寄出」

請用更改字典資料的語法去更新此物流系統的資料。

In [None]:
package_status_dict = {
    "TW92212567": "賣家已寄出",
    "TW92212568": "賣家已寄出",
    "TW92212569": "到達物流中心",
    "TW92212570": "商品配送中",
    "TW92212571": "已送達"
}

package_status_dict[_____] = _______
package_status_dict[_____] = _______

print(package_status_dict["TW92212568"]) # 印出結果應該要為 "到達物流中心"
print(package_status_dict["TW92212569"]) # 印出結果應該要為 "到達物流中心"
print(package_status_dict["TW92212572"]) # 印出結果應該要為 "賣家已寄出"

如果用串列實作，程式碼會長的像這樣

In [None]:
package_status_list = [
    ["TW92212567", "賣家已寄出"],
    ["TW92212568", "賣家已寄出"],
    ["TW92212569", "到達物流中心"],
    ["TW92212570", "商品配送中"],
    ["TW92212571", "已送達"],
]
# 更改物流編號 TW92212568 的狀態
for package in package_status_list:
    package_num = package[0]
    if package_num == "TW92212568":
        package[1]="到達物流中心"

# 新增物流編號 TW92212572，物流狀態為「賣家已寄出」
package_status_list.append(["TW92212572", "賣家已寄出"]) # 要小心編號跟物流狀態不要放相反

# 印出物流編號 TW92212568 的狀態
for package in package_status_list:
    package_num = package[0]
    package_status = package[1]
    if package_num == "TW92212568":
        print(package_status)

# 印出物流編號 TW92212569 的狀態
for package in package_status_list:
    package_num = package[0]
    package_status = package[1]
    if package_num == "TW92212569":
        print(package_status)

# 印出物流編號 TW92212572 的狀態
for package in package_status_list:
    package_num = package[0]
    package_status = package[1]
    if package_num == "TW92212572":
        print(package_status)

到達物流中心
到達物流中心
賣家已寄出


從以上字典的練習跟如果用串列實作的比較，  
應該可以感受到字典好用之處了吧～

# 字典的迭代
- 字典也是個可迭代者
- 字典的每一個元素是 key


不確定資料內容的話，就先用[迴圈](https://colab.research.google.com/drive/1LBMZL2hCUP30yFdPC1wsOnd8fOWo90Jf)把資料裡面的元素一個個取出來，  
可以隨意給一個命名標籤(e.g. `ele`)，看完資料樣貌再給合適的名稱。

In [None]:
dict_example = {
    "A": 20,
    "B": 25,
    "C": 10,
}
for ele in dict_example:
    print(ele)

A
B
C


發覺印出來的結果就是字典的 key，所以把 `ele` 改名為 `key` 比較好理解

In [None]:
dict_example = {
    "A": 20,
    "B": 25,
    "C": 10,
}
for key in dict_example:
    print(key)

A
B
C


In [None]:
dict_example = {
    "A": 20,
    "B": 25,
    "C": 10,
}
for key in dict_example:
    print(key, type(key)) # 這裡的 key 是字串型別

A <class 'str'>
B <class 'str'>
C <class 'str'>


使用 key 去跟字典拿 value

In [None]:
dict_example = {
    "A": 20,
    "B": 25,
    "C": 10,
}
for key in dict_example:
    # print(key, dict_example[key])
    print(dict_example[key])

20
25
10


上述的操作等同於

In [None]:
dict_example = {
    "A": 20,
    "B": 25,
    "C": 10,
}
key = "A"
print(dict_example[key]) # dict_example["A"]
key = "B"
print(dict_example[key]) # dict_example["B"]
key = "C"
print(dict_example[key]) # dict_example["C"]

20
25
10


``` python
for key in dict_example:
    print(dict_example[key])
```
為什麼中括號裡面填的是「`key`」 而不是「`"key"`」？    
原因是前後有單雙引號指的是字串，而不是命名標籤。  
在迴圈的語法中，`key` 是我們給 `dict_example` 的每一個元素的「命名標籤」。  
所以會如同上面分解版：
- 第一次 `key = "A"`
- 第二次 `key = "B"`
- 第三次 `key = "C"`
  

`key` 這個標籤每次對應到的就是一個字串型別的物件(`"A"`, `"B"`, `"C"`)，所以不需要前後加雙引號。  
回顧一下[物件命名](https://colab.research.google.com/drive/1l9fv5A2EThLIkUlVHA0VahgosnWKkTi7#scrollTo=2IyeFGp-Med8)，語法中命名標籤前後也都沒有單雙引號。
```
a = 10
url = "https://pyladies.com/"
```

In [None]:
dict_example = {
    "A": 20,
    "B": 25,
    "C": 10,
}
for key in dict_example:
    print(dict_example["key"]) # 寫成 "key" 代表的意思是，字典 dict_example 有幾個元素，我就做幾次 用 "key" 這個字串 當成 key 去跟字典拿值
                               # 而我們的字典 dict_example 沒有一個 key 是 "key" 這個字串 (只有字串 "A", "B", "C")
                               # 所以程式碼會錯誤，告訴你 Key Error

KeyError: 'key'

## [練習] 物流系統清點
如果我是一家物流公司，我想知道現在還有多少物流項目，以及對應的狀態：
```
物流編號 TW92212567 狀態是 賣家已寄出
物流編號 TW92212568 狀態是 賣家已寄出
物流編號 TW92212569 狀態是 到達物流中心
物流編號 TW92212570 狀態是 商品配送中
物流編號 TW92212571 狀態是 已送達
```

> #### Hint:
> 不確定迭代對象(在這裡是字典 `package_status_dict`) 內容的話，  
> 可以用[迴圈](https://colab.research.google.com/drive/1LBMZL2hCUP30yFdPC1wsOnd8fOWo90Jf)把資料裡面的元素先一個個取出來(字典裡面的每一個元素都是 key)，暫時給一個標籤名稱，然後將其印出(參考前面的講義範例)。  
> 確認內容之後可以再改成一個更容易理解的標籤名稱，然後用其去跟字典拿我們想要的資料。  
> (標籤名稱是給 key 的, 就算 key 指向字串，標籤名稱前後也是不用加雙引號的)

In [None]:
package_status_dict = {
    "TW92212567": "賣家已寄出",
    "TW92212568": "賣家已寄出",
    "TW92212569": "到達物流中心",
    "TW92212570": "商品配送中",
    "TW92212571": "已送達"
}

for ________ in package_status_dict:
    package_status = ________[________]
    print(f"物流編號 {________} 狀態是 {package_status}")

### [練習] 物流系統清點: 列出需派送項目
如果我想知道這些物流項目中，哪些需要派車處理，  
e.g. 「已送達」的是不需要派車的，也就是物流狀態 **不是「已送達」**的都需要列出：

```
物流編號 TW92212567 需要派車
物流編號 TW92212568 需要派車
物流編號 TW92212569 需要派車
物流編號 TW92212570 需要派車
```


> #### Hint:
> - 因為商品的狀態是在字典中，要迭代才能拿到商品狀態，所以判斷式要放在迴圈中
> - 字串是否相等：[比較運算](https://colab.research.google.com/drive/1l9fv5A2EThLIkUlVHA0VahgosnWKkTi7#scrollTo=o9eiGRn5QC70)
> - [判斷式語法](https://colab.research.google.com/drive/1KGTmNzFhvjze3hUvm4i8EBfRyZs2ZxPj#scrollTo=WnXlBWzxBjJC)

In [None]:
package_status_dict = {
    "TW92212567": "賣家已寄出",
    "TW92212568": "賣家已寄出",
    "TW92212569": "到達物流中心",
    "TW92212570": "商品配送中",
    "TW92212571": "已送達"
}

for ________ in package_status_dict:
    package_status = ________[________]
    if _______:
        print(f"物流編號 {________} 需要派車")

### [進階練習] 物流系統清點-減少需派送項目
延續前面的題目，如果我想加上「商品配送中」物流狀態，也需要排除在派車的範圍中，要怎麼修改程式呢？

```
物流編號 TW92212567 需要派車
物流編號 TW92212568 需要派車
物流編號 TW92212569 需要派車
```

> #### Hint:
> 有兩種做法
> - 用[邏輯運算](https://colab.research.google.com/drive/1l9fv5A2EThLIkUlVHA0VahgosnWKkTi7#scrollTo=-VDQGsOsQRvq)的「而且」：如果狀態不是「已送達」**「而且」**也不是「商品配送中」
> - 有多個狀態是我們希望排除的，可以用串列儲存這些字串(在這裡就是兩個字串「已送達」、「商品配送中」)，  
然後判斷[字串是否存在於某些關鍵字清單中](https://colab.research.google.com/drive/1R7wB_1SO0mY2A8GOLhPLDM1HLm1lhqON#scrollTo=_p1XqK0Crbw3)，不存在的話才會印出需要派車


In [None]:
package_status_dict = {
    "TW92212567": "賣家已寄出",
    "TW92212568": "賣家已寄出",
    "TW92212569": "到達物流中心",
    "TW92212570": "商品配送中",
    "TW92212571": "已送達"
}

for ________ in package_status_dict:
    package_status = ________[________]
    if _______ and/or/not _______:
        print(f"物流編號 {________} 需要派車")

In [None]:
package_status_dict = {
    "TW92212567": "賣家已寄出",
    "TW92212568": "賣家已寄出",
    "TW92212569": "到達物流中心",
    "TW92212570": "商品配送中",
    "TW92212571": "已送達"
}

ignore_list = [____]
for ________ in package_status_dict:
    package_status = ________[________]
    if _______ _______ ignore_list:
        print(f"物流編號 {________} 需要派車")

## [補充練習] 迭代計算庫存
水果庫存、價格都以字典型別儲存，  
請計算若水果都賣出後，可賺進多少錢？(答案是 `235`)  

> #### Hint:
> - 庫存跟價格都有相同的 key，  
所以用其中一個字典的 key 也可以去存取另一個字典


In [None]:
stock={
    "banana":5,
    "apple":3,
    "orange":10,
}
price={
    "banana":5,
    "apple":20,
    "orange":15,
}

revenue = 0
for ____ in stock:
    revenue += stock[____] * price[____]
print(revenue)

### [補充練習] 迭代計算另一庫存系統
原先的系統如果庫存跟價格的 key 對不上(e.g. 有進貨西瓜，但忘了標價)，  
用既有的程式計算所有水果賣出的就會出錯。

除了可以在既有程式加上 key 是否有存在才做計算加總；  
也可以更改儲存方式，讓我們比較不容易忘記加該有的資料

> #### Hint:
> 先把資料直接丟入迴圈迭代，看會印出什麼元素～。  
確定拿到的元素是對的，再進行處理！  
(試試印出香蕉的庫存)


In [None]:
product = {
    "banana":{
        "stock":5,
        "price":5
    },
    "apple":{
        "stock":3,
        "price":20
    },
    "orange":{
        "stock":10,
        "price":15
    },
}
revenue = 0
for ____ in stock:
    revenue += product[____][____] * product[____][____]
print(revenue)

# 綜合應用

前面我們體驗到有時候以字典為儲存方式，會比串列方便，  
要把串列轉成字典，可以用迴圈將串列的元素一個個拿出來，  
選定裡面的元素哪個要當 key，其餘的當作 value，加入字典中。

In [None]:
package_status_list = [
    ["TW92212567", "賣家已寄出"],
    ["TW92212568", "賣家已寄出"],
    ["TW92212569", "到達物流中心"],
    ["TW92212570", "商品配送中"],
    ["TW92212571", "已送達"],
]
package_status_dict = {}
for package in package_status_list:
    package_num = package[0]
    package_status = package[1]
    package_status_dict[package_num] = package_status
print(package_status_dict)

{'TW92212567': '賣家已寄出', 'TW92212568': '賣家已寄出', 'TW92212569': '到達物流中心', 'TW92212570': '商品配送中', 'TW92212571': '已送達'}


而串列中的每個元素長度如果都一樣，可以用以下這種寫法更簡短

In [None]:
package_status_list = [
    ["TW92212567", "賣家已寄出"],
    ["TW92212568", "賣家已寄出"],
    ["TW92212569", "到達物流中心"],
    ["TW92212570", "商品配送中"],
    ["TW92212571", "已送達"],
]
package_status_dict = {}
for package_num, package_status in package_status_list:
    package_status_dict[package_num] = package_status
print(package_status_dict)

{'TW92212567': '賣家已寄出', 'TW92212568': '賣家已寄出', 'TW92212569': '到達物流中心', 'TW92212570': '商品配送中', 'TW92212571': '已送達'}


## 應用情境：瀏覽足跡
在平常網路上使用的服務都會收集我們瀏覽的資訊，
因為他的應用範圍非常廣：
- 計算熱門瀏覽商品
- 推薦：其他使用者也看過哪些其他商品
- 網站排名更改後使用者點擊率是否提升
- 瀏覽商品的會員若還沒購買，發送通知(email 或簡訊)提(推)醒(銷)
- 整理使用者行為：
    - 使用者瀏覽幾個頁面、瀏覽某個商品多久下單
    - 使用者瀏覽/觀看時間：推薦使用者「真的」有瀏覽的商品/影片，排除不小心滑到的
- ...

瀏覽足跡的樣貌會像是這樣，  
以下每一列資訊分別代表瀏覽時間、使用者(用戶或會員)、瀏覽商品：
```
19:00:05 userA productA
19:00:17 memberA productB
19:01:43 userA productB
19:02:21 userA productB
19:03:54 userB productC
19:05:39 userC productC
```

如果我們想要計算商品的點擊次數：  
這個可以應用在網頁中熱門瀏覽版面(哪些商品被看過最多次)，  
或是前面提到的判斷網頁排名是不是合適的(點擊率是否比改排名前高)

以目前的瀏覽足跡來看有三個商品，就需要有三個計數器：


In [None]:
# 計數前要先歸零
product_click_cnt_A = 0
product_click_cnt_B = 0
product_click_cnt_C = 0



而我們在每一個資料做計算的時候，都需要針對現在商品是什麼，而把對應的計數器 + 1

In [None]:
product = "productA"

if product == "productA":
    product_click_cnt_A+=1   # product_click_cnt_A = product_click_cnt_A + 1
elif product == "productB":
    product_click_cnt_B+=1
elif product == "productC":
    product_click_cnt_C+=1

print(product_click_cnt_A)
print(product_click_cnt_B)
print(product_click_cnt_C)

1
0
0


In [None]:
product = "productB"

if product == "productA":
    product_click_cnt_A+=1
elif product == "productB":
    product_click_cnt_B+=1
elif product == "productC":
    product_click_cnt_C+=1

print(product_click_cnt_A)
print(product_click_cnt_B)
print(product_click_cnt_C)

1
1
0


In [None]:
product = "productB"

if product == "productA":
    product_click_cnt_A+=1
elif product == "productB":
    product_click_cnt_B+=1
elif product == "productC":
    product_click_cnt_C+=1

print(product_click_cnt_A)
print(product_click_cnt_B)
print(product_click_cnt_C)

1
2
0


可以很明顯地看到，以上的操作方式很繁瑣。  
這個時候用字典可以很方便幫我們處理計數器：  
我們把商品名稱當成 key, 計數器當成 value


In [None]:
# 計數前要先歸零
product_click = {
    "productA":0,
    "productB":0,
    "productC":0,
}

In [None]:
product = "productA"
product_click[product] +=1   # product_click["productA"]+=1
print(product_click)

In [None]:
product = "productB"
product_click[product] +=1
print(product_click)

In [None]:
product = "productB"
product_click[product] +=1
print(product_click)

### [練習] 瀏覽足跡-點擊次數
有了字典幫我們當計數器，接下來我們需要把所有的瀏覽足跡，計數到 `product_click` 字典中。

以下有一串列，表示使用者在某段時間內點擊進入了哪些商品頁，  
串列的每一個元素也是一個串列，分別代表瀏覽時間、使用者(用戶或會員)、瀏覽商品，    
請幫我寫程式實作商品被瀏覽總數的計算：

```
商品 productA 的點擊次數為 1
商品 productB 的點擊次數為 3
商品 productC 的點擊次數為 2
```





> #### Hint:
> 我們要計算的是商品的點擊次數
也就是我們的程式瀏覽足跡迭代會做到
``` python
product_click["productA"] +=1
product_click["productB"] +=1
product_click["productB"] +=1
product_click["productB"] +=1
product_click["productC"] +=1
product_click["productC"] +=1
```
> - 有商品點擊的資料應該是 `logs`，所以要[迭代](https://colab.research.google.com/drive/1LBMZL2hCUP30yFdPC1wsOnd8fOWo90Jf?usp=sharing)的對象應該是 `logs`
> - 把串列 `logs`的一個個元素拿出來，而 `logs` 的每一個元素又是一個串列。  
而商品位在這個串列的末端，可以用[串列取值](https://colab.research.google.com/drive/1R7wB_1SO0mY2A8GOLhPLDM1HLm1lhqON#scrollTo=T9CeCnO6P9bY)的語法拿到。(或是用剛才講的[簡短寫法](#scrollTo=h25DyvThV9pf)拿到)
    - 如果還是不確定怎麼用迴圈拿每一個元素都是串列的值，可以參考[之前的講義的範例](https://colab.research.google.com/drive/1LBMZL2hCUP30yFdPC1wsOnd8fOWo90Jf#scrollTo=Mwqd7ifC2sY3)，一步步處理
> - 有了這個商品名稱，就可以此當 key，去計數器字典 `product_click` 更改他的 value：把原來的值+1

In [None]:
logs = [
    ["19:00:05", "userA", "productA"],
    ["19:00:17", "memberA", "productB"],
    ["19:01:43", "userA", "productB"],
    ["19:02:21", "userA", "productB"],
    ["19:03:54", "userB", "productC"],
    ["19:05:39", "userC", "productC"],
]

product_click = {
    "productA": 0,
    "productB": 0,
    "productC": 0
}

for ______ in ______:
    ______[______] +=1

for product in product_click:
    print(f"商品 {product} 的點擊次數為 {product_click[product]}")

#### [進階練習] 設定初始值
在前面的練習我們先開了上帝視角，知道有哪些商品在瀏覽足跡中，先把他設定在計數器的字典中。  
但實務上這並不太可能，這時會利用到判斷式：  
如果這個商品不在我的計數器字典中，我就把這個商品當成 key 加到字典中，預設值是 0 (`value = 0`)

In [None]:
logs = [
    ["19:00:05", "userA", "productA"],
    ["19:00:17", "memberA", "productB"],
    ["19:01:43", "userA", "productB"],
    ["19:02:21", "userA", "productB"],
    ["19:03:54", "userB", "productC"],
    ["19:05:39", "userC", "productC"],
]
product_click = {}        ### 實務上我們不會知道有哪些商品

for ______ in ______:
    if __ not in _____:   ### 比前面練習題增加的判斷式部分
        ____[______] = 0  ### 比前面練習題增加的判斷式部分
    ______[______] +=1

for product in product_click:
    print(f"商品 {product} 的點擊次數為 {product_click[product]}")

### 文字型的瀏覽足跡處理
實務上，瀏覽足跡都是以文字方式儲存，  
如同前面提到的，就會是以下的樣貌，  
每一列資訊分別代表瀏覽時間、使用者(用戶或會員)、瀏覽商品：

```
19:00:05 userA productA
19:00:17 memberA productB
19:01:43 userA productB
19:02:21 userA productB
19:03:54 userB productC
19:05:39 userC productC
```

要轉換成我們練習題中串列的樣貌：
```python
[
    ["19:00:05", "userA", "productA"],
    ["19:00:17", "memberA", "productB"],
    ["19:01:43", "userA", "productB"],
    ["19:02:21", "userA", "productB"],
    ["19:03:54", "userB", "productC"],
    ["19:05:39", "userC", "productC"],
]
```

#### 原始資料的樣貌
- 列與列之間是由「換行」`\n` 分隔
- 每一列的元素是以「空白」分隔  

#### 程式運作邏輯
- 用一空串列 `logs` 整理我們最後想要呈現的結果
- 先以「換行」切割成一列列的資料串列
- 迭代此串列，把每一列拿出
- 再把每一列用「空白」切割成 瀏覽時間、使用者、瀏覽商品
    - 要檢查是否切割後剛好有三個元素
- 把瀏覽時間、使用者、瀏覽商品組成一個串列加入 `logs` 中

In [None]:
log_text = """
19:00:05 userA productA
19:00:17 memberA productB
19:01:43 userA productB
19:02:21 userA productB
19:03:54 userB productC
19:05:39 userC productC
"""

logs = []
for row in log_text.split("\n"):
    row_eles = row.split(" ")
    if len(row_eles)==3:
        time, user, product = row_eles
        logs.append([time, user, product])

print(logs)
print()
for ele in logs:
    print(ele)

[['19:00:05', 'userA', 'productA'], ['19:00:17', 'memberA', 'productB'], ['19:01:43', 'userA', 'productB'], ['19:02:21', 'userA', 'productB'], ['19:03:54', 'userB', 'productC'], ['19:05:39', 'userC', 'productC']]

['19:00:05', 'userA', 'productA']
['19:00:17', 'memberA', 'productB']
['19:01:43', 'userA', 'productB']
['19:02:21', 'userA', 'productB']
['19:03:54', 'userB', 'productC']
['19:05:39', 'userC', 'productC']


### [進階練習] 推薦系統
一個服務如果有好的推薦系統，透過推薦我們商品/影片，  
可以讓我們在他們的服務中消費或是更黏著於他們的服務上(訂閱制收費)。  

通常推薦可以分為兩種：
- 看了這個商品的使用者還看了哪些商品
- 哪些商品/影片與使用者瀏覽的商品相似(e.g. 同樣都是筆電、都是懸疑片)

我們的瀏覽足跡，也可以組出「看了這個商品的使用者還看了哪些商品」的資料，  
樣貌會像這樣：

會先有一個記錄商品有哪些使用者瀏覽、瀏覽幾次的字典，  
這樣我們可以知道有哪些使用者跟我在瀏覽同樣一個商品：
```python
{
    "productA":{
        "userA":1
    },
    "productB":{
        "userA":2,
        "memberA":1
    },
    "productC":{
        "userB":1,
        "userC":1
    },
}
```

然後需要另一個以使用者為基底的字典，知道每位使用者瀏覽過哪些商品、瀏覽幾次：
```python
{
    "userA":{
        "productA":1,
        "productB":2,
    },
    "memberA":{
        "productB":1,
    },
    "userB":{
        "productC":1,
    },
    "userC":{
        "productC":1,
    },
}
```

這樣當你瀏覽一個商品，  
我們就可以利用第一個字典撈出這個商品有哪些使用者瀏覽，  
再去第二個字典查這個使用者還瀏覽了哪些商品。  
(e.g. 當我瀏覽了 productB，我就去找 userA 和 member A 還看了除了product B 的哪些商品)

我們可以練習將瀏覽足跡，轉換成以上兩個字典：

> #### Hint:
> - 這裡的資料結構是雙層字典
> - 第一層 key 對應的 value 初始值是字典
> - 第二層 key 對應的 value 初始值才是計次的 0

In [None]:
logs = [
    ["19:00:05", "userA", "productA"],
    ["19:00:17", "memberA", "productB"],
    ["19:01:43", "userA", "productB"],
    ["19:02:21", "userA", "productB"],
    ["19:03:54", "userB", "productC"],
    ["19:05:39", "userC", "productC"],
]
product_user_click = {}
user_product_click = {}

for time, user, product in logs:
    ### 處理第一個字典：商品有哪些使用者瀏覽
    if _____ not in product_user_click:
       product_user_click[_____] = {}
    if _____ not in product_user_click[_____]:
        product_user_click[_____][_____] = 0
    product_user_click[_____][_____] +=1

    ### 處理第二個字典：每位使用者瀏覽過哪些商品
    if _____ not in user_product_click:
       user_product_click[_____] = {}
    if _____ not in user_product_click[_____]:
        user_product_click[_____][_____] = 0
    user_product_click[_____][_____] +=1

### 看了 productB 的人還看了哪些其他商品
target = "productB"
for user in product_user_click[target]:
    for product in user_product_click[user]:
        if product != target:
            print(f"{product} ({user}瀏覽過)")

## [補充練習] 遊戲計分
我們有一串列是玩家的遊戲計分：  
第一回合：A 得 10 分、第二回合 B 得 5 分...，最後加總算每個人的分數是：
- A 的得分 19
- B 的得分 12
- C 的得分 25

> #### Hint:
> - 這裡可以用字典當成計分器，玩家應該會是 key，總得分是 value
> - 前面實作 `sum(全數字序列)` 的算法，在計算之前前需要把得分歸零，也就是 value 初始值為0
> - 玩家的計分是在 `scores`，所以要迭代的對象應該是 `scores`
> - 把串列 `scores`的一個個元素拿出來，而 `scores` 的每一個元素又是一個串列。  
而玩家是串列的第一個元素，每回合得分是第二個。
> - 有了玩家名稱，就可以此當 key，去計分字典 `user_score` 把原來的分數 value 加上這一局的得分

In [None]:
scores = [["A",10],["B",5],["C",23],["B",7],["A",6],["A",3],["C",2]]
user_score = {
    __:0,
    __:0,
    __:0
}
for ____ in scores:
    user_score[____] += ____


for user in user_score:
    print(f"{user}的得分{user_score[user]}")

## [補充練習] 會員儲值
有一個記錄會員的目前儲值金額的字典，  
而會員的儲值需求會透過串列傳入：  
串列的每一個元素都串列，第一個值代表會員名稱，第二個值代表要儲值的金額。

這個練習題希望你用迭代的方去處理資料讓：
- 會員 A 儲值 15 元，也就是儲值後 會員 A 總共有 35 元
- 會員 B 儲值 5 元，也就是儲值後 會員 B 總共有 30 元

> #### Hint:
> - 要拿到會員要儲值的金額應該是對串列做迭代
> - 可以先想一下，如果不用迭代，你會怎麼用怎樣的語法操作字典，   
> 讓會員 A 儲值 15 元，也就是儲值後 會員 A 總共有 35 元



In [None]:
member_money = {
    "A": 20,
    "B": 25,
    "C": 10,
}
add_moeny = [["A",15],["B",5]]
for name,money in ____:
    ___[___]+=____
print(member_money)

## 應用情境：正規化
- 星期、月份
- 中文數字 (eg. 三、參、叄)

In [None]:
datetime = "Oct 18"
month,date = datetime.split(" ")
month = month.replace("Oct","10")
format_date = f"{month}/{date}"
print(format_date)

10/18


In [None]:
datetime = "Oct 18"
month,date = datetime.split(" ")
month_dict = {
    #......
    "10":["Oct","October"],
    "11":["Nov","November"],
    "12":["Dec","December"],
}
for key in month_dict:
    print(key,month_dict[key])
    for keyword in month_dict[key]:
        if month==keyword:
            month = month.replace(month,key)
format_date = f"{month}/{date}"
print(format_date)

10 ['Oct', 'October']
11 ['Nov', 'November']
12 ['Dec', 'December']
10/18


# 更多字典的好用功能

## 同時拿到 key 與 value
```
字典.items()
```
- 回傳將 key 與 value 配對成以「[tuple 型別](https://docs.python.org/zh-tw/3/tutorial/datastructures.html#tuples-and-sequences)」為元素的可迭代者

In [None]:
dict_example = {
    "A": 20,
    "B": 25,
    "C": 10,
}
for key, value in dict_example.items():
    print(key, value)

A 20
B 25
C 10


### 應用情境-簡化寫法
- 不需要再用 key 去取值

In [None]:
datetime = "Oct 18"
month,date = datetime.split(" ")
month_dict = {
    #......
    "10":["Oct","October"],
    "11":["Nov","November"],
    "12":["Dec","December"],
}
for key in month_dict:
    print(key,month_dict[key])
    for keyword in month_dict[key]:
        if month==keyword:
            month = month.replace(month,key)
format_date = f"{month}/{date}"
print(format_date)

10 ['Oct', 'October']
11 ['Nov', 'November']
12 ['Dec', 'December']
10/18


In [None]:
datetime = "Oct 18"
month,date = datetime.split(" ")
month_dict = {
    #......
    "10":["Oct","October"],
    "11":["Nov","November"],
    "12":["Dec","December"],
}
for key, month_keywords in month_dict.items():
    print(key, month_keywords)
    for keyword in month_keywords:
        if month==keyword:
            month = month.replace(month,key)
format_date = f"{month}/{date}"
print(format_date)

10 ['Oct', 'October']
11 ['Nov', 'November']
12 ['Dec', 'December']
10/18


## 取不存在的 key 值
``` python
字典.get(key,預設值)
```
- 預設值為 None

In [None]:
dict_example = {
    "A": 20,
    "B": 25,
    "C": 10,
}
print(dict_example["D"])

KeyError: 'D'

In [None]:
dict_example = {
    "A": 20,
    "B": 25,
    "C": 10,
}
print(dict_example.get("D"))

None


In [None]:
dict_example = {
    "A": 20,
    "B": 25,
    "C": 10,
}
print(dict_example.get("D", 0))

0


### 應用情境：判斷式過於冗長

In [None]:
ticket_type="敬老票"
if ticket_type=="學生票":
    price=270
elif ticket_type=="敬老票":
    price=250
else:
    price=300
print(f"{ticket_type}價格為{price}")

敬老票價格為250


In [None]:
ticket_type="敬老票"
ticket_price = {"學生票":270,"敬老票":250}
price = ticket_price.get(ticket_type,300)
print(f"{ticket_type}價格為{price}")

敬老票價格為250
