# 序列 (Sequences)

我們已經學了「字串」，也知道他有很多好用的功能，  
現在我們要來學一個新的型別：「串列」。  
  
「字串」跟「串列」名字很相像，實際上他們也真的屬於一個更大集合的物件型別，叫做「序列」：
- 字串是每一個元素都是一個字元(字, 空白, 標點符號)
    - 可以把它想像成是只能載客輕軌，而且車廂大小給定就不能變更了
- 串列比起字串更為強大，每個元素都可以是不同型別
    - 他可以載貨也可以載客的火車，而且車廂長度可以增減

<table border="0" border="0" cellspacing="0" cellpadding="0">
<tr>
    <td>
<img src="https://khh.travel/Image/41466/?r=1668045924970" height="300vh"/>
    </td>
<td>
<img src="https://cdn.pixabay.com/photo/2018/06/22/21/48/train-3491706_960_720.jpg" height="300vh"/>
</td>
</tr>
<tr>
    <td><center>資料來源：<a href="https://khh.travel/" target="_blank">高雄旅遊網</a></center></td>
    <td></center></td>
</tr>

</table>

## 串列 (list)

- 用「成對的」中括號「`[]`」，將裡面的元素包住，元素間用「`,`」隔開
    - 在實務上會為了方便我們手動增加元素，最後面的元素也會加「`,`」
- 可以直接給定有值的串列，也可以給空串列
- 可以相+、相*


In [None]:
list_mix = ["a",2016,5566,"Python",]
list_empty = []
list_add = list_mix+[2016,2016.0]
list_multi = [1,2,3]*3
print(list_mix)
print(list_empty)
print(list_add)
print(list_multi)

['a', 2016, 5566, 'Python']
[]
['a', 2016, 5566, 'Python', 2016, 2016.0]
[1, 2, 3, 1, 2, 3, 1, 2, 3]


### 串列的布林型別
- 可以判斷是否為空串列

In [None]:
print(bool(list_mix))
print(bool(list_empty))

True
False


# 共通的序列操作方式

既然字串跟串列都屬於序列，有不少共通的功能可以使用：

## 取得序列的元素
```python
序列物件[索引]
```

- 此方式可以拿到序列該索引值對應的資料
- Python 中索引值是從0開始
- 索引可以是負數，如果是索引為 `-i`，會被當作拿取索引為「序列長度-`i`」的元素


In [None]:
list_example = ["a",2016,5566,"Python",2016,2016.0] # 這是一個長度為6的串列
print(list_example[3])    # 拿第四個元素(索引值為3)
print(list_example[-1])   # 拿倒數第一個元素(索引為6-1=5的元素)
print(list_example[-2])   # 拿倒數第二個元素(索引為6-2=4的元素)

Python
2016.0
2016


In [None]:
first_element = list_example[0]
print(first_element)

a


In [None]:
string_example = "Python" # 這是一個長度為6的字串
print(string_example[0])  # 拿第一個元素(索引值為0)
print(string_example[5])  # 拿第六個元素(索引值為5)
print(string_example[-1]) # 拿最後一個個元素(索引值為6-1=5)

P
n
n


### 索引值不能超過序列的長度


In [None]:
print(string_example[6])

IndexError: string index out of range

### [練習] 股票獲利
這裡有一支股票今天的每一小時價格變化，  
如果我的股票操作策略是，每天開盤的時候買，收盤的時候賣，  
我今天的獲利會是多少？  
(請不要直接 `print(1020-1025)`，試試看剛才學的串列取值)



In [None]:
stock_day_price = [1025, 1030, 1025, 1030, 1035, 1030, 1020]

### [補充練習] 身高差
這裡有一群按照身高排序的人，可以告訴我最高和最矮差了幾公分嗎？  
(請不要直接 print(192-145)，試試看剛才學的串列取值)

> #### Hint:
> - 因為身高是有排序過的，最矮是第一個元素，最高是最後一個  
=> 最後一個減第一個


In [None]:
people = [145,148,151,153,158,161,163,164,166,168,170,172,175,192]

顯而易見剛才的練習題開盤買、收盤賣絕對不是一個好的股票操作策略，  
像是今天明明有比開盤價更高的價錢，這時賣出會是賺錢，而不是原本的操作賠錢。  

那要怎麼知道今天的最高價呢？(也就是串列的最大值)

## 序列中的最大值、最小值
``` python
max(序列)
min(序列)
```


In [None]:
list_example = [3, 4, 2.1, 1]
print(max(list_example))
print(min(list_example))

4
1


In [None]:
string_example = "Python"
print(max(string_example))
print(min(string_example))

y
P


## 序列長度
``` python
len(序列)
```


In [None]:
list_example = ["a",2016,5566,"Python",2016,2016.0]
print(len(list_example))

6


In [None]:
string_example = "Python"
print(len(string_example))

6


## 全數字序列的總和
```
sum(全數字序列)
```


In [None]:
list_nums = [3, 4, 2.1, 1]
print(sum(list_nums))

10.1


In [None]:
string_example = "Python"
print(sum(string_example))

TypeError: unsupported operand type(s) for +: 'int' and 'str'

### [練習] 統計全班分數
請統計全班的成績狀況：

- 全班最高分與最低分的落差為？ (Ans. 58)
- 全班分數的平均為？ (Ans. 71.4285...)

> #### Hint:
> - 平均：學生分數總和/學生總數
> - 總數：序列長度
> - 最高分：序列最大值
> - 最低分：序列最小值

In [None]:
scores = [85,70,54,87,98,66,40]
diff_score = _____
avg_score = _____
print("全班分數落差為",diff_score)
print("全班平均為",avg_score)

# 串列與字串的轉換

## 全字序列的組合
``` python
字串 = 間隔字串.join(每一個元素都為字串的序列)
```
- 會產生一個新的字串
- 是將序列以某個字串組合起來
- 針對全字序列才有用

In [None]:
list_strs = ["Python","Tutorial","Workshop"]
print(" ".join(list_strs))

Python Tutorial Workshop


In [None]:
string_example = "Hello Python"
print(".".join(string_example))

H.e.l.l.o. .P.y.t.h.o.n


## 將字串切割成串列
``` python
串列 = 原字串.split(切割字串,最多切割次數)
```
- 將「原字串」以「切割字串」切割，產生一個新的「串列」(不改變原本字串)
- 最多切割次數預設為無限

In [None]:
string_example = "2024-10-09 08:24:13"
list_strs = string_example.split(" ")
print(string_example)
print(list_strs)

date = list_strs[0]
time = list_strs[-1] # list_string[1]
print(date)
print(time)

2024-10-09 08:24:13
['2024-10-09', '08:24:13']
2024-10-09
08:24:13


In [None]:
print(date.split("-",1))

['2024', '10-09']


### [練習] 取出日期的年月日
我們希望將前面取出的日期「2024-10-09」，能改以「2024年10月09日」呈現
> #### Hint:
> - 年月日是以「-」分隔，所以應該要用「-」去切割
> - 而原字串有兩個「-」，切割後應該會產生一個三個元素的串列。再用序列取值的方式分別拿到年、月、日

In [None]:
string_example = "2024-10-09 08:24:13"
list_strs = string_example.split(" ")
date = list_strs[0]

list_date_split = date.split(____)
# print(list_date_split)

year = _______[__]
month = _______[__]
day = _______[__]
print(f"{year}年{month}月{day}日")

### [進階練習] 找出分身 email 的真身
如果我們需要在某些系統需要註冊大量帳號(通常是以不同的email註冊)，  
而那個系統帳號是可以包含「`.`」在裡面，就可以用以下的小技巧：  

在 [Gmail](https://support.google.com/mail/answer/7436150?hl=zh-Hant) 中，會忽略使用者名稱(email`@`前面的部分)中的「`.`」 ，  
例如以下幾個 email 其實 Google 都是認為同一個，  
不管寄信到哪一個，都能收的到信：
- python.tutorial.workshop@gmail.com
- pythontutorialworkshop@gmail.com
- pythontutorial.workshop@gmail.com  
  
  
現在我們要來實作 Google 這樣的功能，找出真正要寄信的 email 信箱，  
以上面的例子來說，要寄的信箱是 `pythontutorialworkshop@gmail.com`，  
所以我們需要做的事：
- 拿到 email 的使用者名稱：`@`前面的部分
- 取代使用者名稱中所有的 「`.`」：會用到 [`replace`](https://colab.research.google.com/github/Python-Tutorial-Workshop/2025/blob/master/01_basicObject_IO.ipynb#scrollTo=Fqh9MBdGdxkd)
- 再把使用名稱 email domain (也就是包含 `@`後的資料) 組合起來(格式化字串)

In [None]:
origin_email = "python.tutorial.workshop@gmail.com"
email_account = _________
email_domain = _________
real_email = f"{email_account}@{email_domain}"
print(real_email)

# 子元素的檢查

## 判斷序列中是否存在某元素
```python
元素 in 序列
元素 not in 序列
```

In [None]:
list_example = ["a",2016,5566,"Python",2016,2016.0]
print(2016 in list_example)
print("2016" in list_example)

True
False


In [None]:
string_example = "Python Tutorial Workshop"

if "Python" in string_example:
    print("\"Python\" found")
if "python" in string_example:
    print("\"python\" found")
if "Workshop" in string_example:
    print("\"Workshop\" found")

"Python" found
"Workshop" found


### [練習] 判斷信件安全性
前面的範例，我們是用以下條件判斷網站的安全性：
- 如果信件內容的網址 `mail_link` 連結不是政府網站 (結尾不是 `.gov.tw`)，請印出「釣魚網站，請勿輸入個資」
-  如果信件內容的網址不是 `https` 開頭，請印出「非安全網站，請勿輸入個資」

而如果是詐騙信件，裡面除了會有連結到不安全的網站，還會有信件內文一些關鍵字可以嗅出端倪。  

現在我們已經知道如何判斷序列中是否存在某元素，  
可以來增加一個新條件，讓原來的程式可以擴充到也能從信件內文判斷這是一封詐騙信件：

- 如果信件內容出現「信息」、「賬戶」、「賬號」的關鍵字， 我們視為詐騙信件，就讓 `is_spam_mail_content` 設為 `True`
- 如果是詐騙信件 (`is_spam_mail_content` 為 `True`)，我們會印出「詐騙網站，請勿輸入個資」

> #### Hint:
- 有三個關鍵字
    - 你可以用[一組判斷式多個條件](https://colab.research.google.com/github/Python-Tutorial-Workshop/2025/blob/master/02_conditional.ipynb#scrollTo=WnXlBWzxBjJC)(因為最後都不符合的話 `is_spam_mail_content` 會為 `False`)
        - 一個 `if`, 很多個 `elif`, 最後會有 `else`
    - 可以用[邏輯運算](https://colab.research.google.com/github/Python-Tutorial-Workshop/2025/blob/master/01_basicObject_IO.ipynb#scrollTo=-VDQGsOsQRvq)的「或者」：有其中一個關鍵字 `is_spam_mail_content` 就要為 `True`
        - 可以配合 `()` 確保邏輯正確


<img src="https://drive.google.com/uc?id=1XAttb5sBdxyEtmk59EspGTI2pTXdetgt" width="45%"/>

In [None]:
# 使用 一個 if, 兩個 elif, 最後會有 else

mail_link = "https://www.nt-gov.bond"
# mail_link = "https://www.einvoice.nat.gov.tw"
mail_content = """
感謝您選擇財政部電子發票整合服務。由於載具信息核實有誤，您的中獎發票無法正常驗證，請更新您的資料。
1. 請點擊載具歸戶更新頁面，打開更新操作界面。
2. 輸入您的手機號碼和驗證密碼。
3. 選擇“更新載具歸戶”並完成操作。

請注意以下可能導致匯款失敗的情況：
1. 如果您提供的身份證號碼與指定收款賬戶所有人信息不一致，匯款可能會失敗。
2. 如果您取消了匯款服務設置或未能在領獎期限內（開獎日起6日至3個月內）提供正確的領獎信息，可能無法完成匯款，需自行承擔責任。
"""

# 有三個關鍵字: 這邊的填空只有兩個，請補上第三個
if ___________:
    is_spam_mail_content = True
elif ___________:
    is_spam_mail_content = True
else:
    is_spam_mail_content = False

warning_word = "，請勿輸入個資"
if not mail_link.endswith(".gov.tw"):
    print(f"釣魚網站{warning_word}")
if not mail_link.startswith("https"):
    print(f"非安全網站{warning_word}")
if is_spam_mail_content:
    print(f"詐騙網站{warning_word}")

In [None]:
# 使用 邏輯運算的「或者」 的語法，並用 () 確保邏輯正確: 會有三個條件需要串接

mail_link = "https://www.nt-gov.bond"
# mail_link = "https://www.einvoice.nat.gov.tw"
mail_content = """
感謝您選擇財政部電子發票整合服務。由於載具信息核實有誤，您的中獎發票無法正常驗證，請更新您的資料。
1. 請點擊載具歸戶更新頁面，打開更新操作界面。
2. 輸入您的手機號碼和驗證密碼。
3. 選擇“更新載具歸戶”並完成操作。

請注意以下可能導致匯款失敗的情況：
1. 如果您提供的身份證號碼與指定收款賬戶所有人信息不一致，匯款可能會失敗。
2. 如果您取消了匯款服務設置或未能在領獎期限內（開獎日起6日至3個月內）提供正確的領獎信息，可能無法完成匯款，需自行承擔責任。
"""

# 有三個關鍵字: 這邊的填空只有兩個，請補上第三個
if (___________) and/or/not (___________):
    is_spam_mail_content = True
else:
    is_spam_mail_content = False

warning_word = "，請勿輸入個資"
if not mail_link.endswith(".gov.tw"):
    print(f"釣魚網站{warning_word}")
if not mail_link.startswith("https"):
    print(f"非安全網站{warning_word}")
if is_spam_mail_content:
    print(f"詐騙網站{warning_word}")

如果我們不只想要的知道子元素是否有出現，  
更進一步想要知道出現幾次呢？

## 序列出現某元素的次數
```
序列.count(元素)
```

In [None]:
list_example = ["a",2016,5566,"Python",2016,2016.0]
print(list_example.count(2016))

3


In [None]:
string_example = "Python Tutorial Workshop"
print(string_example.count("t"))

2


In [None]:
article = """
Bubble tea represents the "QQ" food texture that Taiwanese love.
The phrase refers to something that is especially chewy, like the tapioca balls that form the 'bubbles' in bubble tea.
It's said this unusual drink was invented out of boredom.
"""
print(article.count("in"))

4


### [練習] 關鍵字出現次數
在處理搜尋引擎排名的時候，我們會希望搜尋結果是有包含我們的「搜尋關鍵字」，  
如果出現的關鍵字次數越多，通常會代表這篇內容越是有可能是我要的搜尋結果。  
(p.s. 統計單字出現次數也會用於翻譯古老語言或是破解密碼)

我們這邊先以英文內容的資料來處理：  
想要計算出一篇英文內文中某個單字出現幾次。


不過有可能遇到很短的單字會在其他單字中出現：  
例如「in」這個單字，就也會出現在單字「drink」, 「something」的片段中，  
但這就多少會影響我們搜尋結果的準確性。

幸好英文文章，單字間是用「空白」隔開，  
我們可以用 `split` 先把文章切割成單字串列，然後再數某個單字出現幾次。

In [None]:
article = """
Bubble tea represents the "QQ" food texture that Taiwanese love.
The phrase refers to something that is especially chewy, like the tapioca balls that form the 'bubbles' in bubble tea.
It's said this unusual drink was invented out of boredom.
"""
words = article.split(___)
print(_____.count("in"))

#### [進階練習] 文章處理後再進行關鍵字計算
延續前面的練習題，這篇文章出現幾次單字「tea」呢？  
用人判斷會發覺有兩次，但剛才 `split` 再 `count` 的程式碼只出現一次。  
  
原因是因為 `split` 之後，單字串列有的是「tea」和「tea.\nIt's」。  
所以如果直接用 `.count("tea")` ，就只會算到剛好等於「tea」的字。

=>
- `\n` 指的是換行，實際上換行應該也是單字分割，我們可以取代成「空白」，待會切割的時候就會一起切到
- 標點符號可以消掉
- [`replace` 語法](https://colab.research.google.com/github/Python-Tutorial-Workshop/2025/blob/master/01_basicObject_IO.ipynb#scrollTo=Fqh9MBdGdxkd)

拆解一下我們要做的步驟：
- 把換行取代成空白
- 把標點符號消掉
- 把文章切割成單字串列
- 算出單字串列中，「tea」這個單字出現幾次

In [None]:
article = """
Bubble tea represents the "QQ" food texture that Taiwanese love.
The phrase refers to something that is especially chewy, like the tapioca balls that form the 'bubbles' in bubble tea.
It's said this unusual drink was invented out of boredom.
"""
clean_article = article.______________
words = _____.split(___)
print(_____.count(___))

# 綜合應用：字串、數值、判斷式、串列

## 日期正規化 (年-月-日 時:分:秒) 24小時制

In [None]:
ebc_datetime = "2016-10-17 17:00"
back_datetime = "2016-10-11, 19:55"
ptt_datatime = "Tue Oct 18 23:22:05 2016"

format_ebc_datetime = ebc_datetime+":00"
format_back_datetime = back_datetime.replace(",","")+":00"

ptt_split_list = ptt_datatime.split(" ")
ptt_year = ptt_split_list[-1]
ptt_month = ptt_split_list[1].replace("Oct","10")
ptt_date = ptt_split_list[2]
ptt_time = ptt_split_list[3]
format_ptt_datetime = f"{ptt_year}-{ptt_month}-{ptt_date} {ptt_time}"

print(format_ebc_datetime)
print(format_back_datetime)
print(format_ptt_datetime)

In [None]:
yahoo_datetime = "2016年10月18日 下午10:33"
temp_yahoo_date = yahoo_datetime.split(" ")[0].replace("年","-").replace("月","-")
temp_yahoo_date = temp_yahoo_date.replace("日","")
temp_yahoo_time = yahoo_datetime.split(" ")[-1]
temp_yahoo_hour = temp_yahoo_time.split(":")[0]
temp_yahoo_mins = temp_yahoo_time.split(":")[-1]

if "下午" in temp_yahoo_hour:
    temp_yahoo_hour_int = int(temp_yahoo_hour.replace("下午",""))+12
    temp_yahoo_hour = str(temp_yahoo_hour_int)
else:
    temp_yahoo_hour_int = int(temp_yahoo_hour.replace("上午",""))
    temp_yahoo_hour = str(temp_yahoo_hour_int)

format_yahoo_datetime = f"{temp_yahoo_date} {temp_yahoo_hour}:{temp_yahoo_mins}:00"
print(format_yahoo_datetime)

2016-10-18 22:33:00


## [補充練習] 簡易計算機
實作一個簡易計算機：輸入一行文字，印出計算結果
- 只做加減乘除、次方、餘數
- 只會有兩個數字，與一個運算元

#### 測試內容：
- 輸入 11+2 會印出 13
- 輸入 2**3 會印出 8
- 輸入 10%3 會印出 1

In [None]:
keyin = input("請輸入您要計算的內容，限二個數字 ex: 2**3\n")
if "+" in keyin:
    # 以+號分割字串，從串列中分別取得兩個數字並貼上標籤，印出兩數相加

elif "-" in keyin:
    # 以-號分割字串，從串列中分別取得兩個數字並貼上標籤，印出兩數相減"
...


# 可變與不可變

前面以輕軌跟火車比喻字串與串列的時候，提到字串是不可變動長度的，  
但明明字串就可以相加，這樣長度不是就改變嗎？


In [None]:
string_example = "Hello"
print(string_example)
string_example = string_example + "Python"
print(string_example)

Hello
HelloPython


實際上 int、float、str、是不可變(immutable)物件，在建立之後值就不能更改，  
程式運作的原理其實是把命名標籤貼到新的物件上。  
  
而 list 是可變(mutable)物件，也就是說裡面的資料變動，命名標籤貼的物件並不會改變。

> [圖示說明](https://docs.google.com/presentation/d/1LuXI6tB7UzaayGgDBuejz1OSDuqGJ2Che3k02-zKOj0/edit?usp=sharing)

### 不可變物件的資料變動

In [None]:
a = 3
b = 3
c = a
print(id(a),id(b),id(c))

print("-"*50)            # 分隔線

a += 2  # a = a + 2
b = 4
print(id(a),id(b),id(c))

11654440 11654440 11654440
--------------------------------------------------
11654504 11654472 11654440


In [None]:
b = 5
print(id(a),id(b),id(c))
# Python 的設計上，不可變物件可以重複利用，這樣就不會消耗多餘的儲存空間

11654504 11654504 11654440


### 可變物件的資料變動

In [None]:
list_1 = ["a",2016,5566,"Python"]
list_2 = list_1
print(id(list_1),id(list_2))

138358384066816 138358384066816


In [None]:
list_1 += ["Hi"] # list_1 = list_1+["Hi"]
print(id(list_1),id(list_2))
print(list_1)
print(list_2)

138358384066816 138358384066816
['a', 2016, 5566, 'Python', 'Hi']
['a', 2016, 5566, 'Python', 'Hi']


In [None]:
list_2[2] = 2017
print(id(list_1),id(list_2))
print(list_1)
print(list_2)

138358384066816 138358384066816
['a', 2016, 2017, 'Python', 'Hi']
['a', 2016, 2017, 'Python', 'Hi']
