# 鍛鍊你的資料分析力 | Python 程式設計

> 迭代

郭耀仁 <yaojenkuo@datainpoint.com> from [DATAINPOINT](https://www.datainpoint.com/)

> When you’ve given the same in-person advice 3 times, write a blog post.
>
> David Robinson

## 大綱

- `while` 迴圈
- `for` 迴圈
- List comprehension
- 何時用 `for`？何時用 `while`？

## 什麼是迭代

> 能夠讓一段程式碼反覆執行的敘述，常見的應用是將儲存在資料結構中的每一個資料值都取出來進行加值運算，迭代的敘述必須包含三個元件：開始（start）、結束（stop）與間距（step），與 `list` 的切割語法相當類似，常見的迭代有 `while` 迴圈與 `for` 迴圈。

## 迭代是用來解決需要反覆執行、大量手動複製貼上程式碼的任務

## 迭代三要素

- 開始 `start`，反覆執行的任務要從哪裡出發？
- 停止 `stop`，反覆執行的任務到何時可以結束？
- 間距 `step`，反覆執行的任務每一輪的間隔是多少？

## 假如我們希望可以印出介於 1 到 100 之間的偶數

In [1]:
print(2)
print(4)
#...
print(100)

## 請印出介於 1 到 100 之間的偶數：迭代三要素

- 開始 `start`，2
- 停止 `stop`，100
- 間距 `step`，2

## 假如我們希望可以判斷一個正整數是否為質數

- 對一個正整數 `n` 進行「因數分解」
- 將 1 至 `n` 每個整數都試著去除 `n` 來判斷是否為因數
- 若只有 2 個因數為質數

## 請判斷一個正整數是否為質數：迭代三要素

- 開始 `start`，1
- 停止 `stop`，n
- 間距 `step`，1

## 來到迭代是一個分水嶺，可以運用視覺化工具協助我們學習，例如 <http://pythontutor.com/visualize.html#mode=edit>

## `while` 迴圈

## 我們需要布林來進行：

- 條件判斷
- **`while` 迴圈**
- 資料篩選

## `while` 迴圈的程式碼結構

- 開始 `start`
- `while` 保留字
- 結束 `stop`
- 反覆執行的任務
- 間距 `step`

```python
i = 0 # 開始 start
while EXPR: # 結束 stop，當 EXPR 被評估為 False 的時候結束
    # 反覆執行的任務
    i += 1 # 間距 step
```

## 常見的迭代任務

- `print()`
- 計數（Counter）
- 加總（Summation）
- 合併（Append）

## 印出介於 1 到 100 之間的偶數

In [2]:
# print()
num = 2 # 開始 start
while num <= 100: # 結束 stop
    print(num) # 反覆執行的任務
    num += 2 # 間距 step

2
4
6
8
10
12
14
16
18
20
22
24
26
28
30
32
34
36
38
40
42
44
46
48
50
52
54
56
58
60
62
64
66
68
70
72
74
76
78
80
82
84
86
88
90
92
94
96
98
100


## 介於 1 到 100 之間的偶數有幾個

In [3]:
# 計數
even_counter = 0
num = 2 # 開始 start
while num <= 100: # 結束 stop
    even_counter += 1 # 反覆執行的任務
    num += 2 # 間距 step
even_counter

50

## 介於 1 到 100 之間的偶數加總為何

In [4]:
# 加總
even_summation = 0
num = 2 # 開始 start
while num <= 100: # 結束 stop
    even_summation += num # 反覆執行的任務
    num += 2 # 間距 step
even_summation

2550

## 介於 1 到 100 之間的偶數是哪些

In [5]:
# 合併
even_numbers = list()
num = 2 # 開始 start
while num <= 100: # 結束 stop
    even_numbers.append(num) # 反覆執行的任務
    num += 2 # 間距 step
print(even_numbers)

[2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 40, 42, 44, 46, 48, 50, 52, 54, 56, 58, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78, 80, 82, 84, 86, 88, 90, 92, 94, 96, 98, 100]


## 判斷質數

在大於 1 的正整數中，除了 1 和該數自身外，無法被其他正整數整除的數字。

In [6]:
def is_prime(x):
    i = 1
    divisor_cnts = 0
    while i <= x:
        if x % i == 0:
            divisor_cnts += 1
        i += 1
    if divisor_cnts == 2:
        return "{} 是質數".format(x)
    else:
        return "{} 不是質數".format(x)

## `for` 迴圈

## `for` 迴圈的程式碼結構

- `for` 保留字
- 迭代子名稱 `ITERATOR`
- `in` 保留字
- 可迭代物件 `ITERABLE`
- 反覆執行的任務

```python
for ITERATOR in ITERABLE:
    # 反覆執行的任務
```

## 我們說過的迭代三要素：`start`、`stop`、`step` 去哪裡了呢？

在可迭代物件中就具備了三要素：
- `start`：可迭代物件中的第 0 項
- `stop`：可迭代物件中的第 -1 項
- `step`：可迭代物件中每個物件的間距

## 什麼是可迭代物件（iterables）

目前已經認識的可迭代物件有：

- `list`
- `tuple`
- `dict`
- `set`
- `str`

## 印出介於 1 到 100 之間的偶數

該去哪裡找出可迭代物件？

In [7]:
help(range)

Help on class range in module builtins:

class range(object)
 |  range(stop) -> range object
 |  range(start, stop[, step]) -> range object
 |  
 |  Return an object that produces a sequence of integers from start (inclusive)
 |  to stop (exclusive) by step.  range(i, j) produces i, i+1, i+2, ..., j-1.
 |  start defaults to 0, and stop is omitted!  range(4) produces 0, 1, 2, 3.
 |  These are exactly the valid indices for a list of 4 elements.
 |  When step is given, it specifies the increment (or decrement).
 |  
 |  Methods defined here:
 |  
 |  __bool__(self, /)
 |      self != 0
 |  
 |  __contains__(self, key, /)
 |      Return key in self.
 |  
 |  __eq__(self, value, /)
 |      Return self==value.
 |  
 |  __ge__(self, value, /)
 |      Return self>=value.
 |  
 |  __getattribute__(self, name, /)
 |      Return getattr(self, name).
 |  
 |  __getitem__(self, key, /)
 |      Return self[key].
 |  
 |  __gt__(self, value, /)
 |      Return self>value.
 |  
 |  __hash__(self, /)
 |

In [8]:
# print()
for i in range(2, 101, 2):
    print(i) # 反覆執行的任務

2
4
6
8
10
12
14
16
18
20
22
24
26
28
30
32
34
36
38
40
42
44
46
48
50
52
54
56
58
60
62
64
66
68
70
72
74
76
78
80
82
84
86
88
90
92
94
96
98
100


## 介於 1 到 100 之間的偶數有幾個

In [9]:
# 計數
even_counter = 0
for i in range(2, 101, 2):
    even_counter += 1 # 反覆執行的任務
even_counter

50

In [10]:
# 計數，使用 len()
len(range(2, 101, 2))

50

## 介於 1 到 100 之間的偶數加總為何

In [11]:
# 加總
even_summation = 0
for i in range(2, 101, 2):
    even_summation += i # 反覆執行的任務
even_summation

2550

In [12]:
# 加總，使用 sum()
sum(range(2, 101, 2))

2550

## 介於 1 到 100 之間的偶數是哪些

In [13]:
# 合併
even_numbers = list()
for i in range(2, 101, 2):
    even_numbers.append(i) # 反覆執行的任務
print(even_numbers)

[2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 40, 42, 44, 46, 48, 50, 52, 54, 56, 58, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78, 80, 82, 84, 86, 88, 90, 92, 94, 96, 98, 100]


In [14]:
# 合併，使用 list()
even_numbers = list(range(2, 101, 2))
print(even_numbers)

[2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 40, 42, 44, 46, 48, 50, 52, 54, 56, 58, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78, 80, 82, 84, 86, 88, 90, 92, 94, 96, 98, 100]


## 判斷質數

在大於 1 的正整數中，除了 1 和該數自身外，無法被其他正整數整除的數字。

In [15]:
def is_prime(x):
    divisor_cnts = 0
    for i in range(1, x + 1):
        if x % i == 0:
            divisor_cnts += 1
    if divisor_cnts == 2:
        return "{} 是質數".format(x)
    else:
        return "{} 不是質數".format(x)

## `dict` 中有兩個元件可以被迭代：keys 與 values

- `.keys()`：預設
- `.values()`
- `.items()`：同時迭代 keys 與 values

In [16]:
the_avengers = {
    "Iron Man": "Tony Stark",
    "Captain America": "Steve Rogers",
    "Hulk": "Bruce Banner",
    "Thor": "Thor",
    "Black Widow": "Natasha Romanoff",
    "Hawkeye": "Clint Barton"
}
for k in the_avengers:
    print(k)

Iron Man
Captain America
Hulk
Thor
Black Widow
Hawkeye


In [17]:
the_avengers = {
    "Iron Man": "Tony Stark",
    "Captain America": "Steve Rogers",
    "Hulk": "Bruce Banner",
    "Thor": "Thor",
    "Black Widow": "Natasha Romanoff",
    "Hawkeye": "Clint Barton"
}
for k in the_avengers.keys():
    print(k)

Iron Man
Captain America
Hulk
Thor
Black Widow
Hawkeye


In [18]:
the_avengers = {
    "Iron Man": "Tony Stark",
    "Captain America": "Steve Rogers",
    "Hulk": "Bruce Banner",
    "Thor": "Thor",
    "Black Widow": "Natasha Romanoff",
    "Hawkeye": "Clint Barton"
}
for k in the_avengers.values():
    print(k)

Tony Stark
Steve Rogers
Bruce Banner
Thor
Natasha Romanoff
Clint Barton


In [19]:
the_avengers = {
    "Iron Man": "Tony Stark",
    "Captain America": "Steve Rogers",
    "Hulk": "Bruce Banner",
    "Thor": "Thor",
    "Black Widow": "Natasha Romanoff",
    "Hawkeye": "Clint Barton"
}
for k, v in the_avengers.items():
    print("{} a.k.a. {}".format(v, k))

Tony Stark a.k.a. Iron Man
Steve Rogers a.k.a. Captain America
Bruce Banner a.k.a. Hulk
Thor a.k.a. Thor
Natasha Romanoff a.k.a. Black Widow
Clint Barton a.k.a. Hawkeye


## List comprehension

## 什麼是 List comprehension

> 將使用迭代創建 list 壓縮為簡潔單行的技巧。

In [20]:
# 沒有使用 List comprehension
squared = list()
for i in range(10):
    squared.append(i**2)
print(squared)

[0, 1, 4, 9, 16, 25, 36, 49, 64, 81]


In [21]:
# 使用 List comprehension
squared = [i**2 for i in range(10)]
print(squared)

[0, 1, 4, 9, 16, 25, 36, 49, 64, 81]


In [22]:
# 使用 List comprehension + if
odds = [i for i in range(10) if i % 2]
print(odds)

[1, 3, 5, 7, 9]


In [23]:
# 使用 List comprehension + if-else
is_odds = [True if i % 2 else False for i in range(10)]
print(is_odds)

[False, True, False, True, False, True, False, True, False, True]


## 可搭配使用的保留字

- `break`
- `continue`

## 判斷質數：加入 `break`

In [24]:
def is_prime(x):
    divisor_cnts = 0
    for i in range(1, x + 1):
        if x % i == 0:
            divisor_cnts += 1
        if divisor_cnts > 2:
            break
    if divisor_cnts == 2:
        return "{} 是質數".format(x)
    else:
        return "{} 不是質數".format(x)

## 何時用 `for`？何時用 `while`？

## 所有的 `for` 都可以用 `while` 重現，但反之不然

- 確定重複運行次數的情境：可以採用 `for` 或 `while`
- 不確定重複運行次數的情境：僅能採用 `while`

## 例如將 10 進位的整數轉換成 2 進位

In [25]:
def dec_to_bin(x):
    binaries = ''
    while True:
        modular = x % 2
        binaries += str(modular)
        x //= 2
        if x < 2:
            break
    binaries += str(x)
    return binaries[::-1]

## 例如將浮點數轉換成分數並進行約分

In [26]:
def as_integer_ratio(x):
    x_str = str(x)
    int_part = int(x_str.split(".")[0])
    decimal_part = x_str.split(".")[1]
    n_decimal = len(decimal_part)
    denominator = 10**n_decimal
    numerator = int(decimal_part)
    while numerator % 2 == 0 and denominator % 2 == 0:
        denominator /= 2
        numerator /= 2
    while numerator % 5 == 0 and denominator % 5 == 0:
        denominator /= 5
        numerator /= 5
    final_numerator = int(int_part*denominator + numerator)
    final_denominator = int(denominator)
    return final_numerator, final_denominator

## 具體來說，採用 `for` 與 `while` 的時機

- 當重複的任務具備隨機性（randomness）或不確定性（uncertainty），採用 `while`
- 否則撰寫 `for` 是相對輕鬆的方式

## 隨堂練習

## 隨堂練習：定義一個函式 `find_odds(x, y)` 將介於 x 到 y 之間的奇數儲存在一個 list 之中回傳，假如 x、y 是奇數則回傳的 list 要包含 x 與 y

- 預期輸入：兩個整數 `x` 與 `y`
- 預期輸出：一個 list

In [27]:
def find_odds(x, y):
    """
    >>> find_odds(5, 10)
    [5, 7, 9]
    >>> find_odds(10, 15)
    [11, 13, 15]
    >>> find_odds(11, 19)
    [11, 13, 15, 17, 19]
    """

## 隨堂練習：定義一個函式 `fizz_buzz_100()` 將介於 1 到 100 之間的整數儲存在一個 list 之中回傳，假如該整數可以被 3 整除，改儲存文字 `'Fizz'`，假如該整數可以被 5 整除，改儲存文字 `'Buzz'`，假如該整數可以被 15 整除，改儲存文字 `'Fizz Buzz'`

- 預期輸入：無
- 預期輸出：一個長度為 100 的 list

In [28]:
def fizz_buzz_100():
    """
    >>> fizz_buzz_100()
    [1, 2, 'Fizz', 4, 'Buzz',..., 14, 'Fizz Buzz', ..., 98, 'Fizz', 'Buzz']
    """

## 隨堂練習：定義一個函式 `reverse_vowels(x)` 將英文單字的母音（a, e, i, o, u）更換為大寫、（A, E, I, O, U）更換為小寫

- 預期輸入：一個文字 `x`
- 預期輸出：一個文字

備註：使用 `x.upper()` 與 `x.lower()` 可以將 `x` 更換成大寫或小寫

In [29]:
def reverse_vowels(x):
    """
    >>> reverse_vowels('Luke Skywalker')
    'LUkE SkywAlEr'
    >>> reverse_vowels('Darth Vadar')
    'DArth VAdAr'
    >>> reverse_vowels('The Avengers')
    'ThE avEngErs'
    """

## 隨堂練習：定義一個函式 `find_primes(x, y)` 將介於 x 到 y 之間的質數儲存在一個 list 之中回傳，假如 x、y 是質數則回傳的 list 要包含 x 與 y

- 預期輸入：兩個整數 `x` 與 `y`
- 預期輸出：一個 list

In [30]:
def find_primes(x, y):
    """
    >>> find_primes(1, 7)
    [2, 3, 5, 7]
    >>> find_primes(11, 20)
    [11, 13, 17, 19]
    >>> find_primes(11, 29)
    [11, 13, 17, 19, 23, 29]
    """

## 隨堂練習：定義一個函式 `ascii_dict()` 將大寫英文字母 A 到 Z 與小寫英文字母 a 到 z 這 52 個字母所對應的十進位 [ASCII](https://zh.wikipedia.org/wiki/ASCII) 編碼以 `dict` 的格式回傳

- 預期輸入：無
- 預期輸出：一個長度為 52 的 dict

備註：使用 `ord(x)` 可以獲得 `x` 的十進位 ASCII 編碼、使用 `chr(x)` 可以獲得十進位 ASCII 編碼的字母

In [31]:
def ascii_dict():
    """
    >>> ascii_dict()
    {'A': 65, 'B': 66, ..., 'Y': 89, 'Z': 90, 'a': 97, 'b': 98, ..., 'y': 121, 'z': 122}
    """

## 執行測試

In [None]:
%load ../test_cases/test_cases_06.py