# 成為初級資料分析師 | Python 程式設計

> 流程控制：`for` 迴圈

## 郭耀仁

> When you’ve given the same in-person advice 3 times, write a blog post.
>
> David Robinson

## 大綱

- 資料結構是可迭代的
- `for` 迴圈
- `List Comprehension`
- 迭代 `dict`
- `enumerate()` 與 `zip()`
- 何時用 `for`？何時用 `while`？

## 資料結構是可迭代的

## 複習使用 `while` 迴圈迭代 `list`

In [1]:
# list is iterable
genre = ["Action", "Adventure", "Sci-Fi"]
i = 0
while i < len(genre):
    print(genre[i])
    i += 1

Action
Adventure
Sci-Fi


## 我們目前認識的 iterables

- `list`
- `tuple`
- `dict`
- `set`
- `str`

In [2]:
# tuple is iterable
genre = ("Action", "Adventure", "Sci-Fi")
i = 0
while i < len(genre):
    print(genre[i])
    i += 1

Action
Adventure
Sci-Fi


In [3]:
# dict is iterable
heroes = {
    "Iron Man": "Tony Stark",
    "Captain America": "Steve Rogers",
    "Hulk": "Bruce Banner",
    "Thor": "Thor",
    "Black Widow": "Natasha Romanoff",
    "Hawkeye": "Clint Barton"
}
dict_keys = list(heroes.keys())
i = 0
while i < len(heroes):
    k = dict_keys[i]
    print(heroes[k])
    i += 1

Tony Stark
Steve Rogers
Bruce Banner
Thor
Natasha Romanoff
Clint Barton


## 值得注意 `str` 同樣具有索引與切割的特性

In [4]:
iron_man = "Tony Stark"
print(iron_man[0])
print(iron_man[-1])
print(iron_man[:4])
print(iron_man[-5:])

T
k
Tony
Stark


In [5]:
# str is also iterable!
iron_man = "Tony Stark"
i = 0
while i < len(iron_man):
    print(iron_man[i])
    i += 1

T
o
n
y
 
S
t
a
r
k


## 除了 `str` 其他資料型態是不可迭代的

- `int`
- `float`
- `bool`

## 因為這些資料型態沒有辦法像 `str` 一般索引或切割

In [6]:
my_int = 5566
my_float = 55.66
my_bool = True

print(my_int[0])
print(my_float[0])
print(my_bool[0])

TypeError: 'int' object is not subscriptable

## 針對可迭代的物件（Iterables），比 `while` 更簡便的迴圈是 `for`

## `for` 迴圈

## `for` 迴圈的 Code Block

- `for` 保留字
- 迭代子名稱 `ITERATOR`
- `in` 保留字
- 可迭代的物件 `ITERABLE`
- 反覆執行的任務

```python
for ITERATOR in ITERABLE:
    # 反覆執行的任務
```

## 我們說過的迴圈三要素：`start`、`stop`、`step` 去哪裡了呢？

在可迭代物件中就具備了迴圈三要素：
- `start`：可迭代物件中的第 0 項
- `stop`：可迭代物件中的第 -1 項
- `step`：可迭代物件中每個物件的間隔

## 印出介於 1 到 100 之間的整數

該去哪裡找出有 1 到 100 的可迭代物件呢？

In [7]:
help(range)
print(range(100))
print(range(1, 101))

Help on class range in module builtins:

class range(object)
 |  range(stop) -> range object
 |  range(start, stop[, step]) -> range object
 |  
 |  Return an object that produces a sequence of integers from start (inclusive)
 |  to stop (exclusive) by step.  range(i, j) produces i, i+1, i+2, ..., j-1.
 |  start defaults to 0, and stop is omitted!  range(4) produces 0, 1, 2, 3.
 |  These are exactly the valid indices for a list of 4 elements.
 |  When step is given, it specifies the increment (or decrement).
 |  
 |  Methods defined here:
 |  
 |  __bool__(self, /)
 |      self != 0
 |  
 |  __contains__(self, key, /)
 |      Return key in self.
 |  
 |  __eq__(self, value, /)
 |      Return self==value.
 |  
 |  __ge__(self, value, /)
 |      Return self>=value.
 |  
 |  __getattribute__(self, name, /)
 |      Return getattr(self, name).
 |  
 |  __getitem__(self, key, /)
 |      Return self[key].
 |  
 |  __gt__(self, value, /)
 |      Return self>value.
 |  
 |  __hash__(self, /)
 |

In [8]:
for i in range(1, 101):
    print(i)

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100


## 常見的迴圈任務不會只是 print()

- 計數（Counter）
- 加總（Summation）
- 合併（Append）

## 計算 1 到 100 的之間有幾個整數

In [9]:
# 計數
int_cnt = 0
for i in range(1, 101):
    int_cnt += 1
print(int_cnt)

100


## 計算 1 加到 100 的總和：[The Story of Gauss](https://www.nctm.org/Publications/Teaching-Children-Mathematics/Blog/The-Story-of-Gauss/)

In [10]:
# 加總
summation = 0
for i in range(1, 101):
    summation += i
print(summation)

5050


## 印出介於 1 到 100 之間的偶數

In [11]:
for i in range(2, 101, 2):
    print(i)

2
4
6
8
10
12
14
16
18
20
22
24
26
28
30
32
34
36
38
40
42
44
46
48
50
52
54
56
58
60
62
64
66
68
70
72
74
76
78
80
82
84
86
88
90
92
94
96
98
100


## 將介於 1 到 100 之間的偶數合併至一個 `list`

In [12]:
evens = []
for i in range(2, 101, 2):
    evens.append(i)
print(evens)

[2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 40, 42, 44, 46, 48, 50, 52, 54, 56, 58, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78, 80, 82, 84, 86, 88, 90, 92, 94, 96, 98, 100]


## 隨堂練習

## 印出介於 x 到 y 之間的奇數（包含 x 與 y 假如它們是奇數）

In [13]:
x = int(input("請輸入起始的正整數："))
y = int(input("請輸入終止的正整數："))
for i in range(x, y + 1):
    if i % 2:
        print(i)

請輸入起始的正整數：55
請輸入終止的正整數：66
55
57
59
61
63
65


## 承接上題，介於 x 到 y 之間的奇數有幾個（包含 x 與 y 假如它們是奇數）

In [14]:
x = int(input("請輸入起始的正整數："))
y = int(input("請輸入終止的正整數："))
odds_cnt = 0
for i in range(x, y + 1):
    if i % 2:
        odds_cnt += 1
print(odds_cnt)

請輸入起始的正整數：55
請輸入終止的正整數：66
6


## 承接上題，介於 x 到 y 之間的奇數加總為何（包含 x 與 y 假如它們是奇數）

In [15]:
x = int(input("請輸入起始的正整數："))
y = int(input("請輸入終止的正整數："))
odds_sum = 0
for i in range(x, y + 1):
    if i % 2:
        odds_sum += i
print(odds_sum)

請輸入起始的正整數：55
請輸入終止的正整數：66
360


## 承接上題，介於 x 到 y 之間的奇數為何（包含 x 與 y 假如它們是奇數）

In [16]:
x = int(input("請輸入起始的正整數："))
y = int(input("請輸入終止的正整數："))
odds = []
for i in range(x, y + 1):
    if i % 2:
        odds.append(i)
print(odds)

請輸入起始的正整數：55
請輸入終止的正整數：66
[55, 57, 59, 61, 63, 65]


## 判斷質數

在大於 1 的正整數中，除了 1 和該數自身外，無法被其他正整數整除的數字。

In [17]:
user_int = int(input("請輸入一個正整數："))
divisors = []
for i in range(1, user_int + 1):
    if user_int % i == 0:
        divisors.append(i)
    if len(divisors) > 2:
        break
if len(divisors) == 2:
    print("{} 是質數".format(user_int))
else:
    print("{} 不是質數".format(user_int))

請輸入一個正整數：87
87 不是質數


## `List Comprehension`

## 將使用 loop 構建 list 壓縮為簡潔單行的方法

In [18]:
# Conventional
squared = []
for i in range(10):
    squared.append(i**2)
print(squared)

[0, 1, 4, 9, 16, 25, 36, 49, 64, 81]


In [19]:
# List comprehension
squared = [i**2 for i in range(10)]
print(squared)

[0, 1, 4, 9, 16, 25, 36, 49, 64, 81]


## List Comprehension 搭配 `if` 條件判斷

In [20]:
# List comprehension with if
odds = [i for i in range(10) if i % 2]
print(odds)

[1, 3, 5, 7, 9]


## List Comprehension 搭配 `if else` 條件判斷

In [21]:
# List comprehension with if else
is_odds = [True if i % 2 else False for i in range(10)]
print(is_odds)

[False, True, False, True, False, True, False, True, False, True]


## 隨堂練習

## 將復仇者聯盟系列電影評等大於 8 分的挑選出來

In [22]:
avengers_ratings = [8.1, 7.3, 8.5, 8.8]
recommendations = [i for i in avengers_ratings if i >= 8]
print(recommendations)

[8.1, 8.5, 8.8]


## 迭代 `dict`

## 迭代 `dict` 的兩個元件 

- `.keys()`：預設
- `.values()`
- `.items()`：同時迭代 `key` 與 `value`

In [23]:
# dict is iterable
heroes = {
    "Iron Man": "Tony Stark",
    "Captain America": "Steve Rogers",
    "Hulk": "Bruce Banner",
    "Thor": "Thor",
    "Black Widow": "Natasha Romanoff",
    "Hawkeye": "Clint Barton"
}
for k in heroes:
    print(k)

Iron Man
Captain America
Hulk
Thor
Black Widow
Hawkeye


In [24]:
# dict is iterable
heroes = {
    "Iron Man": "Tony Stark",
    "Captain America": "Steve Rogers",
    "Hulk": "Bruce Banner",
    "Thor": "Thor",
    "Black Widow": "Natasha Romanoff",
    "Hawkeye": "Clint Barton"
}
for k in heroes.keys():
    print(k)

Iron Man
Captain America
Hulk
Thor
Black Widow
Hawkeye


In [25]:
# dict is iterable
heroes = {
    "Iron Man": "Tony Stark",
    "Captain America": "Steve Rogers",
    "Hulk": "Bruce Banner",
    "Thor": "Thor",
    "Black Widow": "Natasha Romanoff",
    "Hawkeye": "Clint Barton"
}
for v in heroes.values():
    print(v)

Tony Stark
Steve Rogers
Bruce Banner
Thor
Natasha Romanoff
Clint Barton


In [26]:
# dict is iterable
heroes = {
    "Iron Man": "Tony Stark",
    "Captain America": "Steve Rogers",
    "Hulk": "Bruce Banner",
    "Thor": "Thor",
    "Black Widow": "Natasha Romanoff",
    "Hawkeye": "Clint Barton"
}
for k, v in heroes.items():
    print(k, ":", v)

Iron Man : Tony Stark
Captain America : Steve Rogers
Hulk : Bruce Banner
Thor : Thor
Black Widow : Natasha Romanoff
Hawkeye : Clint Barton


## `enumerate()` 與 `zip()`

## `enumerate()` 可以在迴圈中取用 iterable 中的索引值和資料

In [27]:
avengers = ["The Avengers", "Avengers: Age of Ultron", "Avengers: Infinity War", "Avengers: Endgame"]
for i, val in enumerate(avengers):
    print("{}: {}".format(i, val))

0: The Avengers
1: Avengers: Age of Ultron
2: Avengers: Infinity War
3: Avengers: Endgame


## 隨堂練習

## 標記復仇者聯盟的上映順序

```
## 第 1 部上映的復仇者聯盟是：The Avengers
## 第 2 部上映的復仇者聯盟是：Avengers: Age of Ultron
## 第 3 部上映的復仇者聯盟是：Avengers: Infinity War
## 第 4 部上映的復仇者聯盟是：Avengers: Endgame
```

In [28]:
avengers = ["The Avengers", "Avengers: Age of Ultron", "Avengers: Infinity War", "Avengers: Endgame"]
for i, val in enumerate(avengers):
    print("第 {} 部上映的復仇者聯盟是：{}".format(i+1, val))

第 1 部上映的復仇者聯盟是：The Avengers
第 2 部上映的復仇者聯盟是：Avengers: Age of Ultron
第 3 部上映的復仇者聯盟是：Avengers: Infinity War
第 4 部上映的復仇者聯盟是：Avengers: Endgame


## `zip()` 可以在迴圈中同時取用多個 iterables 資料

In [29]:
years = [2012, 2015, 2018, 2019]
avengers = ["The Avengers", "Avengers: Age of Ultron", "Avengers: Infinity War", "Avengers: Endgame"]
for y, m in zip(years, avengers):
    print("{}: {}".format(y, m))

2012: The Avengers
2015: Avengers: Age of Ultron
2018: Avengers: Infinity War
2019: Avengers: Endgame


## 隨堂練習

## 標記復仇者聯盟的上映順序與年份

```
## 第 1 部復仇者聯盟：The Avengers 上映年份為 2012
## 第 2 部復仇者聯盟：Avengers: Age of Ultron 上映年份為 2015
## 第 3 部復仇者聯盟：Avengers: Infinity War 上映年份為 2018
## 第 4 部復仇者聯盟：Avengers: Endgame 上映年份為 2019
```

In [30]:
years = [2012, 2015, 2018, 2019]
avengers = ["The Avengers", "Avengers: Age of Ultron", "Avengers: Infinity War", "Avengers: Endgame"]
for y, m, i in zip(years, avengers, range(4)):
    print("第 {} 部復仇者聯盟：{} 上映年份為 {}".format(i+1, m, y))

第 1 部復仇者聯盟：The Avengers 上映年份為 2012
第 2 部復仇者聯盟：Avengers: Age of Ultron 上映年份為 2015
第 3 部復仇者聯盟：Avengers: Infinity War 上映年份為 2018
第 4 部復仇者聯盟：Avengers: Endgame 上映年份為 2019


## 何時用 `for`？何時用 `while`？

## 所有的 `for` 都可以用 `while` 重現，但反之不然

- 確定重複運行次數的情境：可以採用 `for` 或 `while`
- 不確定重複運行次數的情境：僅能採用 `while`

## 隨堂練習

## 從 1 到 1000 的整數中隨機抽樣，記錄第幾次可以抽到 56 的倍數（難）

In [31]:
from random import sample

sampling_times = 0
while True:
    sample_num = sample(range(1, 1001), 1)[0]
    sampling_times += 1
    if sample_num % 56 == 0:
        break
print(sampling_times)

23


## 作業

## 計算字串英文字母的母音（a, e, i, o, u）個數

## 執行範例

如果使用者輸入 'azcbobobegghakl'，應該印出：

```
## 請輸入一個英文字串: azcbobobegghakl
## Number of vowels: 5
```

## 計算字串裡面 'bob' 出現的次數

## 執行範例

如果使用者輸入 'azcbobobegghakl'，應該印出：

```
## 請輸入一個英文字串: azcbobobegghakl
## Number of times bob occurs is: 2
```

## 計算 `range(1, 101)` 的[樣本標準差](https://zh.wikipedia.org/wiki/%E6%A8%99%E6%BA%96%E5%B7%AE)

$$SD = \sqrt{\frac{1}{N-1}\sum_{i=1}^{N}(x_i - \bar{x})^2}$$

## 執行範例

```
## range(1, 101) 的樣本標準差為 29.0115
```