<figure>
  <IMG SRC="https://raw.githubusercontent.com/mbakker7/exploratory_computing_with_python/master/tudelft_logo.png" WIDTH=250 ALIGN="right">
</figure>

# Exploratory Computing with Python
*Developed by Mark Bakker*

## Notebook 3: `for` 循环与 `if/else` 语句
由于我们将再次使用 numpy 和 matplotlib，我们首先导入它们。

In [None]:
%matplotlib inline
import numpy as np
import matplotlib.pyplot as plt

### The `for` loop
循环用于重复执行命令。循环的语法如下：

In [None]:
for i in [0, 1, 2, 3, 4]:
    print('Hello world, the value of i is', i)

在上面的代码中，变量 i 遍历了列表 [0, 1, 2, 3, 4] 中的五个值。第一次循环时，i 的值为 0，第二次循环时，它的值为 1，依此类推，直到最后一次循环时，它的值为 4。请注意 for 循环的语法：在 for 语句的末尾需要加上冒号 (:)，之后需要缩进。不管你缩进多少个空格，只要在整个 for 循环中保持相同的缩进即可。Jupyter 笔记本会自动缩进 4 个空格，这被认为是良好的 Python 风格，所以建议使用 4 个空格。你可以在 for 循环中包含任意数量的代码行。要结束 for 循环，只需停止缩进即可。

In [None]:
for x in [0, 1, 2, 3]: 
    xsquared = x ** 2
    print('x, xsquare', x, xsquared)
print('We are done with the loop')


循环遍历的值列表可以是任何内容，不一定非得是数字。for 循环只是逐一遍历列表中的所有值：

In [None]:
for data in [20, 'mark', np.sqrt(10)]:
    print('the value of data is:', data)

当然，当列表非常长时，必须手动指定一个循环遍历的列表会非常不方便。例如，如果你想执行某个操作 100 次，你肯定不想手动输入从 0 到 100 的值列表。不过，Python 提供了一个方便的函数，叫做 range。你可以像遍历列表一样遍历 range。要循环 10 次，并从值 0 开始：

In [None]:
for i in range(10):
    print('the value of i is:', i)


可以使用 list 函数将 range 转换为列表（但我们不会经常使用这种方式）。你可以只传递一个参数给 range，此时它将生成从 0 开始但不包括指定数字的范围。注意，range(10) 生成的范围是从 0 到 9 共 10 个数字。你还可以选择性地提供起始值和步长，类似于 np.arange 函数。

In [None]:
print('a range with 10 values:', list(range(10)))
print('a range from 10 till 20', list(range(10, 20)))
print('a range from 10 till 20 with steps of 2:', list(range(10, 20, 2)))

循环可以用来填充数组。让我们计算 $y=\cos(x)$，其中 $x$ 是一个从 0 到 $2\pi$ 之间变化且包含 100 个点的数组。当然，我们已经知道可以通过语句 `y = np.cos(x)` 来完成这个计算。然而，有时这种方式不可行，我们需要通过循环来填充数组。首先，我们必须创建数组 `y`（例如，使用 `zeros_like` 函数将其初始化为全零的数组），然后通过遍历 `x` 的所有值填充数组，使得索引从 `0` 到 `x` 数组的长度。循环中的计数器（代码中的变量 `i`）用于作为填充数组的索引。

In [None]:
x = np.linspace(0, 2 * np.pi, 100)
y = np.zeros_like(x)  # similar to zeros(shape(x))
for i in range(len(x)):
    y[i] = np.cos(x[i])
plt.plot(x, y);


循环在编程脚本中是非常有用的结构。每当你需要多次进行某个计算时，你应该立即想到：循环！

练习 1. <a name="back1"></a>第一个 for 循环
创建一个包含月份名称的列表。创建第二个列表，包含每个月的天数（对于常规年份）。创建一个 for 循环，打印：

The number of days in MONTH is XX days

其中，当然，你需要为 MONTH 打印正确的月份名称，并为 XX 打印正确的天数。使用 f-strings。

In [None]:
months = ["January", "February", "March", "April", "May", "June", 
          "July", "August", "September", "October", "November", "December"]

days_in_month = [31, 28, 31, 30, 31, 30, 
                 31, 31, 30, 31, 30, 31]

for i in range(len(months)):
    print(f"The number of days in {months[i]} is {days_in_month[i]} days")


<a href="#ex1answer">Answer for Exercise 1</a>

### The `if` statement
`if` 语句让你仅在 `if` 语句的结果为真时执行某个任务。例如：

In [None]:
data = 4
print('starting value:', data)
if data < 6:
    print('changing data in the first if-statement')
    data = data + 2
print('value after the first if-statement:', data)
if data > 20:
    print('changing data in the second if-statement')
    data = 200
print('value after the second if-statement:', data)  # data hasn't changed as data is not larger than 20

请注意 `if` 语句的语法：它以 `if` 开头，后面跟着一个结果为 `True` 或 `False` 的表达式，然后是一个冒号。在冒号之后，你需要进行缩进，整个缩进的代码块（在这个例子中是两行代码）会在表达式为 `True` 时执行。当你停止缩进时，`if` 语句就结束了。回想一下第 2 个笔记本中，你可以使用大于 `>`、大于或等于 `>=`、等于 `==`、小于或等于 `<=`、小于 `<` 或不等于 `!=`。

### The `if`/`else` statement
`if` 语句后面可以跟一个 `else` 语句，当 `if` 后的条件为 `False` 时，将执行该 `else` 语句。例如：

In [None]:
a = 4
if a < 3:
    print('a is smaller than 3')
else:
    print('a is not smaller than 3')

你甚至可以通过添加一个或多个条件来扩展 `else`，使用 `elif` 命令，`elif` 是 “else if” 的缩写。

In [None]:
a = 4
if a < 4:
    print('a is smaller than 4')
elif a > 4:
    print('a is larger than 4')
else:
    print('a is equal to 4')


与其在代码单元的顶部指定变量的值，你可以要求用户输入一个值，并使用 input 函数将该值存储在变量中。input 函数返回一个字符串，可以通过 float 函数将其转换为数字。运行下面的代码单元，测试当输入的值大于 4、小于 4 或等于 4 时它是否正常工作。

In [None]:
for i in range(3): # do this 3 times
    a = float(input('Enter a value: '))
    if a < 4:
        print('the entered value is smaller than 4')
    elif a > 4:
        print('the entered value is larger than 4')
    else:
        print('the entered value is equal to 4')

### 练习 2. <a name="back2"></a>结合使用 `for` 循环和 `if` 条件判断
思考以下函数

$\begin{split}
y &= \cos(x) \qquad \text{for} \qquad x < 0 \\
y &= \exp(-x) \qquad \text{for} \qquad x \ge 0 \\
\end{split}$

计算 $y$，使得 $x$ 从 $-2\pi$ 到 $2\pi$ 之间有 100 个点，并绘制图形。确保 $x$ 轴的范围是从 $-2\pi$ 到 $2\pi$。

In [None]:
import numpy as np
import matplotlib.pyplot as plt

x = np.linspace(-2 * np.pi, 2 * np.pi, 100)

y = np.cos(x)

plt.figure(figsize=(10, 5))
plt.plot(x, y, label='y = cos(x)')

plt.xlim(-2 * np.pi, 2 * np.pi)

plt.title('y = cos(x)')
plt.xlabel('x')
plt.ylabel('y')
plt.axhline(0, color='black', linewidth=0.5, ls='--')
plt.axvline(0, color='black', linewidth=0.5, ls='--')
plt.grid()
plt.legend()
plt.show()

<a href="#ex2answer">Answer for Exercise 2</a>

### 练习 3. <a name="back3"></a>加载并循环遍历温度数据  
从数据文件 `holland_temperature.dat` 加载荷兰的温度数据。循环遍历所有月度温度，并打印一条信息，包括月份编号，以及说明该月份的平均温度是高于还是低于 10 度。

<a href="#ex3answer">Answer for Exercise 3</a>

### 循环与求和  
循环的一个应用是计算数组中所有值的总和。例如，考虑包含 8 个值的数组 `data`。我们将计算 `data` 中所有值的总和。首先，我们定义一个变量 `datasum` 并将其初始值设为 0。接下来，我们遍历 `data` 中的所有值，并将每个值加到 `datasum` 中：

In [None]:
data = np.array([1, 3, 2, 5, 7, 3, 4, 2])
datasum = 0
for i in range(len(data)):
    datasum = datasum + data[i]
    print('i, datasum: ', i, datasum)
print('total sum of data: ', datasum)

`datasum = datasum + data[i]`

的意思是将 `data[i]` 加到 `datasum` 的当前值上，并将结果赋值给 `datasum`。实际上，对于同一语句有一种更简洁的语法：

`datasum += data[i]`

`+=` 命令的意思是将 `+=` 符号右侧的值加到左侧的值上。你可以使用你最习惯的语法（尽管 `+=` 被认为更好，并在某些情况下更高效）。


练习 4. <a name="back4"></a>累积总和

对于上一个例子中的数据，使用循环计算累积总和并将其存储在一个数组中。因此，结果应该是一个与 data 长度相同的数组，其中第 i 项是数组 data 中所有值的总和，直到并包括 data[i]。打印数组 data 和累积总和数组到屏幕上。最后，通过使用 numpy 的 cumsum 函数检查你的答案，该函数应该给出与循环相同的结果。

In [None]:
import numpy as np

data = np.array([1, 2, 3, 4, 5, 6, 7, 8])
running_total = np.zeros_like(data)

for i in range(len(data)):
    if i == 0:
        running_total[i] = data[i]
    else:
        running_total[i] = running_total[i - 1] + data[i]

print("原始数据数组:", data)
print("累积总和数组:", running_total)

numpy_cumsum = np.cumsum(data)
print("使用 numpy 的 cumsum 计算的累积总和:", numpy_cumsum)


<a href="#ex4answer">Answer for Exercise 4</a>

### 以困难的方式找到最大值  
接下来，让我们在数组 `data` 中找到最大值及其索引。为了说明这一点，我们将通过使用循环和 `if` 语句以困难的方式来实现这一点。首先，我们创建一个变量 `maxvalue`，用来存储最大值，初始值设为一个非常小的数字；然后我们创建一个变量 `maxindex`，用来存储最大值的索引，初始值设为 `None`。接下来，我们遍历 `data` 中的所有值，每当找到一个比当前 `maxvalue` 更大的值时，就更新 `maxvalue` 和 `maxindex`。

In [None]:
maxvalue = -1e8
maxindex = None
for i in range(len(data)):
    if data[i] > maxvalue:
        maxvalue = data[i]
        maxindex = i
print('the maximum value is ', maxvalue)
print('the index of the maximum value is ', maxindex)

对于这个例子，通过查看 `data` 数组来检查这些数字是否正确是很简单的，但当 `data` 数组很大时，这变得更加困难。当然，`numpy` 包中有可用的函数来找到最大值和最大值的索引：`np.max` 返回数组的最大值，`np.argmax` 返回数组最大值的索引。对于最小值，也有类似的函数。

In [None]:
print('the maximum value is ', np.max(data))
print('the index of the maximum value is ', np.argmax(data))

### 练习 5. <a name="back5"></a>最接近 15 度的月份  
找到荷兰平均月温度最接近 15 度的月份（使用练习 3 中的数据）。按照上面描述的方法，遍历所有值，并在循环内使用 `if` 语句。你可能还想使用 `abs` 函数来计算一个数字的绝对值。通过使用几个不需要循环和 `if` 语句的 `numpy` 方法来检查你的答案。

In [None]:
import numpy as np

months = np.array(["January", "February", "March", "April", "May", "June", 
                   "July", "August", "September", "October", "November", "December"])
temperatures = np.array([3.5, 4.0, 7.5, 10.0, 14.0, 17.5, 
                         19.0, 18.5, 15.0, 11.0, 6.0, 4.5])  # 假设的温度数据

closest_month = None
closest_temp_diff = float('inf')

for i in range(len(temperatures)):
    temp_diff = abs(temperatures[i] - 15)
    if temp_diff < closest_temp_diff:
        closest_temp_diff = temp_diff
        closest_month = months[i]


print(f"平均温度最接近 15 度的月份是: {closest_month}")

temp_diffs = np.abs(temperatures - 15)
closest_index = np.argmin(temp_diffs)

print(f"使用 numpy 方法，平均温度最接近 15 度的月份是: {months[closest_index]}")


<a href="#ex5answer">Answer for Exercise 5</a>

### 嵌套循环  
在循环内部也可以有其他循环，这被称为嵌套循环。例如，考虑下面的数组 `data`，它有 3 行 4 列。我们想要计算每一行的值的总和（也就是对列求和），并且我们将使用双重循环来实现这一点。首先，我们创建一个长度为 3 的零数组 `rowtotal`（每一行对应一个值）。接下来，我们循环遍历每一行。在循环内部，对于每一行，我们开始另一个循环，遍历所有列，并将该行的值加到 `rowtotal` 数组中。

In [None]:
data = np.array([[1, 2, 3, 5],
                 [4, 8, 6, 4],
                 [3, 5, 4, 6]])
rowtotal = np.zeros(3)
for irow in range(3):
    for jcol in range(4):
        rowtotal[irow] += data[irow, jcol]
        #longer alternative:
        #rowtotal[irow] = rowtotal[irow] + data[irow, jcol]
print(rowtotal)

在运行上述代码后，首先确保答案是正确的。接下来，请注意，在开始循环之前将 `rowtotal` 的值设置为 0 是很重要的，因为我们会将这些值相加以计算每一行的总和。在代码中，我们使用了两个循环，因此缩进了两次。

`numpy` 有一个 `sum` 函数，可以计算整个数组的总和，或者通过指定 `axis` 关键字计算沿某个轴的总和（例如，沿行或列）。

In [None]:
print('sum of entire array:', np.sum(data))
print('sum rows (axis=0):', np.sum(data, axis=0))
print('sum columns (axis=1):', np.sum(data, axis=1))

### `break` 和 `while`  
一个常见的任务是找到一个值在有序表（例如列表或数组）中的位置。例如，确定数字 6 在有序序列 `[1, 4, 5, 8, 9]` 中落在两个数字之间。我知道，它位于 `5` 和 `8` 之间，但如果列表很长呢？为了找到在列表中的位置，我们需要遍历列表，并在找到位置后使用 `break` 退出循环。Python 提供了 `break` 命令来实现这一点。

In [None]:
x = [1, 4, 5, 8, 9]
a = 6
for i in range(len(x)):
    if a < x[i]:
        break
print('a is between', x[i-1], 'and', x[i])

还有另一种使用 while 循环进行编码的方法，如下所示：

In [None]:
x = [1, 4, 5, 8, 9]
a = 6
i = 0
while a >= x[i]:
    i = i + 1
print('a is between', x[i-1], 'and', x[i])

在 `while` 循环中，比较是在循环开始时进行的，而计数器（在这种情况下是 `i`）则在循环内部更新。使用带有 `break` 的循环或带有计数器的 `while` 循环都可以正常工作，但在某些情况下，`while` 循环可能会很棘手，因为如果代码中存在错误，可能会导致无限循环。一旦进入无限循环（即永远不会停止），请点击窗口顶部的 [Kernel] 菜单项，然后选择 [Interrupt Kernel] 或 [Restart Kernel]。这将结束你的 Python 会话并启动一个新的会话。当你在 `while` 循环中打印某些内容到屏幕时，可能无法退出循环，你可能需要结束你的 Jupyter 会话（并可能丢失一些工作）。由于 `while` 循环中存在这些错误问题，因此建议在可能的情况下使用带有 `break` 的循环，而不是 `while` 循环。

### 练习 6, <a name="back6"></a>石油数据  
文件 `oil_price.dat` 包含自 1985 年以来的每月油价。该文件包含三列：年份、月份和以欧元为单位的价格（来自欧洲银行网站）。绘制油价的图表（将数字放在横轴上；我们将在另一个笔记本中学习如何处理日期），并确定油价首次超过 40 欧元、超过 60 欧元和超过 80 欧元的月份和年份。你需要在屏幕上输出类似于 `油价首次在 yyyy 年 xx 月超过 40 欧元` 的内容，其中 `xx` 和 `yyyy` 是正确的月份和年份。使用双重循环。你能修改代码，使其输出月份名称而不是月份数字吗？

<a href="#ex6answer">Answer for Exercise 6</a>

### 字符串  
字符串是一种非常多功能的数据类型，我们可以轻松地在整个笔记本中讨论字符串。我们只会有限地使用字符串，因此在这里对字符串的处理保持最低限度。我们已经使用字符串来指定图表轴上的名称或图例中的名称。字符串类似于数组或列表，因为字符串中的每个字符都有一个索引。可以访问每个字符或字符范围，但它们不能被更改（因此它们更像元组而不是数组或列表）。字符串也有长度。

In [None]:
text1 = 'Goodmorning everybody'
print(len(text1))
print(text1[0])
print(text1[0:12])

当你将两个字符串相加时，它们会像列表一样连接在一起。当你想将文本与变量组合时，首先需要将变量转换为字符串，然后再将两个字符串相加：

In [None]:
text1 = 'Goodmorning everybody'
newtext = text1 + ' in the class'  # Adding two srings
print(newtext)
a = 7
mes = 'The magic number is ' + str(a)  # Combining strings and numbers
print(mes)

字符串的比较方式与数字的比较方式相同。比较从字符串中的第一个字符开始，仅在两个字符串的首字符相等时才会移动到下一个字符。字母 'a' 小于 'b'，'b' 小于 'c'，依此类推。但要注意，在字符顺序中，大写字符小于所有小写字符！因此，'A' 小于 'a'，同时也小于 'm' 或任何其他小写字符。确保你理解以下语句：

In [None]:
print('delft' < 'eindhoven')  # True as 'd' is smaller than 'e'
print('dalft' < 'delft')      # True as 'a' is smaller than 'e'
print('delft' == 'Delft')     # False as lower and upper case are not equal
print('Delft' < 'delft')      # True as 'D' is smaller than 'd'
print('delft' > 'Eindhoven')  # Also True, as 'd' is larger than 'E' or any other upper case character

字符串可以转换为大写或小写。

In [None]:
TU = 'TU Delft'
print(TU)
print(TU.lower())
print(TU.upper())

由多个单词组成的字符串可以使用 `split` 转换为单词列表。

In [None]:
sentence = 'This is a sentence containing a number of words'
print('This is the sentence:', sentence)
wordlist = sentence.split()
print('This is the split sentence:', wordlist)
print('All words may be printed seperately:')
for word in wordlist:
    print(word)

### 练习 7. <a name="back7"></a>在列表中找到你的名字的位置  
使用循环找出你的名字在以下列表中落在两个名字之间的位置：  
`['Aaldrich', 'Babette', 'Chris', 'Franka', 'Joe', 'Louisa', 'Pierre', 'Simone', 'Tarek', 'Yvonne', 'Zu']` 并将结果打印到屏幕上。

<a href="#ex7answer">Answer for Exercise 7</a>

### Answers to the exercises

<a name="ex1answer">Answer to Exercise 1</a>

In [None]:
months = ['January', 'February', 'March', 'April',\
          'May','June', 'July', 'August', 'September',\
          'October', 'November', 'December']
days = [31, 28, 31, 30, 31, 30, 31, 31, 30, 31, 30, 31]
for i in range(12):
    print(f'The number of days in {months[i]} is {days[i]}')

<a href="#back1">Back to Exercise 1</a>

<a name="ex2answer">Answer to Exercise 2</a>

In [None]:
x = np.linspace(-2 * np.pi, 2 * np.pi, 100)
y = np.zeros_like(x)
for i in range(100):
    if x[i] < 0:
        y[i] = np.cos(x[i])
    else:
        y[i] = np.exp(-x[i])
plt.plot(x, y)
plt.xlim(-2 * np.pi, 2 * np.pi);

<a href="#back2">Back to Exercise 2</a>

<a name="ex3answer">Answer to Exercise 3</a>

In [None]:
temperature = np.loadtxt('holland_temperature.dat')
for i in range(len(temperature)):
    if temperature[i] < 10:
        print('average monthly temperature in month ', i + 1, ' is less than 10 degrees')
    else:
        print('average monthly temperature in month ', i + 1, ' is more than 10 degrees')

<a href="#back3">Back to Exercise 3</a>

<a name="ex4answer">Answer to Exercise 4</a>

In [None]:
data = np.array([1, 3, 2, 5, 7, 3, 4, 2])
runningtotal = np.zeros_like(data)
runningtotal[0] = data[0]
for i in range(1, len(data)):
    runningtotal[i] = runningtotal[i-1] + data[i]
print('data values:', data)
print('running total:', runningtotal)
print('running total with numpy:', np.cumsum(data))

<a href="#back4">Back to Exercise 4</a>

<a name="ex5answer">Answer to Exercise 5</a>

In [None]:
temperature = np.loadtxt('holland_temperature.dat')
print(temperature)
monthindex = -1
tdiff = 100.0
for i in range(12):
    if abs(temperature[i] - 15) < tdiff:
        monthindex = i
        tdiff = abs(temperature[i] - 15)
print('Number of month closest to 15 degrees, temp: ', monthindex + 1, temperature[monthindex])
print('Alternative method:')
altmin = np.argmin(abs(temperature - 15))
print('Number of month closest to 15 degrees, temp: ', altmin + 1, temperature[altmin])

<a href="#back5">Back to Exercise 5</a>

<a name="ex6answer">Answer to Exercise 6</a>

In [None]:
oilprice = np.loadtxt('oil_price_monthly.dat', delimiter=',')
plt.plot(oilprice[:,2], 'b-')
nrow, ncol = oilprice.shape
months = ['January', 'February', 'March', 'April',\
          'May','June', 'July', 'August', 'September',\
          'October', 'November', 'December']
for price in [40, 60, 80]:
    for i in range(nrow):
        if oilprice[i, 2] > price:
            print(f'The oil price exceeds {price} euros for the first time in', \
                  f'{months[int(oilprice[i, 1])]} of {oilprice[i, 0]:.0f}')
            break

<a href="#back6">Back to Exercise 6</a>

<a name="ex7answer">Answer to Exercise 7</a>

In [None]:
x = ['Aaldrich', 'Babette', 'Chris', 'Franka', 'Joe', 'Louisa', 'Pierre', 'Simone', 'Tarek', 'Yvonne', 'Zu']
myname = 'Guido'
for i in range(len(x)):
    if myname < x[i]:
        break
print(myname, 'is between', x[i-1], 'and', x[i])

<a href="#back7">Back to Exercise 7</a>